T e s eo r i e n t a d ap e l o Pr o f . Do ut o rF e r n a n d oAbe l d aCo n c e i ç ã oSi l v a “encontrar um problema, ver a sua beleza e apaixonar-se por ele; casar e viver feliz com ele até que a morte nos separe − a não ser que encontrem um outro problema ainda mais fascinante, ou, evidentemente, a não ser que obtenhamos uma solução. Mas, mesmo que obtenhamos uma solução, poderemos então descobrir, para nosso deleite, a existência de toda uma família de problemas-filhos, encantadores ainda que talvez difíceis, para cujo bem-estar poderemos trabalhar, com um sentido, até ao fim dos nossos dias.” K. Popper agradecimentos ao Professor Doutor Fernando, pelas ideias e pela orientação durante a realização deste trabalho. aos responsáveis pelo Centro de Estruturas Lineares e Combinatórias (CELC), pelo apoio financeiro para participação em reuniões científicas no país e no estrangeiro. aos colegas do departamento de Matemática da Universidade de Aveiro e a todos os que nele trabalham, pelo companheirismo e pelas excelentes condições de trabalho. a todos aqueles que me deram sugestões, críticas e esclarecimentos para uma maior simplicidade e clareza na escrita deste texto, em particular ao Professor Doutor Paolo Vettori, pela disponibilidade e pelo apoio. aos Amigos que, estando sempre presentes, me deram força para continuar nos momentos mais difíceis. aos meus Pais e às minhas Manas, pelo carinho e pelo apoio constantes em todas as fases deste trabalho. ao Bruno, pelo Amor, pelo aconchego. à Carolina, por fazer da minha vida Amor. Bolsa de Doutoramento SFRH/BD/11133/2002 resumo O objectivo deste trabalho é estabelecer relações entre a classe de semelhança de uma matriz quadrada A e as classes de congruência de matrizes quadradas hermíticas K e H , quando é válida a equação de Lyapunov AH + HA∗ = K . O teorema geral da inércia é uma solução parcial deste problema, bem como outros teoremas sobre inércia já conhecidos. Nesta tese, mostramos relações entre a classe de semelhança da matriz A e as classes de congruência das matrizes K e H , quando é válida a equação de Lyapunov para os seguintes casos: H é uma matriz definida positiva A é uma matriz não derrogatória Estudamos também o problema correspondente para sistemas lineares discretos, ou seja, estabelecemos relações entre a classe de semelhança da matriz A e as classes de congruência das matrizes K e H , quando é válida a equação de Stein H − AHA∗ = K . A resposta a este problema é imediata para os casos referidos anteriormente, dada a existência de uma transformada de Cayley que relaciona as duas equações. palavras-chave inércia de matrizes equação de Lyapunov equação de Stein estabilidade transformada de Cayley abstract The aim of this work is to establish relations between the similarity class of a square matrix A and the congruence classes of hermitian squares matrices K and H , when the Lyapunov equation AH + HA∗ = K is satisfied. The main inertia theorem is a partial solution to this problem as well as other known inertia theorems. We obtain relations between the similarity class of A and the congruence classes of K and H , when the Lyapunov equation is satisfied for the following cases: H is a definite positive matrix A is a nonderogatory matrix We also study the corresponding problem for discrete linear systems, that is, establish relations between the similarity class of A and the congruence classes of K and H , when the Stein equation H − AHA∗ = K is satisfied. The answer to this became immediate for the cases mentioned above, due to a Cayley transform that relates the two equations. keywords inertia of matrices Lyapunov equation Stein equation stability Cayley transform notação C corpo dos números complexos C[x] anel dos polinómios com indeterminada x e coeficientes em C Cn×m conjunto das matrizes de ordem n × m com entradas em C Cn×m [x] conjunto das matrizes de ordem n × m com entradas em C[x] A = [aij ] matriz cuja entrada (i, j) é igual a aij In matriz identidade de ordem n 0p×q matriz nula de ordem p × q 0p matriz nula de ordem p × p diag(λ1 , . . . , λn ) matriz diagonal cuja diagonal principal é λ1 , . . . , λn car A característica da matriz A det A determinante da matriz A tr A traço da matriz A Nuc A núcleo da matriz A: Nuc A = {X : AX = 0} A−1 inversa da matriz A AT transposta da matriz A A conjugada da matriz A A∗ transposta da conjugada da matriz A: A∗ = A A⊕B soma directa das matrizes A e B i unidade imaginária <(λ) parte real do número complexo λ =(λ) parte imaginária do número complexo λ gr(f ) grau do polinómio f f |g polinómio f divide polinómio g (a, b, c) ≥ (u, v, w) a ≥ u, b ≥ v e c ≥ w T Índice 1 Preliminares 2 1.1 Revisões de conceitos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2 1.2 Inércia matricial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7 1.3 Estabilidade de sistemas e estabilidade matricial . . . . . . . . . . . . . . . . . 10 2 Equação de Lyapunov 15 2.1 Motivação . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15 2.2 A nossa contribuição . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19 2.2.1 H é uma matriz definida positiva . . . . . . . . . . . . . . . . . . . . . 19 2.2.2 L é uma matriz não derrogatória 34 . . . . . . . . . . . . . . . . . . . . . 3 Equação de Stein 43 3.1 Motivação . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43 3.2 A nossa contribuição . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48 3.2.0 Lemas Preliminares . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48 3.2.1 H é uma matriz definida positiva . . . . . . . . . . . . . . . . . . . . . 52 3.2.2 S é uma matriz não derrogatória 57 . . . . . . . . . . . . . . . . . . . . . Bibliografia 59 Índice Remissivo 62 1 Capítulo 1 Preliminares “The structures of mathematics and the propositions about them are ways for the imagination to travel and the wings, or legs, or vehicles to take you where you want to go.” S. Buchanan Este capítulo é dedicado à exposição de conceitos e resultados já conhecidos. São apresentados tópicos sobre a teoria das matrizes que consideramos fundamentais para a compreensão dos resultados obtidos nos capítulos seguintes e que podem ser encontrados, na sua generalidade, em [8, 10, 11, 12, 25]. 1.1 Revisões de conceitos Nesta secção são revistos tópicos da teoria das matrizes, com o intuito de tornar este trabalho tão auto-contido quanto possível. Dadas duas matrizes A, B ∈ Cn×m , dizemos que A e B são equivalentes se existem matrizes não singulares P ∈ Cn×n e Q ∈ Cm×m tais que B = P AQ. 2 1.1 Revisões de conceitos Em particular, se m = n, dizemos que as matrizes A e B são semelhantes se P = Q−1 , ou seja, se existe uma matriz não singular Q ∈ Cn×n tal que B = Q−1 AQ. Se a matriz Q for uma matriz de permutação (isto é, uma matriz que se obtém da matriz identidade por permutação de linhas ou de colunas), dizemos que A e B são semelhantes por permutação. Dizemos ainda que as matrizes A, B ∈ Cn×n são congruentes se existe uma matriz não singular R ∈ Cn×n tal que B = RAR∗ . Dada uma matriz A ∈ Cn×n chamamos polinómio característico de A ao polinómio mónico det(xIn − A) ∈ C[x]. Os valores próprios de A são as raízes do seu polinómio característico. Ao conjunto de todos os valores próprios de A chamamos espectro de A e representamos por σ(A). Claramente que, atendendo ao teorema fundamental da Álgebra, toda a matriz n × n tem n valores próprios em C (contando com as multiplicidades). É sabido que, se λ1 , . . . , λn ∈ C são os valores próprios da matriz A, então tr A = λ1 + · · · + λn e det A = λ1 · · · · · λn . Seja λ ∈ C um valor próprio de A. A multiplicidade algébrica de λ, que representamos por ma (λ), é a multiplicidade de λ enquanto zero do polinómio característico e, por isso, é usual referir a multiplicidade algébrica apenas por multiplicidade. A multiplicidade geométrica de λ, que representamos por mg (λ), é a dimensão do subespaço vectorial Nuc(λIn − A). Se cada valor próprio de A tem multiplicidade geométrica 1, dizemos que A é uma matriz não derrogatória. Caso contrário, dizemos que A é uma matriz derrogatória. O próximo resultado permite concluir que matrizes semelhantes partilham diversas propriedades: o mesmo polinómio característico e, consequentemente, os mesmos valores próprios, o mesmo determinante, o mesmo traço, entre outras. Teorema 1.1.1 (Decomposição de Schur) [25] Seja A ∈ Cn×n uma matriz. Então A é semelhante a uma matriz triangular superior cuja diagonal principal é constituída pelos seus valores próprios. 3 1.1 Revisões de conceitos Outro resultado que interessa recordar estabelece uma relação entre os valores próprios de uma matriz hermítica e os valores próprios de uma sua submatriz principal. Recorde-se que uma matriz A ∈ Cn×n é hermítica se A∗ = A. Teorema 1.1.2 (Entrelaçamento dos valores próprios) [11] Seja A ∈ Cn×n uma matriz hermítica particionada da seguinte forma: A11 ∗ , onde A11 ∈ Cr×r para algum r ∈ {1, . . . , n}. A= ∗ ∗ Sejam λ1 , . . . , λn ∈ R os valores próprios de A tais que λ1 ≤ · · · ≤ λn e sejam α1 , . . . , αr ∈ R os valores próprios de A11 tais que α1 ≤ · · · ≤ αr . Então, para todo t ∈ {1, . . . , r}, λt ≤ αt ≤ λt+n−r . Para cada k ∈ {1, . . . , n}, chamamos k-ésimo divisor determinantal da matriz polinomial xIn − A ∈ Cn×n [x], e representamos por dk , ao máximo divisor comum mónico de todos os determinantes das submatrizes de ordem k da matriz xIn − A. Convenciona-se que d0 ≡ 1 e prova-se que, na sequência dos divisores determinantais, cada polinómio é divisível pelo seu sucessor, isto é, dk−1 | dk , para todo k ∈ {1, . . . , n}. Definimos o k-ésimo factor invariante da matriz xIn − A, e representamos por fk , como sendo o polinómio fk = dk ∈ C[x]. dk−1 Cada factor invariante pode ser decomposto na forma fk = (x − λ1 )αk1 (x − λ2 )αk2 · · · (x − λt )αkt , onde λ1 , . . . , λt são os valores próprios distintos da matriz A e αkj ∈ N0 , para todo k ∈ {1, . . . , n} e para todo j ∈ {1, . . . , t}. Chamamos divisor elementar da matriz xIn − A a cada elemento da forma (x − λj )αkj com αkj > 0. Chamamos polinómios invariantes da matriz A aos factores invariantes da matriz xIn − A. O polinómio característico de uma matriz é igual ao produto dos seus polinómios invariantes. Além disso, duas matrizes são semelhantes se e só se têm os mesmos polinómios invariantes. 4 1.1 Revisões de conceitos Existe uma relação entre a multiplicidade geométrica de um valor próprio e os polinómios invariantes de uma matriz. De facto, se λ é um valor próprio da matriz A, então a multiplicidade geométrica de λ é o número de polinómios invariantes de A que admitem λ como raiz. Podemos então dizer que uma matriz é não derrogatória se e só se tem apenas um polinómio invariante não constante. Chamamos matriz companheira de um polinómio mónico f (x) ∈ C[x] de grau p ≥ 1 da forma f (x) = xp + ap−1 xp−1 + · · · + a1 x + a0 , à matriz definida por C(f ) = 0 Ip−1 −a0 −a1 . . . −ap−1 ∈ Cp×p . A matriz C(f ) tem polinómios invariantes 1, . . . , 1, f (x). Teorema 1.1.3 (Forma normal companheira) [12] Seja A ∈ Cn×n uma matriz. Sejam ainda f1 , . . . , ft ∈ C[x] polinómios mónicos diferentes de 1 tais que f1 | · · · |ft e gr(f1 · · · ft ) = n. A matriz A é semelhante à matriz C(f1 ) ⊕ · · · ⊕ C(ft ) se e só se f1 , . . . , ft são os polinómios invariantes de A diferentes de 1. Chamamos bloco de Jordan de tamanho p × p associado a λ ∈ C à matriz triangular superior da forma Jp (λ) = ··· ... λ 1 0 0 .. . λ .. . 1 .. . 0 ··· 0 λ 0 ··· 0 0 .. . 0 .. . p×p 0 ∈C . 1 λ A matriz Jp (λ) tem polinómios invariantes 1, . . . , 1, (x − λ)p . 5 1.1 Revisões de conceitos Teorema 1.1.4 (Forma normal de Jordan) [12] Seja A ∈ Cn×n uma matriz e sejam p1 , . . . , pt inteiros positivos tais que p1 + · · · + pt = n. Sejam ainda λ1 , . . . , λt ∈ C. A matriz A é semelhante à matriz Jp1 (λ1 ) ⊕ · · · ⊕ Jpt (λt ) se e só se (x − λ1 )p1 , . . . , (x − λt )pt são os divisores elementares da matriz xIn − A. Note-se que λ1 , . . . , λt são os valores próprios da matriz A (não necessariamente distintos). Para cada i ∈ {1, . . . , t}, a multiplicidade geométrica de λi é o número de blocos de Jordan associados a λi e a sua multiplicidade algébrica é a soma das ordens dos blocos de Jordan associados a λi , que surgem na forma normal de Jordan da matriz A. Os dois próximos lemas são necessários nas demonstrações dos nossos resultados. As respectivas demonstrações são omitidas uma vez que consistem na simples aplicação de operações de permutação. Seja λ ∈ C e sejam r1 , . . . , rp inteiros positivos tais que r1 + · · · + rp = n. Então: Lema 1.1.5 Toda a matriz da forma Jr1 (λ) ⊕ · · · ⊕ Jrp (λ) ∈ Cn×n é semelhante por permutação a uma matriz da forma λIp 0 ∗ ∗ ∈ Cn×n . Lema 1.1.6 Se ma (λ) ≥ 2 então toda a matriz da forma Jr1 (λ) ⊕ · · · ⊕ Jrp (λ) ∈ Cn×n é semelhante por permutação a uma matriz da forma λI 0 0 p Ip λIp 0 ∈ Cn×n . ∗ ∗ ∗ Por fim recordamos algumas propriedades das matrizes definidas positivas. 6 1.2 Inércia matricial Seja A ∈ Cn×n uma matriz hermítica. Dizemos que A é uma matriz definida positiva, e representamos por A > 0, se, para qualquer vector não nulo x ∈ Cn×1 \ {0}, x∗ Ax > 0. Se enfraquecermos a desigualdade estrita obtemos um novo conceito: dizemos que A é uma matriz semi-definida positiva, e representamos por A ≥ 0, se x∗ Ax ≥ 0, qualquer que seja x ∈ Cn×1 \ {0}. Prova-se que uma matriz é definida positiva se e só se é congruente com a matriz identidade. Analogamente, uma matriz A é semi-definida positiva se e só se é congruente com a matriz Ir ⊕ 0n−r , onde r = car A. Seja A ∈ Cn×n uma matriz definida positiva. Então prova-se que: toda a submatriz principal da matriz A é definida positiva; os valores próprios da matriz A são números reais positivos; para todo α > 0, αA é uma matriz definida positiva; se α < 0, então a matriz −αA é definida positiva; seja B ∈ Cn×n uma matriz congruente com a matriz A, então B também é uma matriz definida positiva. Invertendo as desigualdades das definições anteriores, obtemos conceitos duais. Dizemos que a matriz A é definida negativa, e representamos por A < 0, se −A é uma matriz definida positiva. Analogamente, dizemos que A é uma matriz semi-definida negativa, e representamos por A ≤ 0, se a matriz −A é semi-definida positiva. Se a matriz A não é definida positiva (respectivamente, negativa) nem semi-definida positiva (respectivamente, negativa) então dizemos que A é uma matriz indefinida. 1.2 Inércia matricial Nesta secção recordamos um dos conceitos fundamentais para o nosso trabalho: apresentamos a definição de inércia matricial e analisamos algumas das suas propriedades. 7 1.2 Inércia matricial Seja A ∈ Cn×n uma matriz. A inércia de A (ou a inércia de A relativamente ao eixo imaginário) é o terno In(A) = (π(A), ν(A), δ(A)) onde π(A) denota o número de valores próprios da matriz A com parte real positiva, ν(A) o número de valores próprios da matriz A com parte real negativa e δ(A) denota o número de valores próprios da matriz A com parte real nula (contando sempre com as multiplicidades). A inércia de A relativamente ao círculo unitário é o terno In1 (A) = (π1 (A), ν1 (A), δ1 (A)) onde π1 (A) denota o número de valores próprios da matriz A com módulo inferior a 1, ν1 (A) o número de valores próprios da matriz A módulo superior a 1 e δ1 (A) denota o número de valores próprios da matriz A módulo igual a 1 (contando sempre com as multiplicidades). Em qualquer uma das definições, é fácil verificar que: π(A) + ν(A) + δ(A) = n = π1 (A) + ν1 (A) + δ1 (A). Recorde-se que, dadas duas matrizes A, B ∈ Cn×n , temos que: λ1 , . . . , λn ∈ σ(A) se e só se −λ1 , . . . , −λn ∈ σ(−A); λ1 , . . . , λn ∈ σ(A) e µ1 , . . . , µn ∈ σ(B) se e só se λ1 , . . . , λn , µ1 , . . . , µn ∈ σ(A ⊕ B); −1 −1 se A é uma matriz não singular então λ1 , . . . , λn ∈ σ(A) se e só se λ−1 1 , . . . , λn ∈ σ(A ). se A e B são matrizes semelhantes então λ1 , . . . , λn ∈ σ(A) se e só se λ1 , . . . , λn ∈ σ(B). Assim, estas propriedades dos valores próprios de uma matriz permitem estabelecer algumas propriedades para as inércias. Teorema 1.2.1 Sejam A, B ∈ Cn×n matrizes. Então: In(−A) = (ν(A), π(A), δ(A)) In1 (−A) = In1 (A) In(A ⊕ B) = In(A) + In(B) In1 (A ⊕ B) = In1 (A) + In1 (B) Se A é uma matriz não singular então In(A−1 ) = In(A) e In1 (A−1 ) = (ν1 (A), π1 (A), δ1 (A)). Além disso, se A e B são matrizes semelhantes então In(A) = In(B) e In1 (A) = In1 (B). 8 1.2 Inércia matricial Os dois próximos resultados permitem afirmar que a inércia de matrizes hermíticas é também invariante para a congruência de matrizes. Teorema 1.2.2 (Teorema da inércia de Sylvester) [12] Toda a matriz hermítica A ∈ Cn×n é congruente com uma única matriz da forma Iπ ⊕ (−Iν ) ⊕ 0δ e, além disso, In(A) = (π, ν, δ). Corolário 1.2.3 [12] Duas matrizes hermíticas são congruentes se e só se têm a mesma inércia. O teorema seguinte é um caso particular do resultado obtido em [1] por B. E. Cain e E. M. Sá e relaciona a inércia de uma matriz hermítica com as inércias de duas suas submatrizes principais complementares. Teorema 1.2.4 [1] Sejam H1 ∈ Cn1 ×n1 e H2 ∈ Cn2 ×n2 matrizes hermíticas, com n1 + n2 = n, tais que In(H1 ) = (π1 , ν1 , δ1 ) e In(H2 ) = (π2 , ν2 , δ2 ). Sejam ainda π, ν, δ inteiros não negativos. Então existe uma matriz X ∈ Cn1 ×n2 tal que H1 X = (π, ν, δ) In ∗ X H2 se e só se π e ν satisfazem as seguintes condições: (i) π + ν ≤ n; (ii) max{π1 , π2 } ≤ π ≤ min{n1 + π2 , n2 + π1 }; (iii) max{ν1 , ν2 } ≤ ν ≤ min{n1 + ν2 , n2 + ν1 }; (iv) π − ν ≤ π1 + π2 ; (v) ν − π ≤ ν1 + ν2 . 9 1.3 Estabilidade de sistemas e estabilidade matricial 1.3 Estabilidade de sistemas e estabilidade matricial Nesta secção, fazemos uma breve abordagem aos sistemas contínuos e discretos. É com base no estudo destes sistemas que surgem as equações que são mote deste trabalho. Por se tratar de uma teoria que não se insere no âmbito deste trabalho, omitimos as demonstrações, podendo estas ser encontradas em [5, 8, 11]. Num modelo matemático, o comportamento de um sistema real pode ser descrito por uma lista de parâmetros que variam ao longo do tempo, chamados variáveis de estado do sistema. Frequentemente, existem relações de dependência entre as variáveis de estado que tomam a forma de equações diferenciais ou equações com diferenças, as chamadas equações de estado do sistema. O objectivo do estudo matemático destes sistemas é conseguir determinar o seu comportamento. Um conceito subjacente a esse estudo é o de estabilidade. Consideremos um sistema descrito por uma lista finita de variáveis de estado, que obedecem a um sistema contínuo de equações diferenciais lineares com coeficientes constantes definido por χ̇(t) = Aχ(t) onde A ∈ Cn×n e χ̇ representa a derivada de χ em ordem ao tempo t. Dizemos que o sistema contínuo descrito anteriormente é estável se todas as suas soluções convergem para 0 quando t converge para +∞, ou equivalentemente, se eAt converge para 0 quando t converge para +∞. Um dos critérios de estabilidade de sistemas contínuos é apresentado no próximo resultado. Teorema 1.3.1 [5] Seja A ∈ Cn×n uma matriz. O sistema χ̇(t) = Aχ(t) é estável se e só se todos os valores próprios da matriz A têm parte real negativa. Em 1892, na sua tese de doutoramento, Lyapunov publica um resultado histórico na estabilidade de sistemas não lineares de equações diferenciais, que pode ser formulado para sistemas lineares, com equações matriciais. 10 1.3 Estabilidade de sistemas e estabilidade matricial A relação entre a teoria da estabilidade e as equações matriciais é estabelecida definindo uma matriz Z +∞ H=− ∗ eAt KeA t dt 0 onde K é uma matriz arbitrária definida positiva. Note-se que, sendo A uma matriz representativa de um sistema contínuo estável, então eAt converge para 0 quando t converge para +∞ e este integral impróprio é convergente. Mostra-se (cf. [5]) que H satisfaz a equação AH + HA∗ = K. (1.1) Esta equação é conhecida como equação de Lyapunov e é um dos objectos de estudo do nosso trabalho. Vamos ver no próximo capítulo que a estabilidade de um sistema contínuo está associada à existência de soluções desta equação. Existem sistemas cujo modelo natural é discreto. Consideremos um sistema discreto descrito pelas seguintes equações com diferenças lineares com coeficientes constantes xk = Axk−1 , com k ∈ {1, . . . , n} onde A ∈ Cn×n e xi ∈ Cn×1 , para todo i ∈ {1, . . . , n}. Dizemos que um sistema discreto da forma anterior é estável se uma solução do sistema da forma x0 , x1 , x2 , . . . converge para 0, qualquer que seja a escolha inicial de x0 ou, equivalentemente, se Ak converge para 0 quando k converge para +∞. Um dos critérios de estabilidade de sistemas discretos é análogo ao referido para sistemas contínuos, mas usando o conceito de inércia relativamente ao círculo unitário. Teorema 1.3.2 [5] Seja A ∈ Cn×n uma matriz. O sistema xk = Axk−1 , com k ∈ {1, . . . , n}, é estável se e só se todos os valores próprios da matriz A têm módulo inferior a 1. Em 1952, Stein publica um estudo análogo ao de Lyapunov mas relativo à estabilidade de sistemas discretos. Este estudo baseia-se na definição de uma matriz H da forma H= +∞ X Ak K(A∗ )k (1.2) k=0 11 1.3 Estabilidade de sistemas e estabilidade matricial onde K é uma matriz arbitrária definida positiva. De facto, se A é uma matriz representativa de um sistema discreto estável, então Ak converge para 0 quando t converge para +∞ e esta série é convergente. Mostra-se que H satisfaz a equação H − AHA∗ = K. (1.3) Esta equação é denominada por equação de Stein e é também objecto de estudo do nosso trabalho. No último capítulo, vamos ver que a estabilidade de sistemas discretos está também associada à existência de soluções da equação de Stein. De seguida, introduzimos a estabilidade matricial tendo por base a estabilidade de sistemas. Seja A ∈ Cn×n uma matriz. Dizemos que A é uma matriz estável se o sistema contínuo que lhe está associado χ̇(t) = Aχ(t) é estável, ou seja, se todos os valores próprios da matriz A têm parte real negativa. Repare-se que a matriz A é estável se e só se In(A) = (0, n, 0). Dadas as propriedades da inércia (enunciadas no teorema 1.2.1), podemos concluir que se A é uma matriz estável então A é uma matriz não singular e A−1 , A∗ e AT também são matrizes estáveis. E, além disso, como a inércia é invariante para a semelhança, o mesmo se pode afirmar para a estabilidade, ou seja, se A é uma matriz estável então qualquer matriz semelhante a A é estável. Um conceito dual de estabilidade é definido da seguinte forma: dizemos que a matriz A é estável positiva se todos os seus valores próprios têm parte real positiva, ou seja, In(A) = (n, 0, 0). Claramente que a matriz A é estável positiva se e só se −A é uma matriz estável. Assim é possível reescrever qualquer resultado referente a matrizes estáveis num resultado idêntico sobre matrizes estáveis positivas, inserindo adequadamente o sinal −, e vice-versa. Por conveniência de notação, vamos utilizar o conceito de matrizes estáveis positivas em detrimento do conceito de matrizes estáveis. Podemos ainda definir estabilidade de uma matriz associada a um sistema discreto. 12 1.3 Estabilidade de sistemas e estabilidade matricial Dizemos que a matriz A é estável relativamente ao círculo unitário se o sistema discreto que lhe está associado, xk = Axk−1 , com k ∈ {1, . . . , n}, é estável, ou seja, se todos os valores próprios da matriz A têm módulo inferior a 1, isto é, In1 (A) = (n, 0, 0). Em [21], O. Taussky (e, indirectamente, Stein [17]) aplica uma transformação matricial estabelecendo uma relação entre matrizes estáveis e matrizes estáveis relativamente ao círculo unitário. Seja A ∈ Cn×n uma matriz tal que a matriz In + A é não singular, ou seja, −1 ∈ / σ(A). Chamamos transformada de Cayley da matriz A, e denotamos por C(A), à matriz definida por C(A) = (In + A)−1 (In − A) ∈ Cn×n . Teorema 1.3.3 Seja A ∈ Cn×n uma matriz tal que −1 ∈ / σ(A). Então In1 (A) = In(C(A)). Demonstração. Seja A ∈ Cn×n uma matriz tal que µ1 , . . . , µn são os seus valores próprios. Note-se que, como −1 ∈ / σ(A), é possível definir a sua transformada de Cayley, C(A). Pela decomposição de Schur, existe uma matriz não singular U ∈ Cn×n tal que U −1 AU é uma matriz triangular superior cuja diagonal é µ1 , . . . , µn . Então: −1 In + U −1 AU In − U −1 AU (1 + µ1 )−1 (1 − µ1 ) ∗ ... = 0 (1 + µn )−1 (1 − µn ) U −1 C(A)U = e os valores próprios da matriz C(A) são λ1 , . . . , λn , onde λk = (1 + µk )−1 (1 − µk ), para todo k ∈ {1, . . . , n}. Note-se que, para cada k ∈ {1, . . . , n}, λk = |1 + µk |−2 1 − |µk |2 − 2=(µk )i e, consequentemente, <(λk ) = |1 + µk |−2 1 − |µk |2 . Assim, se |µk | = 1 (respectivamente, |µk | > 1 e |µk | < 1), então <(λk ) = 0 (respectivamente, <(λk ) < 0 e <(λk ) > 0), para todo k ∈ {1, . . . , n}, e, portanto, In1 (A) = In(C(A)). 13 1.3 Estabilidade de sistemas e estabilidade matricial Note-se que se A é uma matriz estável relativamente ao círculo unitário e se µ1 , . . . , µn são os seus valores próprios, então |µk | < 1, para todo k ∈ {1, . . . , n}. Donde −1 ∈ / σ(A) e, portanto, a matriz C(A) está bem definida. Aplicando o teorema anterior obtemos: Corolário 1.3.4 Seja A ∈ Cn×n uma matriz. A matriz A é estável relativamente ao círculo unitário se e só se a matriz C(A) é estável positiva. Também fazendo uso da transformada de Cayley, anteriormente definida, é possível criar uma relação entre a equação de Lyapunov e a equação de Stein. Teorema 1.3.5 Seja H ∈ Cn×n uma matriz hermítica e seja A ∈ Cn×n uma matriz estável relativamente ao círculo unitário. Então In(C(A)H + HC(A)∗ ) = In(H − AHA∗ ). Demonstração. Seja H ∈ Cn×n uma matriz hermítica e seja A ∈ Cn×n uma matriz estável relativamente ao círculo unitário. Repare-se que −1 ∈ / σ(A) e, portanto, a matriz C(A) está bem definida. Então: C(A)H + HC(A)∗ = K ⇔ (In + A)−1 (In − A)H + H(In − A∗ )(In + A∗ )−1 = K ⇔ (In − A)H(In + A∗ ) + (In + A)H(In − A∗ ) = (In + A)K(In + A∗ ) ⇔ 2 (H − AHA∗ ) = (In + A)K(In + A∗ ) 1 1 ⇔ H − AHA∗ = 2− 2 (In + A) K 2− 2 (In + A∗ ) 1 Logo existe uma matriz não singular X = 2− 2 (In + A) ∈ Cn×n tal que H − AHA∗ = X (C(A)H + HC(A)∗ ) X ∗ e, portanto, a matriz C(A)H + HC(A)∗ é congruente com a matriz H − AHA∗ . Como são matrizes hermíticas, pelo Corolário 1.2.3, In(C(A)H + HC(A)∗ ) = In(H − AHA∗ ). 14 Capítulo 2 Equação de Lyapunov “But, in this respect, hardly any other method of investigation could be said to be completely satisfactory.” A. Lyapunov O objectivo principal deste capítulo é estabelecer relações entre a classe de semelhança da matriz L e as classes de congruência das matrizes K e H quando é válida a equação de Lyapunov LH + HL∗ = K. Obtêm-se conjuntos completos de relações nos seguintes dois casos: (i) H é uma matriz definida positiva e (ii) L é uma matriz não derrogatória. Os resultados principais deste capítulo podem ser encontrados em [18, 19]. 2.1 Motivação Nesta secção recordamos o teorema de Lyapunov e algumas generalizações que motivaram a formulação do nosso problema. Analisamos também esses resultados enquanto soluções particulares desse problema. 15 2.1 Motivação Tal como já referimos, em 1892, Lyapunov publica um resultado histórico que estabelece uma relação entre as matrizes estáveis positivas e as matrizes definidas positivas. Teorema 2.1.1 (Teorema de Lyapunov) [12] Sejam L, K ∈ Cn×n matrizes tais que K é uma matriz definida positiva. A matriz L é estável positiva se e só se existe uma matriz definida positiva H ∈ Cn×n que satisfaz a equação de Lyapunov LH + HL∗ = K. Uma das generalizações mais importantes deste teorema é o teorema geral da inércia. Este resultado é obtido por A. Ostrowski e H. Schneider [16] e, independentemente, por O. Taussky [20] que prova o caso particular K = In . Teorema 2.1.2 (Teorema geral da inércia) [16] Sejam L, K ∈ Cn×n matrizes tais que K é uma matriz definida positiva. Então existe uma matriz hermítica H ∈ Cn×n tal que LH + HL∗ = K se e só se δ(L) = 0. Além disso, se existir uma matriz hermítica H ∈ Cn×n tal que LH + HL∗ = K então In(L) = In(H). Repare-se que, para toda a matriz não singular R ∈ Cn×n , a equação de Lyapunov é equivalente à equação (RLR−1 )(RHR∗ ) + (RHR∗ )(RLR−1 )∗ = RKR∗ . (2.1) Atendendo a esta observação, o teorema anterior pode ser formulado da seguinte forma: Teorema 2.1.3 Sejam L, H ∈ Cn×n matrizes tais que H é uma matriz hermítica. Então existe uma matriz L0 ∈ Cn×n semelhante à matriz L e existe uma matriz H 0 ∈ Cn×n congruente com a matriz H tais que L0 H 0 + H 0 L0∗ é definida positiva se e só se δ(L) = 0 e In(L) = In(H). Demonstração. Sejam L, H ∈ Cn×n matrizes tais que H é uma matriz hermítica. Suponhamos que existe uma matriz L0 ∈ Cn×n semelhante à matriz L e que existe uma matriz H 0 ∈ Cn×n congruente com a matriz H tais que L0 H 0 + H 0 L0∗ > 0. Pelo teorema geral da inércia, δ(L0 ) = 0 e In(L0 ) = In(H 0 ). Donde, pelas propriedades da inércia (teorema 1.2.1) e pelo corolário 1.2.3, vem que δ(L) = 0 e In(L) = In(H). 16 2.1 Motivação Reciprocamente, suponhamos que δ(L) = 0 e In(L) = In(H). Novamente pelo teorema geral da inércia, existe uma matriz hermítica H 0 ∈ Cn×n tal que LH 0 + H 0 L∗ > 0 e In(L) = In(H 0 ). Logo In(H 0 ) = In(H), ou seja, a matriz H 0 é congruente com a matriz H, pelo corolário 1.2.3. Além disso, atendendo a (2.1), existe uma matriz L0 ∈ Cn×n semelhante à matriz L tal que a matriz L0 H 00 + H 00 L0∗ é definida positiva, onde H 00 ∈ Cn×n é uma matriz congruente às matrizes H e H 0. Assim, este teorema fornece um sistema completo de relações entre a classe de semelhança da matriz L e a classe de congruência da matriz H, quando K é uma matriz definida positiva e é válida a equação de Lyapunov. E sugere o problema base do nosso trabalho. Problema 1 Determinar um sistema completo de relações entre a classe de semelhança da matriz L e as classes de congruência das matrizes H e K quando é válida a equação de Lyapunov. Existem na literatura algumas soluções parciais. Por exemplo, o teorema geral da inércia é uma solução parcial do problema para o caso em que K é uma matriz definida positiva. Também o teorema de Lyapunov é uma solução parcial do problema para o caso em que K e H são matrizes definidas positivas. De facto, podemos enunciá-lo do seguinte modo: Teorema 2.1.4 Sejam L, H ∈ Cn×n matrizes tais que H é uma matriz definida positiva. Então existe uma matriz L0 ∈ Cn×n semelhante à matriz L e existe uma matriz definida positiva H 0 ∈ Cn×n congruente com a matriz H tais que a matriz L0 H 0 + H 0 L0∗ é definida positiva se e só se π(L) = n. Demonstração. Sejam L, H ∈ Cn×n matrizes tais que H é uma matriz definida positiva. Suponhamos que existe uma matriz L0 ∈ Cn×n semelhante à matriz L e que existe uma matriz definida positiva H 0 ∈ Cn×n congruente com a matriz H tais que L0 H 0 +H 0 L0∗ > 0. Pelo teorema de Lyapunov, L0 é uma matriz estável positiva, ou seja, π(L0 ) = n. Donde, pelas propriedades da inércia (teorema 1.2.1), vem que π(L) = n. O recíproco é aplicação directa do teorema 2.1.3, uma vez que δ(L) = 0. 17 2.1 Motivação O próximo resultado, obtido por D. Carlson e H. Schneider [2] motivados pelo teorema de Lyapunov enfraquecendo a condição “K é uma matriz definida positiva”, fornece um sistema completo de relações entre a classe de semelhança da matriz L e a classe de congruência da matriz H quando L é uma matriz não singular e K é uma matriz semi-definida positiva. No final da próxima secção é apresentada uma demonstração alternativa deste teorema enquanto corolário de um dos principais resultados (corolário 2.2.8). Teorema 2.1.5 [2] Seja L ∈ Cn×n uma matriz. Então existe uma matriz definida positiva H ∈ Cn×n tal que LH + HL∗ é semi-definida positiva se e só se a matriz L não tem divisores elementares com raízes imaginárias múltiplas e ν(L) = 0. Em [6], L. M. DeAlba e C. R. Johnson estudam uma variante do problema 1 e garantem que as inércias das matrizes L, H e K são independentes, sob certas condições, sempre que é válida a equação de Lyapunov e K é uma matriz indefinida. Observe-se que no artigo referido é estudada a equação de Stein. No entanto, pelo que foi visto anteriormente, facilmente se podem reescrever os resultados obtidos em análogos para a equação de Lyapunov, uma vez que são válidas as condições do teorema 1.3.5. Teorema 2.1.6 [6, Teorema 3] Sejam πk , νk ,δk , πh , νh , δh , π, ν, δ inteiros não negativos tais que πk > 0, νk ≤ πh + νh e πk + νk + δk = πh + νh + δh = π + ν + δ = n. Então existe uma matriz não singular L ∈ Cn×n e existem matrizes hermíticas H, K ∈ Cn×n tais que é válida a equação de Lyapunov LH + HL∗ = K e In(K) = (πk , νk , δk ), In(H) = (πh , νh , δh ) e In(L) = (π, ν, δ). 18 2.2 A nossa contribuição 2.2 A nossa contribuição 2.2.1 H é uma matriz definida positiva Nesta secção apresentamos um sistema completo de relações entre a classe de semelhança de L e a classe de congruência de K quando é válida a equação de Lyapunov, H é uma matriz definida positiva e, ou L é uma matriz não derrogatória ou K é uma matriz semi-definida positiva. Seguimos de perto [18]. Sejam L, K, H ∈ Cn×n matrizes. Tal como vimos anteriormente, LH + HL∗ = K é equivalente a (2.1). Assim, nas demonstrações, a matriz L é substituída, sempre que necessário, por uma qualquer matriz que lhe seja semelhante, sem que haja perda de generalidade. Denotamos por i(L) o número de polinómios invariantes não constantes de L. Denotamos por i+ (L) o número de polinómios invariantes de L com pelo menos uma raiz com parte real positiva, por i− (L) o número de polinómios invariantes de L com pelo menos uma raiz com parte real negativa e por i0 (L) o número de polinómios invariantes de L com pelo menos uma raiz com parte real nula. Denotamos ainda por i20 (L) o número de polinómios invariantes de L com pelo menos uma raiz com a parte real nula e multiplicidade superior ou igual a 2. O próximo teorema apresenta condições necessárias para a solução parcial do problema 1 quando H é uma matriz definida positiva. Teorema 2.2.1 Sejam L, K, H ∈ Cn×n matrizes tais que K é uma matriz hermítica e H é uma matriz definida positiva. Se LH + HL∗ = K então são válidas as seguintes condições: π(K) ≥ max{i+ (L), i20 (L)} (2.2) ν(K) ≥ max{i− (L), i20 (L)} (2.3) δ(K) ≥ 2i0 (L) − n (2.4) 19 2.2 A nossa contribuição π(K) + δ(K) ≥ i0 (L) (2.5) ν(K) + δ(K) ≥ i0 (L) (2.6) e o seguinte caso não é válido: (S) δ(L) > δ(K), i20 (L) = 0 e min{π(K), ν(K)} = 0. Demonstração. Sejam L, K, H ∈ Cn×n matrizes tais que K é uma matriz hermítica e H é uma matriz definida positiva. Suponhamos que LH + HL∗ = K. demonstração de ν(K) ≥ i− (L) Seja p = i− (L). Pelo lema 1.1.5, a forma normal de Jordan da matriz L é semelhante por permutação a uma matriz da forma λI 0 p , para algum λ ∈ C tal que <(λ) < 0. L0 = ∗ ∗ Note-se que, dada a cadeia de divisibilidade entre os polinómios invariantes, é possível escolher um valor próprio λ da matriz L tal que <(λ) < 0 e mg (λ) = p. Sem perda de generalidade, suponhamos que L = L0 . Particione-se a matriz H da seguinte forma: H11 H12 , com H11 ∈ Cp×p . H= ∗ H12 H22 (2.7) Então −2<(λ)H11 é uma submatriz principal da matriz −K e é definida positiva. Pelo entrelaçamento dos valores próprios, ν(K) = π(−K) ≥ p = i− (L). demonstração de π(K) ≥ i+ (L) Análoga à demonstração de anterior. demonstração de ν(K) ≥ i (L) e π(K) ≥ i (L) Seja p = i20 (L). Pelo lema 1.1.6, a forma normal de Jordan da matriz L é semelhante por permutação a uma matriz da forma λIp 0 0 0 L = Ip λIp 0 , para algum λ ∈ C tal que <(λ) = 0. ∗ ∗ ∗ 20 2.2 A nossa contribuição Novamente, dada a cadeia de divisibilidade entre os polinómios invariantes, é possível escolher um valor próprio λ da matriz L tal que <(λ) = 0, mg (λ) = p e ma (λ) ≥ 2. Sem perda de generalidade, suponhamos que L = L0 e particione-se a matriz H da seguinte forma: H H12 H13 11 ∗ H = H12 H22 H23 , onde H11 , H22 ∈ Cp×p . ∗ ∗ H13 H23 H33 Então Kp = 0 H11 ∗ H11 H12 + H12 é uma submatriz principal da matriz K. Como Kp é uma matriz não singular e 0p é uma sua submatriz principal, pelo entrelaçamento dos valores próprios, In(Kp ) = (p, p, 0). Consequentemente, ν(K) ≥ p = i20 (L) e π(K) ≥ p = i20 (L). E concluímos que as condições (2.2) e (2.3) são válidas. demonstração de δ(K) ≥ i (L) − n Seja p = i0 (L). Pelo lema 1.1.5, a forma normal de Jordan da matriz L é semelhante por permutação a uma matriz da forma λI 0 p , para algum λ ∈ C tal que <(λ) = 0. L0 = ∗ ∗ Sem perda de generalidade, suponhamos que L = L0 e particione-se a matriz H como em (2.7). Então 0p é uma submatriz principal da matriz K e, consequentemente, car K ≤ n − p. Logo, como K é uma matriz hermítica, δ(K) = n − car K ≥ p − car K ≥ p − (n − p) = 2i0 (L) − n. demonstração de π(K) + δ(K) ≥ i (L) e ν(K) + δ(K) ≥ i (L) Aplicando um raciocínio análogo ao da demonstração anterior, seja p = i0 (L). A forma normal de Jordan da matriz L é semelhante por permutação a uma matriz da forma λIp 0 , para algum λ ∈ C tal que <(λ) = 0. L0 = ∗ ∗ 21 2.2 A nossa contribuição Sem perda de generalidade, suponhamos que L = L0 e particione-se a matriz H como em (2.7). Então 0p é uma submatriz principal da matriz K e, portanto, car K ≤ n − p. Então: π(K) + δ(K) = π(K) + (n − car K) ≥ π(K) + (n − (n − p)) ≥ p = i0 (L). Analogamente, ν(K) + δ(K) ≥ ν(K) + (n − (n − p)) ≥ p = i0 (L). demonstração de (S) não é válido Por indução em n. Se n = 1, suponhamos que L = [l11 ] e H = [h11 ], para algum l11 ∈ C e para algum h11 ∈ R tal que h11 > 0. Então: LH + HL∗ = [2<(l11 )h11 ] e In(L) = In(LH + HL∗ ) = In(K). Logo o caso (S) não se verifica. Seja n ≥ 2. Com vista a uma contradição, suponhamos que (S) é válido. Então, como δ(L) > 0 e i20 (L) = 0, a matriz L admite pelo menos um valor próprio imaginário puro com multiplicidade 1 e, portanto, é semelhante a uma matriz da forma [λ] ⊕ L0 , para algum λ ∈ C tal que <(λ) = 0 e L0 ∈ C(n−1)×(n−1) . Sem perda de generalidade, suponhamos que L = [λ] ⊕ L0 e particione-se a matriz H da seguinte forma: h g ∈ Cn×n , onde H0 ∈ C(n−1)×(n−1) . H= ∗ g H0 Então K= Se g(λIn−1 + L∗0 ) 6= 0 então M = 0 g(λIn−1 + L∗0 ) (−λIn−1 + L0 )g ∗ L0 H0 + H0 L∗0 0 m12 m∗12 m22 . ∈ C2×2 , com m12 , m22 ∈ C \ {0}, é uma submatriz principal da matriz K tal que In(M ) = (1, 1, 0). Pelo entrelaçamento dos valores próprios, π(K) ≥ π(M ) = 1 e ν(K) ≥ ν(M ) = 1, 22 2.2 A nossa contribuição o que é absurdo pois, por (S), min{π(K), ν(K)} = 0. Suponhamos agora que g(λIn−1 + L∗0 ) = 0. Seja K0 = L0 H0 + H0 L∗0 ∈ C(n−1)×(n−1) . Note-se que i20 (L0 ) = 0 e, como (S) é válido, δ(L0 ) = δ(L) − 1 > δ(K) − 1 = δ(K0 ). Por hipótese de indução, (S) não é válido para a matriz K0 , logo min{π(K0 ), ν(K0 )} > 0. Mas π(K) = π(K0 ) e ν(K) = ν(K0 ) e obtemos de novo uma contradição. Concluímos assim que o caso (S) não é válido. Tal como vamos ver mais adiante, as condições (2.2) a (2.6) não são condições suficientes para quaisquer matrizes L e K. Chamamos τ -matriz a toda a matriz triangular superior T = [tij ] ∈ Cn×n tal que ti,i+1 6= 0, para todo i ∈ {1, . . . , n − 1}. Os próximos lemas envolvem este conceito e são úteis na demonstração do resultado principal desta secção. Lema 2.2.2 Sejam λ1 , ..., λn ∈ C ordenados por forma a que: se λi = λj , para algum i < j, então λi = λk , para todo k ∈ {i, . . . , j}. Seja T = ∗ λ1 .. 0 . λn ∈ Cn×n (2.8) uma τ -matriz. Então T é uma matriz não derrogatória. Demonstração. Começamos por mostrar que i(A) = n − RC (A), onde RC (A) = min car(αIn − A), para qualquer matriz A ∈ Cn×n (cf. [15]). α∈C 23 2.2 A nossa contribuição Suponhamos que a matriz A tem t valores próprios distintos, com 1 ≤ t ≤ n, e que os seus divisores elementares são da forma (x − λi )ri,1 , . . . , (x − λi )ri,si , para todo i ∈ {1, . . . , t}, onde 0 < ri,1 ≤ · · · ≤ ri,si . Então i(A) = max si . i∈{1,...,t} Como RC (A) é invariante para a semelhança, podemos considerar, sem perda de generalidade, a matriz A na forma normal de Jordan. Na matriz λj In − A existem sj linhas nulas e sj colunas nulas e a matriz que resulta da eliminação dessas linhas e dessas colunas é não singular e, portanto, car(λj In − A) = n − sj . Logo RC (A) = min car(αIn − A) = n − max si = n − i(A). α∈C i∈{1,...,t} Assim, em particular, RC (T ) = n − i(T ). Atendendo à forma da matriz T , RC (T ) = n − 1. Donde i(T ) = 1, isto é, T é uma matriz não derrogatória. Lema 2.2.3 Sejam a, b ∈ R e λ ∈ C. Seja ainda K ∈ C3×3 uma matriz hermítica tal que In(K) ≥ (1, 1, 0). Então, para todo z ∈ C \ {0}, existe y ∈ C tal que a matriz ia z y T = 0 ib 1 ∈ C3×3 0 0 λ satisfaz a condição In(T + T ∗ ) = In(K). Demonstração. Seja S= 1 0 0 1 −z −1 −y z −1 0 3×3 0 ∈C . 1 Então a matriz T + T ∗ é congruente com a matriz 0 z ⊕ 2<(λ) − 2<(yz −1 ) . S(T + T ∗ )S ∗ = z 0 24 2.2 A nossa contribuição Como In 0 z z 0 = (1, 1, 0), o valor de y pode ser escolhido por forma a que In(T + T ∗ ) = In(K). Lema 2.2.4 Seja L ∈ Cn×n uma matriz não derrogatória tal que π(L) = 0. Seja K ∈ Cn×n uma matriz hermítica. Sejam ainda λ1 , . . . , λn os valores próprios da matriz L ordenados por forma a que: se λi = λj , para algum i < j, então λi = λk , para todo k ∈ {i, . . . , j}; se <(λi ) = 0, para algum i, então <(λk ) = 0, para todo k ∈ {1, . . . , i}. Suponhamos ainda que o seguinte caso não é válido: (S0 ) n ≥ 2, δ(L) > 0 e min{π(K), ν(K)} = 0. Se são válidas as condições (2.2) a (2.6) então a matriz L é semelhante a uma τ -matriz da forma (2.8) e In(T + T ∗ ) = In(K). Demonstração. Por indução em n. Suponhamos n = 1. Como L é uma matriz não derrogatória, i(L) = 1 e i20 (L) = 0. Além disso, por hipótese, i+ (L) = 0. Assim In(L) = (0, 1, 0) ou In(L) = (0, 0, 1). Por outro lado, das condições (2.2) a (2.4) vem que π(K) = 0, ν(K) ≥ i− (L) e δ(K) ≥ 2i0 (L) − 1. Logo In(L) = In(L + L∗ ) = In(K). Suponhamos agora que n = 2. Então, para todo t ∈ C \ {0}, a matriz L é semelhante à matriz λ1 t ∈ C2×2 . T = 0 λ2 Note-se que L e T são matrizes não derrogatórias e têm os mesmos valores próprios. Por hipótese, ou <(λ1 ) = 0 ou <(λ1 ) < 0. Se <(λ1 ) = 0, então a matriz T + T ∗ tem uma submatriz nula de ordem 1 e det(T + T ∗ ) 6= 0. Pelo entrelaçamento dos valores próprios, In(T + T ∗ ) = (1, 1, 0), para todo t ∈ C \ {0}. 25 2.2 A nossa contribuição Por outro lado, pelas condições (2.2) a (2.4), sabemos que π(K) ≥ 1 e δ(K) ≥ 0. Além disso, como (S0 ) não é válido e δ(L) > 0, então min{π(K), ν(K)} 6= 0 e, consequentemente, ν(K) ≥ 1. O que permite concluir que In(K) = (1, 1, 0) = In(T + T ∗ ). Se <(λ1 ) < 0, pela forma como os valores próprios da matriz L foram ordenados e recordando que π(L) = 0, concluímos que <(λ2 ) < 0. Além disso, a condição (2.3) implica que ν(K) ≥ 1. Como (0, 2, 0), ∗ In(T + T ) = (1, 1, 0), (0, 1, 1), se se se p 0 < |t| < 2 <(λ1 )<(λ2 ) p |t| > 2 <(λ1 )<(λ2 ) p |t| = 2 <(λ1 )<(λ2 ) basta escolher t ∈ C \ {0} por forma a que In(T ∗ + T ) = In(K). Por fim, suponhamos que n ≥ 3. Seja L0 ∈ C(n−1)×(n−1) uma matriz não derrogatória cujos valores próprios são λ1 , . . . , λn−1 . Se n = 3 e In(K) = (1, 1, 1), seja K0 = diag(1, −1); caso contrário, seja K0 ∈ C(n−1)×(n−1) uma matriz hermítica tal que min{π(K), 1} ≤ π(K0 ) ≤ π(K) min{ν(K), 1} ≤ ν(K0 ) ≤ ν(K) min{δ(K), 1} ≤ δ(K0 ) ≤ δ(K). De acordo com a hipótese de indução, a matriz L0 é semelhante a uma τ -matriz da forma λ1 ∗ t ∗ ... ∈ C(n−1)×(n−1) , (2.9) T0 = = 0 λn−1 0 λn−1 com t ∈ C(n−2)×1 e In(T0 + T0∗ ) = In(K0 ). Como π(L) = 0, ou <(λn−1 ) < 0 ou <(λn−1 ) = 0. caso 1 Suponhamos que <(λn−1 ) < 0. Seja −1 In−2 −(2<(λn−1 )) t ∈ C(n−1)×(n−1) . X0 = 0 1 26 2.2 A nossa contribuição Então a matriz T0 + T0∗ é congruente com a matriz X0 (T0 + T0∗ )X0∗ = S ⊕ [2<(λn−1 )] ∈ C(n−1)×(n−1) , para alguma matriz S ∈ C(n−2)×(n−2) . Logo In(K0 ) = In(T0 + T0∗ ) = In(S) + In ([2<(λn−1 )]), ou seja, In(S) = In(K0 ) − (0, 1, 0). Seja Kr ∈ C2×2 uma matriz tal que In(Kr ) = In(K) − In(S) ≥ In(K0 ) − In(S) = (0, 1, 0). Por hipótese de indução, existe ν ∈ C \ {0} tal que a matriz λn−1 ν ∈ C2×2 R= 0 λn satisfaz a condição In(R + R∗ ) = In(Kr ). Seja T0 T = 0 (2<(λn−1 ))−1 νt ν λn ∈ Cn×n . Pelo lema 2.2.2, T é uma matriz não derrogatória e, consequentemente, T e L são matrizes semelhantes. Seja X = X0 ⊕ [1]. Então a matriz T + T ∗ é congruente com a matriz X(T + T ∗ )X ∗ = S ⊕ (R + R∗ ), o que mostra que In(T + T ∗ ) = In(S) + In(R + R∗ ) = In(K). caso 2 Suponhamos agora que <(λn−1 ) = 0. Então, pela forma como foram ordenados os valores próprios da matriz L, <(λi ) = 0, para todo i ∈ {1, . . . , n − 1}, ou seja, todas as entradas principais da matriz T0 + T0∗ são iguais a 0. Particione-se a matriz T0 da seguinte forma: T11 T12 ∈ C(n−1)×(n−1) , T0 = 0 T22 λn−2 t ∗ ∈ C2×2 , com t ∈ C \ {0}. Consequentemente, In(T2,2 + T2,2 onde T22 = )= 0 λn−1 (1, 1, 0). 27 2.2 A nossa contribuição Se n = 3, consideremos T0 = T22 . Como In(K) ≥ (1, 1, 0), pelo lema 2.2.3, existe y ∈ C tal que a matriz λ t y 1 T = 0 λ2 1 0 0 λ3 ∈ C3×3 é semelhante à matriz L e satisfaz a condição In(T + T ∗ ) = In(K). Suponhamos agora que n > 3. Seja ∗ −1 In−3 −T12 (T22 + T22 ) ∈ C(n−1)×(n−1) . X0 = 0 I2 Então a matriz T0 + T0∗ é congruente com a matriz ∗ ) ∈ C(n−1)×(n−1) , X0 (T0 + T0∗ )X0∗ = S ⊕ (T22 + T22 para alguma matriz S ∈ C(n−3)×(n−3) . Então ∗ In(K0 ) = In(T0 + T0∗ ) = In(S) + In(T22 + T22 ), ∗ ou seja, In(S) = In(K0 ) − In(T22 + T22 ). Novamente, pelo lema 2.2.3, existe y ∈ C tal que a matriz T22 R= 0 y 3×3 1 ∈C λn satisfaz a condição In(R + R∗ ) = In(K) − In(S). Note-se que ∗ In(K) − In(S) ≥ In(K0 ) − In(S) = In(T22 + T22 ) = (1, 1, 0). Seja ∗ −1 T11 T12 T12 (T22 + T22 ) M T = 0 0 T22 M 0 λn ∈ Cn×n , com M = [y 1]T ∈ C2×1 . Pelo lema 2.2.2, T é uma matriz não derrogatória e como as matrizes T e L têm os mesmos valores próprios, são semelhantes. Seja X = X0 ⊕ [1] ∈ Cn×n . Então a matriz T + T ∗ é congruente com a matriz X(T + T ∗ )X ∗ = S ⊕ (R + R∗ ), o que mostra que In(T + T ∗ ) = In(S) + In(R + R∗ ) = In(K). 28 2.2 A nossa contribuição Analogamente se mostra que: Lema 2.2.5 Seja L ∈ Cn×n uma matriz não derrogatória tal que ν(L) = 0. Seja K ∈ Cn×n uma matriz hermítica. Sejam ainda λ1 , . . . , λn os valores próprios de L ordenados de acordo com o lema 2.2.4. Suponhamos ainda que não é válido o caso (S0 ). Se são válidas as condições (2.2) a (2.6) então L é semelhante a uma τ -matriz da forma (2.8) e In(T + T ∗ ) = In(K). O próximo teorema é uma das soluções parciais do problema 1 a apresentar neste trabalho. Este resultado estabelece as relações entre a classe de semelhança da matriz L e a classe de congruência da matriz K quando é válida a equação de Lyapunov e H é uma matriz definida positiva e ou L é uma matriz não derrogatória ou K é uma matriz semi-definida positiva. Teorema 2.2.6 Sejam L, K ∈ Cn×n matrizes tais que K é uma matriz hermítica. Suponhamos que ou L é uma matriz não derrogatória ou K é uma matriz semi-definida positiva. Suponhamos ainda que não é válido o caso (S), referido no enunciado no teorema 2.2.1. Então existe uma matriz definida positiva H ∈ Cn×n tal que In(LH + HL∗ ) = In(K) se e só se são válidas as condições (2.2) a (2.6). Demonstração. Note-se que o teorema 2.2.1 é a condição suficiente. Resta apenas mostrar a condição necessária. Sejam L, K ∈ Cn×n matrizes tais que K é uma matriz hermítica e suponhamos não é válido o caso (S). Se a matriz L é escalar então é da forma L = λIn , para algum λ ∈ C. As condições (2.2) a (2.6) implicam que existe uma matriz definida positiva H ∈ Cn×n tal que In(K) = In(LH + HL∗ ). De facto, como In(L + L∗ ) = In(L), basta considerar H = In . Suponhamos agora que a matriz L é não escalar. A demonstração é feita por indução em n. Para n = 1, a demonstração é trivial. Suponhamos então que n ≥ 2. 29 2.2 A nossa contribuição caso 1 Suponhamos que L é uma matriz não derrogatória. Vamos considerar 3 casos: (i) π(L) = 0, (ii) ν(L) = 0 e (iii) π(L) > 0 e ν(L) = 0. Suponhamos que π(L) = 0 Sejam λ1 , . . . , λn os valores próprios da matriz L. Sem perda de generalidade, suponhamos que estão ordenados de acordo com o lema 2.2.4. Se não é válido o caso (S0 ) então, pelo lema 2.2.4, existe uma matriz não singular X ∈ Cn×n tal que a matriz L é semelhante à matriz T = X −1 LX e In(T + T ∗ ) = In(K). Por outro lado, In(T + T ∗ ) = In (X(T + T ∗ )X ∗ ) = In(LXX ∗ + XX ∗ L∗ ). Logo existe uma matriz definida positiva H = XX ∗ ∈ Cn×n tal que In(LH + HL∗ ) = In(K). Note-se que XX ∗ é uma matriz definida positiva pois x∗ (XX ∗ )x > 0, para todo x ∈ C \ {0}. Suponhamos agora que (S0 ) é válido, ou seja, δ(L) > 0 e min{π(K), ν(K)} = 0. Então, pelas condições (2.2) a (2.6), concluimos que i20 (L) = 0, i0 (L) = 1 e δ(K) > 0. Além disso, como (S) não é válido, temos que δ(K) ≥ δ(L). Sem perda de generalidade, suponhamos que <(λ1 ) = 0. Suponhamos que n = 2. Suponhamos ainda que <(λ2 ) = 0. Como i20 (L) = 0, vem que λ1 6= λ2 e a matriz L é semelhante à matriz diag(λ1 , λ2 ). Sem perda de generalidade, suponhamos L = diag(λ1 , λ2 ). Então In(L + L∗ ) = (0, 0, 2) = In(K), pois δ(K) ≥ δ(L) = 2. Suponhamos agora que <(λ2 ) 6= 0. Sendo π(L) = 0, <(λ2 ) < 0. Novamente, sem perda de generalidade, consideremos L = diag(λ1 , λ2 ). Como δ(K) ≥ δ(L) = 1 e i− (L) = 1, pela condição (2.3), vem que ν(K) ≥ 1 e é fácil verificar que In(L + L∗ ) = (0, 1, 1) = In(K). Suponhamos agora que n ≥ 3. Como <(λ1 ) = 0 e i20 (L) = 0, a matriz L é semelhante à matriz [λ1 ] ⊕ L0 , para alguma matriz L0 ∈ C(n−1)×(n−1) . Sem perda de generalidade, seja L = [λ1 ]⊕L0 . Seja K0 ∈ C(n−1)×(n−1) uma matriz hermítica tal que In(K0 ) = In(K)−(0, 0, 1). De acordo com a hipótese de indução, existe uma matriz definida positiva H0 ∈ C(n−1)×(n−1) tal que In(L0 H0 + H0 L∗0 ) = In(K0 ). Seja H = [1] ⊕ H0 ∈ Cn×n . Então In(LH + HL∗ ) = In(K) e a demonstração para o caso π(L) = 0 fica completa. Suponhamos que ν(L) = 0 Este caso demonstra-se de forma análoga ao anterior. 30 2.2 A nossa contribuição Suponhamos agora que ν(L) > 0 e π(L) > 0 Pelas condições (2.2) e (2.3), ν(K) > 0 e π(K) > 0. Assim a matriz L é semelhante a uma matriz da forma L+ ⊕ L− , onde L+ ∈ Cn+ ×n+ é uma matriz não derrogatória e ν(L+ ) = 0, L− ∈ Cn− ×n− é uma matriz não derrogatória e π(L− ) = δ(L− ) = 0, com n+ + n− = n. Sejam π+ , ν+ , δ+ , π− , ν− e δ− inteiros definidos por: π+ = max{1, min{π(K), n+ } − 1}, ν+ = min{ν(K), n+ − π+ }, δ+ = n + − π + − ν + , ν− = min{ν(K), n− }, π− = min{π(K), n− − ν− }, δ− = n − − π − − ν − . É fácil verificar que qualquer um dos inteiros π+ , ν+ , δ+ , π− , ν− e δ− é não negativo. Além disso, as seguintes desigualdades são satisfeitas: π+ ≥ 1, ν+ ≥ 1, (2.10) a menos que n+ = 1, (2.11) ν− ≥ 1, (2.12) max{π+ , π− } ≤ π(K) ≤ min{n+ + π− , n− + π+ }, (2.13) max{ν+ , ν− } ≤ ν(K) ≤ min{n+ + ν− , n− + ν+ }, (2.14) π(K) − ν(K) ≤ π+ + π− , (2.15) ν(K) − π(K) ≤ ν+ + ν− . (2.16) De acordo com a hipótese de indução, existem matrizes definidas positivas H+ ∈ Cn+ ×n+ e H− ∈ Cn− ×n− tais que In(L+ H+ +H+ L∗+ ) = (π+ , ν+ , δ+ ) e In(L− H− +H− L∗− ) = (π− , ν− , δ− ). Dadas as condições (2.13) a (2.16) e, de acordo com o teorema 1.2.4, existe uma matriz X ∈ Cn+ ×n− tal que a matriz L+ H+ + X ∗ H+ L∗+ X L− H− + H− L∗− ∈ Cn×n (2.17) 31 2.2 A nossa contribuição tem a mesma inércia de K. Como as matrizes L+ e L− não têm valores próprios comuns, podemos supor, sem perda de generalidade, que −1 L+ XH− . L= 0 L− Seja H = H+ ⊕ H− ∈ Cn×n . Então a matriz LH + HL∗ tem a forma (2.17) e, portanto, In(LH + HL∗ ) = In(K). caso 2 Suponhamos que K é uma matriz semi-definida positiva e L é uma matriz derrogatória. Sem perda de generalidade, consideremos a matriz L na sua forma normal companheira e suponhamos que L = L0 ⊕ Lr , com L0 = C(f1 ) ⊕ · · · ⊕ C(fr−1 ) ∈ Cn0 ×n0 e Lr = C(fr ) ∈ Cnr ×nr , onde f1 | · · · |fr são os polinómios invariantes da matriz L e n0 + nr = n. Sejam π0 , δ0 , πr e δr inteiros definidos por: π0 = max{i+ (L0 ), δ(Lr ) + π(K) − nr }, δ0 = n 0 − π 0 , πr = π(K) − π0 , δr = nr − πr . É fácil verificar que estes inteiros são não negativos. Como K ≥ 0 e ν(K) = 0, pela condição (2.3), temos que i− (L) = i20 (L) = 0. Além disso, como (S) não é válido, δ(L) ≤ δ(K). Não é difícil verificar que π0 ≥ i+ (L0 ), δ0 ≥ δ(L0 ) ≥ i0 (L0 ) ≥ 2i0 (L0 ) − n0 , πr ≥ i+ (Lr ), δr ≥ δ(Lr ) ≥ i0 (Lr ) ≥ 2i0 (Lr ) − nr . De acordo com a hipótese de indução, existem matrizes definidas positivas H0 ∈ Cn0 ×n0 e Hr ∈ Cnr ×nr tais que In(L0 H0 + H0 L∗0 ) = (π0 , 0, δ0 ) e In(Lr Hr + Hr L∗r ) = (πr , 0, δr ). Seja H = H0 ⊕ Hr ∈ Cn×n . Então In(LH + HL∗ ) = In(K). 32 2.2 A nossa contribuição O teorema 2.2.6 nem sempre é válido quando L é uma matriz derrogatória e a matriz K não é semi-definida positiva, como se pode verificar no exemplo seguinte. Exemplo 2.2.7 Seja L = λ1 Ip ⊕ λ2 Iq ∈ Cn×n , onde λ1 , λ2 ∈ C são tais que λ1 6= λ2 e <(λ1 ) = <(λ2 ) = 0 e p+q = n. Suponhamos que é válido o teorema 2.2.6, ou seja, suponhamos que existe uma matriz definida positiva H11 H12 ∈ Cn×n , H= ∗ H12 H22 tal que In(LH + HL∗ ) = In(K). Então LH + HL∗ = com H11 ∈ Cp×p , 0 (λ1 − λ2 )H12 ∗ (λ2 − λ1 )H12 0 (2.18) e pelas condições (iv) e (v) do teorema 1.2.4, π(K) = ν(K). Suponhamos que n = 5, p = 3 e q = 2 e seja K ∈ C5×5 uma matriz hermítica tal que In(K) = (2, 1, 2). Então, como 2 = δ(L) = δ(K) e min{π(K), ν(K)} = 1 6= 0, o caso (S) não é válido. Por outro lado, as condições (2.2) a (2.6) são válidas. E, no entanto, o teorema 2.2.6 não é válido pois, neste caso, 2 = π(K) 6= ν(K) = 1. O próximo resultado é o teorema 2.1.5 formulado como corolário do teorema anterior, apresentando assim uma demonstração alternativa à dada em [2, Corolário III]. Corolário 2.2.8 Seja L ∈ Cn×n uma matriz. Então existe uma matriz definida positiva H ∈ Cn×n tal que LH + HL∗ ≥ 0 se e só se a matriz L não tem divisores elementares com raízes imaginárias múltiplas e ν(L) = 0. Demonstração. Seja L ∈ Cn×n uma matriz. Suponhamos que existe uma matriz definida positiva H ∈ Cn×n tal que a matriz K = LH +HL∗ é semi-definida positiva, ou seja, π(K) > 0, ν(K) = 0 e δ(K) > 0. De acordo com o teorema 2.2.1, max{i− (L), i20 (L)} = 0, ou seja: 33 2.2 A nossa contribuição i− (L) = 0, isto é, ν(L) = 0, i20 (L)} = 0, isto é, a matriz L não admite divisores elementares com raízes imaginárias múltiplas. Reciprocamente, suponhamos que a matriz L não admite divisores elementares com raízes imaginárias múltiplas e ν(L) = 0. Seja K ∈ Cn×n uma matriz hermítica tal que In(K) = (i+ (L), 0, n − i+ (L)). É fácil verificar que as condições (2.2) a (2.6) são válidas e δ(L) ≤ δ(K). Então, pelo teorema 2.2.6, existe uma matriz definida positiva H ∈ Cn×n tal que In(LH + HL∗ ) = In(K). Donde LH + HL∗ ≥ 0. 2.2.2 L é uma matriz não derrogatória Nesta secção apresentamos condições para as classes de congruência das matrizes K e H quando é válida a equação de Lyapunov, L é uma matriz não derrogatória e K é uma matriz indefinida. O nosso resultado generaliza os resultados obtidos por L. M. DeAlba em [7]. Seguiremos de perto [19]. O próximo resultado é uma generalização do lema 2.2.3. Lema 2.2.9 Sejam a ∈ R e λ, µ ∈ C. Seja ainda K ∈ C3×3 uma matriz hermítica tal que In(K) ≥ (1, 1, 0). Então, para todo z ∈ C \ {0}, existe y ∈ C tal que a matriz λ 1 y T = 0 ia z ∈ C3×3 0 0 µ satisfaz a condição In(T + T ∗ ) = In(K). 34 2.2 A nossa contribuição Demonstração. Seja S ∈ Cn×n uma matriz definida por: 1 z −1 (2<(µ)z −1 − y) −z −1 S= 0 1 0 0 0 1 . Então a matriz T + T ∗ é congruente com a matriz i h 0 z 2 . S(T + T ∗ )S ∗ = 2<(λ) + 2<(µ) z −1 − 2< yz −1 ⊕ z 2<(µ) Assim h 2 In(T + T ∗ ) = In 2<(λ) + 2<(µ) z −1 − 2< yz −1 i + In 0 z z 2<(µ) e, portanto, é possível escolher o valor de y por forma a que In(T + T ∗ ) = In(K). Lema 2.2.10 Sejam L, K ∈ Cn×n matrizes tais que L uma matriz não derrogatória e In(K) ≥ (1, 1, 0). Sejam ainda λ1 , . . . , λn os valores próprios de L ordenados por forma a que: se λi = λj , para algum i < j, então λi = λk , para todo k ∈ {i, . . . , j}, se <(λi ) < 0, para algum i, então <(λk ) < 0, para todo k ∈ {1, . . . , i}, se <(λi ) > 0, para algum i, então <(λk ) > 0, para todo k ∈ {i, . . . , n}. Então existe uma τ -matriz T = [tij ] ∈ Cn×n tal que tii = λi , para todo i ∈ {1, . . . , n}, e In(T + T ∗ ) = In(K). Demonstração. Por indução em n. Se n = 1, a demonstração é imediata. Se n = 2, o resultado é fácil de provar. De facto, In(K) = (1, 1, 0) e, além disso, a matriz L é semelhante a uma τ -matriz T ∈ C2×2 da forma λ1 t , para algum t ∈ C \ {0}. T = 0 λ2 35 2.2 A nossa contribuição Note-se que as matrizes T e L têm os mesmos valores próprios e são ambas não derrogatórias. Suponhamos que <(λ1 ) = 0 ou <(λ2 ) = 0; então, para todo t ∈ C\{0}, tem-se que In(T +T ∗ ) = (1, 1, 0). Suponhamos que <(λ2 ) < 0, então <(λ1 ) < 0 e p (0, 2, 0) se 0 < |t| < 2 <(λ1 )<(λ2 ) p In(T + T ∗ ) = . (1, 1, 0) se |t| > 2 <(λ1 )<(λ2 ) p (0, 1, 1) se |t| = 2 <(λ )<(λ ) 1 2 Basta escolher t de modo a obter a inércia pretendida. Suponhamos agora que <(λ2 ) > 0. Se <(λ1 ) > 0, o raciocínio é análogo ao anterior, ou seja, p (2, 0, 0) se 0 < |t| < 2 <(λ1 )<(λ2 ) p In(T + T ∗ ) = . (1, 1, 0) se |t| > 2 <(λ1 )<(λ2 ) p (1, 0, 1) se |t| = 2 <(λ )<(λ ) 1 2 e basta escolher t de modo a obter a inércia pretendida. Se <(λ1 ) < 0, atendendo à definição de valores próprios, concluímos que In(T +T ∗ ) = (1, 1, 0). Suponhamos agora que n ≥ 3. Se π(L) = 0 ou ν(L) = 0, obtemos casos particulares do lema 2.2.4 e do lema 2.2.5, respectivamente. Note-se que o caso (S0 ) não é válido pois min{π(K), ν(K)} ≥ 1 e as condições (2.2) a (2.6) são satisfeitas uma vez que i+ (L), i− (L), i0 (L), i20 (L) ∈ {0, 1}. Suponhamos então que π(L) > 0 e ν(L) > 0. Como n ≥ 3, π(L) + δ(L) ≥ 2 ou ν(L) + δ(L) ≥ 2. Sem perda de generalidade, suponhamos que π(L) + δ(L) ≥ 2. Sejam n− = ν(L) e n+ = π(L) + δ(L). Então a matriz L é semelhante a uma matriz da forma L− ⊕ L+ ∈ Cn×n , onde L− ∈ Cn− ×n− é uma matriz não derrogatória e tem valores próprios λ1 , . . . , λn− e L+ ∈ Cn+ ×n+ é uma matriz não derrogatória e tem valores próprios λn− +1 , . . . , λn . Desta construção resulta que ou <(λn− +1 ) > 0 ou <(λn− +1 ) = 0. 36 2.2 A nossa contribuição caso 1 Suponhamos que <(λn− +1 ) > 0. Sejam π+ , ν+ , δ+ , π− , ν− e δ− inteiros definidos por: ν− = min{n− , ν(K)}, ν+ = ν(K) − ν− , (2.19) π+ = min{π(K), n+ − ν+ }, (2.20) π− = π(K) − π+ , (2.21) δ− = n− − ν− − π− , (2.22) δ+ = n+ − ν+ − π+ . (2.23) Não é difícil verificar que ν− , π+ são inteiros positivos e ν+ , π− , δ− , δ+ são inteiros não negativos. Do lema 2.2.4, vem que existe uma τ -matriz T− ∈ Cn− ×n− com diagonal principal λ1 , . . . , λn− tal que In(T− + T−∗ ) = (π− , ν− , δ− ). Analogamente, pelo lema 2.2.5, existe uma τ -matriz T+ ∈ Cn+ ×n+ com diagonal principal λn− +1 , . . . , λn tal que In(T+ + T+∗ ) = (π+ , ν+ , δ+ ). Suponhamos que T− = T+ = ∗ t− 0 λn− λn− +1 t+ 0 ∗ ∈ Cn− ×n− para algum t− ∈ C(n− −1)×1 , para algum t+ ∈ C1×(n+ −1) . (2.24) ∈ Cn+ ×n+ Sejam X− ∈ Cn− ×n− e X+ ∈ Cn+ ×n+ matrizes definidas, respectivamente, por −1 In− −1 −(2<(λn− )) t− X− = 0 1 1 0 . X+ = −1 ∗ −(2<(λn− +1 )) t+ In+ −1 (2.25) Então a matriz T− + T−∗ é congruente com a matriz X− (T− + T−∗ )X−∗ = S− ⊕ [2<(λn− )], (2.26) 37 2.2 A nossa contribuição para alguma matriz S− ∈ C(n− −1)×(n− −1) . E a matriz T+ + T+∗ é congruente com a matriz X+ (T+ + T+∗ )X+∗ = [2<(λn− +1 )] ⊕ S+ , para alguma matriz S+ ∈ C(n+ −1)×(n+ −1) . Donde In(S− ) = (π− , ν− − 1, δ− ) e In(S+ ) = (π+ − 1, ν+ , δ+ ). Sejam T, X ∈ Cn×n matrizes definidas por X = X− ⊕ X+ e (2<(λn− ))−1 t− (4<(λn− )<(λn− +1 ))−1 t− t+ T− T = 1 (2<(λn− +1 ))−1 t+ 0 T+ . Então a matriz T + T ∗ é congruente com a matriz 2<(λn− ) 1 ⊕ S+ . X(T + T ∗ )X ∗ = S− ⊕ 1 2<(λn− +1 ) Logo In(T + T ∗ ) = In(S− ) + (1, 1, 0) + In(S+ ) = In(K), ou seja, existe uma τ -matriz T nas condições pretendidas. caso 2 Suponhamos agora que <(λn− +1 ) = 0. Definam-se os inteiros π+ , ν+ , δ+ , π− , ν− e δ− da forma a seguir indicada. Se ν(K) = 1, sejam ν− = 1, ν+ = 1, defina-se π+ como em (2.20), seja π− = max{0, π(K) − π+ − 1}, e defina-se δ− e δ+ como em (2.22) e (2.23), respectivamente. Se ν(K) ≥ 2, seja ν− = min{n− , ν(K) − 1} e defina-se ν+ , π+ , π− , δ− e δ+ como em (2.19) a (2.23), respectivamente. Novamente, não é difícil verificar que, em qualquer um dos casos, ν− , ν+ , π+ são inteiros positivos e π− , δ− , δ+ são inteiros não negativos. Analogamente ao caso anterior, aplicando o lema 2.2.4 e o lema 2.2.5, respectivamente, existe uma τ -matriz T− ∈ Cn− ×n− com diagonal principal λ1 , . . . , λn− tal que In(T− +T−∗ ) = (π− , ν− , δ− ) 38 2.2 A nossa contribuição e existe uma τ -matriz T+ ∈ Cn+ ×n+ com diagonal principal λn− +1 , . . . , λn tal que In(T+ +T+∗ ) = (π+ , ν+ , δ+ ). Suponhamos que a matriz T− é particionada tal como em (2.24) e suponhamos que T11 T12 ∈ Cn+ ×n+ , onde T11 ∈ C2×2 . T+ = 0 T22 ∗ ) = Como <(λn− +1 ) = 0 e a entrada (1, 2) da matriz T11 é não nula, vem que In(T11 + T11 (1, 1, 0). Defina-se a matriz X− como em (2.25) e seja X+ ∈ Cn+ ×n+ a matriz definida por: I2 0 . X+ = ∗ ∗ −1 −T12 (T11 + T11 ) In+ −2 Então a matriz T− + T−∗ é congruente com a matriz definida em (2.26) e a matriz T+ + T+∗ é congruente com a matriz ∗ ) ⊕ S+ , X+ (T+ + T+∗ )X+∗ = (T11 + T11 para alguma matriz S+ ∈ C(n+ −2)×(n+ −2) . Donde In(S− ) = (π− , ν− − 1, δ− ) e In(S+ ) = (π+ − 1, ν+ − 1, δ+ ). De acordo com o lema anterior (lema 2.2.9), existe y ∈ C tal que a matriz λn− 1 y ∈ C3×3 R= 0 T11 satisfaz a condição In(R + R∗ ) = In(K) − In(S− ) − In(S+ ) ≥ (1, 1, 0). Seja M = [ 1 y ] ∈ C1×2 e seja ∗ −1 (2<(λn− ))−1 t− M (2<(λn− ))−1 t− M (T11 + T11 ) T12 T− ∗ −1 T = M M (T11 + T11 ) T12 0 T+ ∈ Cn×n . Seja ainda X = X− ⊕ X+ ∈ Cn×n . Então a matriz T + T ∗ é congruente com a matriz X(T + T ∗ )X ∗ = S− ⊕ (R + R∗ ) ⊕ S+ . e, portanto, In(T + T ∗ ) = In(K). 39 2.2 A nossa contribuição Observe-se que as matrizes L e T definidas no lema anterior são semelhantes. De facto, pelo lema 2.2.2, T é uma matriz não derrogatória e, além disso, tem os mesmos valores próprios que a matriz L; logo é semelhante à matriz L. O próximo teorema é o resultado principal desta secção e apresenta uma solução do problema 1 para o caso em que L é uma matriz não derrogatória e K é uma matriz indefinida. Teorema 2.2.11 Sejam L, K ∈ Cn×n matrizes tais que L é uma matriz não derrogatória e In(K) ≥ (1, 1, 0). Sejam ainda πh e νh inteiros não negativos tais que πh + νh = n. Então existe uma matriz hermítica H ∈ Cn×n tal que In(H) = (πh , νh , 0) e In(LH + HL∗ ) = In(K). Demonstração. Sejam L, K ∈ Cn×n matrizes tais que L é uma matriz não derrogatória e In(K) ≥ (1, 1, 0). demonstração se δ(L) = n Sejam λ1 , . . . , λn os valores próprios da matriz L, ordenados de acordo com o lema 2.2.10. Escolha-se um número real negativo h tal que, para todo i ∈ {1, . . . , n}, se λi 6= 0 então hλi não é valor próprio da matriz L. De acordo com o lema 2.2.10, existe uma τ -matriz T ∈ Cn×n cuja diagonal principal é hλ1 , . . . , hλνh , λνh +1 , . . . , λn e tal que In(T + T ∗ ) = In(K). Seja H = (hIνh ) ⊕ Iπh ∈ Cn×n . Então In(H) = (πh , νh , 0), a matriz T H −1 é semelhante à matriz L e In((T H −1 )H + H(T H −1 )∗ ) = In(K). (2.27) demonstração se δ(L) =0 Vamos considerar dois casos: νh ≤ π(L) e νh > π(L). caso 1 Suponhamos que νh ≤ π(L). Sejam λ1 , . . . , λn os valores próprios da matriz L, ordenados de acordo com o lema 2.2.10. Analogamente à demonstração anterior, escolha-se um número real negativo h tal que, para todo i ∈ {1, . . . , n}, hλi não é valor próprio da matriz L. De acordo com o lema 2.2.10, existe uma τ -matriz T ∈ Cn×n cuja diagonal principal é λ1 , . . . , λν(L) , hλν(L)+1 , . . . , hλν(L)+νh , λν(L)+νh +1 , . . . , λn , e tal que In(T + T ∗ ) = In(K). 40 2.2 A nossa contribuição Seja H = Iν(L) ⊕ (hIνh ) ⊕ Iπ(L)−νh ∈ Cn×n . Então In(H) = (πh , νh , 0), a matriz T H −1 é semelhante à matriz L e a condição (2.27) é válida. caso 2 Suponhamos agora que νh > π(L). Então πh = n − νh < n − π(L) = ν(L) = π(−L). De acordo com o caso anterior, existe uma matriz X ∈ Cn×n semelhante à matriz −L e existe uma matriz hermítica H ∈ Cn×n tal que In(H) = (νh , πh , 0) e In(XH + HX ∗ ) = In(K). Então a matriz −X é semelhante à matriz L, In(−H) = (πh , νh , 0) e In((−X)(−H) + (−H)(−X ∗ )) = In(K). demonstração se 0< δ(L) < n A matriz L é semelhante a uma matriz da forma L0 ⊕ L1 , onde L0 ∈ Cn0 ×n0 é uma matriz não derrogatória tal que δ(L0 ) = n0 , com 0 < n0 < n, e L1 ∈ Cn1 ×n1 é uma matriz não derrogatória tal que δ(L1 ) = 0. Sem perda de generalidade, suponhamos que π(K) ≥ ν(K). O caso π(K) ≤ ν(K) é análogo. Escolham-se inteiros não negativos p0 , n0 , p1 , n1 tais que p0 +n0 = n0 , p1 +n1 = n1 , p0 +p1 = πh e n0 + n1 = νh . Definam-se ainda os inteiros não negativos π0 , ν0 , δ0 , π1 , ν1 , δ1 e as matrizes hermíticas H0 ∈ Cn0 ×n0 e H1 ∈ Cn1 ×n1 da forma a seguir indicada. Se n0 = 1, escolha-se h0 ∈ {1, −1} tal que a matriz H0 = [h0 ] satisfaz a condição In(H0 ) = (p0 , n0 , 0) (2.28) e sejam π0 , ν0 , δ0 inteiros que satisfaçam a condição In(L0 H0 + H0 L∗0 ) = (π0 , ν0 , δ0 ). (2.29) Se n0 ≥ 2, definam-se π0 = min{π(K), n0 − 1}, ν0 = min{ν(K), n0 − π0 }, δ0 = n0 − π0 − ν0 . Então min{π0 , ν0 } > 0 e δ0 ≥ 0; como δ(L0 ) = n0 , pela demonstração do caso δ(L) = n, existe uma matriz hermítica H0 ∈ Cn0 ×n0 tal que são válidas as condições (2.28) e (2.29). 41 2.2 A nossa contribuição Se n1 = 1, escolha-se h1 ∈ {1, −1} tal que a matriz H1 = [h1 ] satisfaz a condição In(H1 ) = (p1 , n1 , 0), (2.30) e sejam π1 , ν1 , δ1 inteiros que satisfazem a condição In(L1 H1 + H1 L∗1 ) = (π1 , ν1 , δ1 ). (2.31) Se n1 ≥ 2, definam-se π1 = min{π(K), n1 − 1}, ν1 = min{ν(K), n1 − π1 }, δ1 = n1 − π1 − ν1 . Então min{π1 , ν1 } > 0 e δ1 ≥ 0; como δ(L1 ) = 0, pela demonstração do caso δ(L) = 0, existe uma matriz hermítica H1 ∈ Cn1 ×n1 tal que as condições (2.30) e (2.31) são válidas. Em qualquer dos casos, pelo teorema 1.2.4, existe uma matriz X ∈ Cn0 ×n1 tal que ∗ L0 H0 + H0 L0 X = In(K). In X∗ L1 H1 + H1 L∗1 Note-se que: π(K) + ν(K) ≤ n, max{π0 , π1 } ≤ π(K) ≤ min{n0 + π1 , n1 + π0 }, max{ν0 , ν1 } ≤ ν(K) ≤ min{n0 + ν1 , n1 + ν0 }, π(K) − ν(K) ≤ π0 + π1 , ν(K) − π(K) ≤ ν0 + ν1 . Como as matrizes L0 e L1 não têm valores próprios em comum, a matriz L é semelhante à matriz L0 XH1−1 ∈ Cn×n . 0 L1 Sem perda de generalidade, suponhamos que a matriz L tem essa forma. Seja H = H0 ⊕ H1 ∈ Cn×n . Então In(H) = (πh , νh , 0) e In(LH + HL∗ ) = In(K). 42 Capítulo 3 Equação de Stein “Research means going out into the unknown with the hope of finding something new to bring home. If you know what you are going to do, or even to find there, then it is not research at all, then it is only a kind of honourable occupation.” A. Szent-Györgyi O objectivo deste capítulo é apresentar um estudo análogo ao do capítulo anterior mas para a equação de Stein. Este estudo é feito tendo por base uma relação entre a equação de Lyapunov e a equação de Stein, que permite generalizar para o caso discreto os resultados obtidos no caso contínuo. Os principais teoremas deste capítulo podem ser encontrados em [18, 19]. 3.1 Motivação Nesta secção, introduzimos a teoria e os resultados que motivam a formulação do problema para a equação de Stein e apresentamos também soluções parciais desse mesmo problema. 43 3.1 Motivação Tal como é referido no primeiro capítulo, em 1952, Stein publica um resultado análogo ao de Lyapunov mas relativo à estabilidade de sistemas discretos em termos de equações matriciais. Uma das demonstrações possíveis desse resultado é referida no Capítulo 1 e baseia-se numa definição específica da matriz H dada por (1.2). Outra demonstração, mais imediata, tem por base o teorema de Lyapunov e a relação entre as duas equações (teorema 1.3.5), envolvendo a transformada de Cayley, anteriormente definida. Teorema 3.1.1 (Teorema de Stein) [12] Sejam S, K ∈ Cn×n matrizes tais que K é uma matriz definida positiva. A matriz S é estável relativamente ao círculo unitário se e só se existe uma matriz definida positiva H ∈ Cn×n que satisfaz a equação de Stein H − SHS ∗ = K. Demonstração. Sejam S, K ∈ Cn×n matrizes tais que K é uma matriz definida positiva. Suponhamos que a matriz S é estável relativamente ao círculo unitário. Então, pelo corolário 1.3.4, a sua transformada de Cayley C(S) é estável positiva e, pelo teorema de Lyapunov, existe matriz definida positiva H ∈ Cn×n tal que C(S)H + HC(S)∗ = 2−1 (In + S)K(In + S)∗ . Logo H − SHS ∗ = K, pelo teorema 1.3.5. Reciprocamente, suponhamos que existe uma matriz definida positiva H ∈ Cn×n tal que é válida a equação de Stein H − SHS ∗ = K > 0. Então existe uma matriz não singular X ∈ Cn×n tal que C(S)H + HC(S)∗ = XKX ∗ > 0. Aplicando o teorema de Lyapunov, a matriz C(S) é estável positiva e, consequentemente, a matriz S é estável relativamente ao círculo unitário (corolário 1.3.4). Observe-se que aplicando a transformada de Cayley, podemos transferir para a equação de Stein resultados relativos à equação de Lyapunov desde que −1 não seja valor próprio da matriz S. Por exemplo, o teorema geral da inércia pode ser reescrito para o caso discreto da seguinte forma: 44 3.1 Motivação Teorema 3.1.2 (Teorema geral da inércia relativamente ao círculo unitário) [12] Sejam S, K ∈ Cn×n matrizes tais que K é uma matriz definida positiva. Então existe uma matriz hermítica H ∈ Cn×n tal que H − SHS ∗ = K se e só se δ1 (S) = 0. Além disso, se existir uma matriz hermítica H ∈ Cn×n tal que H − SHS ∗ = K então In1 (S) = In(H). Demonstração. Seja S ∈ Cn×n uma matriz. Suponhamos que existe uma matriz hermítica H ∈ Cn×n tal que H − SHS ∗ > 0. Pelo teorema 1.3.5, a matriz C(S)H + HC(S)∗ também é definida positiva. Aplicando o teorema geral da inércia, δ(C(S)) = 0, ou seja, δ1 (S) = 0, pelo teorema 1.3.3. O recíproco é análogo. Se δ1 (S) = 0 então δ(C(S)) = 0 e, pelo teorema geral da inércia, C(S)H + HC(S)∗ > 0, ou seja, a matriz H − SHS ∗ é definida positiva. Além disso, se C(S)H + HC(S)∗ > 0, pelo teorema geral da inércia, In(C(S)) = In(H) e, pelo teorema 1.3.3, In1 (S) = In(C(S)); donde In1 (S) = In(H). Tal como já vimos a inércia relativamente ao círculo unitário é invariante para a semelhança. Além disso, para toda a matriz não singular R ∈ Cn×n , H − SHS ∗ = K é equivalente a RHR∗ − (RSR−1 )(RHR∗ )(RSR−1 )∗ = RKR∗ . (3.1) Atendendo a esta observação podemos formular o teorema anterior da seguinte forma: Teorema 3.1.3 Sejam S, H ∈ Cn×n matrizes tais que H é uma matriz hermítica. Então existe uma matriz S 0 ∈ Cn×n semelhante a S e existe uma matriz H 0 ∈ Cn×n congruente com H tais que H 0 − S 0 H 0 S 0∗ é definida positiva se e só se δ1 (S) = 0 e In1 (S) = In(H). Demonstração. Sejam S, H ∈ Cn×n matrizes tais que H é uma matriz hermítica. Suponhamos que existe uma matriz S 0 ∈ Cn×n semelhante a S e existe uma matriz H 0 ∈ Cn×n congruente com H tais que H 0 − S 0 H 0 S 0∗ > 0. Pelo teorema 3.1.2, δ1 (S 0 ) = 0 e In(S 0 ) = In(H 0 ). Pelas propriedades da inércia relativamente ao círculo unitário (teorema 1.2.1) e pelo corolário 1.2.3, δ1 (S) = 0 e In1 (S) = In(H). 45 3.1 Motivação Reciprocamente, suponhamos que δ1 (S) = 0 e In1 (S) = In(H). Pelo teorema 3.1.2, existe uma matriz hermítica H 0 ∈ Cn×n tal que H 0 −SH 0 S ∗ > 0 e In1 (S) = In(H 0 ). Logo In(H 0 ) = In(H), ou seja, a matriz H 0 é congruente com a matriz H, pelo corolário 1.2.3. Atendendo a (3.1), existe uma matriz S 0 ∈ Cn×n semelhante a S tal que H 00 − S 0 H 00 S 0∗ é definida positiva, onde H 00 ∈ Cn×n é uma matriz congruente às matrizes H e H 0 . Este resultado sugere o problema correspondente para equação de Stein e análogo ao anteriormente formulado para a equação de Lyapunov: Problema 2 Encontrar um sistema completo de relações entre a classe de semelhança da matriz S e as classes de congruência das matrizes H e de K quando é válida a equação de Stein H − SHS ∗ = K. Note-se que o teorema geral da inércia relativamente ao círculo unitário é uma solução parcial para este problema, para o caso em que K é uma matriz definida positiva: fornece um sistema completo de relações entre a classe de semelhança da matriz S e a classe de congruência da matriz H, quando K é uma matriz semi-definida positiva. O próprio teorema de Stein é uma solução parcial do problema, para o caso em que K e H são matrizes definidas positivas. De facto, o teorema de Stein pode ser enunciado do seguinte modo: Teorema 3.1.4 Sejam S, H ∈ Cn×n matrizes tais que H é uma matriz definida positiva. Então existe uma matriz S 0 ∈ Cn×n semelhante à matriz S e existe uma matriz definida positiva H 0 ∈ Cn×n congruente com a matriz H tais que a matriz H 0 − S 0 H 0 S 0∗ é definida positiva se e só se π1 (S) = n. Demonstração. Sejam S, H ∈ Cn×n matrizes tais que H é uma matriz definida positiva. Suponhamos que existe uma matriz S 0 ∈ Cn×n semelhante à matriz S e que existe uma matriz definida positiva H 0 ∈ Cn×n congruente com a matriz H tais que H 0 − S 0 H 0 S 0∗ > 0. Pelo teorema de Stein, S 0 é uma matriz estável relativamente ao círculo unitário, ou seja, π1 (S 0 ) = n. Donde, pelas propriedades da inércia (teorema 1.2.1), vem que π1 (S) = n. 46 3.1 Motivação O recíproco é aplicação directa do teorema anterior. De facto, se π1 (S) = n então δ1 (S) = 0, ou seja, pelo teorema 3.1.3, existe uma matriz S 0 ∈ Cn×n semelhante à matriz S e existe uma matriz definida positiva H 0 ∈ Cn×n congruente com a matriz H tais que H 0 − S 0 H 0 S 0∗ > 0. Os resultados apresentadas em [6] e [7] também relacionam as inércia das matrizes que compõem a equação de Stein dentro de certas condições sendo, portanto, resultados associados a uma variante do problema 2. Em [6, Teorema 3], L. M. DeAlba e C. R. Johnson, supondo que K é uma matriz indefinida, provam que qualquer conjunto de inércias In1 (S), In(H) e In(K) pode ocorrer quando é válida a equação de Stein, desde que sejam satisfeitas certas condições. Teorema 3.1.5 [6, Teorema 3] Sejam πk , νk ,δk , πh , νh , δh , π, ν e δ inteiros não negativos tais que πk + νk + δk = πh + νh + δh = π + ν + δ = n, πk > 0 e νk ≤ πh + νh . Então existe uma matriz não singular S ∈ Cn×n e existem matrizes hermíticas K, H ∈ Cn×n tais que In(K) = (πk , νk , δk ), In(H) = (πh , νh , δh ) e In1 (S) = (π, ν, δ). Em [7], L. M. DeAlba resolve o problema 2 para o caso em que K é uma matriz indefinida, S é uma matriz não derrogatória de um certo tipo que apenas admite valores próprios cujo módulo é 1 e H é uma matriz não singular. Num primeiro resultado, mostra que se S é uma matriz não derrogatória com n valores próprios distintos de módulo igual a 1 não só é possível escolher a inércia da matriz K como não existe nenhuma relação entre In1 (S) e In(H). Teorema 3.1.6 [7, Teorema 1] Seja S ∈ Cn×n uma matriz não derrogatória com n valores próprios distintos todos de módulo igual a 1. Sejam πh , νh , πk , νk e δk inteiros não negativos tais que πh + νn = n = πk + νk + δk e min{πk , νk } > 0. Então existe uma matriz hermítica H ∈ Cn×n tal que In(H) = (πh , νh , 0) e In(H − SHS ∗ ) = (πk , νk , δk ). O segundo teorema estuda o caso em que S é uma matriz não derrogatória e é um bloco de Jordan de tamanho n associado a uma valor próprio de módulo é 1. 47 3.2 A nossa contribuição Neste caso, as inércias possíveis para a matriz K são aquelas que permitem característica máxima ou igual a n − 1 e novamente não existe nenhuma relação entre In1 (S) e In(H). Teorema 3.1.7 [7, Teorema 2] Seja S = Jn (λ) ∈ Cn×n , para algum λ ∈ C tal que |λ| = 1. Sejam ainda πh , νh , πk , νk e δk inteiros não negativos tais que πh + νh = n = πk + νk + δk , min{πk , νk } > 0 e δk = 0 ou δk = 1. Então existe uma matriz hermítica H ∈ Cn×n tal que In(H) = (πh , νh , 0) e In(H − SHS ∗ ) = (πk , νk , δk ). Por fim, no último resultado, L. M. DeAlba considera S uma matriz não derrogatória e soma directa de dois blocos de Jordan de tamanho 1 e n − 1 associados a dois valores próprios distintos de módulo igual a 1. As conclusões são idênticas ao teorema anterior. Teorema 3.1.8 [7, Teorema 3] Seja S = [λ1 ] ⊕ Jn−1 (λ2 ) ∈ Cn×n , com λ1 , λ2 ∈ C tais que λ1 6= λ2 e |λ1 | = |λ2 | = 1. Sejam πh , νh , πk , νk e δk inteiros não negativos tais que πh + νh = n = πk + νk + δk , min{πk , νk } > 0 e δk = 0 ou δk = 1. Então existe uma matriz hermítica H ∈ Cn×n tal que In(H) = (πh , νh , 0) e In(H − SHS ∗ ) = (πk , νk , δk ). Estes três resultados são generalizados na próxima secção. 3.2 3.2.0 A nossa contribuição Lemas Preliminares Nesta secção demonstramos lemas que permitem reformular as soluções do problema 1, expostas no Capítulo 2, em soluções para o problema 2. Atendendo à utilidade da transformada de Cayley de uma matriz na generalização de resultados (cf. [7]), surge a necessidade de alargar esse conceito por forma a aplicá-lo sem qualquer restrição. Recorde-se que a relação entre a equação de Lyapunov e a equação de Stein que envolve a transformada de Cayley só é válida se −1 não é valor próprio da matriz em causa. 48 3.2 A nossa contribuição Nesta secção, consideramos S ∈ Cn×n uma matriz e θ ∈ C um número complexo tais que o módulo de θ é 1 e a matriz θIn + S ∈ Cn×n é não singular. Chamamos transformada generalizada de Cayley da matriz S, e denotamos por Cθ (S), à matriz definida por Cθ (S) = (θIn + S)−1 (θIn − S) ∈ Cn×n . Algumas relações importantes entre a matriz S e a sua transformada generalizada de Cayley são apresentadas nos próximos lemas. Lema 3.2.1 Sejam f1 , . . . , fn ∈ C[x] polinómios invariantes da matriz S tais que f1 | · · · |fn e fi (x) = (x − µ1 )qi,1 · · · (x − µt )qi,t , com qi,j ∈ N0 , para todo i ∈ {1, . . . , n} e para todo j ∈ {1, . . . , t}. Então a matriz Cθ (S) tem polinómios invariantes g1 , . . . , gn ∈ C[x] tais que g1 | · · · |gn e gi (x) = (x − λ1 )qi,1 · · · (x − λt )qi,t , para todo i ∈ {1, . . . , n}, onde λj = (θ + µj )−1 (θ − µj ), para todo j ∈ {1, . . . , t}. Demonstração. Sejam f1 | · · · |fn os polinómios invariantes da matriz S tais que fi (x) = (x − µ1 )qi,1 · · · (x − µt )qi,t , com qi,j ∈ N0 , para todo i ∈ {1, . . . , n} e para todo j ∈ {1, . . . , t}. Então µ1 , . . . , µt são os valores próprios da matriz S, sem repetições. Seja J = Jp1 (µk1 ) ⊕ · · · ⊕ Jps (µks ) a forma normal de Jordan da matriz S onde, para cada r ∈ {1, . . . , s}, Jpr (µkr ) é um bloco de Jordan de ordem pr × pr associado ao valor próprio µkr , com kr ∈ {1, . . . , t}. Então existe uma matriz não singular X ∈ Cn×n tal que J = X −1 SX. Donde X −1 Cθ (S)X = X −1 (θIn + S)−1 XX −1 (θIn − S)X = (θIn + X −1 SX)−1 (θIn − X −1 SX) = (θIn + J)−1 (θIn − J) = Cθ (J) = Cθ (Jp1 (µk1 )) ⊕ · · · ⊕ Cθ (Jps (µks )) . 49 3.2 A nossa contribuição Para cada r ∈ {1, . . . , s}, a matriz xIpr − Cθ (Jpr (µkr )) ∈ Cpr ×pr [x] é equivalente à matriz (θIpr + Jpr (µkr )) x − θIpr + Jpr (µkr ) ∈ Cpr ×pr [x]. (3.2) De facto, θIpr + Jpr (µkr ) ∈ Cpr ×pr [x] é uma matriz não singular e (θIpr + Jpr (µkr )) (xIpr − Cθ (Jpr (µkr ))) Ipr = (θIpr + Jpr (µkr ))x − θIpr + Jpr (µkr ). A matriz representada em (3.2) tem duas submatrizes de ordem (pr − 1) × (pr − 1) com determinantes (x + 1)pr −1 e ((θ + µkr )x − (θ − µkr ))pr −1 : basta eliminar a primeira linha e a primeira coluna ou eliminar a última linha e a última coluna, respectivamente. Estes determinantes são primos relativos. O que permite concluir que a matriz Cθ (Jpr (µkr )) tem pr − 1 polinómios invariantes constantes, ou seja, os seus polinómios invariantes são 1, . . . , 1, (x − λkr )pr , com λkr = (θ + µkr )−1 (θ − µkr ). Logo os divisores elementares da matriz Cθ (S) são (x − λk1 )p1 , . . . , (x − λks )ps e, portanto, os seus polinómios invariantes g1 | · · · |gn , onde gi (x) = (x − λ1 )qi,1 · · · (x − λt )qi,t , para todo i ∈ {1, . . . , n} . com λj = (θ + µj )−1 (θ − µj ), para todo j ∈ {1, . . . , t}. Observe-se que, se µ1 , . . . , µn são os valores próprios da matriz S, então λ1 , . . . , λn são os valores próprios da matriz Cθ (S), onde λk = (θ + µk )−1 (θ − µk ), para todo k ∈ {1, . . . , n}. O próximo teorema permite concluir que a inércia da matriz S relativamente ao círculo unitário e a inércia da sua transformada generalizada de Cayley Cθ (S) são iguais. Lema 3.2.2 Seja µ ∈ C tal que θ + µ 6= 0 e seja λ = (θ + µ)−1 (θ − µ) ∈ C. Então |µ| < 1 (respectivamente, |µ| = 1, |µ| > 1) se e só se <(λ) > 0 (respectivamente, <(λ) = 0, <(λ) < 0). 50 3.2 A nossa contribuição Demonstração. Sejam µ, λ ∈ C tais que λ = (θ+µ)−1 (θ−µ). Suponhamos que µ = a+ib ∈ C, com a, b ∈ R. Então: λ = (θ + µ)−1 (θ − µ) = |θ + µ|−2 (θ + µ)(θ − µ) = |θ + µ|−2 1 − |µ|2 + 2i(a=(θ) − b<(θ)) Assim <(λ) = |θ + µ|−2 (1 − |µ|2 ). Como |θ + µ|−2 > 0, <(λ) > 0 (respectivamente, <(λ) = 0, <(λ) > 0) se e só se |µ| < 1 (respectivamente, |µ| = 1, |µ| > 1). Corolário 3.2.3 A inércia da transformada generalizada de Cayley da matriz S é igual à inércia da matriz S relativamente ao círculo unitário. Simbolicamente, In(Cθ (S)) = In1 (S). A demonstração do próximo resultado garante que uma matriz S satisfaz a equação de Stein H − SHS ∗ = K se e só se a sua transformada generalizada de Cayley Cθ (S) satisfaz a equação da Lyapunov Cθ (S)H − HCθ (S)∗ = K 0 , onde K 0 é uma matriz congruente com a matriz K. Lema 3.2.4 Para toda a matriz hermítica H ∈ Cn×n , In(H − SHS ∗ ) = In(Cθ (S)H + H(Cθ (S))∗ ). Demonstração. Sejam S, H ∈ Cn×n matrizes tais que H é uma matriz hermítica. Seja ainda 1 X ∈ Cn×n a matriz definida por X = 2− 2 (θIn + S). Então X é uma matriz não singular e H − SHS ∗ = X (Cθ (S)H + H(Cθ (S))∗ ) X ∗ , ou seja, as matrizes H − SHS ∗ e Cθ (S)H + H(Cθ (S))∗ são congruentes. Pelo corolário 1.2.3, concluímos que In(H − SHS ∗ ) = In(Cθ (S)H + H(Cθ (S))∗ ). Já estamos em condições de generalizar para a equação de Stein os resultados do Capítulo 2. 51 3.2 A nossa contribuição 3.2.1 H é uma matriz definida positiva Nesta secção apresentamos condições necessárias e suficientes que relacionam a classe de semelhança da matriz S e a classe de congruência da matriz K quando é válida a equação de Stein, sabendo que H é uma matriz definida positiva e ou S é uma matriz não derrogatória ou K é uma matriz semi-definida positiva. Seja S ∈ Cn×n uma matriz. Ao longo desta secção, consideramos θ ∈ C um número complexo cujo módulo é 1 e tal que a matriz θIn + S ∈ Cn×n é não singular. Denotamos por i(S) o número de polinómios invariantes não constantes de S. Seja i⊕ (S) (respectivamente, i (S), i1 (S)) o número de polinómios invariantes da matriz S com pelo menos uma raiz com módulo inferior (respectivamente, superior, igual) a 1. Denotamos ainda por i21 (S) o número de polinómios invariantes da matriz S com pelo menos uma raiz com módulo igual a 1 e multiplicidade superior ou igual a 2. Pelo lema 3.2.1 e pelo lema 3.2.2, podemos concluir que: i⊕ (S) = i+ (Cθ (S)), i (S) = i− (Cθ (S)), i1 (S) = i0 (Cθ (S)) e i21 (S) = i20 (Cθ (S)). O próximo resultado apresenta condições necessárias para a solução do problema 2 quando H é uma matriz definida positiva. Teorema 3.2.5 Sejam S, K, H ∈ Cn×n matrizes tais que K é uma matriz hermítica e H é uma matriz definida positiva. Se H − SHS ∗ = K então são válidas as seguintes condições: π(K) ≥ max{i⊕ (S), i21 (S)} (3.3) ν(K) ≥ max{i (S), i21 (S)} (3.4) δ(K) ≥ 2i1 (S) − n (3.5) π(K) + δ(K) ≥ i1 (S) (3.6) ν(K) + δ(K) ≥ i1 (S) (3.7) 52 3.2 A nossa contribuição e o seguinte caso não é válido: (S1 ) δ1 (S) > δ(K), i21 (S) = 0 e min{π(K), ν(K)} = 0. Demonstração. Sejam S, H, K ∈ Cn×n matrizes tais que K é uma matriz hermítica e H é uma matriz definida positiva. Se H − SHS ∗ = K então, pelo lema 3.2.4, existe uma matriz não singular X ∈ Cn×n tal que Cθ (S)H + H(Cθ (S))∗ = XKX ∗ . Logo, como In(K) = In(XKX ∗ ), pelo teorema 2.2.1 vem que: π(K) ≥ max{i+ (Cθ (S)), i20 (Cθ (S))} = max{i⊕ (S), i21 (S)} ν(K) ≥ max{i− (Cθ (S)), i20 (Cθ (S))} = max{i (S), i21 (S)} δ(K) ≥ 2i0 (Cθ (S)) − n = 2i1 (S) − n π(K) + δ(K) ≥ i0 (Cθ (S)) = i1 (S) ν(K) + δ(K) ≥ i0 (Cθ (S)) = i1 (S). E provamos que são válidas as condições (3.3) a (3.7). Além disso, o caso (S1 ) não é válido. De facto, como (S) não é válido, então também não é válido que δ1 (S) = δ(Cθ (S)) > δ(K), i21 (S) = i20 (Cθ (S)) = 0 e min{π(K), ν(K)} = min{π(XKX ∗ ), ν(XKX ∗ )} = 0. Repare-se que, pelo lema 3.2.1, se S é uma matriz não derrogatória então também a matriz Cθ (S) é não derrogatória. E, portanto, usando os mesmos argumentos da última demonstração, o lema 2.2.4 e o lema 2.2.5 podem ser adaptados para a equação de Stein. Lema 3.2.6 Seja S ∈ Cn×n uma matriz não derrogatória tal que π1 (S) = 0. Seja K ∈ Cn×n uma matriz hermítica. Sejam ainda µ1 , . . . , µn os valores próprios da matriz S ordenados por forma a que: se µi = µj , para algum i < j, então µi = µk , para todo k ∈ {i, . . . , j}; se |µi | = 1, para algum i, então |µk | = 1, para todo k ∈ {1, . . . , i}. Suponhamos ainda que o seguinte caso não é válido: 53 3.2 A nossa contribuição (S01 ) n ≥ 2, δ1 (S) > 0 e min{π(K), ν(K)} = 0. Se são válidas as condições (3.3) a (3.7) então a matriz S é semelhante a uma τ -matriz da forma µ ∗ 1 . . T = (3.8) . ∈ Cn×n 0 µn e In(In − T T ∗ ) = In(K). Demonstração. Seja S ∈ Cn×n uma matriz não derrogatória tal que π1 (S) = 0. Então Cθ (S) é uma matriz não derrogatória e π(Cθ (S)) = 0. Se µ1 , . . . , µn são os valores próprios da matriz S então λ1 , . . . , λn são os valores próprios da matriz Cθ (S), onde λk = (1 + µk )−1 (1 − µk ), para todo k ∈ {1, . . . , n}, e claramente, pelo lema 3.2.2, estão ordenados de acordo com o lema 2.2.4. Além disso, como (S01 ) não é válido então também não é válido (S0 ). Se são válidas as condições (3.3) a (3.7) também são válidas as condições (2.2) a (2.6) considerando a matriz L = Cθ (S). Então, pelo lema 2.2.4, a matriz Cθ (S) é semelhante a uma τ -matriz da forma µ1 ∗ λ1 ∗ . . n×n . . Cθ (T ) = . . ∈ Cn×n ∈ C , onde T = λn µn e In(Cθ (T ) + Cθ (T )∗ ) = In(K). Mas, pelo lema 3.2.4, In(Cθ (T ) + Cθ (T )∗ ) = In(In − T T ∗ ). Além disso, a matriz S é semelhante à matriz T , uma vez que são ambas não derrogatórias e têm os mesmo valores próprios. Analogamente, se mostra que: Lema 3.2.7 Seja S ∈ Cn×n uma matriz não derrogatória tal que ν1 (S) = 0. Seja K ∈ Cn×n uma matriz hermítica. Sejam ainda µ1 , . . . , µn os valores próprios da matriz S ordenados de acordo com o lema 3.2.6. Suponhamos que não é válido o caso (S01 ). 54 3.2 A nossa contribuição Se são válidas as condições (3.3) a (3.7) então a matriz S é semelhante a uma τ -matriz da forma (3.8) e In(In − T T ∗ ) = In(K). O próximo teorema é uma das soluções parciais do problema 2 a apresentar nesta tese. Este teorema apresenta as relações entre a classe de semelhança da matriz S e a classe de congruência da matriz K quando H > 0 e ou i(S) = 1 ou K ≥ 0. Teorema 3.2.8 Sejam S, K ∈ Cn×n matrizes tais que K é uma matriz hermítica. Suponhamos que ou S é uma matriz não derrogatória ou K é uma matriz semi-definida positiva. Suponhamos ainda que não é válido o caso (S1 ). Então existe uma matriz definida positiva H ∈ Cn×n tal que In(H − SHS ∗ ) = In(K) se e só se são válidas as condições (3.3) a (3.7). Demonstração. Seja S ∈ Cn×n uma matriz e suponhamos que o caso (S1 ) não é válido. Então o caso (S) não é válido, considerando L = Cθ (S). Suponhamos que S é uma matriz não derrogatória. Então a matriz Cθ (S) também é não derrogatória. Pelo lema 3.2.4, In(H − SHS ∗ ) = In(Cθ (S)H + HCθ (S)∗ ). Por outro lado, pelo teorema 2.2.6, existe uma matriz definida positiva H ∈ Cn×n tal que In(Cθ (S)H + HCθ (S)∗ ) = In(K) se e só se são válidas as condições (2.2) a (2.6), considerando L = Cθ (S), ou seja, se e só se se verificam as condições (3.3) a (3.7). Se K é uma matriz semi-definida positiva e S é uma matriz derrogatória, o raciocínio é análogo. O teorema 3.2.8 nem sempre é válido quando S é uma matriz derrogatória e a matriz K não é semi-definida positiva, como se pode verificar no exemplo apresentado a seguir. 55 3.2 A nossa contribuição Exemplo 3.2.9 Seja S = µ1 Ip ⊕ µ2 Iq ∈ Cn×n , onde ν1 , ν2 ∈ C são tais que ν1 6= ν2 e |µ1 | = |µ2 | = 1 e p + q = n. Suponhamos que é válido o teorema 3.2.8, ou seja, suponhamos que existe uma matriz definida positiva H= H11 H12 ∗ H12 H22 ∈ Cn×n , tal que In(H − SHS ∗ ) = In(K). Então H − SHS ∗ = (1 − 0 com H11 ∈ Cp×p (1 − µ1 µ2 )H12 ∗ µ1 µ2 )H12 0 (3.9) e, pelas condições (iv) e (v) do teorema 1.2.4, π(K) = ν(K). Suponhamos que p = 3 e q = 2 e seja K ∈ C5×5 uma matriz hermítica tal que In(K) = (2, 1, 2). Então, como 2 = δ1 (S) = δ(K) e min{π(K), ν(K)} = 1 6= 0, o caso (S1 ) não é válido. Por outro lado, as condições (3.3) a (3.7) são válidas. E, no entanto, o teorema 3.2.8 não é válido pois, neste caso, 2 = π(K) 6= ν(K) = 1. O próximo resultado é um corolário do teorema 3.2.8 e a sua demonstração aplica raciocínios análogos aos efectuadas nas demonstrações feitas ao longo desta secção. Corolário 3.2.10 Seja S ∈ Cn×n uma matriz. Então existe uma matriz definida positiva H ∈ Cn×n tal que a matriz H − SHS ∗ é semi-definida positiva se e só se a matriz S não tem divisores elementares com raízes múltiplas com módulo igual a 1 e ν1 (S) = 0. Demonstração. Suponhamos que existe uma matriz definida positiva H ∈ Cn×n tal que H − SHS ∗ ≥ 0. Pelo lema 3.2.4, a matriz Cθ (S)H + HCθ (S)∗ também é semi-definida positiva e, aplicando o corolário 2.2.8, a matriz Cθ (S) não tem divisores elementares com raízes imaginárias múltiplas e ν(Cθ (S)) = 0. Logo, pelo corolário 3.2.3 e pelo lema 3.2.1, respectivamente, ν1 (S) = 0 e a matriz S não tem divisores elementares com raízes múltiplas com módulo igual a 1. Para o recíproco, o raciocínio é análogo. 56 3.2 A nossa contribuição 3.2.2 S é uma matriz não derrogatória Nesta secção resolvemos o problema 2 para o caso em que S é uma matriz não derrogatória, H é uma matriz não singular e K é uma matriz com pelo menos um valor próprio com módulo inferior a 1 e um valor próprio com módulo superior a 1. Este resultado generaliza resultados obtidos por L. M. DeAlba em [7]. Sejam S, K, H ∈ Cn×n matrizes tais que K e H são matrizes hermíticas. É possível adaptar o lema 2.2.10 obtido para a equação de Lyapunov quando foi resolvido o caso particular análogo do problema 1. Lema 3.2.11 Sejam S, K ∈ Cn×n matrizes tais que S é uma matriz não derrogatória e In(K) ≥ (1, 1, 0). Sejam ainda µ1 , . . . , µn os valores próprios da matriz S ordenados por forma a que: se µi = µj , para algum i < j, então µi = µk , para todo k ∈ {i, . . . , j}, se |µi | > 1, para algum i, então |µk | > 1, para todo k ∈ {1, . . . , i}, se |µi | < 1, para algum i, então |µk | < 1, para todo k ∈ {i, . . . , n}. Então existe uma τ -matriz T = [tij ] ∈ Cn×n tal que tii = µi , para todo i ∈ {1, . . . , n}, e In(In − T T ∗ ) = (πk , νk , δk ). Demonstração. Sejam µ1 , . . . , µn os valores próprios da matriz S ordenados de acordo com o enunciado. Então, pelo lema 3.2.2, os valores próprios da matriz Cθ (S) são λ1 , . . . , λn , com λk = (θ + µk )−1 (θ − µk ), para todo k ∈ {1, . . . , n} e estão ordenados de acordo com o lema 2.2.10. Logo existe uma τ -matriz T = [tij ] ∈ Cn×n tal que tii = µi , para todo i ∈ {1, . . . , n}, e In(Cθ (T ) + Cθ (T )∗ ) = In(K). Por outro lado, pelo lema 3.2.4, In(Cθ (T ) + Cθ (T )∗ ) = In(In − T T ∗ ). Logo existe uma τ -matriz T nas condições pretendidas. O próximo teorema é o resultado principal desta secção e fornece uma solução parcial para o problema 2 para o caso em que S é uma matriz não derrogatória e In(K) ≥ (1, 1, 0). 57 3.2 A nossa contribuição Teorema 3.2.12 Sejam S, K ∈ Cn×n matrizes tais que S é uma matriz não derrogatória e In(K) ≥ (1, 1, 0). Sejam ainda πh e νh inteiros não negativos tais que πh + νh = n. Então existe uma matriz hermítica H ∈ Cn×n tal que In(H) = (πh , νh , 0) e In(H − SHS ∗ ) = In(K). Demonstração. Sejam S, K ∈ Cn×n matrizes tais que S é uma matriz não derrogatória e In(K) ≥ (1, 1, 0). Pelo lema 3.2.1, a matriz Cθ (S) é não derrogatória. Como min{π(K), ν(K)} > 0, pelo teorema 2.2.11, existe uma matriz hermítica H ∈ Cn×n tal que In(H) = (πh , νh , 0) e In(Cθ (S)H + HCθ (S)∗ ) = In(K). Por outro lado, pelo lema 3.2.4, In(Cθ (S)H + HCθ (S)∗ ) = In(H − SHS ∗ ) e provamos assim o pretendido. 58 Bibliografia [1] B. E. Cain, E. M. Sá, The inertia of a Hermitian matrix having prescribed complementary principal submatrices, Linear Algebra Appl. 37 (1981), 161–171. {9} [2] D. Carlson, H. Schneider, Inertia theorems for matrices: the semidefinite case, J. Math. Anal. Appl. 6 (1963), 430–446. {18,33} [3] C. T. Chen, A generalization of the inertia theorem, SIAM J. Appl. Math. 25 (1973), 158– 161. {−} [4] B. N. Datta, Matrix equations, matrix polynomial, and the number of zeros of a polynomial inside the unit circle, Linear and Multilinear Algebra 9 (1980), 63–68. {−} [5] B. N. Datta, Stability and Inertia, Linear Algebra Appl. 302-303 (1999), 563–600. {10,11} [6] L. M. DeAlba, C. R. Johnson, Possible inertia combinations in the Stein and Lyapunov equations, Linear Algebra Appl. 222 (1995), 227–240. {18,47} [7] L. M. DeAlba, Inertia of the Stein transformation with respect to some nonderogatory matrices, Linear Algebra Appl. 241/243 (1996), 191–201. {34,47,48,57} [8] F. Gantmacher, The Theory of Matrices, Volume One, Chelsea Publishing · New York; 1977 {2,10} [9] T. Haynes, Stable matrices, the Cayley transform, and convergent matrices, Internat. J. Math. Math. Sci. 14 (1991), 77–81. {−} 59 Bibliografia [10] R. Horn, C. Johnson, Topics in Matrix Analysis, Cambridge University Press · Cambridge; 1991. {2} [11] R. Horn, C. Johnson, Matrix Analysis, Cambridge University Press · Cambridge; 1994. {2,4,10} [12] P. Lancaster, M. Tismenetsky, The Theory of Matrices with Applications · Second Edition, Academic Press, Inc. · California; 1985. {2,5,6,9,16,44,45} [13] R. Loewy, On the ranges of Lyapunov Transformations II, Linear and Multilin. Algebra 2 (1974), 227–237. {−} [14] R. Loewy, An inertia theorem for Lyapunov’s equation and the dimension of a controllability space, Linear Algebra Appl. 260 (1997), 1–7. {−} [15] G. N. Oliveira, E. M. Sá and J. A. Dias da Silva, On the eigenvalues of the matrix A + XBX −1 , Linear Multilin. Algebra 5 (1977), 119–128. {23} [16] A. Ostrowski, H. Schneider, Some theorems on the inertia of general matrices, J. Math. Anal. Appl. 4 (1962), 72–84. {16} [17] P. Stein, On the ranges of two functions of positive matrices, J. Algebra 2 (1965), 350–353. {13} [18] F. C. Silva, R. Simões, On the Lyapunov and the Stein Equations, Linear Algebra Appl. 420 (2007), 329–338. {15,19,43} [19] F. C. Silva, R. Simões, On the Lyapunov and the Stein Equations, II Linear Algebra Appl. 426 (2007), 305–311. {15,34,43} [20] O. Taussky, A generalization of a theorem of Lyapunov, SIAM J. Appl. Math. 9 (1961), 640–643. {16} [21] O. Taussky, Matrices C with C n → 0, J. Algebra 1 (1964), 5–10. {13} 60 Bibliografia [22] H. Wimmer, On the Ostrowski-Schneider inertia theorem, J. Math. Anal. Appl. 42 (1973), 164–169. {−} [23] H. Wimmer, Inertia theorem for matrices, controllability and linear vibrations, Linear Algreba Appl. 8 (1974), 337–343. {−} [24] H. Wimmer, A. Ziebur, Remarks on inertia theorems for matrices, Czech. Math. J. 25 (1975), 556–561. {−} [25] F. Zhang, Matrix Theory: Basics Results and Techniques, Springer-Verlarg · New York; 1999. {2,3} 61 Índice remissivo Cayley transformada de, 13 transformada generalizada de, 49 divisor determinantal, 4 elementar, 4 forma normal de, 6 Lyapunov equação de, 11 teorema de, 16 matriz τ , 23 espectro, 3 companheira, 5 estável de permutação, 3 matriz, 12 definida negativa, 7 sistema contínuo, 10 definida positiva, 7 sistema discreto, 11 derrogatória, 3 estável, 12 factor invariante, 4 forma normal companheira, 5 de Jordan, 6 inércia, 8 estável positiva, 12 estável relativamente ao círculo unitário, 13 hermítica, 4 indefinida, 7 não derrogatória, 3 relativamente ao círculo unitário, 8 semi-definida negativa, 7 relativamente ao eixo imaginário, 8 semi-definida positiva, 7 Jordan bloco de, 5 matrizes congruentes, 3 equivalentes, 2 62 Índice remissivo semelhantes, 3 semelhantes por permutação, 3 multiplicidade algébrica, 3 geométrica, 3 polinómio característico, 3 invariante, 4 Schur decomposição de, 3 Stein equação de, 12 teorema de, 44 Sylvester teorema da inércia de, 9 valores próprios, 3 entrelaçamento dos, 4 63