1.1 Revisões de conceitos

T
e
s
eo
r
i
e
n
t
a
d
ap
e
l
o
Pr
o
f
.
Do
ut
o
rF
e
r
n
a
n
d
oAbe
l
d
aCo
n
c
e
i
ç
ã
oSi
l
v
a
“encontrar um problema, ver a sua beleza e apaixonar-se por ele;
casar e viver feliz com ele até que a morte nos separe − a não
ser que encontrem um outro problema ainda mais fascinante,
ou, evidentemente, a não ser que obtenhamos uma solução.
Mas, mesmo que obtenhamos uma solução,
poderemos então descobrir, para nosso deleite,
a existência de toda uma família de problemas-filhos,
encantadores ainda que talvez difíceis,
para cujo bem-estar poderemos trabalhar,
com um sentido, até ao fim dos nossos dias.”
K. Popper
agradecimentos
ao Professor Doutor Fernando, pelas ideias e pela orientação durante
a realização deste trabalho.
aos responsáveis pelo Centro de Estruturas Lineares e Combinatórias (CELC), pelo apoio financeiro para participação em reuniões
científicas no país e no estrangeiro.
aos colegas do departamento de Matemática da Universidade
de Aveiro e a todos os que nele trabalham, pelo companheirismo e
pelas excelentes condições de trabalho.
a todos aqueles que me deram sugestões, críticas e esclarecimentos para uma maior simplicidade e clareza na escrita deste texto,
em particular ao Professor Doutor Paolo Vettori, pela disponibilidade
e pelo apoio.
aos Amigos que, estando sempre presentes, me deram força
para continuar nos momentos mais difíceis.
aos meus Pais e às minhas Manas, pelo carinho e pelo apoio
constantes em todas as fases deste trabalho.
ao Bruno, pelo Amor, pelo aconchego.
à Carolina, por fazer da minha vida Amor.
Bolsa de Doutoramento
SFRH/BD/11133/2002
resumo
O objectivo deste trabalho é estabelecer relações entre a classe de
semelhança de uma matriz quadrada A e as classes de congruência
de matrizes quadradas hermíticas K e H , quando é válida a equação
de Lyapunov AH + HA∗ = K .
O teorema geral da inércia é uma solução parcial deste problema, bem
como outros teoremas sobre inércia já conhecidos.
Nesta tese, mostramos relações entre a classe de semelhança da matriz A e as classes de congruência das matrizes K e H , quando é
válida a equação de Lyapunov para os seguintes casos:
H é uma matriz definida positiva
A é uma matriz não derrogatória
Estudamos também o problema correspondente para sistemas lineares discretos, ou seja, estabelecemos relações entre a classe de
semelhança da matriz A e as classes de congruência das matrizes
K e H , quando é válida a equação de Stein H − AHA∗ = K . A
resposta a este problema é imediata para os casos referidos anteriormente, dada a existência de uma transformada de Cayley que relaciona as duas equações.
palavras-chave
inércia de matrizes
equação de Lyapunov
equação de Stein
estabilidade
transformada de Cayley
abstract
The aim of this work is to establish relations between the similarity class of a square matrix A and the congruence classes of hermitian squares matrices K and H , when the Lyapunov equation
AH + HA∗ = K is satisfied.
The main inertia theorem is a partial solution to this problem as well as
other known inertia theorems.
We obtain relations between the similarity class of A and the congruence classes of K and H , when the Lyapunov equation is satisfied
for the following cases:
H is a definite positive matrix
A is a nonderogatory matrix
We also study the corresponding problem for discrete linear systems,
that is, establish relations between the similarity class of A and the congruence classes of K and H , when the Stein equation H − AHA∗ =
K is satisfied. The answer to this became immediate for the cases
mentioned above, due to a Cayley transform that relates the two equations.
keywords
inertia of matrices
Lyapunov equation
Stein equation
stability
Cayley transform
notação
C
corpo dos números complexos
C[x]
anel dos polinómios com indeterminada x e coeficientes em C
Cn×m
conjunto das matrizes de ordem n × m com entradas em C
Cn×m [x]
conjunto das matrizes de ordem n × m com entradas em C[x]
A = [aij ]
matriz cuja entrada (i, j) é igual a aij
In
matriz identidade de ordem n
0p×q
matriz nula de ordem p × q
0p
matriz nula de ordem p × p
diag(λ1 , . . . , λn )
matriz diagonal cuja diagonal principal é λ1 , . . . , λn
car A
característica da matriz A
det A
determinante da matriz A
tr A
traço da matriz A
Nuc A
núcleo da matriz A: Nuc A = {X : AX = 0}
A−1
inversa da matriz A
AT
transposta da matriz A
A
conjugada da matriz A
A∗
transposta da conjugada da matriz A: A∗ = A
A⊕B
soma directa das matrizes A e B
i
unidade imaginária
<(λ)
parte real do número complexo λ
=(λ)
parte imaginária do número complexo λ
gr(f )
grau do polinómio f
f |g
polinómio f divide polinómio g
(a, b, c) ≥ (u, v, w) a ≥ u, b ≥ v e c ≥ w
T
Índice
1 Preliminares
2
1.1 Revisões de conceitos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
2
1.2 Inércia matricial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
7
1.3 Estabilidade de sistemas e estabilidade matricial . . . . . . . . . . . . . . . . .
10
2 Equação de Lyapunov
15
2.1 Motivação . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
15
2.2 A nossa contribuição . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
19
2.2.1 H é uma matriz definida positiva . . . . . . . . . . . . . . . . . . . . .
19
2.2.2 L é uma matriz não derrogatória
34
. . . . . . . . . . . . . . . . . . . . .
3 Equação de Stein
43
3.1 Motivação . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
43
3.2 A nossa contribuição . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
48
3.2.0 Lemas Preliminares . . . . . . . . . . . . . . . . . . . . . . . . . . . .
48
3.2.1 H é uma matriz definida positiva . . . . . . . . . . . . . . . . . . . . .
52
3.2.2 S é uma matriz não derrogatória
57
. . . . . . . . . . . . . . . . . . . . .
Bibliografia
59
Índice Remissivo
62
1
Capítulo 1
Preliminares
“The structures of mathematics and the propositions about
them are ways for the imagination to travel and the wings,
or legs, or vehicles to take you where you want to go.”
S. Buchanan
Este capítulo é dedicado à exposição de conceitos e resultados já conhecidos. São apresentados
tópicos sobre a teoria das matrizes que consideramos fundamentais para a compreensão dos
resultados obtidos nos capítulos seguintes e que podem ser encontrados, na sua generalidade, em
[8, 10, 11, 12, 25].
1.1
Revisões de conceitos
Nesta secção são revistos tópicos da teoria das matrizes, com o intuito de tornar este trabalho tão
auto-contido quanto possível.
Dadas duas matrizes A, B ∈ Cn×m , dizemos que A e B são equivalentes se existem matrizes
não singulares P ∈ Cn×n e Q ∈ Cm×m tais que B = P AQ.
2
1.1 Revisões de conceitos
Em particular, se m = n, dizemos que as matrizes A e B são semelhantes se P = Q−1 , ou seja,
se existe uma matriz não singular Q ∈ Cn×n tal que B = Q−1 AQ. Se a matriz Q for uma matriz
de permutação (isto é, uma matriz que se obtém da matriz identidade por permutação de linhas
ou de colunas), dizemos que A e B são semelhantes por permutação.
Dizemos ainda que as matrizes A, B ∈ Cn×n são congruentes se existe uma matriz não singular
R ∈ Cn×n tal que B = RAR∗ .
Dada uma matriz A ∈ Cn×n chamamos polinómio característico de A ao polinómio mónico
det(xIn − A) ∈ C[x].
Os valores próprios de A são as raízes do seu polinómio característico. Ao conjunto de todos
os valores próprios de A chamamos espectro de A e representamos por σ(A). Claramente que,
atendendo ao teorema fundamental da Álgebra, toda a matriz n × n tem n valores próprios em C
(contando com as multiplicidades).
É sabido que, se λ1 , . . . , λn ∈ C são os valores próprios da matriz A, então
tr A = λ1 + · · · + λn
e
det A = λ1 · · · · · λn .
Seja λ ∈ C um valor próprio de A. A multiplicidade algébrica de λ, que representamos por
ma (λ), é a multiplicidade de λ enquanto zero do polinómio característico e, por isso, é usual
referir a multiplicidade algébrica apenas por multiplicidade. A multiplicidade geométrica de λ,
que representamos por mg (λ), é a dimensão do subespaço vectorial Nuc(λIn − A). Se cada valor
próprio de A tem multiplicidade geométrica 1, dizemos que A é uma matriz não derrogatória.
Caso contrário, dizemos que A é uma matriz derrogatória.
O próximo resultado permite concluir que matrizes semelhantes partilham diversas propriedades:
o mesmo polinómio característico e, consequentemente, os mesmos valores próprios, o mesmo
determinante, o mesmo traço, entre outras.
Teorema 1.1.1 (Decomposição de Schur) [25] Seja A ∈ Cn×n uma matriz. Então A é semelhante a uma matriz triangular superior cuja diagonal principal é constituída pelos seus valores
próprios.
3
1.1 Revisões de conceitos
Outro resultado que interessa recordar estabelece uma relação entre os valores próprios de uma
matriz hermítica e os valores próprios de uma sua submatriz principal. Recorde-se que uma
matriz A ∈ Cn×n é hermítica se A∗ = A.
Teorema 1.1.2 (Entrelaçamento dos valores próprios) [11] Seja A ∈ Cn×n uma matriz hermítica particionada da seguinte forma:


A11 ∗
 , onde A11 ∈ Cr×r para algum r ∈ {1, . . . , n}.
A=
∗ ∗
Sejam λ1 , . . . , λn ∈ R os valores próprios de A tais que λ1 ≤ · · · ≤ λn e sejam α1 , . . . , αr ∈ R
os valores próprios de A11 tais que α1 ≤ · · · ≤ αr . Então, para todo t ∈ {1, . . . , r},
λt ≤ αt ≤ λt+n−r .
Para cada k ∈ {1, . . . , n}, chamamos k-ésimo divisor determinantal da matriz polinomial
xIn − A ∈ Cn×n [x], e representamos por dk , ao máximo divisor comum mónico de todos os
determinantes das submatrizes de ordem k da matriz xIn − A. Convenciona-se que d0 ≡ 1
e prova-se que, na sequência dos divisores determinantais, cada polinómio é divisível pelo seu
sucessor, isto é, dk−1 | dk , para todo k ∈ {1, . . . , n}. Definimos o k-ésimo factor invariante da
matriz xIn − A, e representamos por fk , como sendo o polinómio
fk =
dk
∈ C[x].
dk−1
Cada factor invariante pode ser decomposto na forma
fk = (x − λ1 )αk1 (x − λ2 )αk2 · · · (x − λt )αkt ,
onde λ1 , . . . , λt são os valores próprios distintos da matriz A e αkj ∈ N0 , para todo k ∈
{1, . . . , n} e para todo j ∈ {1, . . . , t}. Chamamos divisor elementar da matriz xIn − A a
cada elemento da forma (x − λj )αkj com αkj > 0.
Chamamos polinómios invariantes da matriz A aos factores invariantes da matriz xIn − A. O
polinómio característico de uma matriz é igual ao produto dos seus polinómios invariantes. Além
disso, duas matrizes são semelhantes se e só se têm os mesmos polinómios invariantes.
4
1.1 Revisões de conceitos
Existe uma relação entre a multiplicidade geométrica de um valor próprio e os polinómios invariantes de uma matriz. De facto, se λ é um valor próprio da matriz A, então a multiplicidade
geométrica de λ é o número de polinómios invariantes de A que admitem λ como raiz. Podemos
então dizer que uma matriz é não derrogatória se e só se tem apenas um polinómio invariante não
constante.
Chamamos matriz companheira de um polinómio mónico f (x) ∈ C[x] de grau p ≥ 1 da forma
f (x) = xp + ap−1 xp−1 + · · · + a1 x + a0 ,
à matriz definida por

C(f ) = 
0

Ip−1
−a0
−a1 . . .
−ap−1
 ∈ Cp×p .
A matriz C(f ) tem polinómios invariantes 1, . . . , 1, f (x).
Teorema 1.1.3 (Forma normal companheira) [12] Seja A ∈ Cn×n uma matriz. Sejam ainda
f1 , . . . , ft ∈ C[x] polinómios mónicos diferentes de 1 tais que f1 | · · · |ft e gr(f1 · · · ft ) = n. A
matriz A é semelhante à matriz
C(f1 ) ⊕ · · · ⊕ C(ft )
se e só se f1 , . . . , ft são os polinómios invariantes de A diferentes de 1.
Chamamos bloco de Jordan de tamanho p × p associado a λ ∈ C à matriz triangular superior
da forma






Jp (λ) = 




···
...
λ
1
0
0
..
.
λ
..
.
1
..
.
0 ···
0
λ
0 ···
0
0
..
.

0

.. 
. 


p×p
0 ∈C .


1 

λ
A matriz Jp (λ) tem polinómios invariantes 1, . . . , 1, (x − λ)p .
5
1.1 Revisões de conceitos
Teorema 1.1.4 (Forma normal de Jordan) [12] Seja A ∈ Cn×n uma matriz e sejam p1 , . . . , pt
inteiros positivos tais que p1 + · · · + pt = n. Sejam ainda λ1 , . . . , λt ∈ C. A matriz A é
semelhante à matriz
Jp1 (λ1 ) ⊕ · · · ⊕ Jpt (λt )
se e só se (x − λ1 )p1 , . . . , (x − λt )pt são os divisores elementares da matriz xIn − A.
Note-se que λ1 , . . . , λt são os valores próprios da matriz A (não necessariamente distintos). Para
cada i ∈ {1, . . . , t}, a multiplicidade geométrica de λi é o número de blocos de Jordan associados
a λi e a sua multiplicidade algébrica é a soma das ordens dos blocos de Jordan associados a λi ,
que surgem na forma normal de Jordan da matriz A.
Os dois próximos lemas são necessários nas demonstrações dos nossos resultados. As respectivas
demonstrações são omitidas uma vez que consistem na simples aplicação de operações de permutação.
Seja λ ∈ C e sejam r1 , . . . , rp inteiros positivos tais que r1 + · · · + rp = n. Então:
Lema 1.1.5 Toda a matriz da forma Jr1 (λ) ⊕ · · · ⊕ Jrp (λ) ∈ Cn×n é semelhante por permutação
a uma matriz da forma


λIp 0
∗
∗

 ∈ Cn×n .
Lema 1.1.6 Se ma (λ) ≥ 2 então toda a matriz da forma Jr1 (λ) ⊕ · · · ⊕ Jrp (λ) ∈ Cn×n é
semelhante por permutação a uma matriz da forma


λI
0 0
 p



 Ip λIp 0  ∈ Cn×n .


∗
∗ ∗
Por fim recordamos algumas propriedades das matrizes definidas positivas.
6
1.2 Inércia matricial
Seja A ∈ Cn×n uma matriz hermítica. Dizemos que A é uma matriz definida positiva, e representamos por A > 0, se, para qualquer vector não nulo x ∈ Cn×1 \ {0}, x∗ Ax > 0.
Se enfraquecermos a desigualdade estrita obtemos um novo conceito: dizemos que A é uma
matriz semi-definida positiva, e representamos por A ≥ 0, se x∗ Ax ≥ 0, qualquer que seja
x ∈ Cn×1 \ {0}.
Prova-se que uma matriz é definida positiva se e só se é congruente com a matriz identidade.
Analogamente, uma matriz A é semi-definida positiva se e só se é congruente com a matriz
Ir ⊕ 0n−r , onde r = car A.
Seja A ∈ Cn×n uma matriz definida positiva. Então prova-se que:
toda a submatriz principal da matriz A é definida positiva;
os valores próprios da matriz A são números reais positivos;
para todo α > 0, αA é uma matriz definida positiva; se α < 0, então a matriz −αA é
definida positiva;
seja B ∈ Cn×n uma matriz congruente com a matriz A, então B também é uma matriz
definida positiva.
Invertendo as desigualdades das definições anteriores, obtemos conceitos duais. Dizemos que
a matriz A é definida negativa, e representamos por A < 0, se −A é uma matriz definida
positiva. Analogamente, dizemos que A é uma matriz semi-definida negativa, e representamos
por A ≤ 0, se a matriz −A é semi-definida positiva.
Se a matriz A não é definida positiva (respectivamente, negativa) nem semi-definida positiva
(respectivamente, negativa) então dizemos que A é uma matriz indefinida.
1.2
Inércia matricial
Nesta secção recordamos um dos conceitos fundamentais para o nosso trabalho: apresentamos a
definição de inércia matricial e analisamos algumas das suas propriedades.
7
1.2 Inércia matricial
Seja A ∈ Cn×n uma matriz. A inércia de A (ou a inércia de A relativamente ao eixo imaginário) é o terno
In(A) = (π(A), ν(A), δ(A))
onde π(A) denota o número de valores próprios da matriz A com parte real positiva, ν(A) o
número de valores próprios da matriz A com parte real negativa e δ(A) denota o número de
valores próprios da matriz A com parte real nula (contando sempre com as multiplicidades).
A inércia de A relativamente ao círculo unitário é o terno
In1 (A) = (π1 (A), ν1 (A), δ1 (A))
onde π1 (A) denota o número de valores próprios da matriz A com módulo inferior a 1, ν1 (A) o
número de valores próprios da matriz A módulo superior a 1 e δ1 (A) denota o número de valores
próprios da matriz A módulo igual a 1 (contando sempre com as multiplicidades).
Em qualquer uma das definições, é fácil verificar que:
π(A) + ν(A) + δ(A) = n = π1 (A) + ν1 (A) + δ1 (A).
Recorde-se que, dadas duas matrizes A, B ∈ Cn×n , temos que:
λ1 , . . . , λn ∈ σ(A) se e só se −λ1 , . . . , −λn ∈ σ(−A);
λ1 , . . . , λn ∈ σ(A) e µ1 , . . . , µn ∈ σ(B) se e só se λ1 , . . . , λn , µ1 , . . . , µn ∈ σ(A ⊕ B);
−1
−1
se A é uma matriz não singular então λ1 , . . . , λn ∈ σ(A) se e só se λ−1
1 , . . . , λn ∈ σ(A ).
se A e B são matrizes semelhantes então λ1 , . . . , λn ∈ σ(A) se e só se λ1 , . . . , λn ∈ σ(B).
Assim, estas propriedades dos valores próprios de uma matriz permitem estabelecer algumas
propriedades para as inércias.
Teorema 1.2.1 Sejam A, B ∈ Cn×n matrizes. Então:
In(−A) = (ν(A), π(A), δ(A))
In1 (−A) = In1 (A)
In(A ⊕ B) = In(A) + In(B)
In1 (A ⊕ B) = In1 (A) + In1 (B)
Se A é uma matriz não singular então In(A−1 ) = In(A) e In1 (A−1 ) = (ν1 (A), π1 (A), δ1 (A)).
Além disso, se A e B são matrizes semelhantes então In(A) = In(B) e In1 (A) = In1 (B).
8
1.2 Inércia matricial
Os dois próximos resultados permitem afirmar que a inércia de matrizes hermíticas é também
invariante para a congruência de matrizes.
Teorema 1.2.2 (Teorema da inércia de Sylvester) [12] Toda a matriz hermítica A ∈ Cn×n é
congruente com uma única matriz da forma Iπ ⊕ (−Iν ) ⊕ 0δ e, além disso, In(A) = (π, ν, δ).
Corolário 1.2.3 [12] Duas matrizes hermíticas são congruentes se e só se têm a mesma inércia.
O teorema seguinte é um caso particular do resultado obtido em [1] por B. E. Cain e E. M. Sá e
relaciona a inércia de uma matriz hermítica com as inércias de duas suas submatrizes principais
complementares.
Teorema 1.2.4 [1] Sejam H1 ∈ Cn1 ×n1 e H2 ∈ Cn2 ×n2 matrizes hermíticas, com n1 + n2 = n,
tais que
In(H1 ) = (π1 , ν1 , δ1 )
e
In(H2 ) = (π2 , ν2 , δ2 ).
Sejam ainda π, ν, δ inteiros não negativos. Então existe uma matriz X ∈ Cn1 ×n2 tal que


H1 X
 = (π, ν, δ)
In 
∗
X H2
se e só se π e ν satisfazem as seguintes condições:
(i) π + ν ≤ n;
(ii) max{π1 , π2 } ≤ π ≤ min{n1 + π2 , n2 + π1 };
(iii) max{ν1 , ν2 } ≤ ν ≤ min{n1 + ν2 , n2 + ν1 };
(iv) π − ν ≤ π1 + π2 ;
(v) ν − π ≤ ν1 + ν2 .
9
1.3 Estabilidade de sistemas e estabilidade matricial
1.3
Estabilidade de sistemas e estabilidade matricial
Nesta secção, fazemos uma breve abordagem aos sistemas contínuos e discretos. É com base no
estudo destes sistemas que surgem as equações que são mote deste trabalho. Por se tratar de uma
teoria que não se insere no âmbito deste trabalho, omitimos as demonstrações, podendo estas ser
encontradas em [5, 8, 11].
Num modelo matemático, o comportamento de um sistema real pode ser descrito por uma lista
de parâmetros que variam ao longo do tempo, chamados variáveis de estado do sistema. Frequentemente, existem relações de dependência entre as variáveis de estado que tomam a forma de
equações diferenciais ou equações com diferenças, as chamadas equações de estado do sistema.
O objectivo do estudo matemático destes sistemas é conseguir determinar o seu comportamento.
Um conceito subjacente a esse estudo é o de estabilidade.
Consideremos um sistema descrito por uma lista finita de variáveis de estado, que obedecem a
um sistema contínuo de equações diferenciais lineares com coeficientes constantes definido por
χ̇(t) = Aχ(t)
onde A ∈ Cn×n e χ̇ representa a derivada de χ em ordem ao tempo t.
Dizemos que o sistema contínuo descrito anteriormente é estável se todas as suas soluções convergem para 0 quando t converge para +∞, ou equivalentemente, se eAt converge para 0 quando
t converge para +∞. Um dos critérios de estabilidade de sistemas contínuos é apresentado no
próximo resultado.
Teorema 1.3.1 [5] Seja A ∈ Cn×n uma matriz. O sistema χ̇(t) = Aχ(t) é estável se e só se
todos os valores próprios da matriz A têm parte real negativa.
Em 1892, na sua tese de doutoramento, Lyapunov publica um resultado histórico na estabilidade
de sistemas não lineares de equações diferenciais, que pode ser formulado para sistemas lineares,
com equações matriciais.
10
1.3 Estabilidade de sistemas e estabilidade matricial
A relação entre a teoria da estabilidade e as equações matriciais é estabelecida definindo uma
matriz
Z
+∞
H=−
∗
eAt KeA t dt
0
onde K é uma matriz arbitrária definida positiva. Note-se que, sendo A uma matriz representativa
de um sistema contínuo estável, então eAt converge para 0 quando t converge para +∞ e este
integral impróprio é convergente. Mostra-se (cf. [5]) que H satisfaz a equação
AH + HA∗ = K.
(1.1)
Esta equação é conhecida como equação de Lyapunov e é um dos objectos de estudo do
nosso trabalho. Vamos ver no próximo capítulo que a estabilidade de um sistema contínuo está
associada à existência de soluções desta equação.
Existem sistemas cujo modelo natural é discreto. Consideremos um sistema discreto descrito
pelas seguintes equações com diferenças lineares com coeficientes constantes
xk = Axk−1 , com k ∈ {1, . . . , n}
onde A ∈ Cn×n e xi ∈ Cn×1 , para todo i ∈ {1, . . . , n}.
Dizemos que um sistema discreto da forma anterior é estável se uma solução do sistema da forma
x0 , x1 , x2 , . . . converge para 0, qualquer que seja a escolha inicial de x0 ou, equivalentemente,
se Ak converge para 0 quando k converge para +∞.
Um dos critérios de estabilidade de sistemas discretos é análogo ao referido para sistemas contínuos, mas usando o conceito de inércia relativamente ao círculo unitário.
Teorema 1.3.2 [5] Seja A ∈ Cn×n uma matriz. O sistema xk = Axk−1 , com k ∈ {1, . . . , n}, é
estável se e só se todos os valores próprios da matriz A têm módulo inferior a 1.
Em 1952, Stein publica um estudo análogo ao de Lyapunov mas relativo à estabilidade de sistemas discretos. Este estudo baseia-se na definição de uma matriz H da forma
H=
+∞
X
Ak K(A∗ )k
(1.2)
k=0
11
1.3 Estabilidade de sistemas e estabilidade matricial
onde K é uma matriz arbitrária definida positiva. De facto, se A é uma matriz representativa de
um sistema discreto estável, então Ak converge para 0 quando t converge para +∞ e esta série é
convergente. Mostra-se que H satisfaz a equação
H − AHA∗ = K.
(1.3)
Esta equação é denominada por equação de Stein e é também objecto de estudo do nosso trabalho. No último capítulo, vamos ver que a estabilidade de sistemas discretos está também
associada à existência de soluções da equação de Stein.
De seguida, introduzimos a estabilidade matricial tendo por base a estabilidade de sistemas.
Seja A ∈ Cn×n uma matriz. Dizemos que A é uma matriz estável se o sistema contínuo que lhe
está associado
χ̇(t) = Aχ(t)
é estável, ou seja, se todos os valores próprios da matriz A têm parte real negativa. Repare-se
que a matriz A é estável se e só se In(A) = (0, n, 0).
Dadas as propriedades da inércia (enunciadas no teorema 1.2.1), podemos concluir que se A é
uma matriz estável então A é uma matriz não singular e A−1 , A∗ e AT também são matrizes
estáveis. E, além disso, como a inércia é invariante para a semelhança, o mesmo se pode afirmar
para a estabilidade, ou seja, se A é uma matriz estável então qualquer matriz semelhante a A é
estável.
Um conceito dual de estabilidade é definido da seguinte forma: dizemos que a matriz A é estável
positiva se todos os seus valores próprios têm parte real positiva, ou seja, In(A) = (n, 0, 0).
Claramente que a matriz A é estável positiva se e só se −A é uma matriz estável. Assim é
possível reescrever qualquer resultado referente a matrizes estáveis num resultado idêntico sobre
matrizes estáveis positivas, inserindo adequadamente o sinal −, e vice-versa. Por conveniência
de notação, vamos utilizar o conceito de matrizes estáveis positivas em detrimento do conceito
de matrizes estáveis.
Podemos ainda definir estabilidade de uma matriz associada a um sistema discreto.
12
1.3 Estabilidade de sistemas e estabilidade matricial
Dizemos que a matriz A é estável relativamente ao círculo unitário se o sistema discreto que
lhe está associado, xk = Axk−1 , com k ∈ {1, . . . , n}, é estável, ou seja, se todos os valores
próprios da matriz A têm módulo inferior a 1, isto é, In1 (A) = (n, 0, 0).
Em [21], O. Taussky (e, indirectamente, Stein [17]) aplica uma transformação matricial estabelecendo uma relação entre matrizes estáveis e matrizes estáveis relativamente ao círculo unitário.
Seja A ∈ Cn×n uma matriz tal que a matriz In + A é não singular, ou seja, −1 ∈
/ σ(A).
Chamamos transformada de Cayley da matriz A, e denotamos por C(A), à matriz definida
por
C(A) = (In + A)−1 (In − A) ∈ Cn×n .
Teorema 1.3.3 Seja A ∈ Cn×n uma matriz tal que −1 ∈
/ σ(A). Então In1 (A) = In(C(A)).
Demonstração.
Seja A ∈ Cn×n uma matriz tal que µ1 , . . . , µn são os seus valores próprios.
Note-se que, como −1 ∈
/ σ(A), é possível definir a sua transformada de Cayley, C(A). Pela
decomposição de Schur, existe uma matriz não singular U ∈ Cn×n tal que U −1 AU é uma matriz
triangular superior cuja diagonal é µ1 , . . . , µn . Então:
−1
In + U −1 AU
In − U −1 AU

(1 + µ1 )−1 (1 − µ1 )
∗


...
= 

0
(1 + µn )−1 (1 − µn )
U −1 C(A)U =





e os valores próprios da matriz C(A) são λ1 , . . . , λn , onde λk = (1 + µk )−1 (1 − µk ), para todo
k ∈ {1, . . . , n}. Note-se que, para cada k ∈ {1, . . . , n},
λk = |1 + µk |−2 1 − |µk |2 − 2=(µk )i
e, consequentemente, <(λk ) = |1 + µk |−2 1 − |µk |2 .
Assim, se |µk | = 1 (respectivamente, |µk | > 1 e |µk | < 1), então <(λk ) = 0 (respectivamente,
<(λk ) < 0 e <(λk ) > 0), para todo k ∈ {1, . . . , n}, e, portanto, In1 (A) = In(C(A)).
13
1.3 Estabilidade de sistemas e estabilidade matricial
Note-se que se A é uma matriz estável relativamente ao círculo unitário e se µ1 , . . . , µn são os
seus valores próprios, então |µk | < 1, para todo k ∈ {1, . . . , n}. Donde −1 ∈
/ σ(A) e, portanto,
a matriz C(A) está bem definida. Aplicando o teorema anterior obtemos:
Corolário 1.3.4 Seja A ∈ Cn×n uma matriz. A matriz A é estável relativamente ao círculo
unitário se e só se a matriz C(A) é estável positiva.
Também fazendo uso da transformada de Cayley, anteriormente definida, é possível criar uma
relação entre a equação de Lyapunov e a equação de Stein.
Teorema 1.3.5 Seja H ∈ Cn×n uma matriz hermítica e seja A ∈ Cn×n uma matriz estável
relativamente ao círculo unitário. Então
In(C(A)H + HC(A)∗ ) = In(H − AHA∗ ).
Demonstração.
Seja H ∈ Cn×n uma matriz hermítica e seja A ∈ Cn×n uma matriz estável
relativamente ao círculo unitário. Repare-se que −1 ∈
/ σ(A) e, portanto, a matriz C(A) está bem
definida. Então:
C(A)H + HC(A)∗ = K ⇔ (In + A)−1 (In − A)H + H(In − A∗ )(In + A∗ )−1 = K
⇔ (In − A)H(In + A∗ ) + (In + A)H(In − A∗ ) = (In + A)K(In + A∗ )
⇔ 2 (H − AHA∗ ) = (In + A)K(In + A∗ )
1
1
⇔ H − AHA∗ = 2− 2 (In + A) K 2− 2 (In + A∗ )
1
Logo existe uma matriz não singular X = 2− 2 (In + A) ∈ Cn×n tal que
H − AHA∗ = X (C(A)H + HC(A)∗ ) X ∗
e, portanto, a matriz C(A)H + HC(A)∗ é congruente com a matriz H − AHA∗ . Como são
matrizes hermíticas, pelo Corolário 1.2.3,
In(C(A)H + HC(A)∗ ) = In(H − AHA∗ ).
14
Capítulo 2
Equação de Lyapunov
“But, in this respect, hardly any other
method of investigation could be said
to be completely satisfactory.”
A. Lyapunov
O objectivo principal deste capítulo é estabelecer relações entre a classe de semelhança da matriz
L e as classes de congruência das matrizes K e H quando é válida a equação de Lyapunov
LH + HL∗ = K. Obtêm-se conjuntos completos de relações nos seguintes dois casos: (i) H é
uma matriz definida positiva e (ii) L é uma matriz não derrogatória.
Os resultados principais deste capítulo podem ser encontrados em [18, 19].
2.1
Motivação
Nesta secção recordamos o teorema de Lyapunov e algumas generalizações que motivaram a
formulação do nosso problema. Analisamos também esses resultados enquanto soluções particulares desse problema.
15
2.1 Motivação
Tal como já referimos, em 1892, Lyapunov publica um resultado histórico que estabelece uma
relação entre as matrizes estáveis positivas e as matrizes definidas positivas.
Teorema 2.1.1 (Teorema de Lyapunov) [12] Sejam L, K ∈ Cn×n matrizes tais que K é uma
matriz definida positiva. A matriz L é estável positiva se e só se existe uma matriz definida
positiva H ∈ Cn×n que satisfaz a equação de Lyapunov LH + HL∗ = K.
Uma das generalizações mais importantes deste teorema é o teorema geral da inércia. Este
resultado é obtido por A. Ostrowski e H. Schneider [16] e, independentemente, por O. Taussky
[20] que prova o caso particular K = In .
Teorema 2.1.2 (Teorema geral da inércia) [16] Sejam L, K ∈ Cn×n matrizes tais que K é uma
matriz definida positiva. Então existe uma matriz hermítica H ∈ Cn×n tal que LH + HL∗ = K
se e só se δ(L) = 0. Além disso, se existir uma matriz hermítica H ∈ Cn×n tal que LH + HL∗ =
K então In(L) = In(H).
Repare-se que, para toda a matriz não singular R ∈ Cn×n , a equação de Lyapunov é equivalente
à equação
(RLR−1 )(RHR∗ ) + (RHR∗ )(RLR−1 )∗ = RKR∗ .
(2.1)
Atendendo a esta observação, o teorema anterior pode ser formulado da seguinte forma:
Teorema 2.1.3 Sejam L, H ∈ Cn×n matrizes tais que H é uma matriz hermítica. Então existe
uma matriz L0 ∈ Cn×n semelhante à matriz L e existe uma matriz H 0 ∈ Cn×n congruente com a
matriz H tais que L0 H 0 + H 0 L0∗ é definida positiva se e só se δ(L) = 0 e In(L) = In(H).
Demonstração. Sejam L, H ∈ Cn×n matrizes tais que H é uma matriz hermítica.
Suponhamos que existe uma matriz L0 ∈ Cn×n semelhante à matriz L e que existe uma matriz
H 0 ∈ Cn×n congruente com a matriz H tais que L0 H 0 + H 0 L0∗ > 0. Pelo teorema geral da
inércia, δ(L0 ) = 0 e In(L0 ) = In(H 0 ). Donde, pelas propriedades da inércia (teorema 1.2.1) e
pelo corolário 1.2.3, vem que δ(L) = 0 e In(L) = In(H).
16
2.1 Motivação
Reciprocamente, suponhamos que δ(L) = 0 e In(L) = In(H). Novamente pelo teorema geral
da inércia, existe uma matriz hermítica H 0 ∈ Cn×n tal que LH 0 + H 0 L∗ > 0 e In(L) = In(H 0 ).
Logo In(H 0 ) = In(H), ou seja, a matriz H 0 é congruente com a matriz H, pelo corolário 1.2.3.
Além disso, atendendo a (2.1), existe uma matriz L0 ∈ Cn×n semelhante à matriz L tal que a
matriz L0 H 00 + H 00 L0∗ é definida positiva, onde H 00 ∈ Cn×n é uma matriz congruente às matrizes
H e H 0.
Assim, este teorema fornece um sistema completo de relações entre a classe de semelhança da
matriz L e a classe de congruência da matriz H, quando K é uma matriz definida positiva e é
válida a equação de Lyapunov. E sugere o problema base do nosso trabalho.
Problema 1 Determinar um sistema completo de relações entre a classe de semelhança da matriz L e as classes de congruência das matrizes H e K quando é válida a equação de Lyapunov.
Existem na literatura algumas soluções parciais. Por exemplo, o teorema geral da inércia é uma
solução parcial do problema para o caso em que K é uma matriz definida positiva. Também o
teorema de Lyapunov é uma solução parcial do problema para o caso em que K e H são matrizes
definidas positivas. De facto, podemos enunciá-lo do seguinte modo:
Teorema 2.1.4 Sejam L, H ∈ Cn×n matrizes tais que H é uma matriz definida positiva. Então
existe uma matriz L0 ∈ Cn×n semelhante à matriz L e existe uma matriz definida positiva H 0 ∈
Cn×n congruente com a matriz H tais que a matriz L0 H 0 + H 0 L0∗ é definida positiva se e só se
π(L) = n.
Demonstração. Sejam L, H ∈ Cn×n matrizes tais que H é uma matriz definida positiva.
Suponhamos que existe uma matriz L0 ∈ Cn×n semelhante à matriz L e que existe uma matriz
definida positiva H 0 ∈ Cn×n congruente com a matriz H tais que L0 H 0 +H 0 L0∗ > 0. Pelo teorema
de Lyapunov, L0 é uma matriz estável positiva, ou seja, π(L0 ) = n. Donde, pelas propriedades
da inércia (teorema 1.2.1), vem que π(L) = n.
O recíproco é aplicação directa do teorema 2.1.3, uma vez que δ(L) = 0.
17
2.1 Motivação
O próximo resultado, obtido por D. Carlson e H. Schneider [2] motivados pelo teorema de Lyapunov enfraquecendo a condição “K é uma matriz definida positiva”, fornece um sistema completo de relações entre a classe de semelhança da matriz L e a classe de congruência da matriz
H quando L é uma matriz não singular e K é uma matriz semi-definida positiva. No final da
próxima secção é apresentada uma demonstração alternativa deste teorema enquanto corolário
de um dos principais resultados (corolário 2.2.8).
Teorema 2.1.5 [2] Seja L ∈ Cn×n uma matriz. Então existe uma matriz definida positiva
H ∈ Cn×n tal que LH + HL∗ é semi-definida positiva se e só se a matriz L não tem divisores
elementares com raízes imaginárias múltiplas e ν(L) = 0.
Em [6], L. M. DeAlba e C. R. Johnson estudam uma variante do problema 1 e garantem que as
inércias das matrizes L, H e K são independentes, sob certas condições, sempre que é válida a
equação de Lyapunov e K é uma matriz indefinida. Observe-se que no artigo referido é estudada
a equação de Stein. No entanto, pelo que foi visto anteriormente, facilmente se podem reescrever
os resultados obtidos em análogos para a equação de Lyapunov, uma vez que são válidas as
condições do teorema 1.3.5.
Teorema 2.1.6 [6, Teorema 3] Sejam πk , νk ,δk , πh , νh , δh , π, ν, δ inteiros não negativos tais
que πk > 0, νk ≤ πh + νh e πk + νk + δk = πh + νh + δh = π + ν + δ = n.
Então existe uma matriz não singular L ∈ Cn×n e existem matrizes hermíticas H, K ∈ Cn×n
tais que é válida a equação de Lyapunov LH + HL∗ = K e
In(K) = (πk , νk , δk ),
In(H) = (πh , νh , δh )
e
In(L) = (π, ν, δ).
18
2.2 A nossa contribuição
2.2
A nossa contribuição
2.2.1 H é uma matriz definida positiva
Nesta secção apresentamos um sistema completo de relações entre a classe de semelhança de L e
a classe de congruência de K quando é válida a equação de Lyapunov, H é uma matriz definida
positiva e, ou L é uma matriz não derrogatória ou K é uma matriz semi-definida positiva.
Seguimos de perto [18].
Sejam L, K, H ∈ Cn×n matrizes. Tal como vimos anteriormente, LH + HL∗ = K é equivalente
a (2.1). Assim, nas demonstrações, a matriz L é substituída, sempre que necessário, por uma
qualquer matriz que lhe seja semelhante, sem que haja perda de generalidade.
Denotamos por i(L) o número de polinómios invariantes não constantes de L. Denotamos por
i+ (L) o número de polinómios invariantes de L com pelo menos uma raiz com parte real positiva,
por i− (L) o número de polinómios invariantes de L com pelo menos uma raiz com parte real
negativa e por i0 (L) o número de polinómios invariantes de L com pelo menos uma raiz com
parte real nula. Denotamos ainda por i20 (L) o número de polinómios invariantes de L com pelo
menos uma raiz com a parte real nula e multiplicidade superior ou igual a 2.
O próximo teorema apresenta condições necessárias para a solução parcial do problema 1 quando
H é uma matriz definida positiva.
Teorema 2.2.1 Sejam L, K, H ∈ Cn×n matrizes tais que K é uma matriz hermítica e H é uma
matriz definida positiva.
Se LH + HL∗ = K então são válidas as seguintes condições:
π(K) ≥ max{i+ (L), i20 (L)}
(2.2)
ν(K) ≥ max{i− (L), i20 (L)}
(2.3)
δ(K) ≥ 2i0 (L) − n
(2.4)
19
2.2 A nossa contribuição
π(K) + δ(K) ≥ i0 (L)
(2.5)
ν(K) + δ(K) ≥ i0 (L)
(2.6)
e o seguinte caso não é válido:
(S) δ(L) > δ(K), i20 (L) = 0 e min{π(K), ν(K)} = 0.
Demonstração. Sejam L, K, H ∈ Cn×n matrizes tais que K é uma matriz hermítica e H é uma
matriz definida positiva. Suponhamos que LH + HL∗ = K.
demonstração de ν(K) ≥ i− (L) Seja p = i− (L). Pelo lema 1.1.5, a forma normal de Jordan
da matriz L é semelhante por permutação a uma matriz da forma


λI
0
p
 , para algum λ ∈ C tal que <(λ) < 0.
L0 = 
∗ ∗
Note-se que, dada a cadeia de divisibilidade entre os polinómios invariantes, é possível escolher
um valor próprio λ da matriz L tal que <(λ) < 0 e mg (λ) = p. Sem perda de generalidade,
suponhamos que L = L0 . Particione-se a matriz H da seguinte forma:


H11 H12
 , com H11 ∈ Cp×p .
H=
∗
H12 H22
(2.7)
Então −2<(λ)H11 é uma submatriz principal da matriz −K e é definida positiva. Pelo entrelaçamento dos valores próprios, ν(K) = π(−K) ≥ p = i− (L).
demonstração de π(K) ≥ i+ (L) Análoga à demonstração de anterior.
demonstração de ν(K) ≥ i (L) e π(K) ≥ i (L) Seja p = i20 (L). Pelo lema 1.1.6, a forma
normal de Jordan da matriz L é semelhante por permutação a uma matriz da forma


λIp 0 0




0
L =  Ip λIp 0  , para algum λ ∈ C tal que <(λ) = 0.


∗
∗ ∗
20
2.2 A nossa contribuição
Novamente, dada a cadeia de divisibilidade entre os polinómios invariantes, é possível escolher
um valor próprio λ da matriz L tal que <(λ) = 0, mg (λ) = p e ma (λ) ≥ 2. Sem perda de
generalidade, suponhamos que L = L0 e particione-se a matriz H da seguinte forma:


H
H12 H13

 11

 ∗
H =  H12 H22 H23  , onde H11 , H22 ∈ Cp×p .


∗
∗
H13 H23 H33
Então

Kp = 
0
H11
∗
H11 H12 + H12


é uma submatriz principal da matriz K. Como Kp é uma matriz não singular e 0p é uma sua
submatriz principal, pelo entrelaçamento dos valores próprios, In(Kp ) = (p, p, 0). Consequentemente, ν(K) ≥ p = i20 (L) e π(K) ≥ p = i20 (L).
E concluímos que as condições (2.2) e (2.3) são válidas.
demonstração de δ(K) ≥ i (L) − n Seja p = i0 (L). Pelo lema 1.1.5, a forma normal de
Jordan da matriz L é semelhante por permutação a uma matriz da forma


λI
0
p
 , para algum λ ∈ C tal que <(λ) = 0.
L0 = 
∗ ∗
Sem perda de generalidade, suponhamos que L = L0 e particione-se a matriz H como em (2.7).
Então 0p é uma submatriz principal da matriz K e, consequentemente, car K ≤ n − p. Logo,
como K é uma matriz hermítica,
δ(K) = n − car K ≥ p − car K ≥ p − (n − p) = 2i0 (L) − n.
demonstração de π(K) + δ(K) ≥ i (L) e ν(K) + δ(K) ≥ i (L) Aplicando um raciocínio
análogo ao da demonstração anterior, seja p = i0 (L). A forma normal de Jordan da matriz L é
semelhante por permutação a uma matriz da forma


λIp 0
 , para algum λ ∈ C tal que <(λ) = 0.
L0 = 
∗ ∗
21
2.2 A nossa contribuição
Sem perda de generalidade, suponhamos que L = L0 e particione-se a matriz H como em (2.7).
Então 0p é uma submatriz principal da matriz K e, portanto, car K ≤ n − p. Então:
π(K) + δ(K) = π(K) + (n − car K) ≥ π(K) + (n − (n − p)) ≥ p = i0 (L).
Analogamente, ν(K) + δ(K) ≥ ν(K) + (n − (n − p)) ≥ p = i0 (L).
demonstração de (S) não é válido Por indução em n.
Se n = 1, suponhamos que L = [l11 ] e H = [h11 ], para algum l11 ∈ C e para algum h11 ∈ R tal
que h11 > 0. Então:
LH + HL∗ = [2<(l11 )h11 ]
e
In(L) = In(LH + HL∗ ) = In(K).
Logo o caso (S) não se verifica.
Seja n ≥ 2. Com vista a uma contradição, suponhamos que (S) é válido.
Então, como δ(L) > 0 e i20 (L) = 0, a matriz L admite pelo menos um valor próprio imaginário
puro com multiplicidade 1 e, portanto, é semelhante a uma matriz da forma [λ] ⊕ L0 , para algum
λ ∈ C tal que <(λ) = 0 e L0 ∈ C(n−1)×(n−1) . Sem perda de generalidade, suponhamos que
L = [λ] ⊕ L0 e particione-se a matriz H da seguinte forma:


h g
 ∈ Cn×n , onde H0 ∈ C(n−1)×(n−1) .
H=
∗
g H0
Então

K=
Se g(λIn−1 + L∗0 ) 6= 0 então

M =
0
g(λIn−1 +
L∗0 )
(−λIn−1 + L0 )g ∗ L0 H0 + H0 L∗0
0
m12
m∗12
m22

.

 ∈ C2×2 , com m12 , m22 ∈ C \ {0},
é uma submatriz principal da matriz K tal que In(M ) = (1, 1, 0). Pelo entrelaçamento dos
valores próprios,
π(K) ≥ π(M ) = 1 e
ν(K) ≥ ν(M ) = 1,
22
2.2 A nossa contribuição
o que é absurdo pois, por (S), min{π(K), ν(K)} = 0.
Suponhamos agora que g(λIn−1 + L∗0 ) = 0. Seja K0 = L0 H0 + H0 L∗0 ∈ C(n−1)×(n−1) . Note-se
que i20 (L0 ) = 0 e, como (S) é válido,
δ(L0 ) = δ(L) − 1 > δ(K) − 1 = δ(K0 ).
Por hipótese de indução, (S) não é válido para a matriz K0 , logo min{π(K0 ), ν(K0 )} > 0. Mas
π(K) = π(K0 ) e ν(K) = ν(K0 ) e obtemos de novo uma contradição.
Concluímos assim que o caso (S) não é válido.
Tal como vamos ver mais adiante, as condições (2.2) a (2.6) não são condições suficientes para
quaisquer matrizes L e K.
Chamamos τ -matriz a toda a matriz triangular superior T = [tij ] ∈ Cn×n tal que ti,i+1 6= 0,
para todo i ∈ {1, . . . , n − 1}.
Os próximos lemas envolvem este conceito e são úteis na demonstração do resultado principal
desta secção.
Lema 2.2.2 Sejam λ1 , ..., λn ∈ C ordenados por forma a que:
se λi = λj , para algum i < j, então λi = λk , para todo k ∈ {i, . . . , j}.
Seja



T =

∗
λ1
..
0
.
λn



 ∈ Cn×n

(2.8)
uma τ -matriz. Então T é uma matriz não derrogatória.
Demonstração. Começamos por mostrar que
i(A) = n − RC (A),
onde RC (A) = min car(αIn − A), para qualquer matriz A ∈ Cn×n (cf. [15]).
α∈C
23
2.2 A nossa contribuição
Suponhamos que a matriz A tem t valores próprios distintos, com 1 ≤ t ≤ n, e que os seus
divisores elementares são da forma
(x − λi )ri,1 , . . . , (x − λi )ri,si , para todo i ∈ {1, . . . , t},
onde 0 < ri,1 ≤ · · · ≤ ri,si . Então i(A) = max si .
i∈{1,...,t}
Como RC (A) é invariante para a semelhança, podemos considerar, sem perda de generalidade,
a matriz A na forma normal de Jordan. Na matriz λj In − A existem sj linhas nulas e sj colunas nulas e a matriz que resulta da eliminação dessas linhas e dessas colunas é não singular e,
portanto, car(λj In − A) = n − sj . Logo
RC (A) = min car(αIn − A) = n − max si = n − i(A).
α∈C
i∈{1,...,t}
Assim, em particular, RC (T ) = n − i(T ). Atendendo à forma da matriz T , RC (T ) = n − 1.
Donde i(T ) = 1, isto é, T é uma matriz não derrogatória.
Lema 2.2.3 Sejam a, b ∈ R e λ ∈ C. Seja ainda K ∈ C3×3 uma matriz hermítica tal que
In(K) ≥ (1, 1, 0). Então, para todo z ∈ C \ {0}, existe y ∈ C tal que a matriz


ia z y




T =  0 ib 1  ∈ C3×3


0 0 λ
satisfaz a condição In(T + T ∗ ) = In(K).
Demonstração. Seja



S=

1
0
0
1
−z −1 −y z −1
0



3×3
0 ∈C .

1
Então a matriz T + T ∗ é congruente com a matriz


0 z
 ⊕ 2<(λ) − 2<(yz −1 ) .
S(T + T ∗ )S ∗ = 
z 0
24
2.2 A nossa contribuição
Como

In 
0 z
z 0

 = (1, 1, 0),
o valor de y pode ser escolhido por forma a que In(T + T ∗ ) = In(K).
Lema 2.2.4 Seja L ∈ Cn×n uma matriz não derrogatória tal que π(L) = 0. Seja K ∈ Cn×n
uma matriz hermítica. Sejam ainda λ1 , . . . , λn os valores próprios da matriz L ordenados por
forma a que:
se λi = λj , para algum i < j, então λi = λk , para todo k ∈ {i, . . . , j};
se <(λi ) = 0, para algum i, então <(λk ) = 0, para todo k ∈ {1, . . . , i}.
Suponhamos ainda que o seguinte caso não é válido:
(S0 ) n ≥ 2, δ(L) > 0 e min{π(K), ν(K)} = 0.
Se são válidas as condições (2.2) a (2.6) então a matriz L é semelhante a uma τ -matriz da forma
(2.8) e In(T + T ∗ ) = In(K).
Demonstração. Por indução em n.
Suponhamos n = 1. Como L é uma matriz não derrogatória, i(L) = 1 e i20 (L) = 0. Além disso,
por hipótese, i+ (L) = 0. Assim In(L) = (0, 1, 0) ou In(L) = (0, 0, 1). Por outro lado, das
condições (2.2) a (2.4) vem que
π(K) = 0, ν(K) ≥ i− (L) e δ(K) ≥ 2i0 (L) − 1.
Logo In(L) = In(L + L∗ ) = In(K).
Suponhamos agora que n = 2. Então, para todo t ∈ C \ {0}, a matriz L é semelhante à matriz


λ1 t
 ∈ C2×2 .
T =
0 λ2
Note-se que L e T são matrizes não derrogatórias e têm os mesmos valores próprios. Por
hipótese, ou <(λ1 ) = 0 ou <(λ1 ) < 0.
Se <(λ1 ) = 0, então a matriz T + T ∗ tem uma submatriz nula de ordem 1 e det(T + T ∗ ) 6= 0.
Pelo entrelaçamento dos valores próprios, In(T + T ∗ ) = (1, 1, 0), para todo t ∈ C \ {0}.
25
2.2 A nossa contribuição
Por outro lado, pelas condições (2.2) a (2.4), sabemos que π(K) ≥ 1 e δ(K) ≥ 0. Além
disso, como (S0 ) não é válido e δ(L) > 0, então min{π(K), ν(K)} 6= 0 e, consequentemente,
ν(K) ≥ 1. O que permite concluir que In(K) = (1, 1, 0) = In(T + T ∗ ).
Se <(λ1 ) < 0, pela forma como os valores próprios da matriz L foram ordenados e recordando
que π(L) = 0, concluímos que <(λ2 ) < 0. Além disso, a condição (2.3) implica que ν(K) ≥ 1.
Como



(0, 2, 0),


∗
In(T + T ) =
(1, 1, 0),



 (0, 1, 1),
se
se
se
p
0 < |t| < 2 <(λ1 )<(λ2 )
p
|t| > 2 <(λ1 )<(λ2 )
p
|t| = 2 <(λ1 )<(λ2 )
basta escolher t ∈ C \ {0} por forma a que In(T ∗ + T ) = In(K).
Por fim, suponhamos que n ≥ 3. Seja L0 ∈ C(n−1)×(n−1) uma matriz não derrogatória cujos
valores próprios são λ1 , . . . , λn−1 . Se n = 3 e In(K) = (1, 1, 1), seja K0 = diag(1, −1); caso
contrário, seja K0 ∈ C(n−1)×(n−1) uma matriz hermítica tal que
min{π(K), 1} ≤ π(K0 ) ≤ π(K)
min{ν(K), 1} ≤ ν(K0 ) ≤ ν(K)
min{δ(K), 1} ≤ δ(K0 ) ≤ δ(K).
De acordo com a hipótese de indução, a matriz L0 é semelhante a uma τ -matriz da forma




λ1
∗


t

  ∗
...
 ∈ C(n−1)×(n−1) ,
(2.9)
T0 = 
=


0 λn−1
0
λn−1
com t ∈ C(n−2)×1 e In(T0 + T0∗ ) = In(K0 ).
Como π(L) = 0, ou <(λn−1 ) < 0 ou <(λn−1 ) = 0.
caso 1 Suponhamos que <(λn−1 ) < 0. Seja


−1
In−2 −(2<(λn−1 )) t
 ∈ C(n−1)×(n−1) .
X0 = 
0
1
26
2.2 A nossa contribuição
Então a matriz T0 + T0∗ é congruente com a matriz
X0 (T0 + T0∗ )X0∗ = S ⊕ [2<(λn−1 )] ∈ C(n−1)×(n−1) ,
para alguma matriz S ∈ C(n−2)×(n−2) . Logo
In(K0 ) = In(T0 + T0∗ ) = In(S) + In ([2<(λn−1 )]),
ou seja, In(S) = In(K0 ) − (0, 1, 0).
Seja Kr ∈ C2×2 uma matriz tal que
In(Kr ) = In(K) − In(S) ≥ In(K0 ) − In(S) = (0, 1, 0).
Por hipótese de indução, existe ν ∈ C \ {0} tal que a matriz


λn−1 ν
 ∈ C2×2
R=
0
λn
satisfaz a condição In(R + R∗ ) = In(Kr ).
Seja

 T0

T =

0
(2<(λn−1 ))−1 νt
ν
λn



 ∈ Cn×n .

Pelo lema 2.2.2, T é uma matriz não derrogatória e, consequentemente, T e L são matrizes
semelhantes. Seja X = X0 ⊕ [1]. Então a matriz T + T ∗ é congruente com a matriz
X(T + T ∗ )X ∗ = S ⊕ (R + R∗ ),
o que mostra que In(T + T ∗ ) = In(S) + In(R + R∗ ) = In(K).
caso 2 Suponhamos agora que <(λn−1 ) = 0. Então, pela forma como foram ordenados os
valores próprios da matriz L, <(λi ) = 0, para todo i ∈ {1, . . . , n − 1}, ou seja, todas as entradas
principais da matriz T0 + T0∗ são iguais a 0. Particione-se a matriz T0 da seguinte forma:


T11 T12
 ∈ C(n−1)×(n−1) ,
T0 = 
0 T22


λn−2
t
∗
 ∈ C2×2 , com t ∈ C \ {0}. Consequentemente, In(T2,2 + T2,2
onde T22 = 
)=
0
λn−1
(1, 1, 0).
27
2.2 A nossa contribuição
Se n = 3, consideremos T0 = T22 . Como In(K) ≥ (1, 1, 0), pelo lema 2.2.3, existe y ∈ C tal
que a matriz

λ
t y
 1

T =  0 λ2 1

0 0 λ3



 ∈ C3×3

é semelhante à matriz L e satisfaz a condição In(T + T ∗ ) = In(K).
Suponhamos agora que n > 3. Seja


∗ −1
In−3 −T12 (T22 + T22 )
 ∈ C(n−1)×(n−1) .
X0 = 
0
I2
Então a matriz T0 + T0∗ é congruente com a matriz
∗
) ∈ C(n−1)×(n−1) ,
X0 (T0 + T0∗ )X0∗ = S ⊕ (T22 + T22
para alguma matriz S ∈ C(n−3)×(n−3) . Então
∗
In(K0 ) = In(T0 + T0∗ ) = In(S) + In(T22 + T22
),
∗
ou seja, In(S) = In(K0 ) − In(T22 + T22
). Novamente, pelo lema 2.2.3, existe y ∈ C tal que a
matriz

 T22

R=

0
y



3×3
1 ∈C

λn
satisfaz a condição In(R + R∗ ) = In(K) − In(S). Note-se que
∗
In(K) − In(S) ≥ In(K0 ) − In(S) = In(T22 + T22
) = (1, 1, 0).
Seja

∗ −1
T11 T12 T12 (T22 + T22
) M


T = 0

0
T22
M
0
λn



 ∈ Cn×n ,

com M = [y 1]T ∈ C2×1 . Pelo lema 2.2.2, T é uma matriz não derrogatória e como as matrizes
T e L têm os mesmos valores próprios, são semelhantes.
Seja X = X0 ⊕ [1] ∈ Cn×n . Então a matriz T + T ∗ é congruente com a matriz X(T + T ∗ )X ∗ =
S ⊕ (R + R∗ ), o que mostra que In(T + T ∗ ) = In(S) + In(R + R∗ ) = In(K).
28
2.2 A nossa contribuição
Analogamente se mostra que:
Lema 2.2.5 Seja L ∈ Cn×n uma matriz não derrogatória tal que ν(L) = 0. Seja K ∈ Cn×n
uma matriz hermítica. Sejam ainda λ1 , . . . , λn os valores próprios de L ordenados de acordo
com o lema 2.2.4. Suponhamos ainda que não é válido o caso (S0 ).
Se são válidas as condições (2.2) a (2.6) então L é semelhante a uma τ -matriz da forma (2.8) e
In(T + T ∗ ) = In(K).
O próximo teorema é uma das soluções parciais do problema 1 a apresentar neste trabalho.
Este resultado estabelece as relações entre a classe de semelhança da matriz L e a classe de
congruência da matriz K quando é válida a equação de Lyapunov e H é uma matriz definida
positiva e ou L é uma matriz não derrogatória ou K é uma matriz semi-definida positiva.
Teorema 2.2.6 Sejam L, K ∈ Cn×n matrizes tais que K é uma matriz hermítica. Suponhamos
que ou L é uma matriz não derrogatória ou K é uma matriz semi-definida positiva. Suponhamos
ainda que não é válido o caso (S), referido no enunciado no teorema 2.2.1.
Então existe uma matriz definida positiva H ∈ Cn×n tal que
In(LH + HL∗ ) = In(K)
se e só se são válidas as condições (2.2) a (2.6).
Demonstração.
Note-se que o teorema 2.2.1 é a condição suficiente. Resta apenas mostrar
a condição necessária. Sejam L, K ∈ Cn×n matrizes tais que K é uma matriz hermítica e
suponhamos não é válido o caso (S).
Se a matriz L é escalar então é da forma L = λIn , para algum λ ∈ C. As condições (2.2) a (2.6)
implicam que existe uma matriz definida positiva H ∈ Cn×n tal que In(K) = In(LH + HL∗ ).
De facto, como In(L + L∗ ) = In(L), basta considerar H = In .
Suponhamos agora que a matriz L é não escalar. A demonstração é feita por indução em n. Para
n = 1, a demonstração é trivial. Suponhamos então que n ≥ 2.
29
2.2 A nossa contribuição
caso 1 Suponhamos que L é uma matriz não derrogatória. Vamos considerar 3 casos: (i)
π(L) = 0, (ii) ν(L) = 0 e (iii) π(L) > 0 e ν(L) = 0.
Suponhamos que π(L) = 0 Sejam λ1 , . . . , λn os valores próprios da matriz L. Sem perda de
generalidade, suponhamos que estão ordenados de acordo com o lema 2.2.4.
Se não é válido o caso (S0 ) então, pelo lema 2.2.4, existe uma matriz não singular X ∈ Cn×n tal
que a matriz L é semelhante à matriz T = X −1 LX e In(T + T ∗ ) = In(K). Por outro lado,
In(T + T ∗ ) = In (X(T + T ∗ )X ∗ ) = In(LXX ∗ + XX ∗ L∗ ).
Logo existe uma matriz definida positiva H = XX ∗ ∈ Cn×n tal que In(LH + HL∗ ) = In(K).
Note-se que XX ∗ é uma matriz definida positiva pois x∗ (XX ∗ )x > 0, para todo x ∈ C \ {0}.
Suponhamos agora que (S0 ) é válido, ou seja, δ(L) > 0 e min{π(K), ν(K)} = 0. Então, pelas
condições (2.2) a (2.6), concluimos que i20 (L) = 0, i0 (L) = 1 e δ(K) > 0. Além disso, como
(S) não é válido, temos que δ(K) ≥ δ(L).
Sem perda de generalidade, suponhamos que <(λ1 ) = 0.
Suponhamos que n = 2. Suponhamos ainda que <(λ2 ) = 0. Como i20 (L) = 0, vem que λ1 6= λ2
e a matriz L é semelhante à matriz diag(λ1 , λ2 ). Sem perda de generalidade, suponhamos L =
diag(λ1 , λ2 ). Então In(L + L∗ ) = (0, 0, 2) = In(K), pois δ(K) ≥ δ(L) = 2. Suponhamos
agora que <(λ2 ) 6= 0. Sendo π(L) = 0, <(λ2 ) < 0. Novamente, sem perda de generalidade,
consideremos L = diag(λ1 , λ2 ). Como δ(K) ≥ δ(L) = 1 e i− (L) = 1, pela condição (2.3),
vem que ν(K) ≥ 1 e é fácil verificar que In(L + L∗ ) = (0, 1, 1) = In(K).
Suponhamos agora que n ≥ 3. Como <(λ1 ) = 0 e i20 (L) = 0, a matriz L é semelhante à
matriz [λ1 ] ⊕ L0 , para alguma matriz L0 ∈ C(n−1)×(n−1) . Sem perda de generalidade, seja
L = [λ1 ]⊕L0 . Seja K0 ∈ C(n−1)×(n−1) uma matriz hermítica tal que In(K0 ) = In(K)−(0, 0, 1).
De acordo com a hipótese de indução, existe uma matriz definida positiva H0 ∈ C(n−1)×(n−1) tal
que In(L0 H0 + H0 L∗0 ) = In(K0 ). Seja H = [1] ⊕ H0 ∈ Cn×n . Então In(LH + HL∗ ) = In(K)
e a demonstração para o caso π(L) = 0 fica completa.
Suponhamos que ν(L) = 0 Este caso demonstra-se de forma análoga ao anterior.
30
2.2 A nossa contribuição
Suponhamos agora que ν(L) > 0 e π(L) > 0 Pelas condições (2.2) e (2.3), ν(K) > 0 e
π(K) > 0. Assim a matriz L é semelhante a uma matriz da forma L+ ⊕ L− , onde L+ ∈ Cn+ ×n+
é uma matriz não derrogatória e ν(L+ ) = 0, L− ∈ Cn− ×n− é uma matriz não derrogatória e
π(L− ) = δ(L− ) = 0, com n+ + n− = n. Sejam π+ , ν+ , δ+ , π− , ν− e δ− inteiros definidos por:
π+ = max{1, min{π(K), n+ } − 1},
ν+ = min{ν(K), n+ − π+ },
δ+ = n + − π + − ν + ,
ν− = min{ν(K), n− },
π− = min{π(K), n− − ν− },
δ− = n − − π − − ν − .
É fácil verificar que qualquer um dos inteiros π+ , ν+ , δ+ , π− , ν− e δ− é não negativo. Além
disso, as seguintes desigualdades são satisfeitas:
π+ ≥ 1,
ν+ ≥ 1,
(2.10)
a menos que
n+ = 1,
(2.11)
ν− ≥ 1,
(2.12)
max{π+ , π− } ≤ π(K) ≤ min{n+ + π− , n− + π+ },
(2.13)
max{ν+ , ν− } ≤ ν(K) ≤ min{n+ + ν− , n− + ν+ },
(2.14)
π(K) − ν(K) ≤ π+ + π− ,
(2.15)
ν(K) − π(K) ≤ ν+ + ν− .
(2.16)
De acordo com a hipótese de indução, existem matrizes definidas positivas H+ ∈ Cn+ ×n+ e
H− ∈ Cn− ×n− tais que In(L+ H+ +H+ L∗+ ) = (π+ , ν+ , δ+ ) e In(L− H− +H− L∗− ) = (π− , ν− , δ− ).
Dadas as condições (2.13) a (2.16) e, de acordo com o teorema 1.2.4, existe uma matriz X ∈
Cn+ ×n− tal que a matriz


L+ H+ +
X
∗
H+ L∗+

X
L− H− +
H− L∗−
 ∈ Cn×n
(2.17)
31
2.2 A nossa contribuição
tem a mesma inércia de K. Como as matrizes L+ e L− não têm valores próprios comuns,
podemos supor, sem perda de generalidade, que


−1
L+ XH−
.
L=
0
L−
Seja H = H+ ⊕ H− ∈ Cn×n . Então a matriz LH + HL∗ tem a forma (2.17) e, portanto,
In(LH + HL∗ ) = In(K).
caso 2 Suponhamos que K é uma matriz semi-definida positiva e L é uma matriz derrogatória.
Sem perda de generalidade, consideremos a matriz L na sua forma normal companheira e suponhamos que L = L0 ⊕ Lr , com L0 = C(f1 ) ⊕ · · · ⊕ C(fr−1 ) ∈ Cn0 ×n0 e Lr = C(fr ) ∈ Cnr ×nr ,
onde f1 | · · · |fr são os polinómios invariantes da matriz L e n0 + nr = n. Sejam π0 , δ0 , πr e δr
inteiros definidos por:
π0 = max{i+ (L0 ), δ(Lr ) + π(K) − nr },
δ0 = n 0 − π 0 ,
πr = π(K) − π0 ,
δr = nr − πr .
É fácil verificar que estes inteiros são não negativos. Como K ≥ 0 e ν(K) = 0, pela condição
(2.3), temos que i− (L) = i20 (L) = 0. Além disso, como (S) não é válido, δ(L) ≤ δ(K). Não é
difícil verificar que
π0 ≥ i+ (L0 ),
δ0 ≥ δ(L0 ) ≥ i0 (L0 ) ≥ 2i0 (L0 ) − n0 ,
πr ≥ i+ (Lr ),
δr ≥ δ(Lr ) ≥ i0 (Lr ) ≥ 2i0 (Lr ) − nr .
De acordo com a hipótese de indução, existem matrizes definidas positivas H0 ∈ Cn0 ×n0 e
Hr ∈ Cnr ×nr tais que In(L0 H0 + H0 L∗0 ) = (π0 , 0, δ0 ) e In(Lr Hr + Hr L∗r ) = (πr , 0, δr ). Seja
H = H0 ⊕ Hr ∈ Cn×n . Então In(LH + HL∗ ) = In(K).
32
2.2 A nossa contribuição
O teorema 2.2.6 nem sempre é válido quando L é uma matriz derrogatória e a matriz K não é
semi-definida positiva, como se pode verificar no exemplo seguinte.
Exemplo 2.2.7 Seja L = λ1 Ip ⊕ λ2 Iq ∈ Cn×n , onde λ1 , λ2 ∈ C são tais que λ1 6= λ2 e
<(λ1 ) = <(λ2 ) = 0 e p+q = n. Suponhamos que é válido o teorema 2.2.6, ou seja, suponhamos
que existe uma matriz definida positiva


H11 H12
 ∈ Cn×n ,
H=
∗
H12 H22
tal que In(LH + HL∗ ) = In(K). Então

LH + HL∗ = 
com
H11 ∈ Cp×p ,
0
(λ1 − λ2 )H12
∗
(λ2 − λ1 )H12
0
(2.18)


e pelas condições (iv) e (v) do teorema 1.2.4, π(K) = ν(K).
Suponhamos que n = 5, p = 3 e q = 2 e seja K ∈ C5×5 uma matriz hermítica tal que In(K) =
(2, 1, 2). Então, como 2 = δ(L) = δ(K) e min{π(K), ν(K)} = 1 6= 0, o caso (S) não é válido.
Por outro lado, as condições (2.2) a (2.6) são válidas. E, no entanto, o teorema 2.2.6 não é válido
pois, neste caso, 2 = π(K) 6= ν(K) = 1.
O próximo resultado é o teorema 2.1.5 formulado como corolário do teorema anterior, apresentando assim uma demonstração alternativa à dada em [2, Corolário III].
Corolário 2.2.8 Seja L ∈ Cn×n uma matriz. Então existe uma matriz definida positiva H ∈
Cn×n tal que LH + HL∗ ≥ 0 se e só se a matriz L não tem divisores elementares com raízes
imaginárias múltiplas e ν(L) = 0.
Demonstração.
Seja L ∈ Cn×n uma matriz. Suponhamos que existe uma matriz definida
positiva H ∈ Cn×n tal que a matriz K = LH +HL∗ é semi-definida positiva, ou seja, π(K) > 0,
ν(K) = 0 e δ(K) > 0. De acordo com o teorema 2.2.1, max{i− (L), i20 (L)} = 0, ou seja:
33
2.2 A nossa contribuição
i− (L) = 0, isto é, ν(L) = 0,
i20 (L)} = 0, isto é, a matriz L não admite divisores elementares com raízes imaginárias
múltiplas.
Reciprocamente, suponhamos que a matriz L não admite divisores elementares com raízes imaginárias múltiplas e ν(L) = 0. Seja K ∈ Cn×n uma matriz hermítica tal que
In(K) = (i+ (L), 0, n − i+ (L)).
É fácil verificar que as condições (2.2) a (2.6) são válidas e δ(L) ≤ δ(K).
Então, pelo teorema 2.2.6, existe uma matriz definida positiva H ∈ Cn×n tal que
In(LH + HL∗ ) = In(K).
Donde LH + HL∗ ≥ 0.
2.2.2 L é uma matriz não derrogatória
Nesta secção apresentamos condições para as classes de congruência das matrizes K e H quando
é válida a equação de Lyapunov, L é uma matriz não derrogatória e K é uma matriz indefinida.
O nosso resultado generaliza os resultados obtidos por L. M. DeAlba em [7].
Seguiremos de perto [19].
O próximo resultado é uma generalização do lema 2.2.3.
Lema 2.2.9 Sejam a ∈ R e λ, µ ∈ C. Seja ainda K ∈ C3×3 uma matriz hermítica tal que
In(K) ≥ (1, 1, 0).
Então, para todo z ∈ C \ {0}, existe y ∈ C tal que a matriz


λ 1 y




T =  0 ia z  ∈ C3×3


0 0 µ
satisfaz a condição In(T + T ∗ ) = In(K).
34
2.2 A nossa contribuição
Demonstração. Seja S ∈ Cn×n uma matriz definida por:

1 z −1 (2<(µ)z −1 − y) −z −1


S= 0
1
0

0
0
1



.

Então a matriz T + T ∗ é congruente com a matriz


i
h
0
z
2
.
S(T + T ∗ )S ∗ = 2<(λ) + 2<(µ) z −1 − 2< yz −1 ⊕ 
z 2<(µ)
Assim

h
2
In(T + T ∗ ) = In 2<(λ) + 2<(µ) z −1 − 2< yz −1
i
+ In 
0
z
z 2<(µ)


e, portanto, é possível escolher o valor de y por forma a que In(T + T ∗ ) = In(K).
Lema 2.2.10 Sejam L, K ∈ Cn×n matrizes tais que L uma matriz não derrogatória e In(K) ≥
(1, 1, 0). Sejam ainda λ1 , . . . , λn os valores próprios de L ordenados por forma a que:
se λi = λj , para algum i < j, então λi = λk , para todo k ∈ {i, . . . , j},
se <(λi ) < 0, para algum i, então <(λk ) < 0, para todo k ∈ {1, . . . , i},
se <(λi ) > 0, para algum i, então <(λk ) > 0, para todo k ∈ {i, . . . , n}.
Então existe uma τ -matriz T = [tij ] ∈ Cn×n tal que tii = λi , para todo i ∈ {1, . . . , n}, e
In(T + T ∗ ) = In(K).
Demonstração. Por indução em n. Se n = 1, a demonstração é imediata.
Se n = 2, o resultado é fácil de provar. De facto, In(K) = (1, 1, 0) e, além disso, a matriz L é
semelhante a uma τ -matriz T ∈ C2×2 da forma


λ1 t
 , para algum t ∈ C \ {0}.
T =
0 λ2
35
2.2 A nossa contribuição
Note-se que as matrizes T e L têm os mesmos valores próprios e são ambas não derrogatórias.
Suponhamos que <(λ1 ) = 0 ou <(λ2 ) = 0; então, para todo t ∈ C\{0}, tem-se que In(T +T ∗ ) =
(1, 1, 0). Suponhamos que <(λ2 ) < 0, então <(λ1 ) < 0 e

p


(0,
2,
0)
se
0
<
|t|
<
2
<(λ1 )<(λ2 )


p
In(T + T ∗ ) =
.
(1, 1, 0) se |t| > 2 <(λ1 )<(λ2 )


p

 (0, 1, 1) se |t| = 2 <(λ )<(λ )
1
2
Basta escolher t de modo a obter a inércia pretendida.
Suponhamos agora que <(λ2 ) > 0. Se <(λ1 ) > 0, o raciocínio é análogo ao anterior, ou seja,

p


(2,
0,
0)
se
0
<
|t|
<
2
<(λ1 )<(λ2 )


p
In(T + T ∗ ) =
.
(1, 1, 0) se |t| > 2 <(λ1 )<(λ2 )


p

 (1, 0, 1) se |t| = 2 <(λ )<(λ )
1
2
e basta escolher t de modo a obter a inércia pretendida.
Se <(λ1 ) < 0, atendendo à definição de valores próprios, concluímos que In(T +T ∗ ) = (1, 1, 0).
Suponhamos agora que n ≥ 3. Se π(L) = 0 ou ν(L) = 0, obtemos casos particulares
do lema 2.2.4 e do lema 2.2.5, respectivamente. Note-se que o caso (S0 ) não é válido pois
min{π(K), ν(K)} ≥ 1 e as condições (2.2) a (2.6) são satisfeitas uma vez que
i+ (L), i− (L), i0 (L), i20 (L) ∈ {0, 1}.
Suponhamos então que π(L) > 0 e ν(L) > 0.
Como n ≥ 3, π(L) + δ(L) ≥ 2 ou ν(L) + δ(L) ≥ 2. Sem perda de generalidade, suponhamos
que π(L) + δ(L) ≥ 2.
Sejam n− = ν(L) e n+ = π(L) + δ(L). Então a matriz L é semelhante a uma matriz da forma
L− ⊕ L+ ∈ Cn×n , onde L− ∈ Cn− ×n− é uma matriz não derrogatória e tem valores próprios
λ1 , . . . , λn− e L+ ∈ Cn+ ×n+ é uma matriz não derrogatória e tem valores próprios λn− +1 , . . . , λn .
Desta construção resulta que ou <(λn− +1 ) > 0 ou <(λn− +1 ) = 0.
36
2.2 A nossa contribuição
caso 1 Suponhamos que <(λn− +1 ) > 0. Sejam π+ , ν+ , δ+ , π− , ν− e δ− inteiros definidos por:
ν− = min{n− , ν(K)},
ν+ = ν(K) − ν− ,
(2.19)
π+ = min{π(K), n+ − ν+ },
(2.20)
π− = π(K) − π+ ,
(2.21)
δ− = n− − ν− − π− ,
(2.22)
δ+ = n+ − ν+ − π+ .
(2.23)
Não é difícil verificar que ν− , π+ são inteiros positivos e ν+ , π− , δ− , δ+ são inteiros não negativos.
Do lema 2.2.4, vem que existe uma τ -matriz T− ∈ Cn− ×n− com diagonal principal λ1 , . . . , λn−
tal que In(T− + T−∗ ) = (π− , ν− , δ− ). Analogamente, pelo lema 2.2.5, existe uma τ -matriz T+ ∈
Cn+ ×n+ com diagonal principal λn− +1 , . . . , λn tal que In(T+ + T+∗ ) = (π+ , ν+ , δ+ ).
Suponhamos que

T− = 

T+ = 
∗
t−
0 λn−
λn− +1 t+
0
∗

 ∈ Cn− ×n−
para algum
t− ∈ C(n− −1)×1 ,
para algum
t+ ∈ C1×(n+ −1) .
(2.24)

 ∈ Cn+ ×n+
Sejam X− ∈ Cn− ×n− e X+ ∈ Cn+ ×n+ matrizes definidas, respectivamente, por


−1
In− −1 −(2<(λn− )) t−

X− = 
0
1


1
0
.
X+ = 
−1 ∗
−(2<(λn− +1 )) t+ In+ −1
(2.25)
Então a matriz T− + T−∗ é congruente com a matriz
X− (T− + T−∗ )X−∗ = S− ⊕ [2<(λn− )],
(2.26)
37
2.2 A nossa contribuição
para alguma matriz S− ∈ C(n− −1)×(n− −1) .
E a matriz T+ + T+∗ é congruente com a matriz
X+ (T+ + T+∗ )X+∗ = [2<(λn− +1 )] ⊕ S+ ,
para alguma matriz S+ ∈ C(n+ −1)×(n+ −1) .
Donde In(S− ) = (π− , ν− − 1, δ− ) e In(S+ ) = (π+ − 1, ν+ , δ+ ).
Sejam T, X ∈ Cn×n matrizes definidas por X = X− ⊕ X+ e

(2<(λn− ))−1 t− (4<(λn− )<(λn− +1 ))−1 t− t+
 T−

T =
1
(2<(λn− +1 ))−1 t+

0
T+



.

Então a matriz T + T ∗ é congruente com a matriz


2<(λn− )
1
 ⊕ S+ .
X(T + T ∗ )X ∗ = S− ⊕ 
1
2<(λn− +1 )
Logo In(T + T ∗ ) = In(S− ) + (1, 1, 0) + In(S+ ) = In(K), ou seja, existe uma τ -matriz T nas
condições pretendidas.
caso 2 Suponhamos agora que <(λn− +1 ) = 0. Definam-se os inteiros π+ , ν+ , δ+ , π− , ν− e δ−
da forma a seguir indicada.
Se ν(K) = 1, sejam ν− = 1, ν+ = 1, defina-se π+ como em (2.20), seja
π− = max{0, π(K) − π+ − 1},
e defina-se δ− e δ+ como em (2.22) e (2.23), respectivamente.
Se ν(K) ≥ 2, seja
ν− = min{n− , ν(K) − 1}
e defina-se ν+ , π+ , π− , δ− e δ+ como em (2.19) a (2.23), respectivamente.
Novamente, não é difícil verificar que, em qualquer um dos casos, ν− , ν+ , π+ são inteiros positivos e π− , δ− , δ+ são inteiros não negativos.
Analogamente ao caso anterior, aplicando o lema 2.2.4 e o lema 2.2.5, respectivamente, existe
uma τ -matriz T− ∈ Cn− ×n− com diagonal principal λ1 , . . . , λn− tal que In(T− +T−∗ ) = (π− , ν− , δ− )
38
2.2 A nossa contribuição
e existe uma τ -matriz T+ ∈ Cn+ ×n+ com diagonal principal λn− +1 , . . . , λn tal que In(T+ +T+∗ ) =
(π+ , ν+ , δ+ ).
Suponhamos que a matriz T− é particionada tal como em (2.24) e suponhamos que


T11 T12
 ∈ Cn+ ×n+ , onde T11 ∈ C2×2 .
T+ = 
0 T22
∗
) =
Como <(λn− +1 ) = 0 e a entrada (1, 2) da matriz T11 é não nula, vem que In(T11 + T11
(1, 1, 0).
Defina-se a matriz X− como em (2.25) e seja X+ ∈ Cn+ ×n+ a matriz definida por:


I2
0
.
X+ = 
∗
∗ −1
−T12 (T11 + T11 )
In+ −2
Então a matriz T− + T−∗ é congruente com a matriz definida em (2.26) e a matriz T+ + T+∗ é
congruente com a matriz
∗
) ⊕ S+ ,
X+ (T+ + T+∗ )X+∗ = (T11 + T11
para alguma matriz S+ ∈ C(n+ −2)×(n+ −2) .
Donde In(S− ) = (π− , ν− − 1, δ− ) e In(S+ ) = (π+ − 1, ν+ − 1, δ+ ).
De acordo com o lema anterior (lema 2.2.9), existe y ∈ C tal que a matriz


λn− 1 y
 ∈ C3×3
R=
0
T11
satisfaz a condição In(R + R∗ ) = In(K) − In(S− ) − In(S+ ) ≥ (1, 1, 0).
Seja M = [ 1 y ] ∈ C1×2 e seja

∗ −1
(2<(λn− ))−1 t− M (2<(λn− ))−1 t− M (T11 + T11
) T12
 T−

∗ −1
T =
M
M (T11 + T11
) T12

0
T+



 ∈ Cn×n .

Seja ainda X = X− ⊕ X+ ∈ Cn×n . Então a matriz T + T ∗ é congruente com a matriz
X(T + T ∗ )X ∗ = S− ⊕ (R + R∗ ) ⊕ S+ .
e, portanto, In(T + T ∗ ) = In(K).
39
2.2 A nossa contribuição
Observe-se que as matrizes L e T definidas no lema anterior são semelhantes. De facto, pelo
lema 2.2.2, T é uma matriz não derrogatória e, além disso, tem os mesmos valores próprios que
a matriz L; logo é semelhante à matriz L.
O próximo teorema é o resultado principal desta secção e apresenta uma solução do problema 1
para o caso em que L é uma matriz não derrogatória e K é uma matriz indefinida.
Teorema 2.2.11 Sejam L, K ∈ Cn×n matrizes tais que L é uma matriz não derrogatória e
In(K) ≥ (1, 1, 0). Sejam ainda πh e νh inteiros não negativos tais que πh + νh = n. Então existe
uma matriz hermítica H ∈ Cn×n tal que In(H) = (πh , νh , 0) e In(LH + HL∗ ) = In(K).
Demonstração.
Sejam L, K ∈ Cn×n matrizes tais que L é uma matriz não derrogatória e
In(K) ≥ (1, 1, 0).
demonstração se δ(L) = n Sejam λ1 , . . . , λn os valores próprios da matriz L, ordenados
de acordo com o lema 2.2.10. Escolha-se um número real negativo h tal que, para todo i ∈
{1, . . . , n}, se λi 6= 0 então hλi não é valor próprio da matriz L. De acordo com o lema 2.2.10,
existe uma τ -matriz T ∈ Cn×n cuja diagonal principal é
hλ1 , . . . , hλνh , λνh +1 , . . . , λn
e tal que In(T + T ∗ ) = In(K). Seja H = (hIνh ) ⊕ Iπh ∈ Cn×n . Então In(H) = (πh , νh , 0), a
matriz T H −1 é semelhante à matriz L e
In((T H −1 )H + H(T H −1 )∗ ) = In(K).
(2.27)
demonstração se δ(L) =0 Vamos considerar dois casos: νh ≤ π(L) e νh > π(L).
caso 1 Suponhamos que νh ≤ π(L). Sejam λ1 , . . . , λn os valores próprios da matriz L, ordenados de acordo com o lema 2.2.10. Analogamente à demonstração anterior, escolha-se um
número real negativo h tal que, para todo i ∈ {1, . . . , n}, hλi não é valor próprio da matriz L.
De acordo com o lema 2.2.10, existe uma τ -matriz T ∈ Cn×n cuja diagonal principal é
λ1 , . . . , λν(L) , hλν(L)+1 , . . . , hλν(L)+νh , λν(L)+νh +1 , . . . , λn ,
e tal que In(T + T ∗ ) = In(K).
40
2.2 A nossa contribuição
Seja
H = Iν(L) ⊕ (hIνh ) ⊕ Iπ(L)−νh ∈ Cn×n .
Então In(H) = (πh , νh , 0), a matriz T H −1 é semelhante à matriz L e a condição (2.27) é válida.
caso 2 Suponhamos agora que νh > π(L). Então πh = n − νh < n − π(L) = ν(L) = π(−L).
De acordo com o caso anterior, existe uma matriz X ∈ Cn×n semelhante à matriz −L e existe
uma matriz hermítica H ∈ Cn×n tal que In(H) = (νh , πh , 0) e In(XH + HX ∗ ) = In(K). Então
a matriz −X é semelhante à matriz L, In(−H) = (πh , νh , 0) e
In((−X)(−H) + (−H)(−X ∗ )) = In(K).
demonstração se 0< δ(L) < n A matriz L é semelhante a uma matriz da forma L0 ⊕ L1 , onde
L0 ∈ Cn0 ×n0 é uma matriz não derrogatória tal que δ(L0 ) = n0 , com 0 < n0 < n, e L1 ∈ Cn1 ×n1
é uma matriz não derrogatória tal que δ(L1 ) = 0.
Sem perda de generalidade, suponhamos que π(K) ≥ ν(K). O caso π(K) ≤ ν(K) é análogo.
Escolham-se inteiros não negativos p0 , n0 , p1 , n1 tais que p0 +n0 = n0 , p1 +n1 = n1 , p0 +p1 = πh
e n0 + n1 = νh . Definam-se ainda os inteiros não negativos π0 , ν0 , δ0 , π1 , ν1 , δ1 e as matrizes
hermíticas H0 ∈ Cn0 ×n0 e H1 ∈ Cn1 ×n1 da forma a seguir indicada.
Se n0 = 1, escolha-se h0 ∈ {1, −1} tal que a matriz H0 = [h0 ] satisfaz a condição
In(H0 ) = (p0 , n0 , 0)
(2.28)
e sejam π0 , ν0 , δ0 inteiros que satisfaçam a condição
In(L0 H0 + H0 L∗0 ) = (π0 , ν0 , δ0 ).
(2.29)
Se n0 ≥ 2, definam-se
π0 = min{π(K), n0 − 1},
ν0 = min{ν(K), n0 − π0 },
δ0 = n0 − π0 − ν0 .
Então min{π0 , ν0 } > 0 e δ0 ≥ 0; como δ(L0 ) = n0 , pela demonstração do caso δ(L) = n, existe
uma matriz hermítica H0 ∈ Cn0 ×n0 tal que são válidas as condições (2.28) e (2.29).
41
2.2 A nossa contribuição
Se n1 = 1, escolha-se h1 ∈ {1, −1} tal que a matriz H1 = [h1 ] satisfaz a condição
In(H1 ) = (p1 , n1 , 0),
(2.30)
e sejam π1 , ν1 , δ1 inteiros que satisfazem a condição
In(L1 H1 + H1 L∗1 ) = (π1 , ν1 , δ1 ).
(2.31)
Se n1 ≥ 2, definam-se
π1 = min{π(K), n1 − 1},
ν1 = min{ν(K), n1 − π1 },
δ1 = n1 − π1 − ν1 .
Então min{π1 , ν1 } > 0 e δ1 ≥ 0; como δ(L1 ) = 0, pela demonstração do caso δ(L) = 0, existe
uma matriz hermítica H1 ∈ Cn1 ×n1 tal que as condições (2.30) e (2.31) são válidas.
Em qualquer dos casos, pelo teorema 1.2.4, existe uma matriz X ∈ Cn0 ×n1 tal que


∗
L0 H0 + H0 L0
X
 = In(K).
In 
X∗
L1 H1 + H1 L∗1
Note-se que:
π(K) + ν(K) ≤ n,
max{π0 , π1 } ≤ π(K) ≤ min{n0 + π1 , n1 + π0 },
max{ν0 , ν1 } ≤ ν(K) ≤ min{n0 + ν1 , n1 + ν0 },
π(K) − ν(K) ≤ π0 + π1 ,
ν(K) − π(K) ≤ ν0 + ν1 .
Como as matrizes L0 e L1 não têm valores próprios em comum, a matriz L é semelhante à matriz


L0 XH1−1
 ∈ Cn×n .

0
L1
Sem perda de generalidade, suponhamos que a matriz L tem essa forma.
Seja H = H0 ⊕ H1 ∈ Cn×n . Então In(H) = (πh , νh , 0) e In(LH + HL∗ ) = In(K).
42
Capítulo 3
Equação de Stein
“Research means going out into the unknown
with the hope of finding something new to bring home.
If you know what you are going to do, or even to find there,
then it is not research at all, then it is only a kind of honourable occupation.”
A. Szent-Györgyi
O objectivo deste capítulo é apresentar um estudo análogo ao do capítulo anterior mas para a
equação de Stein. Este estudo é feito tendo por base uma relação entre a equação de Lyapunov
e a equação de Stein, que permite generalizar para o caso discreto os resultados obtidos no caso
contínuo.
Os principais teoremas deste capítulo podem ser encontrados em [18, 19].
3.1
Motivação
Nesta secção, introduzimos a teoria e os resultados que motivam a formulação do problema para
a equação de Stein e apresentamos também soluções parciais desse mesmo problema.
43
3.1 Motivação
Tal como é referido no primeiro capítulo, em 1952, Stein publica um resultado análogo ao de
Lyapunov mas relativo à estabilidade de sistemas discretos em termos de equações matriciais.
Uma das demonstrações possíveis desse resultado é referida no Capítulo 1 e baseia-se numa
definição específica da matriz H dada por (1.2). Outra demonstração, mais imediata, tem por
base o teorema de Lyapunov e a relação entre as duas equações (teorema 1.3.5), envolvendo a
transformada de Cayley, anteriormente definida.
Teorema 3.1.1 (Teorema de Stein) [12] Sejam S, K ∈ Cn×n matrizes tais que K é uma matriz
definida positiva. A matriz S é estável relativamente ao círculo unitário se e só se existe uma
matriz definida positiva H ∈ Cn×n que satisfaz a equação de Stein H − SHS ∗ = K.
Demonstração.
Sejam S, K ∈ Cn×n matrizes tais que K é uma matriz definida positiva.
Suponhamos que a matriz S é estável relativamente ao círculo unitário. Então, pelo corolário
1.3.4, a sua transformada de Cayley C(S) é estável positiva e, pelo teorema de Lyapunov, existe
matriz definida positiva H ∈ Cn×n tal que
C(S)H + HC(S)∗ = 2−1 (In + S)K(In + S)∗ .
Logo H − SHS ∗ = K, pelo teorema 1.3.5.
Reciprocamente, suponhamos que existe uma matriz definida positiva H ∈ Cn×n tal que é válida
a equação de Stein H − SHS ∗ = K > 0. Então existe uma matriz não singular X ∈ Cn×n
tal que C(S)H + HC(S)∗ = XKX ∗ > 0. Aplicando o teorema de Lyapunov, a matriz C(S)
é estável positiva e, consequentemente, a matriz S é estável relativamente ao círculo unitário
(corolário 1.3.4).
Observe-se que aplicando a transformada de Cayley, podemos transferir para a equação de Stein
resultados relativos à equação de Lyapunov desde que −1 não seja valor próprio da matriz S. Por
exemplo, o teorema geral da inércia pode ser reescrito para o caso discreto da seguinte forma:
44
3.1 Motivação
Teorema 3.1.2 (Teorema geral da inércia relativamente ao círculo unitário) [12] Sejam S, K ∈
Cn×n matrizes tais que K é uma matriz definida positiva. Então existe uma matriz hermítica
H ∈ Cn×n tal que H − SHS ∗ = K se e só se δ1 (S) = 0. Além disso, se existir uma matriz
hermítica H ∈ Cn×n tal que H − SHS ∗ = K então In1 (S) = In(H).
Demonstração.
Seja S ∈ Cn×n uma matriz. Suponhamos que existe uma matriz hermítica
H ∈ Cn×n tal que H − SHS ∗ > 0. Pelo teorema 1.3.5, a matriz C(S)H + HC(S)∗ também é
definida positiva. Aplicando o teorema geral da inércia, δ(C(S)) = 0, ou seja, δ1 (S) = 0, pelo
teorema 1.3.3.
O recíproco é análogo. Se δ1 (S) = 0 então δ(C(S)) = 0 e, pelo teorema geral da inércia,
C(S)H + HC(S)∗ > 0, ou seja, a matriz H − SHS ∗ é definida positiva.
Além disso, se C(S)H + HC(S)∗ > 0, pelo teorema geral da inércia, In(C(S)) = In(H) e, pelo
teorema 1.3.3, In1 (S) = In(C(S)); donde In1 (S) = In(H).
Tal como já vimos a inércia relativamente ao círculo unitário é invariante para a semelhança.
Além disso, para toda a matriz não singular R ∈ Cn×n , H − SHS ∗ = K é equivalente a
RHR∗ − (RSR−1 )(RHR∗ )(RSR−1 )∗ = RKR∗ .
(3.1)
Atendendo a esta observação podemos formular o teorema anterior da seguinte forma:
Teorema 3.1.3 Sejam S, H ∈ Cn×n matrizes tais que H é uma matriz hermítica. Então existe
uma matriz S 0 ∈ Cn×n semelhante a S e existe uma matriz H 0 ∈ Cn×n congruente com H tais
que H 0 − S 0 H 0 S 0∗ é definida positiva se e só se δ1 (S) = 0 e In1 (S) = In(H).
Demonstração. Sejam S, H ∈ Cn×n matrizes tais que H é uma matriz hermítica. Suponhamos
que existe uma matriz S 0 ∈ Cn×n semelhante a S e existe uma matriz H 0 ∈ Cn×n congruente
com H tais que H 0 − S 0 H 0 S 0∗ > 0. Pelo teorema 3.1.2, δ1 (S 0 ) = 0 e In(S 0 ) = In(H 0 ). Pelas
propriedades da inércia relativamente ao círculo unitário (teorema 1.2.1) e pelo corolário 1.2.3,
δ1 (S) = 0 e In1 (S) = In(H).
45
3.1 Motivação
Reciprocamente, suponhamos que δ1 (S) = 0 e In1 (S) = In(H). Pelo teorema 3.1.2, existe uma
matriz hermítica H 0 ∈ Cn×n tal que H 0 −SH 0 S ∗ > 0 e In1 (S) = In(H 0 ). Logo In(H 0 ) = In(H),
ou seja, a matriz H 0 é congruente com a matriz H, pelo corolário 1.2.3.
Atendendo a (3.1), existe uma matriz S 0 ∈ Cn×n semelhante a S tal que H 00 − S 0 H 00 S 0∗ é definida
positiva, onde H 00 ∈ Cn×n é uma matriz congruente às matrizes H e H 0 .
Este resultado sugere o problema correspondente para equação de Stein e análogo ao anteriormente formulado para a equação de Lyapunov:
Problema 2 Encontrar um sistema completo de relações entre a classe de semelhança da matriz
S e as classes de congruência das matrizes H e de K quando é válida a equação de Stein
H − SHS ∗ = K.
Note-se que o teorema geral da inércia relativamente ao círculo unitário é uma solução parcial
para este problema, para o caso em que K é uma matriz definida positiva: fornece um sistema
completo de relações entre a classe de semelhança da matriz S e a classe de congruência da
matriz H, quando K é uma matriz semi-definida positiva. O próprio teorema de Stein é uma
solução parcial do problema, para o caso em que K e H são matrizes definidas positivas. De
facto, o teorema de Stein pode ser enunciado do seguinte modo:
Teorema 3.1.4 Sejam S, H ∈ Cn×n matrizes tais que H é uma matriz definida positiva. Então
existe uma matriz S 0 ∈ Cn×n semelhante à matriz S e existe uma matriz definida positiva H 0 ∈
Cn×n congruente com a matriz H tais que a matriz H 0 − S 0 H 0 S 0∗ é definida positiva se e só se
π1 (S) = n.
Demonstração. Sejam S, H ∈ Cn×n matrizes tais que H é uma matriz definida positiva.
Suponhamos que existe uma matriz S 0 ∈ Cn×n semelhante à matriz S e que existe uma matriz
definida positiva H 0 ∈ Cn×n congruente com a matriz H tais que H 0 − S 0 H 0 S 0∗ > 0. Pelo
teorema de Stein, S 0 é uma matriz estável relativamente ao círculo unitário, ou seja, π1 (S 0 ) = n.
Donde, pelas propriedades da inércia (teorema 1.2.1), vem que π1 (S) = n.
46
3.1 Motivação
O recíproco é aplicação directa do teorema anterior. De facto, se π1 (S) = n então δ1 (S) = 0,
ou seja, pelo teorema 3.1.3, existe uma matriz S 0 ∈ Cn×n semelhante à matriz S e existe uma
matriz definida positiva H 0 ∈ Cn×n congruente com a matriz H tais que H 0 − S 0 H 0 S 0∗ > 0.
Os resultados apresentadas em [6] e [7] também relacionam as inércia das matrizes que compõem
a equação de Stein dentro de certas condições sendo, portanto, resultados associados a uma
variante do problema 2.
Em [6, Teorema 3], L. M. DeAlba e C. R. Johnson, supondo que K é uma matriz indefinida,
provam que qualquer conjunto de inércias In1 (S), In(H) e In(K) pode ocorrer quando é válida
a equação de Stein, desde que sejam satisfeitas certas condições.
Teorema 3.1.5 [6, Teorema 3] Sejam πk , νk ,δk , πh , νh , δh , π, ν e δ inteiros não negativos tais
que πk + νk + δk = πh + νh + δh = π + ν + δ = n, πk > 0 e νk ≤ πh + νh . Então existe uma
matriz não singular S ∈ Cn×n e existem matrizes hermíticas K, H ∈ Cn×n tais que
In(K) = (πk , νk , δk ),
In(H) = (πh , νh , δh )
e
In1 (S) = (π, ν, δ).
Em [7], L. M. DeAlba resolve o problema 2 para o caso em que K é uma matriz indefinida, S é
uma matriz não derrogatória de um certo tipo que apenas admite valores próprios cujo módulo é
1 e H é uma matriz não singular.
Num primeiro resultado, mostra que se S é uma matriz não derrogatória com n valores próprios
distintos de módulo igual a 1 não só é possível escolher a inércia da matriz K como não existe
nenhuma relação entre In1 (S) e In(H).
Teorema 3.1.6 [7, Teorema 1] Seja S ∈ Cn×n uma matriz não derrogatória com n valores
próprios distintos todos de módulo igual a 1. Sejam πh , νh , πk , νk e δk inteiros não negativos
tais que πh + νn = n = πk + νk + δk e min{πk , νk } > 0. Então existe uma matriz hermítica
H ∈ Cn×n tal que In(H) = (πh , νh , 0) e In(H − SHS ∗ ) = (πk , νk , δk ).
O segundo teorema estuda o caso em que S é uma matriz não derrogatória e é um bloco de Jordan
de tamanho n associado a uma valor próprio de módulo é 1.
47
3.2 A nossa contribuição
Neste caso, as inércias possíveis para a matriz K são aquelas que permitem característica máxima
ou igual a n − 1 e novamente não existe nenhuma relação entre In1 (S) e In(H).
Teorema 3.1.7 [7, Teorema 2] Seja S = Jn (λ) ∈ Cn×n , para algum λ ∈ C tal que |λ| = 1.
Sejam ainda πh , νh , πk , νk e δk inteiros não negativos tais que πh + νh = n = πk + νk + δk ,
min{πk , νk } > 0 e δk = 0 ou δk = 1. Então existe uma matriz hermítica H ∈ Cn×n tal que
In(H) = (πh , νh , 0) e In(H − SHS ∗ ) = (πk , νk , δk ).
Por fim, no último resultado, L. M. DeAlba considera S uma matriz não derrogatória e soma
directa de dois blocos de Jordan de tamanho 1 e n − 1 associados a dois valores próprios distintos
de módulo igual a 1. As conclusões são idênticas ao teorema anterior.
Teorema 3.1.8 [7, Teorema 3] Seja S = [λ1 ] ⊕ Jn−1 (λ2 ) ∈ Cn×n , com λ1 , λ2 ∈ C tais que
λ1 6= λ2 e |λ1 | = |λ2 | = 1. Sejam πh , νh , πk , νk e δk inteiros não negativos tais que πh + νh =
n = πk + νk + δk , min{πk , νk } > 0 e δk = 0 ou δk = 1. Então existe uma matriz hermítica
H ∈ Cn×n tal que In(H) = (πh , νh , 0) e In(H − SHS ∗ ) = (πk , νk , δk ).
Estes três resultados são generalizados na próxima secção.
3.2
3.2.0
A nossa contribuição
Lemas Preliminares
Nesta secção demonstramos lemas que permitem reformular as soluções do problema 1, expostas
no Capítulo 2, em soluções para o problema 2.
Atendendo à utilidade da transformada de Cayley de uma matriz na generalização de resultados
(cf. [7]), surge a necessidade de alargar esse conceito por forma a aplicá-lo sem qualquer restrição. Recorde-se que a relação entre a equação de Lyapunov e a equação de Stein que envolve a
transformada de Cayley só é válida se −1 não é valor próprio da matriz em causa.
48
3.2 A nossa contribuição
Nesta secção, consideramos S ∈ Cn×n uma matriz e θ ∈ C um número complexo tais que o
módulo de θ é 1 e a matriz θIn + S ∈ Cn×n é não singular.
Chamamos transformada generalizada de Cayley da matriz S, e denotamos por Cθ (S), à matriz
definida por
Cθ (S) = (θIn + S)−1 (θIn − S) ∈ Cn×n .
Algumas relações importantes entre a matriz S e a sua transformada generalizada de Cayley são
apresentadas nos próximos lemas.
Lema 3.2.1 Sejam f1 , . . . , fn ∈ C[x] polinómios invariantes da matriz S tais que f1 | · · · |fn e
fi (x) = (x − µ1 )qi,1 · · · (x − µt )qi,t ,
com qi,j ∈ N0 , para todo i ∈ {1, . . . , n} e para todo j ∈ {1, . . . , t}. Então a matriz Cθ (S) tem
polinómios invariantes g1 , . . . , gn ∈ C[x] tais que g1 | · · · |gn e
gi (x) = (x − λ1 )qi,1 · · · (x − λt )qi,t ,
para todo i ∈ {1, . . . , n},
onde λj = (θ + µj )−1 (θ − µj ), para todo j ∈ {1, . . . , t}.
Demonstração. Sejam f1 | · · · |fn os polinómios invariantes da matriz S tais que
fi (x) = (x − µ1 )qi,1 · · · (x − µt )qi,t ,
com qi,j ∈ N0 , para todo i ∈ {1, . . . , n} e para todo j ∈ {1, . . . , t}.
Então µ1 , . . . , µt são os valores próprios da matriz S, sem repetições.
Seja J = Jp1 (µk1 ) ⊕ · · · ⊕ Jps (µks ) a forma normal de Jordan da matriz S onde, para cada
r ∈ {1, . . . , s}, Jpr (µkr ) é um bloco de Jordan de ordem pr × pr associado ao valor próprio µkr ,
com kr ∈ {1, . . . , t}.
Então existe uma matriz não singular X ∈ Cn×n tal que J = X −1 SX. Donde
X −1 Cθ (S)X = X −1 (θIn + S)−1 XX −1 (θIn − S)X
= (θIn + X −1 SX)−1 (θIn − X −1 SX)
= (θIn + J)−1 (θIn − J) = Cθ (J)
= Cθ (Jp1 (µk1 )) ⊕ · · · ⊕ Cθ (Jps (µks )) .
49
3.2 A nossa contribuição
Para cada r ∈ {1, . . . , s}, a matriz xIpr − Cθ (Jpr (µkr )) ∈ Cpr ×pr [x] é equivalente à matriz
(θIpr + Jpr (µkr )) x − θIpr + Jpr (µkr ) ∈ Cpr ×pr [x].
(3.2)
De facto, θIpr + Jpr (µkr ) ∈ Cpr ×pr [x] é uma matriz não singular e
(θIpr + Jpr (µkr )) (xIpr − Cθ (Jpr (µkr ))) Ipr
= (θIpr + Jpr (µkr ))x − θIpr + Jpr (µkr ).
A matriz representada em (3.2) tem duas submatrizes de ordem (pr − 1) × (pr − 1) com determinantes (x + 1)pr −1 e ((θ + µkr )x − (θ − µkr ))pr −1 : basta eliminar a primeira linha e a primeira
coluna ou eliminar a última linha e a última coluna, respectivamente. Estes determinantes são
primos relativos. O que permite concluir que a matriz Cθ (Jpr (µkr )) tem pr − 1 polinómios
invariantes constantes, ou seja, os seus polinómios invariantes são 1, . . . , 1, (x − λkr )pr , com
λkr = (θ + µkr )−1 (θ − µkr ).
Logo os divisores elementares da matriz Cθ (S) são
(x − λk1 )p1 , . . . , (x − λks )ps
e, portanto, os seus polinómios invariantes g1 | · · · |gn , onde
gi (x) = (x − λ1 )qi,1 · · · (x − λt )qi,t ,
para todo i ∈ {1, . . . , n}
.
com λj = (θ + µj )−1 (θ − µj ), para todo j ∈ {1, . . . , t}.
Observe-se que, se µ1 , . . . , µn são os valores próprios da matriz S, então λ1 , . . . , λn são os valores próprios da matriz Cθ (S), onde λk = (θ + µk )−1 (θ − µk ), para todo k ∈ {1, . . . , n}.
O próximo teorema permite concluir que a inércia da matriz S relativamente ao círculo unitário
e a inércia da sua transformada generalizada de Cayley Cθ (S) são iguais.
Lema 3.2.2 Seja µ ∈ C tal que θ + µ 6= 0 e seja λ = (θ + µ)−1 (θ − µ) ∈ C.
Então |µ| < 1 (respectivamente, |µ| = 1, |µ| > 1) se e só se <(λ) > 0 (respectivamente,
<(λ) = 0, <(λ) < 0).
50
3.2 A nossa contribuição
Demonstração. Sejam µ, λ ∈ C tais que λ = (θ+µ)−1 (θ−µ). Suponhamos que µ = a+ib ∈ C,
com a, b ∈ R. Então:
λ = (θ + µ)−1 (θ − µ)
= |θ + µ|−2 (θ + µ)(θ − µ)
= |θ + µ|−2 1 − |µ|2 + 2i(a=(θ) − b<(θ))
Assim <(λ) = |θ + µ|−2 (1 − |µ|2 ). Como |θ + µ|−2 > 0, <(λ) > 0 (respectivamente, <(λ) = 0,
<(λ) > 0) se e só se |µ| < 1 (respectivamente, |µ| = 1, |µ| > 1).
Corolário 3.2.3 A inércia da transformada generalizada de Cayley da matriz S é igual à inércia
da matriz S relativamente ao círculo unitário. Simbolicamente, In(Cθ (S)) = In1 (S).
A demonstração do próximo resultado garante que uma matriz S satisfaz a equação de Stein
H − SHS ∗ = K se e só se a sua transformada generalizada de Cayley Cθ (S) satisfaz a equação
da Lyapunov Cθ (S)H − HCθ (S)∗ = K 0 , onde K 0 é uma matriz congruente com a matriz K.
Lema 3.2.4 Para toda a matriz hermítica H ∈ Cn×n ,
In(H − SHS ∗ ) = In(Cθ (S)H + H(Cθ (S))∗ ).
Demonstração. Sejam S, H ∈ Cn×n matrizes tais que H é uma matriz hermítica. Seja ainda
1
X ∈ Cn×n a matriz definida por X = 2− 2 (θIn + S). Então X é uma matriz não singular e
H − SHS ∗ = X (Cθ (S)H + H(Cθ (S))∗ ) X ∗ ,
ou seja, as matrizes H − SHS ∗ e Cθ (S)H + H(Cθ (S))∗ são congruentes. Pelo corolário 1.2.3,
concluímos que
In(H − SHS ∗ ) = In(Cθ (S)H + H(Cθ (S))∗ ).
Já estamos em condições de generalizar para a equação de Stein os resultados do Capítulo 2.
51
3.2 A nossa contribuição
3.2.1 H é uma matriz definida positiva
Nesta secção apresentamos condições necessárias e suficientes que relacionam a classe de semelhança da matriz S e a classe de congruência da matriz K quando é válida a equação de Stein,
sabendo que H é uma matriz definida positiva e ou S é uma matriz não derrogatória ou K é uma
matriz semi-definida positiva.
Seja S ∈ Cn×n uma matriz. Ao longo desta secção, consideramos θ ∈ C um número complexo
cujo módulo é 1 e tal que a matriz θIn + S ∈ Cn×n é não singular.
Denotamos por i(S) o número de polinómios invariantes não constantes de S. Seja i⊕ (S) (respectivamente, i (S), i1 (S)) o número de polinómios invariantes da matriz S com pelo menos
uma raiz com módulo inferior (respectivamente, superior, igual) a 1. Denotamos ainda por i21 (S)
o número de polinómios invariantes da matriz S com pelo menos uma raiz com módulo igual a 1
e multiplicidade superior ou igual a 2. Pelo lema 3.2.1 e pelo lema 3.2.2, podemos concluir que:
i⊕ (S) = i+ (Cθ (S)),
i (S) = i− (Cθ (S)),
i1 (S) = i0 (Cθ (S))
e
i21 (S) = i20 (Cθ (S)).
O próximo resultado apresenta condições necessárias para a solução do problema 2 quando H é
uma matriz definida positiva.
Teorema 3.2.5 Sejam S, K, H ∈ Cn×n matrizes tais que K é uma matriz hermítica e H é uma
matriz definida positiva.
Se H − SHS ∗ = K então são válidas as seguintes condições:
π(K) ≥ max{i⊕ (S), i21 (S)}
(3.3)
ν(K) ≥ max{i (S), i21 (S)}
(3.4)
δ(K) ≥ 2i1 (S) − n
(3.5)
π(K) + δ(K) ≥ i1 (S)
(3.6)
ν(K) + δ(K) ≥ i1 (S)
(3.7)
52
3.2 A nossa contribuição
e o seguinte caso não é válido:
(S1 ) δ1 (S) > δ(K), i21 (S) = 0 e min{π(K), ν(K)} = 0.
Demonstração. Sejam S, H, K ∈ Cn×n matrizes tais que K é uma matriz hermítica e H é uma
matriz definida positiva.
Se H − SHS ∗ = K então, pelo lema 3.2.4, existe uma matriz não singular X ∈ Cn×n tal que
Cθ (S)H + H(Cθ (S))∗ = XKX ∗ . Logo, como In(K) = In(XKX ∗ ), pelo teorema 2.2.1 vem
que:
π(K) ≥ max{i+ (Cθ (S)), i20 (Cθ (S))} = max{i⊕ (S), i21 (S)}
ν(K) ≥ max{i− (Cθ (S)), i20 (Cθ (S))} = max{i (S), i21 (S)}
δ(K) ≥ 2i0 (Cθ (S)) − n = 2i1 (S) − n
π(K) + δ(K) ≥ i0 (Cθ (S)) = i1 (S)
ν(K) + δ(K) ≥ i0 (Cθ (S)) = i1 (S).
E provamos que são válidas as condições (3.3) a (3.7).
Além disso, o caso (S1 ) não é válido. De facto, como (S) não é válido, então também não
é válido que δ1 (S) = δ(Cθ (S)) > δ(K), i21 (S) = i20 (Cθ (S)) = 0 e min{π(K), ν(K)} =
min{π(XKX ∗ ), ν(XKX ∗ )} = 0.
Repare-se que, pelo lema 3.2.1, se S é uma matriz não derrogatória então também a matriz Cθ (S)
é não derrogatória. E, portanto, usando os mesmos argumentos da última demonstração, o lema
2.2.4 e o lema 2.2.5 podem ser adaptados para a equação de Stein.
Lema 3.2.6 Seja S ∈ Cn×n uma matriz não derrogatória tal que π1 (S) = 0. Seja K ∈ Cn×n
uma matriz hermítica. Sejam ainda µ1 , . . . , µn os valores próprios da matriz S ordenados por
forma a que:
se µi = µj , para algum i < j, então µi = µk , para todo k ∈ {i, . . . , j};
se |µi | = 1, para algum i, então |µk | = 1, para todo k ∈ {1, . . . , i}.
Suponhamos ainda que o seguinte caso não é válido:
53
3.2 A nossa contribuição
(S01 ) n ≥ 2, δ1 (S) > 0 e min{π(K), ν(K)} = 0.
Se são válidas as condições (3.3) a (3.7) então a matriz S é semelhante a uma τ -matriz da forma


µ
∗
 1



.
.
T =
(3.8)
.
 ∈ Cn×n


0
µn
e In(In − T T ∗ ) = In(K).
Demonstração. Seja S ∈ Cn×n uma matriz não derrogatória tal que π1 (S) = 0. Então Cθ (S) é
uma matriz não derrogatória e π(Cθ (S)) = 0. Se µ1 , . . . , µn são os valores próprios da matriz S
então λ1 , . . . , λn são os valores próprios da matriz Cθ (S), onde λk = (1 + µk )−1 (1 − µk ), para
todo k ∈ {1, . . . , n}, e claramente, pelo lema 3.2.2, estão ordenados de acordo com o lema 2.2.4.
Além disso, como (S01 ) não é válido então também não é válido (S0 ).
Se são válidas as condições (3.3) a (3.7) também são válidas as condições (2.2) a (2.6) considerando a matriz L = Cθ (S).
Então, pelo lema 2.2.4, a matriz Cθ (S) é semelhante a uma τ -matriz da forma




µ1
∗
λ1
∗








.
.
n×n
.
.
Cθ (T ) = 
.
.
 ∈ Cn×n
 ∈ C , onde T = 




λn
µn
e In(Cθ (T ) + Cθ (T )∗ ) = In(K).
Mas, pelo lema 3.2.4, In(Cθ (T ) + Cθ (T )∗ ) = In(In − T T ∗ ). Além disso, a matriz S é semelhante
à matriz T , uma vez que são ambas não derrogatórias e têm os mesmo valores próprios.
Analogamente, se mostra que:
Lema 3.2.7 Seja S ∈ Cn×n uma matriz não derrogatória tal que ν1 (S) = 0. Seja K ∈ Cn×n
uma matriz hermítica. Sejam ainda µ1 , . . . , µn os valores próprios da matriz S ordenados de
acordo com o lema 3.2.6. Suponhamos que não é válido o caso (S01 ).
54
3.2 A nossa contribuição
Se são válidas as condições (3.3) a (3.7) então a matriz S é semelhante a uma τ -matriz da forma
(3.8) e In(In − T T ∗ ) = In(K).
O próximo teorema é uma das soluções parciais do problema 2 a apresentar nesta tese. Este
teorema apresenta as relações entre a classe de semelhança da matriz S e a classe de congruência
da matriz K quando H > 0 e ou i(S) = 1 ou K ≥ 0.
Teorema 3.2.8 Sejam S, K ∈ Cn×n matrizes tais que K é uma matriz hermítica. Suponhamos
que ou S é uma matriz não derrogatória ou K é uma matriz semi-definida positiva. Suponhamos
ainda que não é válido o caso (S1 ).
Então existe uma matriz definida positiva H ∈ Cn×n tal que
In(H − SHS ∗ ) = In(K)
se e só se são válidas as condições (3.3) a (3.7).
Demonstração. Seja S ∈ Cn×n uma matriz e suponhamos que o caso (S1 ) não é válido. Então
o caso (S) não é válido, considerando L = Cθ (S).
Suponhamos que S é uma matriz não derrogatória. Então a matriz Cθ (S) também é não derrogatória. Pelo lema 3.2.4, In(H − SHS ∗ ) = In(Cθ (S)H + HCθ (S)∗ ). Por outro lado, pelo
teorema 2.2.6, existe uma matriz definida positiva H ∈ Cn×n tal que
In(Cθ (S)H + HCθ (S)∗ ) = In(K)
se e só se são válidas as condições (2.2) a (2.6), considerando L = Cθ (S), ou seja, se e só se se
verificam as condições (3.3) a (3.7).
Se K é uma matriz semi-definida positiva e S é uma matriz derrogatória, o raciocínio é análogo.
O teorema 3.2.8 nem sempre é válido quando S é uma matriz derrogatória e a matriz K não é
semi-definida positiva, como se pode verificar no exemplo apresentado a seguir.
55
3.2 A nossa contribuição
Exemplo 3.2.9 Seja S = µ1 Ip ⊕ µ2 Iq ∈ Cn×n , onde ν1 , ν2 ∈ C são tais que ν1 6= ν2 e |µ1 | =
|µ2 | = 1 e p + q = n. Suponhamos que é válido o teorema 3.2.8, ou seja, suponhamos que existe
uma matriz definida positiva

H=
H11 H12
∗
H12
H22

 ∈ Cn×n ,
tal que In(H − SHS ∗ ) = In(K). Então

H − SHS ∗ = 
(1 −
0
com
H11 ∈ Cp×p
(1 − µ1 µ2 )H12
∗
µ1 µ2 )H12
0
(3.9)


e, pelas condições (iv) e (v) do teorema 1.2.4, π(K) = ν(K).
Suponhamos que p = 3 e q = 2 e seja K ∈ C5×5 uma matriz hermítica tal que In(K) = (2, 1, 2).
Então, como 2 = δ1 (S) = δ(K) e min{π(K), ν(K)} = 1 6= 0, o caso (S1 ) não é válido. Por
outro lado, as condições (3.3) a (3.7) são válidas. E, no entanto, o teorema 3.2.8 não é válido
pois, neste caso, 2 = π(K) 6= ν(K) = 1.
O próximo resultado é um corolário do teorema 3.2.8 e a sua demonstração aplica raciocínios
análogos aos efectuadas nas demonstrações feitas ao longo desta secção.
Corolário 3.2.10 Seja S ∈ Cn×n uma matriz. Então existe uma matriz definida positiva H ∈
Cn×n tal que a matriz H − SHS ∗ é semi-definida positiva se e só se a matriz S não tem divisores
elementares com raízes múltiplas com módulo igual a 1 e ν1 (S) = 0.
Demonstração. Suponhamos que existe uma matriz definida positiva H ∈ Cn×n tal que H −
SHS ∗ ≥ 0. Pelo lema 3.2.4, a matriz Cθ (S)H + HCθ (S)∗ também é semi-definida positiva e,
aplicando o corolário 2.2.8, a matriz Cθ (S) não tem divisores elementares com raízes imaginárias
múltiplas e ν(Cθ (S)) = 0. Logo, pelo corolário 3.2.3 e pelo lema 3.2.1, respectivamente, ν1 (S) =
0 e a matriz S não tem divisores elementares com raízes múltiplas com módulo igual a 1. Para o
recíproco, o raciocínio é análogo.
56
3.2 A nossa contribuição
3.2.2 S é uma matriz não derrogatória
Nesta secção resolvemos o problema 2 para o caso em que S é uma matriz não derrogatória,
H é uma matriz não singular e K é uma matriz com pelo menos um valor próprio com módulo
inferior a 1 e um valor próprio com módulo superior a 1.
Este resultado generaliza resultados obtidos por L. M. DeAlba em [7].
Sejam S, K, H ∈ Cn×n matrizes tais que K e H são matrizes hermíticas.
É possível adaptar o lema 2.2.10 obtido para a equação de Lyapunov quando foi resolvido o caso
particular análogo do problema 1.
Lema 3.2.11 Sejam S, K ∈ Cn×n matrizes tais que S é uma matriz não derrogatória e In(K) ≥
(1, 1, 0). Sejam ainda µ1 , . . . , µn os valores próprios da matriz S ordenados por forma a que:
se µi = µj , para algum i < j, então µi = µk , para todo k ∈ {i, . . . , j},
se |µi | > 1, para algum i, então |µk | > 1, para todo k ∈ {1, . . . , i},
se |µi | < 1, para algum i, então |µk | < 1, para todo k ∈ {i, . . . , n}.
Então existe uma τ -matriz T = [tij ] ∈ Cn×n tal que tii = µi , para todo i ∈ {1, . . . , n}, e
In(In − T T ∗ ) = (πk , νk , δk ).
Demonstração.
Sejam µ1 , . . . , µn os valores próprios da matriz S ordenados de acordo com
o enunciado. Então, pelo lema 3.2.2, os valores próprios da matriz Cθ (S) são λ1 , . . . , λn , com
λk = (θ + µk )−1 (θ − µk ), para todo k ∈ {1, . . . , n} e estão ordenados de acordo com o lema
2.2.10. Logo existe uma τ -matriz T = [tij ] ∈ Cn×n tal que tii = µi , para todo i ∈ {1, . . . , n}, e
In(Cθ (T ) + Cθ (T )∗ ) = In(K). Por outro lado, pelo lema 3.2.4,
In(Cθ (T ) + Cθ (T )∗ ) = In(In − T T ∗ ).
Logo existe uma τ -matriz T nas condições pretendidas.
O próximo teorema é o resultado principal desta secção e fornece uma solução parcial para o
problema 2 para o caso em que S é uma matriz não derrogatória e In(K) ≥ (1, 1, 0).
57
3.2 A nossa contribuição
Teorema 3.2.12 Sejam S, K ∈ Cn×n matrizes tais que S é uma matriz não derrogatória e
In(K) ≥ (1, 1, 0). Sejam ainda πh e νh inteiros não negativos tais que πh + νh = n. Então existe
uma matriz hermítica H ∈ Cn×n tal que In(H) = (πh , νh , 0) e In(H − SHS ∗ ) = In(K).
Demonstração.
Sejam S, K ∈ Cn×n matrizes tais que S é uma matriz não derrogatória e
In(K) ≥ (1, 1, 0). Pelo lema 3.2.1, a matriz Cθ (S) é não derrogatória. Como min{π(K), ν(K)} >
0, pelo teorema 2.2.11, existe uma matriz hermítica H ∈ Cn×n tal que In(H) = (πh , νh , 0) e
In(Cθ (S)H + HCθ (S)∗ ) = In(K).
Por outro lado, pelo lema 3.2.4, In(Cθ (S)H + HCθ (S)∗ ) = In(H − SHS ∗ ) e provamos assim o
pretendido.
58
Bibliografia
[1] B. E. Cain, E. M. Sá, The inertia of a Hermitian matrix having prescribed complementary
principal submatrices, Linear Algebra Appl. 37 (1981), 161–171.
{9}
[2] D. Carlson, H. Schneider, Inertia theorems for matrices: the semidefinite case, J. Math.
Anal. Appl. 6 (1963), 430–446.
{18,33}
[3] C. T. Chen, A generalization of the inertia theorem, SIAM J. Appl. Math. 25 (1973), 158–
161.
{−}
[4] B. N. Datta, Matrix equations, matrix polynomial, and the number of zeros of a polynomial
inside the unit circle, Linear and Multilinear Algebra 9 (1980), 63–68.
{−}
[5] B. N. Datta, Stability and Inertia, Linear Algebra Appl. 302-303 (1999), 563–600.
{10,11}
[6] L. M. DeAlba, C. R. Johnson, Possible inertia combinations in the Stein and Lyapunov
equations, Linear Algebra Appl. 222 (1995), 227–240.
{18,47}
[7] L. M. DeAlba, Inertia of the Stein transformation with respect to some nonderogatory matrices, Linear Algebra Appl. 241/243 (1996), 191–201.
{34,47,48,57}
[8] F. Gantmacher, The Theory of Matrices, Volume One, Chelsea Publishing · New York; 1977
{2,10}
[9] T. Haynes, Stable matrices, the Cayley transform, and convergent matrices, Internat. J.
Math. Math. Sci. 14 (1991), 77–81.
{−}
59
Bibliografia
[10] R. Horn, C. Johnson, Topics in Matrix Analysis, Cambridge University Press · Cambridge;
1991.
{2}
[11] R. Horn, C. Johnson, Matrix Analysis, Cambridge University Press · Cambridge; 1994.
{2,4,10}
[12] P. Lancaster, M. Tismenetsky, The Theory of Matrices with Applications · Second Edition,
Academic Press, Inc. · California; 1985.
{2,5,6,9,16,44,45}
[13] R. Loewy, On the ranges of Lyapunov Transformations II, Linear and Multilin. Algebra 2
(1974), 227–237.
{−}
[14] R. Loewy, An inertia theorem for Lyapunov’s equation and the dimension of a controllability space, Linear Algebra Appl. 260 (1997), 1–7.
{−}
[15] G. N. Oliveira, E. M. Sá and J. A. Dias da Silva, On the eigenvalues of the matrix A +
XBX −1 , Linear Multilin. Algebra 5 (1977), 119–128.
{23}
[16] A. Ostrowski, H. Schneider, Some theorems on the inertia of general matrices, J. Math.
Anal. Appl. 4 (1962), 72–84.
{16}
[17] P. Stein, On the ranges of two functions of positive matrices, J. Algebra 2 (1965), 350–353.
{13}
[18] F. C. Silva, R. Simões, On the Lyapunov and the Stein Equations, Linear Algebra Appl. 420
(2007), 329–338.
{15,19,43}
[19] F. C. Silva, R. Simões, On the Lyapunov and the Stein Equations, II Linear Algebra Appl.
426 (2007), 305–311.
{15,34,43}
[20] O. Taussky, A generalization of a theorem of Lyapunov, SIAM J. Appl. Math. 9 (1961),
640–643.
{16}
[21] O. Taussky, Matrices C with C n → 0, J. Algebra 1 (1964), 5–10.
{13}
60
Bibliografia
[22] H. Wimmer, On the Ostrowski-Schneider inertia theorem, J. Math. Anal. Appl. 42 (1973),
164–169.
{−}
[23] H. Wimmer, Inertia theorem for matrices, controllability and linear vibrations, Linear Algreba Appl. 8 (1974), 337–343.
{−}
[24] H. Wimmer, A. Ziebur, Remarks on inertia theorems for matrices, Czech. Math. J. 25
(1975), 556–561.
{−}
[25] F. Zhang, Matrix Theory: Basics Results and Techniques, Springer-Verlarg · New York;
1999.
{2,3}
61
Índice remissivo
Cayley
transformada de, 13
transformada generalizada de, 49
divisor
determinantal, 4
elementar, 4
forma normal de, 6
Lyapunov
equação de, 11
teorema de, 16
matriz
τ , 23
espectro, 3
companheira, 5
estável
de permutação, 3
matriz, 12
definida negativa, 7
sistema contínuo, 10
definida positiva, 7
sistema discreto, 11
derrogatória, 3
estável, 12
factor invariante, 4
forma normal
companheira, 5
de Jordan, 6
inércia, 8
estável positiva, 12
estável relativamente ao círculo unitário, 13
hermítica, 4
indefinida, 7
não derrogatória, 3
relativamente ao círculo unitário, 8
semi-definida negativa, 7
relativamente ao eixo imaginário, 8
semi-definida positiva, 7
Jordan
bloco de, 5
matrizes
congruentes, 3
equivalentes, 2
62
Índice remissivo
semelhantes, 3
semelhantes por permutação, 3
multiplicidade
algébrica, 3
geométrica, 3
polinómio
característico, 3
invariante, 4
Schur
decomposição de, 3
Stein
equação de, 12
teorema de, 44
Sylvester
teorema da inércia de, 9
valores próprios, 3
entrelaçamento dos, 4
63