Autovalores e Autovetores : Considere um sistema linear do tipo: y Ab, (1) em A é uma matriz arbitrária N x N, e transforma o vetor b de dimensão N no vetor y também de dimensão N. Vamos considerar que o nosso objetivo seja resolver este sistema linear sendo que o vetor y é o vetor contendo os dados conhecidos e o nosso problema consiste em achar o vetor b . No entanto, nesta seção nós não iremos nos preocupar com nenhum método para a solução deste sistema, ao contrário iremos nos concentrar no estudo das propriedades básicas deste sistema. x um vetor em Rn, então geralmente não há uma relação geométrica comum entre o vetor x e o vetor Ax (Figura 1a). No entanto, há geralmente certos vetores x tal que x e Ax são Considerando que A é uma matriz arbitrária N x N e múltiplos escalares de um no outro (Figura 1b). Ax Ax x (a) x (b) Figura 1 DEFINIÇÃO: se A é uma matriz arbitrária N x N, então um vetor não nulo x em Rn é chamado autovetor (eigenvector) de A se o vetor x , ou seja, Ax x Ax é um escalar múltiplo do vetor (2) O escalar é chamado de autovalor (eigenvalue) de A , e x A correspondente (associado) ao autovalor para algum escalar é o autovetor de 1 Autovalores e autovetores têm uma interpretação geométrica em R2. Se o escalar autovalor de A correspondente ao autovetor x, é o então dependendo do valor do autovalor a multiplicação por A levará há uma dilatação, contração ou mudança de direção de x (Figura 2). x=Ax x x x=Ax x x=Ax (a) Dilatação (b) Contração (c) Mudança de Direção ( (0 < ( Figura 2 Para acharmos os autovalores da matriz A (N x N) temos que escrever a equação Ax x como : Ax I x (3) ou seja: I Para - A x0 (4) ser um autovalor deve existir uma solução não nula para esta equação, ou seja, deve existir uma solução não trivial x 0 que satisfaça esta equação homogênea. Uma solução não trivial para esta equação homogênea ocorre se e somente se DET I - A 0 (5) Esta equação acima é chamada de equação característica de A ; os escalares que satisfazem a esta equação são os autovalores de A . Os autovalores de A devem satisfazer ao polinômio de ordem N chamado de polinômio característico em que o coeficiente de é 1 e tem a seguinte forma: DET I - A N c1 N-1 ... cN 0 (6) 2 Interpretação Geométrica de autovalor e autovetor: Considere a matriz simétrica 4 8 A 8 4 Esta matriz simétrica pode ser interpretada como uma matriz de dados em estatística, em que as colunas representam variáveis e as linhas representam observações. Assim o conteúdo de informação desta matriz pode ser visualizado geometricamente em R2 (e também em R3 matriz 3 x 3), representando-se as observações num espaço definido por eixos de variáveis (ou vice-versa): Variável 2 Observação A (4,8) Observação B (8,4) Variável 1 Assim os pontos A (vermelho) e B (azul) representam as duas observações (linhas da matriz) num espaço de duas variáveis (colunas da matriz) Os autovalores da matriz A são dados resolvendo-se a equação característica. Assim temos que 4 - DET 8 8 4 - 2 64 0 4 - Portanto a equação característica de A é: 2 8 48 0 A solução desta equação são e ; estes são os autovalores da matriz A. 3 Por definição temos que são: I - A x 0 portanto os autovetores respectivos 8 x11 0 4 - 1 8 x1 0 4 1 2 Tomando-se assim temos o vetor normalizado 1 x1 1 e 8 x21 0 4 - 2 8 x2 0 4 2 2 Tomando-se assim temos o vetor normalizado 1 x2 1 . Introduzindo-se os autovetores e autovalores no gráfico acima temos: Vemos que os autovetores tomados com módulos iguais ao valores absolutos dos respectivos autovalores caracterizam uma elipse com centro na origem e que passa pelos pontos A e B. A forma elíptica indica a existência de um autovalor próximo a zero. Mas o que significa um autovalor próximo de zero ? Ou ainda. O que significa um 4 autovalor igual a zero ? Veremos, a seguir, que na direção do autovetor associado a este autovalor próximo a zero há um mal-condicionamento do sistema, ou seja, há uma dependência linear. Vamos considerar agora dois casos extremos: CASO (a) - Neste primeiro caso temos 4 0 A 0 4 Neste primeiro caso os autovalores são A e ; e os autovetores da matriz associada a estes autovalores são indeterminados: quaisquer dos vetores satisfazem a equação I - A x 0 . Graficamente podemos constatar que este caso representa uma situação ideal em que as observações A e B são o mais diferentes possível (são informações não redundantes) e os autovalores são idênticos. A forma circular indica uma independência linear do sistema. CASO (b) - O segundo caso extremo temos: 5 4 4 A 4 4 Neste segundo caso os autovalores são A associada a estes autovalores são e ; e 1 x1 1 e os autovetores da matriz 1 x2 . 1 Graficamente podemos constatar que as observações são idênticas (redundantes), ou seja a observação A é idêntica a observação B = (4,4). Concluímos que o caso (a) representa uma situação ideal: as observações A e B são o mais diferente possível e os autovalores são valores idênticos. Note que neste o número de condição (razão entre o maior e menor valor singular) é igual a 1.No caso (b), ao contrário, as observações A e B são idênticas (redundantes), neste caso o numero de condição tende para o infinito (razão extrema) Os três casos que estudados podem ser sintetizados de acordo com o número de condição: COND = | | / | | , | | > | Observações completamente independentes COND = 4 / 4 = 1 Observações parcialmente independentes COND = 12 / 4 = 3 6 COND = 8 / 0 Observações redundantes Note que a presença de um autovalor NULO ou muito próximo a zero aumenta a razão (em valor absoluto) entre os módulos dos autovalores extremos e indica observações redundantes. Podemos constatar que um autovalor nulo ou muito próximo de zero é um medidor da não unicidade e da instabilidade, respectivamente, já que a redundância de observações leva a problema subdeterminado, contendo mais incógnitas do que observações (equações), e caracterizando portanto uma demanda de informação maior que aquela contida nos dados observados problema mal-posto. Então, para caracterizarmos se um problema é mal-posto, basta então analisarmos os autovalores da matriz associada com o sistema linear correspondente. Infelizmente, a análise acima não pode ser aplicada diretamente porque em geral o número de observações difere do número de parâmetros (incógnitas), de modo que os autovalores e os autovetores de matriz não quadrada não são definidos. Veremos abaixo como este problema é contornado. Sistema linear Arbitrário: Agora iremos investigar um sistema linear arbitrário n X M y Ap, (7) p de dimensão M e o vetor y A transforma o vetor p de dimensão M no vetor y em A é uma matriz arbitrária N x M, o vetor de dimensão N. Portanto a matriz de dimensão N. É evidente que a matriz A está associada com dois espaços em que um é de N dimensão e o outro de M dimensão. Se o vetor p do espaço M-dimensional é dado, o operador A opera e o transplanta dentro do espaço N-dimensional. Por outro lado, se o nosso objetivo é resolver este sistema linear, em que foi nos dado o vetor y do espaço N-dimensional (vetor contendo os dados geofísicos), então o nosso problema consiste em achar o vetor p do espaço M-dimensional que o produza por meio do operador A . No entanto, nesta seção nós também não iremos nos preocupar com nenhum método para a solução deste sistema, ao contrário iremos nos concentrar no estudo das propriedades básicas deste sistema A idéia central que será a base para toda as nossas discussões do comportamento do operados linear é a seguinte. Nós não consideraremos o sistema linear y Ap AT qx isoladamente mas expandido pelo sistema adjunto (M x N) (8) 7 A matriz AT x estão em uma relação de reciprocidade (intercâmbio) com os vetores tem M linhas e N colunas (M x N) e adequadamente os vetores y Concretamente, enquanto pe x e q são pe q e y. vetores que pertencem ao espaço N-dimensional, são vetores que pertencem ao espaço M-dimensional. Tomaremos o sistema adjunto A T q x como um sistema auxiliar formarmos um sistema aumentado. Assim combinaremos o sistema para A T q x com o sistema Apy dentro do esquema aumentado: Tza (9) em que introduzimos uma nova matriz quadrada T de dimensões ( N+M X N+M ) e definida como segue: A N 0 T M AT 0 N M z N M (10) q p (11) e a N M y x (12) O sistema linear pode ser então definido como 0 A T A q y 0 p x Vale ressaltar que o sistema adjunto efeito no sistema linear principal A T q x não exerce nenhum Apy. Assim os vetores q e x são 8 completamente independente dos vetores p e y , e vice-versa. Porém a adição do sistema adjunto ao sistema linear principal amplia o nosso conhecimento sobre as propriedades do sistema linear arbitrário N x M. Como a matriz T é quadrada podemos definir agora seus autovalores e autovetores. Para tanto vamos tomar a equação fundamental dos autovalores Twsw (13) T s I w 0 ou seja, (14) Em vista das características da nossa matriz T de dimensões ( N+M X N+M ) o vetor w é um vetor de dimensão N+M. Vamos considerar então que o vetor w seja particionado nos vetores u e v de dimensões N e M, respectivamente w u N M v Então o sistema Twsw pode ser desdobrado na seguinte forma: A v su T A u s v (15) Este par de equações chamaremos de “problema de autovalor deslocado” uma vez que os vetores do lado direito u e v estão deslocados quando comparando com o problema de autovalor já estudado em que temos Ax x . Vamos então pré multiplicar a primeira equação do sistema acima por segunda equação por A AT e a . Temos então o seguinte sistema T T A A v s A u T A A usAv Da primeira equação do sistema (15) temos que segunda equação do sistema (16) temos que (16) A v su . Substituindo na 9 T A A u s2 u (17) T Da segunda equação do sistema (15) temos que primeira equação do sistema (16) temos que A u sv . Substituindo na T A A v s2 v (18) As equações (17) e (18) definem dois problemas de autovalores-autovetores. O primeiro problema é associado a matriz simétrica N x N AA T e o segundo problema T A A , ambos problemas com os mesmos autovalores não nulos s 2. Os vetores u e v são, respectivamente, os autovetores de está associado a matriz M x M AA T T e A A , portanto são vetores ortogonais que geram, respectivamente espaços de N e M dimensões. Existirão, no máximo, min (M,N) autovalores diferentes de zero, todos os outros autovalores serão nulos. Assim se N > M a equação (18) comportará M autovalores que poderão ser diferentes de zero. Por outro lado, a equação (17) comportará os mesmos M autovalores que poderão ser diferentes de zero e também comportará N - M autovalores nulos. As mesmas observações se aplicam, mutatis mutandis, para o caso M > N. Presumindo, sem perda da generalidade, que N > M a primeira equação do sistema (15) aplicado a cada par de autovalor-autovetor leva ao sistema: A v s u 1 1 1 A v s u 2 2 2 A v s u M M M (19) Em notação matricial podemos escrever o sistema acima como: 10 A v1 v 2 ... vM s1u1 s2 u 2 ... sM uM (20) ou ainda u 11 u21 u N 1 A V u12 u22 uN 2 ... u1M ... u2 M ... u1, M 1 u2, M 1 ... u NM u N , M 1 ... u1N s1 ... u2 N ... 0 ... u NN 0 sM s2... ... 0 Finalmente podemos escrever: A (N M)V (M M) U(N N) S(N M) as matrizes UeV v1 V (21) são definidas como v 2 ... vM e U u1 u 2 ... uN T T Isto é U e V são matrizes cujas colunas são os autovalores de A A e A A , respectivamente. Como os autovetores são ortogonais, concluímos que os conjuntos u1 v1 v 2 ... vM formam bases ortogonais e que geram os espaços de observações e parâmetros, respectivamente. Assim as matrizes u 2 ... uN U e V tendo colunas que são vetores ortogonais, são matrizes ortogonais. As matrizes U e V são normalizadas de modo que U e V sejam ortonormais, isto é: T T I ( M M ) e T T I (NN ) V VVV U UUU 11 T Pós multiplicando a equação (21) por V : A V V T US V T portanto; A U S VT (22) A equação 22 representa a DECOMPOSIÇÃO EM VALORES SINGULARES da matriz A , assim chamada porque os valores S i que compõe a diagonal da matriz S raiz quadrada positiva dos autovalores das matrizes denominados de valores singulares de T A A ou AA , são a T e são A. A importância da decomposição de uma matriz em valores singulares está na obtenção dos valores singulares, cuja análise, como já vimos, permite detectar se um problema é mal-posto quando pelo menos um valor singular for NULO ou PRÓXIMO DE ZERO. Veremos a seguir uma análise detalhada da relação entre a não unicidade e da instabilidade com os valores singulares nulo ou próximo do valor zero. 12 Exemplo numérico da decomposição em valores singulares de uma matriz A (3 x 2) em que o posto é igual a 1, portanto r < M < N. Neste exemplo algumas propriedades das matrizes ortogonais U e V são abordadas. 2 A 4 8 4 8 16 20.4939 0.2182 0.9759 0.0000 0 U 0.4364 - 0.0976 - 0.8944 S 0.8729 - 0.1952 0.4472 0 0 0 V 0 0.4472 - 0.8944 0.8944 0.4472 1.0000 0.0000 0.0000 U U 0.0000 1.0000 0.0000 I ( N N ) 0.0000 0.0000 1.0000 1.0000 0.0000 0.0000 T U U 0.0000 1.0000 0.0000 I ( N N ) 0.0000 0.0000 1.0000 T T Então conclui-se que: U U U U 1 0 I V V 0 1 T I (N N ) 1 0 I ( M M ) VV 0 1 T T (M M ) T Então conclui-se que: V VVV T I (M M ) 0.9759 0.0000 0.2182 UN- r - 0.0976 - 0.8944 U r 0.4364 - 0.1952 0.4472 0.8729 ( N N r ) ( N r ) V r 0.4472 - 0.8944 ( M r ) VM-r ( M r ) 0.8944 0.4472 1 0 T U U N r N r U r U r 1(r r ) 0 1 ( N r N r ) T 13 Então conclui-se que: U r T V 1 (r r ) rVr T U r I (r r ) e U N r T U N r I ( N r N r ) T V M r V M r 1 (M r M r ) Então conclui-se que: T V r Vr I ( r r ) e V T Ur Ur T U N r U N r T M r V M r I (M r M r ) 0.0476 0.0952 0.0952 0.1905 0.1905 0.3810 0.1905 0.3810 0.7619 0.0000 - 0.8944 ( N N ) 0.9759 - 0.0976 - 0.1952 0.4472 ( N N ) Veja que: U r U r U N r U N r 1 0 0 0 1 0 I (N N ) 0 0 1 ( N N ) T V r Vr 0.2 0.4 T T T V M r VM-r 0.4 0.8 0.8 - 0.4 ( M M ) - 0.4 0.2 ( M M ) 14 Veja que T V r Vr T V M r VM-r 1 0 I ( M M ) 0 1 ( M M ) 0.2182 T A U r S r V r 0.4364 20.4959 0.8729 2 A 4 8 0.4472 0.8944 4 8 16 Das Equações acima poderíamos escrever: T V r Vr T V r Vr T V M r V M-r I ( M M ) T Ur Ur T Ur Ur I ( M M ) T V M r V M-r e T U N r U N r I I ( N N ) T ( N N ) - U N r U N r Alguma propriedades importantes das matrizes ortonormais V V T -1 U T U 1 0.8944 - 0.8944 0.4472 0.4472 0.2182 0.4364 0.8729 0.9759 - 0.0976 - 0.1952 0.0000 - 0.8944 0.4472 15 Alguma propriedades importantes dos Autovalores de uma matriz quadrada A ( N X N). Considere que i , i 1,, N são os autovalores de A . 1) A transposta de 2) A matriz 3) Se A kA A tem os mesmos autovalores da matriz tem os autovalores for Não- Singular, então A ki A 1 tem autovalores 1 i i k 4) A matriz A kI 5) A matriz p A p em que p é um inteiro positivo, tem os autovalores i 6) Se a matriz A tem os autovalores é uma matriz diagonal os autovalores i aii 16