Considere que a distância entre y c ey O é a distância

Propaganda
Transformação de um problema mal-posto em um outro
bem-posto através da introdução de informação a priori:
Na prática, um problema inverso é mal posto quando existem infinitas soluções
que explicam as observações geofísicas dentro de uma precisão experimental.
Heuristicamente, podemos dizer que um problema mal posto reflete um
desbalanceamento entre a quantidade de informações contida nos dados observados e
a quantidade de informações demandada pelo intérprete na solução do problema
inverso.
Matematicamente, um problema é mal posto (Hadamard, 1962) se a sua solução
não obedece a pelo menos uma das três condições:



EXISTÊNCIA
UNICIDADE
ESTABILIDADE
O problema da Existência , Unicidade e Estabilidade:
Seja p uma função desconhecida pertencente ao sub-espaço F do espaço de P de
todos os possíveis parâmetros e seja uma função conhecida y pertencente ao subespaço métrico AF de um espaço Y de todas as possíveis observações. Considere A
um operador linear que mapea p em y,
Portanto, nosso problema reduz-se a resolver a equação linear dada por
y=Ap
(1)
1
Note que um elemento y  AF representa um elemento produzido por uma
transformação AP , cujo operador A envolve relações de causa e efeito obtidas da
resolução de um sistema de equações diferenciais advindas da física-matemática
(equação de Poisson, equação de Laplace, equações de Maxwell, equação da onda).
No entanto, em problemas práticos não conhecemos y com total precisão, em geral,
conhecemos uma medida aproximada yo que contem componentes aleatórias que não
são explicadas por estas equações. Assim a medida y o pertence ao espaço Y porém
pode não pertencer ao sub-espaço AF. Neste caso NÃO EXISTE SOLUÇÃO PARA O
O
SISTEMA y = A p, uma vez que o operado A não é definido
Portanto, estamos violando a primeira condição imposta por Hadarmard para
que um problema seja bem posto: inexistência da solução.
A inexistência de solução levou ao conceito de Quasisolução . Para tanto
considere uma projeção de y
distância entre y c e y
O
o
no sub-espaço AF. Esta projeção yc, será tal que a
será mínima dentre todos os elementos y  AF, em outras
palavras, d (yc, y O )   em que d é uma métrica definida no espaço Y e  um escalar
positivo que tende a zero a medida que y O tende a y c .
2
Agora o operador A é definido garantindo a existência da solução p*
denominadas de Quasisolução . Logo temos que o operador A mapea p* em y
resultando na equação:
C
y c= A p *.
Considere que a distância entre y c e y
O
é a distância Euclideana, então
buscamos uma estimativa de p que minimize a distância Euclideana entre y c e y O. A
solução é a estimativa via MQ.
Ap = y
Mínimos quadrados:
yo
AT Ap = AT yo
T
-1 T o
Operador inverso: p = (A A) A y
yc
Y
AF
P
p
F
3
No entanto se o sub-espaço AF for não convexo existirão infinitas projeções de
y em AF uma vez que há infinitas métricas d (y c , y O )  . Se há infinitas projeções
yc há portanto infinitas quasisoluções p*. Neste caso a existência da solução foi
garantida mas a unicidade da solução não.
o
Desta forma temos a primeira condição de UNICIDADE DA SOLUÇÂO que garante que
a situação mostrada na figura acima não ocorre.
PRIMEIRA CONDIÇÃO DE UNICIDADE DA SOLUÇÃO:
Para a garantia da unicidade da solução temos que garantir a unicidade da projeção yo
no sub-espaço AF. Para tanto AF tem que ser CONVEXO. Como o operador A é
linear se AF é convexo então F é convexo também.
4
SEGUNDA CONDIÇÃO DE UNICIDADE DA SOLUÇÃO:
A segunda condição para a garantia da unicidade da solução é a garantia da
unicidade do operador linear A que deve ser único um por um. Logo para o operador A
que mapea F em AF há um operador inverso A
implica p* = 0 é a única solução da equação
–1
que mapea AF em F. Esta condição
A p * = 0.
TERCEIRA CONDIÇÃO DE UNICIDADE DA SOLUÇÃO:
A terceira condição para a garantia da unicidade da solução é a garantia da
continuidade do operador linear A. A continuidade do operador A leva ao importante
conceito de estabilidade da solução.
Para entendermos o conceito de estabilidade vamos considerar que o
subespaço métrico AF é convexo (logo garantimos a unicidade da projeção de yo no
subespaço AF) e que o operador linear A é único e um-por-um (logo garantimos a
unicidade do operador linear A que mapea p* em y c, portanto p* = 0 é a única solução
da equação A p * = 0). Vamos considerar agora uma pequena perturbação , de modo
que ao invés de conhecermos y c conhecemos y c  pertencente ao subespaço métrico
5
AF, tal que a métrica d ( yc, y c )  . Logo o operador A mapea p * em yc e o mesmo
operador A mapea p* em yc e que a métrica entre d ( p * , p*)  .
Uma solução é INSTÀVEL se a métrica entre y c e y c  tender a zero NÃO
implica que a métrica entre p * e p* tenda a zero. Em outras palavras, uma solução é
instável quando  tender a zero NÃO implica que  tenda a zero.
Estabilidade da solução
Mapeamento descontínuo ===> Instabilidade
yo
A
p*

yc
F

yc

p*
Y
AF
d ( yc , yc ) < 
A
P
d ( p* , p* ) < 
Neste caso de instabilidade da solução, o operador linear A é único, um-porum porém descontínuo.
Heuristicamente, falando uma solução é instável se uma pequena perturbação
no espaço da observações geofísicas leva a uma grande perturbação no espaço dos
parâmetros (soluções).
Por outro lado, se operador linear A é único, um-por-um e contínuo a
solução é ESTÁVEL. Neste caso, no mapeamento contínuo se a métrica entre yc e yc
tender a zero, ou seja se  tender a zero, implica que a métrica entre p* e p* tenda a
6
zero, ou seja implica que  tenda a zero.
Neste caso, em que o mapeamento é
contínuo p* tende a p* .
Temos então um lema: Dado um subespaço COMPACTO e CONVEXO F, se o
mapeamento é F  AF é CONTÍNUO e UM-POR-UM então o mapeamento inverso
AF  F é também CONTÍNUO.
Mapeamento contínuo ==> Estabilidade
A
yo

yc
Y


yc

AF

p*
0
0
p*
F
A
P
d ( yc , yc )
0
d ( p* , p* )
0
p*
p*
Subespaço F é compacto
Conclusão: Se o operador linear A é contínuo e um-por-um e se o subespaço F
que contem a solução é compacto então temos um problema bem posto.
Heuristicamente, um conjunto compacto é um conjunto em que dado qualquer
elemento podemos encontrar outro elemento tão próximo do primeiro quanto se queira.
Geometricamente, um conjunto compacto é aquele que não há “buracos” ou
“descontinuidades”.
Exemplo físico-geométrico de um problema bem posto:
Vamos ilustrar um problema bem posto com um exemplo físico-geométrico
usando uma fotografia aérea, em que o centro do sistema óptico está em um avião que
sobrevoa uma região. Então temos que:

P (espaço de todos os possíveis parâmetros) é a topografia da região;

Y (espaço de todas as possíveis observações) é o registro fotográfico;

F (sub-espaço do espaço P que contém a solução) é o trecho da topografia visível
quando o centro óptico está na atual posição (localização do avião);
7

AF (sub-espaço do espaço Y que contém as observações) é a imagem de F;

A (operador que mapea F em AF ) é o sistema ótico;

-1
A (operador inverso AF  F ) é a definição de alguma propriedade da topografia
(por exemplo cor do solo);
Exemplo físico-geométrico de um problema BEM POSTO
y
AF
Topografia
F
A: F
P
AF
A é o sistema óptico
A-1 é a definição de alguma propriedade da
superfície da topografia
Operador do tipo um por um e contínuo
Note que o operador A que faz o mapeamento F  AF é UM-POR-UM isto porque a
cada elemento em F corresponde apenas um elemento em AF. Note também que o
operador A que faz o mapeamento F  AF é contínuo porque se dois elementos
estão próximos em F suas correspondes imagens em AF também estão próximas. Além
disso note que o subespaço F é um espaço compacto, ou seja, não há buracos ou
descontinuidades.
Concluímos que se o operador A é contínuo e um-por-um e se o subespaço F que
contem a solução é compacto então temos um problema bem posto.
8
Exemplo físico-geométrico de um problema mal posto:
Vamos ilustrar um problema mal posto usando o mesmo exemplo físicogeométrico da fotografia aérea apresentado acima. No entanto, vamos supor que o
avião esteja sobrevoando uma região com muitas nuvens.
Especificamente,
suponhamos agora que haja uma nuvem entre os pontos p1 e p2 então, neste trecho, a
imagem fotográfica da topografia não foi registrada. Assim as operações A e A –1 não
foram definidas em y  isto porque y 

AF. Em outras palavras, houve neste caso
a violação da condição de existência da solução (primeira condição de Hadamard).
Além disso, observe que uma pequena perturbação em torno de y3 leva a grandes
perturbações no espaço dos parâmetros. Especificamente, uma pequena perturbação
para direita de y3 leva através de A –1 a pontos na topografia a direita de p4, ou seja, a
elementos (pontos) afastados de p3. Em outras palavras, neste caso o mapeamento
inverso AF  F é descontínuo (A –1 é descontínua em y3).
Exemplo físico-geométrico de um problema MAL POSTO
y1 y y2
y0
AF
y3
y
y5
Topografia
p0
p1
p2
p3
F
p4
P
p5
y AF inexistência do operador A
y  AF existência do operador A-1 porém é
descontinuo
9
Concluímos que neste exemplo não há garantia da existência do operador A.
Além disso, quando o operador A existe é do tipo um-por-um porém é
descontínuo e o subespaço F, que contem a solução,
não é compacto (com
buracos e descontinuidades). Então este segundo exemplo caracteriza um
problema mal posto.
O método da Regularização de Tikhonov:
Suponhamos que o operador A na equação
Ap =y
(2)
é tal que o operador inverso
A-1 não seja contínuo no subespaço AF e o subespaço F
de possíveis soluções não seja compacto, logo não há estabilidade da solução.
Para solucionarmos o problema da instabilidade da solução, há uma abordagem
desenvolvida por Tikhonov (1963) conhecida como método de Regularização de
Tikhonov que estabelece condições matemáticas para obtermos soluções estáveis de
modo que uma pequena perturbação nos dados leve a pequenas perturbações nas
soluções estimadas. Esta abordagem baseia-se no conceito de operador regularizador.
O conceito de operador regularizador:
Suponhamos que o operador A na equação (2) é tal que o operador inverso
A-1
não seja contínuo no subespaço AF e o subespaço F de possíveis soluções não seja
compacto. Se o membro do lado direito da equação

AF que difere do exato membro do lado direito
métrica, definida no subespaço AF,
aproximada
p*
d ( yT , y
p
y
T
é um elemento
de um valor

y

, então se a
)   , é óbvio que a solução
da equação (2) não pode ser definida como a solução exata desta
equação com membro do lado direito aproximado
equação:

Ap =y
*

= A-1 y.
Isto porque se
(y = y  ) , ou seja, conforme a
A-1
não é um operador contínuo no
subespaço AF, então não há garantia que a solução obtida a partir de observações
10
imprecisas y , ou seja a solução

p * = A-1 y , tenda a solução exata p*T quando
 0.
Para obtermos uma solução aproximada estável via método da regularização de
Tikhonov teremos primeiro que encontrar um operador regularizador.
Para tanto
faremos algumas considerações preliminares. Vimos que o parâmetro numérico
caracteriza o erro no lado direito da equação (2).
regularizadores
que iremos definir

Naturalmente os operadores
para buscar uma solução aproximada estável
dependerá de um parâmetro chamado de parâmetro de regularização que é função de
. Portanto,
*
definiremos p  com o auxílio de um operador regularizador que depende
de um parâmetro tendo um valor escolhido de acordo com o erro
 no dado inicial y .
Especificamente, este operador será escolhido de modo que se

y

aproximar-se do valor exato
aproximar-se da solução exata
Ap=yT.
exatas,
p*
y
T
T
, então a solução aproximada
p
*

deve
que estamos procurando para a equação
Sendo que a solução exata, o elemento
yT  AF,
 0 , ou seja, se
são conectados pela equação Ap
p*T 
*T
F , e as observações
= yT
Como já abordamos, para solucionarmos o problema da instabilidade da
solução, há uma abordagem desenvolvida por Tikhonov (1963) conhecida como método
de Regularização de Tikhonov que estabelece condições matemáticas para obtermos
soluções estáveis. Este método baseia-se na construção de um operador regularizador
para a equação (2) na vizinhança de
regularizador para a equação
y=yT.
y=Ap
Um operador R( y, ) é chamado de
na vizinhança de
y = yT se duas condições
forem satisfeitas:
(1)
Se na vizinhança de y existir um número positivo
,
R( y, ) é definido para todo > 0 e todo y  AF.
tal que o operador
Então existe um valor
11
> 0
tal que
d ( y , yT )     e dentro desta região define-
se um operador regularizador R(
(2)
Se existe
y, ).
y  que satisfaz d ( yT , y
operador regularizador
existe uma função

)     em que
o
R( y , ) está definido dentro desta região. Então
, y de  e dos dados y tal que, para todo
 existe um número  ()   tal que a inclusão y  AF
e
da inequação
d ( yT, y  )   ()
implique
d ( p*T , p*)  
onde
12
p* = p*= R( y  , ).
d ( y , y ) < 
(b) Se existir y que satisfaz
Então posso definir um operador R(y ,   ), em
que   >0, tal que
d ( p *, p *  ) < 
d ( y , y ) <  
implique
em que será escolhido de modo que se :
 0

Se
d ( y, y )
yT )    
d(y,
R( y , ),
, y  conforme o erro 
 0 , ou seja, se
regularizada da
solução exata
p* 
d ( p* , p* ) 0
0
operador de regularização

0
y

isto é,
podemos com o auxílio de um
escolher o parâmetro numérico
dos dados iniciais
aproximar-se do valor exato
p* = p*= R( y
p*T,
p*

d ( p*T , p*)
y
de modo que, se
y T , então a solução
, )
aproxima-se da
 0. Portanto a solução
*
regularizada p  é uma solução estável.
13
Esta solução
p* = p*= R( y  , ), obtida com o auxílio
do operador de regularização
R( y

, ),
é chamada uma solução
regularizada da equação (2) e o parâmetro numérico
é
chamado de
parâmetro de regularização.
Em resumo o método de Regularização de Tikhonov estabelece
duas condições. A condição (1) estabelece que existe uma região em torno do
elemento
y = yT dentro da qual definimos um operador R( y , ) chamado
de operador de regularização. Este operador depende continuamente da
variável

elemento
(parâmetro de regularização). A condição (2) estabelece que se o
y
está dentro desta região definida pela condição (1), então
podemos definir um operador de regularização
continuamente da variável
d ( y  , yT )
 tal que, se 
 0 , isto implica que
0 e por conseqüência que
R( y  , )

que depende
 0 , ou seja, se a distância
0, isto é,
d ( p*T , p*) 
p*  p*T .
O método da Regularização de Tikhonov:
O método de regularização de Tikhonov é um método de obtenção de soluções
aproximadas da equação (2) que são estáveis sob pequenas perturbações no membro
do lado direito da equação (dados geofísicos). Este método consiste:
a) na construção de operadores de regularização ; e
b) na determinação do parâmetro de regularização
tamanho do erro contido nos dados
y

que é função do
(no membro do lado direito da
equação)
14
Então o nosso primeiro passo, consiste em construir operadores de
regularização.
Método de construção de operadores de regularização:
O método para a construção de operadores de regularização para a equação (2)
baseia-se no princípio variacional. Nós presumiremos que a equação
que
yT  AF
A p= yT , em
*T
são os dados exatos, tem apenas uma ÚNICA solução p
.
Seja H(p) um funcional com as seguintes propriedades:
1)
contínuo;
2)
não negativo,
3)
definido no subespaço compacto F1 do espaço métrico F;
4)
em que a solução exata p
5)
para todo número positivo
*T
pertence ao domínio de definição de H(p);e
c, o conjunto de elementos p de F1 para o qual
H(p)  c é um subconjunto de F1 .
A este funcional
H(p)
apresentando tais propriedades chamaremos de
funcional estabilizante ou simplesmente o estabilizador.
O método de construção de operador regularizador reduz-se a um problema de
extremo condicional de minimizar o funcional quasimonotônico H(p) sujeito a explicar os
dados observados (geofísicos) dentro do erro
 contido nos dados y observados (erro
experimental)
H( p )
 inf
p  F


sujeito a : A p  y
,
(3)
este problema é de difícil solução. Operacionalmente, torna-se mais fácil solucionarmos
o seguinte problema de extremo condicional:
15
H( p )
 inf
p  F


sujeito a : A p  y
(4)
.
Este problema de extremo condicional (equação 4) é resolvido via método dos
Multiplicadores de Lagrange. Assim temos o seguinte problema de extremo
incondicional :

pF
A p  y 2
INF

  ( )H(p) ,
(5)
em que o parâmetro de regularização  é determinado da condição
d ( A p* y ) = 
(6)

*
sendo p o elemento em F no qual o funcional M
M p, y   A p  y 2
(p, y)
  ( )H(p)
(7)
atinge o seu maior limite inferior (inf).
O elemento
p*pode ser considerado como
o resultado da aplicação ao
membro do lado direito (y=y) da equação (2) algum operador regularizador R1 que
depende do parâmetro de regularização :
p*= R1 ( y  , ),
onde o parâmetro numérico
(8)
 depende do erro .
Chamamos o funcional
H(p)
estabilizador e chamamos o funcional
de funcional estabilizante ou simplesmente o
M (p, y) de funcional suavizante.
Observe a generalidade da condição (5) para obtenção de soluções estáveis:

p

A é um operador linear ou não linear que realiza um mapea contínuo e um-
y
são elementos definidos em espaços métricos;
por-um.
16
O funcional H(p) sob as condições de ser um funcional estabilizante, isto é,

contínuo, não negativo, definido em um subespaço compacto do espaço de
parâmetros ao qual pertence a solução teórica, é um funcional bastante
genérico no sentido de permitir incorporar uma classe bastante ampla de
informações a priori sobre os parâmetros p na solução de um problema
geofísico.
Note também a generalidade do problema (7) que estabelece. Suponha que o
conjunto F de possíveis soluções da equação (2) é um espaço métrico e que
H(p)
é
um funcional estabilizante definido no conjunto F1  F. Então temos o seguinte teorema:
Seja
A um operador contínuo que mapea F em AF.
existe
AF e todo parâmetro positivo
um elemento
Para todo elemento
p*
F1
y de
para o qual o
funcional
M p, y  d A p, y   H(p)
atinge o seu maior limite inferior:

, y
inf M p, y  M pμ
pF1
Veja que
p
y

.
são, simplesmente, elementos definidos em espaços
métricos. Estes elementos podem ser, por exemplo, funções. Considerando os
elementos
p
y
como os vetores
p e y o que contém, respectivamente, um
número finito de parâmetros descrevendo o modelo interpretativo e as observações em
pontos discretos, então ao invés de um operador contínuo
sensibilidade
teremos a matriz de
A p  , que no caso linear não depende de p e, finalmente, ao invés
do maior limite inferior (inf) do funcional
escalar
A,
H(p)
teremos o mínimo de uma função
H p  . Tomando então na equação (4) a norma

e a função
H p  , como normas Euclideanas ponderadas:
17

Hp   p  p o
e
yo  A p
2

T Wp p  p o  ,
y o  A p 
T


(9)
Wy y o  A p ,
então a condição (5) torna-se:




T
 1
MIN Mp   MIN 
y o  A p Wy y o  A p  p  p o
  ( )
em que
po é
um vetor de referência e
WP
e
Wy
 W p  p  ,(10)
T
p
o

são matrizes positivo-
definidas nos espaços de parâmetros e observações, respectivamente. Note que a
função escalar
H p  na equação (9) introduz informações a priori no espaço dos
parâmetros e depende somente do vetor
po
e da matriz
WP .
Se a matriz
WP for diagonal então a função H p  ( na equação (9) ) pode ser escrita como:
Hp  
 p
M
i 1
em que
i
 poi
Wp i , pi e poi
elementos de
W
2
pi
,
são o i-ésimo valor diagonal e os o i-ésimos
o
WP , p e p respectivamente.
Assim a informação a priori introduzida ao minimizar
uma solução aproximada
~
p
que esteja o mais próximo possível de
o grau de proximidade desejada é dado pela matriz
de
WP impõe
H p  é a de buscar
uma grande proximidade de
~
p
p o , sendo que
WP . Valores altos na diagonal
a
po
e vice–versa. A solução
18
geral da equação (10) é obtida tomando o gradiente da função M p  e igualando o
resultado ao vetor nulo:





T


o
p  Mp    p  y o  A p Wy y o  A p    ( )p 
pp



 W p  p 
T
o
p
T
T
T
 T T

 p M( p )   p p A Wy A p  2 p A Wy y o  y o Wy y o  



T

T
T
 ( )  p p Wp p  2p Wp p o  p o Wp p o 


Calculando os gradientes e igualando o resultado ao vetor nulo temos:
T
T
~
~
2A Wy A p  2 A Wy y o  2 ( ) Wp p  2 ( ) Wp p o  0
(12)
T
~
A Wy A p 
(13)
~
T
 ( ) Wp p   ( ) Wp p o  A Wy y o
T
Vamos somar nos dois lados da equação o termo

 A Wy Ap o então teremos:

T
T
~
~
A Wy A( p  p o )   ( ) Wp p  p o  A Wy (y o  Ap o )
Resultando na equação normal:
A
T
Wy A   ( ) Wp
 p~  p   A W y
T
o
o
y
Portanto obtemos o estimador genérico:

T
~
p  p o  A Wy A   ( ) Wp

-1

T
 A po

A Wy y o  A p o
(14)
(15)

(16)
Tomando a identidade matricial:
C D  I C  C D C  I 
m
sendo
C
(17)
n
uma matriz com dimensão M x N e
D
uma matriz com dimensão N x M.
19
C D  I 
1
Pré e pós-multiplicando ambos os lados
 D C  I 
n


da identidade (17) por
, respectivamente, obtemos:
1
1
m
m

e
1
C D  I  C D  I  C D C  I   C D  I 
C D C  In
m
1
n
  C D  I 
1
1
m
m


C D C  In D C  In
C
(18)
Podemos reescrever a equação (16):

~
p  po  B yo  A po

em que

T
B  A Wy A   ( ) Wp
(19)

-1
vamos colocar em evidência o termo
T
A Wy
 ( ) Wp dentro do termo a ser invertido:
 T
 1

B   A Wy A 
Wp1   Im
  ( )



B   ( ) Wp

1 


  ( ) Wp 



 1

Wp1   Im
 A Wy A 
  ( )


T
-1
T
A Wy



 
-1
T
A Wy
(20)
Vamos chamar:
T
C  A Wy e
 1

D  A 
Wp1 .
  ( )

Agora vamos usar a identidade (18) na equação (20)

B   ( ) Wp

1
  1
 T
A Wy  A 
Wp1  A Wy  In

   ( )
T



 
-1
20

1
Colocando o termo
 ( ) 1 Wy
para dentro do termo a ser invertido temos:
  1
 T
1
B  Wp A  A 
Wp1  A Wy  In

   ( )
T


 ( ) Wy -1 



T
T
B  Wp 1A  AWp1A   ( ) Wy -1  

 
Substituindo a equação 21 em 19 temos:

T
T
~
p  p o  Wp 1A AWp1A   ( ) Wy -1
 y
-1
o
-1
-1
(21)
 A po

(22)
As equações (16) e (22) só são identidades entre si se as matrizes
Wp
e/ou
se
e suas inversas (
Wy 1 e Wp 1 ) não forem singulares. Note que se
Wy e
Wy
Wp forem singulares, então só a equação (16) pode ser usada. Por outro lado,
Wy 1 e/ou Wp 1
forem singulares, então só a equação (22) pode ser usada. Se
nem uma das quatro matrizes acima for singular, então os estimadores genéricos (16) e
(22) são idênticos.
Portanto as duas equações que chamaremos de estimador genérico são:

T
~
p  p o  A Wy A   ( ) Wp

-1
T

A Wy y o  A p o

e

T
T
~
p  p o  Wp 1A AWp1A   ( ) Wy -1
 y
-1
o
 A po

21
Download