Apêndice A - Ajuste de funções a um conjunto de pontos

Propaganda
Roteiro de Física Experimental II
45
Apêndice A - Ajuste de funções a um conjunto de pontos
experimentais
Fonte: Fundamentos da Teoria de Erros – José Henrique Vuolo – Editora Edgar Blücher Ltda. – 1992
Na experiência sobre o empuxo medimos duas grandezas x e y que, segundo nosso modelo,
deveriam relacionar-se de uma maneira linear, ou seja, sua relação era do tipo y = ax + b . De posse de
vários pontos experimentais ( x, y ) pretendíamos determinar os valores dos coeficientes a e b.
Contudo, ao construirmos um gráfico desses pontos, descobrimos que eles não se alinhavam
perfeitamente, formando uma reta, mas apresentavam certa aleatoriedade em sua distribuição. Na
verdade, já deveríamos esperar por isso, pois esses pontos são pontos experimentais e suas medidas
estão sujeitas a erros aleatórios. Devido à distribuição dos pontos, várias retas com diferentes
coeficientes a e b, poderiam ser boas candidatas para descrever o comportamento de nossos pontos
experimentais. Precisávamos, portanto, descobrir qual era a reta que melhor se ajustava aos pontos
experimentais.
Essa é uma situação comum no laboratório: temos um conjunto de pontos experimentais ( x, y )
e gostaríamos de obter a melhor função f ( x) para descrever esses pontos. Esse procedimento é
chamado de regressão ou ajuste de curva. Naturalmente, a primeira pergunta que deve passar por sua
cabeça é: que critério deve ser usado para definir objetivamente o que é a melhor função? Geralmente,
usamos como critério o princípio de máxima verossimilhança. Admitimos que, ao realizarmos um
conjunto de medidas, ocorre o resultado que tem maior probabilidade de ocorrer. Note que isso não
acontece necessariamente. No entanto, essa ainda parece ser a melhor hipótese a ser feita. Segundo
esse princípio, a melhor função f ( x) é aquela para a qual a probabilidade de ocorrência de um dado
conjunto de pontos experimentais é máxima, quando tal função é considerada como a verdadeira.
É importante notar que esse critério estatístico não permite ajustar uma função arbitrária a um
conjunto de pontos experimentais. Por isso o que se considera é o ajuste de uma função particular,
dentro de uma família de funções com forma pré-determinada, aos pontos experimentais. Por exemplo,
procura-se determinar entre todas as retas y = ax + b , quais os valores particulares dos coeficientes a e
b que melhor se ajustam aos pontos experimentais.
Método dos mínimos quadrados
O método dos mínimos quadrados é um método baseado no princípio de máxima
verossimilhança e que pode ser aplicado quando as distribuições de erros experimentais são
gaussianas. O que, na prática, acontece frequentemente. Além disso, a melhor função f ( x) , deve ser
determinada a partir de uma função tentativa f ( x) = f ( x; a1 , a2 ,L , a p ) , previamente escolhida. Isso
significa que as variáveis a serem ajustadas são os parâmetros a1 , a2 ,L , a p .
Considere que num processo de medida de duas grandezas x e y, obtemos um conjunto de n
pontos experimentais que designaremos por
{x1 , y1 , σ 1 }, {x2 , y 2 , σ 2 }, ..., {xn , y n , σ n },
onde a variável independente xi é considerada isenta de erros e a variável yi tem incerteza estatística
dada pelo desvio padrão σ i . Na prática a variável xi também apresenta erros estatísticos. Quando
esses erros forem significativos, eles podem ser transferidos para a variável yi através das regras de
propagação de erros.
Roteiro de Física Experimental II
46
Considere, agora, o ponto experimental
{ xi , yi , σ i } .
Como estamos considerando que a
distribuição estatística de yi é gaussiana, então, conforme o que você aprendeu na Aula 1, a
probabilidade Pi de ocorrência desse ponto é determinada pela função gaussiana de densidade de
probabilidade correspondente a:
 1  y − µ 2 
C
i
Pi = exp  −  i
 ,
σi
 2  σ i  
onde µi é o valor médio verdadeiro correspondente a yi e C é uma constante de normalização. Como
a probabilidade Ptotal de ocorrência do conjunto dos n pontos experimentais é o produto das
probabilidades de ocorrência de cada ponto, pois eles são estatisticamente independentes, temos que:
Ptotal
 1 n  y − µ 2 
Cn
i
= ∏ i =1 Pi =
exp  − ∑  i
 .
σ 1σ 2 Lσ n
σ
2

i =1 
 
i
n
Se substituirmos o valor médio verdadeiro µi pela função tentativa f ( x) = f ( x; a1 , a2 ,L , a p ) ,
teremos:
Ptotal = ∏
n
i =1
 1 n  y i − f ( xi ; a1 , a 2 , ..., a p )  2 
Cn
Cn
 1 
  =
Pi =
exp− ∑i =1 
exp− χ 2 
σ 1σ 2 ...σ n
σi
 2 
 2

  σ 1σ 2 ...σ n
com
 y i − f ( xi ; a1 , a 2 , ..., a p ) 

χ = ∑i =1 
σi


2
2
n
Segundo o princípio da máxima verossimilhança, a função f ( x) = f ( x; a1 , a2 ,L , a p ) que
melhor se ajusta aos pontos experimentais é aquela que maximiza a probabilidade Ptotal , se for
considerada como a função verdadeira. Portanto, tudo o que devemos fazer é determinar os parâmetros
a1 , a2 ,L , a p que maximizam Ptotal . Devido à exponencial na expressão acima para Ptotal , essa
probabilidade é uma função decrescente de χ 2 . Portanto, para maximizar Ptotal , basta minimizar χ 2
em relação aos parâmetros a1 , a2 ,L , a p .
Resumindo, se
f ( x; a1 , a2 ,L , a p ) é uma função tentativa previamente escolhida. Então, o
método dos mínimos quadrados consiste em determinar os parâmetros a1 , a2 ,L , a p que minimizam a
soma dos quadrados na expressão:
 y − f (xi ; a1 , a 2 ,..., a p ) 

χ = ∑i =1  i
σi


2
n
2
Roteiro de Física Experimental II
47
Nas situações em que as incertezas σ i são todas iguais, ou seja, σ 1 = σ 2 = L = σ n = σ , teremos
n
2
χ 2 = S / σ 2 , onde S = ∑ ( yi − f ( xi ; a1 , a2 ,L , a p ) . Nesses casos, os parâmetros a1 , a2 ,L , a p devem
i =1
ser tais que minimizam S . Note que, num gráfico, S representa a soma dos quadrados das distâncias
verticais dos pontos experimentais à curva que representa f ( x) .
Regressão linear
O problema da minimização de χ 2 , no método dos mínimos quadrados, se torna especialmente
simples quando a função tentativa representa uma reta, ou seja, f ( x) = ax + b . O problema do ajuste de
uma reta a um conjunto de dados experimentais se chama regressão linear. Como nesse caso a
aplicação do método dos mínimos quadrados é bastante simples, vamos realizá-la aqui explicitamente
para que você tenha uma idéia de como o método funciona.
Nosso problema consiste em minimizar a expressão
2
 y − (axi + b) 
χ = ∑ i
 ,
σi
i =1 

2
em relação aos parâmetros a e b. Para isso, vamos derivar χ em relação a a e b e igualar essas
derivadas a zero:
n
[ y − (axi + b)]
∂χ 2
= −2∑ i
xi = 0,
σ i2
∂a
i =1
2
n
n
[ y − (axi + b)]
∂χ 2
= −2∑ i
= 0.
∂b
σ i2
i =1
Rearranjando os termos, podemos escrever o sistema de equações acima como:
a ∑i =1
1
n
σ
a ∑i =1
xi2 + b ∑i =1
1
n
σ
1
n
2
i
σ
xi + b ∑i =1
1
n
2
i
2
i
σ
2
i
xi =
∑
1=
∑
1
n
i =1
n
i =1
σ i2
xi y i
1
yi
σ i2
Para simplificar a notação vamos definir:
Sσ =
∑
n
i =1
1
σ
2
i
; Sx =
∑
n
i =1
xi
σ
2
i
; S x2 =
∑
n
i =1
xi2
σ
2
i
; Sy =
∑
n
i =1
yi
σ
2
i
; S xy =
∑
n
xi y i
i =1
σ i2
Ao utilizarmos a nova notação, obtemos o seguinte sistema de equações lineares para as variáveis a e
b:
a S x 2 + b S x = S xy
a S x + b Sσ = S y
A solução desse sistema de equações pode ser facilmente obtida, fornecendo:
Roteiro de Física Experimental II
a=
48
S σ S xy − S x S y
b=
Sσ S x 2 − S x S x
e
S x 2 S y − S x S xy
Sσ S x2 − S x S x
As grandezas a e b foram obtidas em função das variáveis yi que possuem incertezas estatísticas σ i .
Portanto, a e b também estão sujeitas a erros estatísticos. Suas incertezas podem ser computadas
através da fórmula de propagação de erros:
 ∂a
σ = ∑i =1 
 ∂y i
2
2
 2
n  ∂b 
 σ i
 σ i2
σ b2 = ∑i =1 
y
∂

 i
;
S x2
Sσ
σ b2 =
σ a2 =
Sσ S x 2 − S x S x
Sσ S x2 − S x S x
;
2
a
n
Como as grandezas a e b foram obtidas através das mesmas grandezas yi , elas devem estar
estatisticamente correlacionadas. A covariância dessas duas grandezas pode ser calculada através da
n
∂a ∂b 2
2
=∑
σ i , fornecendo:
fórmula σ ab
i =1 ∂yi ∂yi
σ ab2 = −
Sx
Sσ S x 2 − S x S x
EXEMPLO 1 – Os resultados das medidas do índice de refração da luz no quartzo, n, como função do
comprimento de onda λ, são listados na tabela abaixo. A imprecisão estimada para as medidas de n é
de δ n = 0,0020 (note que n é adimensional) e consideramos δλ = 0 :
λ (µm )
n ± 0, 0020
0,400
0,425
0,450
0,475
0,500
0,525
0,550
0,575
0,600
0,625
0,650
0,675
0,700
1,5610
1,5540
1,5500
1,5430
1,5410
1,5350
1,5340
1,5290
1,5280
1,5240
1,5230
1,5220
1,5200
(
x = λ−2 µm −2
6,25
5,53633
4,93827
4,43213
4
3,62812
3,30579
3,02457
2,77778
2,56
2,36686
2,19479
2,04082
)
Sabemos que a relação entre o índice de refração da luz em meios materiais e o comprimento de onda,
pode se descrita na região do visível pela fórmula de Cauchy:
n(λ ) = a λ −2 + b ,
que pode ser linearizada se fizermos a mudança de variável x = λ−2 → n( x) = ax + b . Veja os gráficos
abaixo.
Roteiro de Física Experimental II
49
Quadrático
Linearizado
1,56
1,55
1,55
1,54
1,54
n
n
1,56
1,53
1,53
1,52
1,52
0,40
0,45
0,50
0,55
0,60
0,65
2
0,70
3
λ(µm)
4
5
6
-2
x(µm )
O objetivo da regressão linear é encontrar os valores de a e b que caracterizam a reta que passa mais
perto de todos os pontos do gráfico, ao mesmo tempo! Para utilizar a fórmula obtida anteriormente,
precisamos calcular os valores de:
Sσ =
∑
1
n
i =1
σ
; Sx =
2
i
∑
n
i =1
xi
σ
2
i
; S x2 =
∑
n
i =1
xi2
σ
2
i
; Sy =
∑
n
i =1
yi
σ
2
i
; S xy =
∑
n
xi y i
i =1
σ i2
No experimento acima, as imprecisões são iguais para todas as medidas. Isto significa que
σ i → σ 1 = σ 2 = ... = σ 13 = 0, 0020
logo
Sσ =
Sx =
∑
xi
n
i =1
σ
1
0,002 2
=
2
i
xi2
∑
1
n
i =1
σ
=
2
i
∑
13
i =1
1
0,002 2
∑
13
i =1
1=
1
× 13 = 3,25 × 10 6
2
0,002
(adimensional)
xi = 2,5 ×10 5 × 47,05546 =1,1763865 ×10 7 µm − 2
1
13
x 2 = 2,5 ×10 5 × 191,83702 = 4,7959255 ×10 7 µm −4
2 ∑i =1 i
0,002
σ
y
n
13
1
S y = ∑i =1 i2 =
y = 2,50 ×10 5 × 19,964 = 4991000 ×10 6
2 ∑i =1 i
σi
0,002
(adimensional)
S x2 =
∑
S xy =
∑
n
i =1
n
i =1
2
i
xi y i
σ
2
i
=
=
1
0,002 2
∑
13
i =1
xi y i = 2,5 ×10 5 × 72,47473= 1,8118683×10 7 µm − 2
Note que todas as casas decimais foram mantidas nos cálculos intermediários para evitar erros de
truncamento.
Aplicando a fórmula acima temos:
a=
Sσ S xy − S x S y
Sσ S x 2 − S x S x
= 0,986 × 10 − 2 µm 2
b=
e
S x 2 S y − S x S xy
Sσ S x 2 − S x S x
=1,50
Roteiro de Física Experimental II
50
Os valores de a e b acima são respectivamente o coeficiente angular e linear da reta que passa o mais
próximo possível de todos os pontos experimentais, ao mesmo tempo. Veja o gráfico abaixo, onde a
reta com os parâmetros acima é desenhada juntamente com os pontos experimentais:
1,56
1,55
n
1,54
1,53
1,52
2
3
4
5
6
-2
x(µm )
Regressão não-linear
O método dos mínimos quadrados pode ser formalmente deduzido para qualquer função de ajuste e
não apenas para retas. A seguir apresentamos um exemplo em que utilizamos um ajuste não-linear
implementado com o programa de ajustes de curvas do ORIGIN.
EXEMPLO 2 – Ajuste não linear de curvas.
Em um experimento sobre a polarização da luz são feitas medidas da intensidade da luz transmitida
através de um polarizador em função do ângulo entre a polarização da luz incidente e o eixo do
polarizador. Os dados são apresentados na tabela abaixo, junto com o respectivo gráfico da intensidade
I em função do ângulo θ :
σ I (W / m2 )
0,31
0,62
0,94
1,25
1,57
1,88
2,19
2,51
2,82
3,14
0,091
0,064
0,033
0,0090
0,0010
0,0080
0,035
0,066
0,091
0,10
1,2
1,0
0,8
2
Ângulo θ (rd )
I(W/m )
Intensidade I (W / m 2 )
0,910
0,640
0,330
0,0900
0,0001
0,0800
0,350
0,660
0,910
1,02
0,6
0,4
0,2
0,0
0,0
0,5
1,0
1,5
2,0
2,5
3,0
3,5
θ(rd)
Sabemos que a partir do modelo para este sistema, temos a seguinte relação entre a intensidade
transmitida e o ângulo de polarização:
I (θ ) = I 0 cos 2 (θ ) ,
onde I 0 é a intensidade incidente.
Roteiro de Física Experimental II
51
Se fizermos um ajuste não-linear dos nossos dados para a função tentativa y = P1 cos 2 ( x) , a coluna das
intensidades medidas fornecerá a coluna y para o ajuste, os ângulos serão a coluna x e obteremos
como resultado do ajuste, o parâmetro ajustável P1 que dará o valor da intensidade incidente I 0 .
Veja o resultado do ajuste no gráfico abaixo:
(
)
O valor obtido no ajuste foi de I 0 = 1, 0040 ± 0, 0070 W m 2 . Isto significa que para as medidas
realizadas, a função que gera pontos mais próximos dos pontos medidos, de acordo com o critério de
mínimos quadrados é a função
.
I transmit = (1, 0040 ± 0, 0070) cos 2 (θ ) (W / m 2 ).
1,2
y = P1*cos(x)^2
Chi^2 = 0.00019
P1
1.004 ±0.007
0,8
2
I(W/m )
1,0
0,6
0,4
0,2
0,0
0,0
0,5
1,0
1,5
2,0
2,5
3,0
3,5
θ(rd)
Cuidados com os resultados do ajuste
Ao analisarmos um ajuste de curva, linear ou não-linear, devemos tomar o cuidado de considerar o
papel do χ 2 reduzido. Ele corresponde ao valor do χ 2 dividido pelo número de graus de liberdade
(ν). O número de graus de liberdade do ajuste é o número de pontos experimentais menos o número de
parâmetros ajustados, no caso de um ajuste linear com N pontos experimentais ν = N – 2, e podemos
escrever:
χ
2
red
=
χ2
N −2
.
Os programas de análise usualmente fornecem o valor de χ 2 como um dos resultados do ajuste. Para
obtermos o valor do χ 2 reduzido, devemos dividir o valor encontrado para χ 2 pelo número de graus
de liberdade (ν). Destacamos três situações para a interpretação dos resultados:
•
2
χ red
> 1 : ou o modelo matemático proposto não está adequado, ou as incertezas foram
•
subestimadas.
2
χ red
< 1 : o modelo matemático proposto está adequado, ou as incertezas foram superestimadas.
Roteiro de Física Experimental II
•
52
2
χ red
>>1: certamente o modelo proposto não está adequado.
Quanto às incertezas dos parâmetros de ajuste precisamos ter um olhar crítico. Como no cálculo das
incertezas apenas os valores experimentais “xi” e as incertezas “σi” são utilizados, os dois resultados
abaixo fornecem os mesmos valores de incerteza para os parâmetros “a” e “b” do ajuste de reta.
Reta 1
Reta 2
Como temos 5 pontos experimentais e dois parâmetros de ajuste, os valores de χ 2 reduzido são:
•
Reta 1: χ 2 reduzido = 10,83;
•
Reta 2: χ 2 reduzido = 0,088.
Assim, mesmo fornecendo valores iguais para os erros nos parâmetros “a” e “b”, é a análise do χ 2
reduzido que nos permite dizer que o ajuste da Reta 2, comparado ao ajuste da Reta 1, é o melhor. As
incertezas nos parâmetros encontrados não podem ser o único critério de julgamento da qualidade do
ajuste de curvas realizado.
Download