Roteiro de Física Experimental II 45 Apêndice A - Ajuste de funções a um conjunto de pontos experimentais Fonte: Fundamentos da Teoria de Erros – José Henrique Vuolo – Editora Edgar Blücher Ltda. – 1992 Na experiência sobre o empuxo medimos duas grandezas x e y que, segundo nosso modelo, deveriam relacionar-se de uma maneira linear, ou seja, sua relação era do tipo y = ax + b . De posse de vários pontos experimentais ( x, y ) pretendíamos determinar os valores dos coeficientes a e b. Contudo, ao construirmos um gráfico desses pontos, descobrimos que eles não se alinhavam perfeitamente, formando uma reta, mas apresentavam certa aleatoriedade em sua distribuição. Na verdade, já deveríamos esperar por isso, pois esses pontos são pontos experimentais e suas medidas estão sujeitas a erros aleatórios. Devido à distribuição dos pontos, várias retas com diferentes coeficientes a e b, poderiam ser boas candidatas para descrever o comportamento de nossos pontos experimentais. Precisávamos, portanto, descobrir qual era a reta que melhor se ajustava aos pontos experimentais. Essa é uma situação comum no laboratório: temos um conjunto de pontos experimentais ( x, y ) e gostaríamos de obter a melhor função f ( x) para descrever esses pontos. Esse procedimento é chamado de regressão ou ajuste de curva. Naturalmente, a primeira pergunta que deve passar por sua cabeça é: que critério deve ser usado para definir objetivamente o que é a melhor função? Geralmente, usamos como critério o princípio de máxima verossimilhança. Admitimos que, ao realizarmos um conjunto de medidas, ocorre o resultado que tem maior probabilidade de ocorrer. Note que isso não acontece necessariamente. No entanto, essa ainda parece ser a melhor hipótese a ser feita. Segundo esse princípio, a melhor função f ( x) é aquela para a qual a probabilidade de ocorrência de um dado conjunto de pontos experimentais é máxima, quando tal função é considerada como a verdadeira. É importante notar que esse critério estatístico não permite ajustar uma função arbitrária a um conjunto de pontos experimentais. Por isso o que se considera é o ajuste de uma função particular, dentro de uma família de funções com forma pré-determinada, aos pontos experimentais. Por exemplo, procura-se determinar entre todas as retas y = ax + b , quais os valores particulares dos coeficientes a e b que melhor se ajustam aos pontos experimentais. Método dos mínimos quadrados O método dos mínimos quadrados é um método baseado no princípio de máxima verossimilhança e que pode ser aplicado quando as distribuições de erros experimentais são gaussianas. O que, na prática, acontece frequentemente. Além disso, a melhor função f ( x) , deve ser determinada a partir de uma função tentativa f ( x) = f ( x; a1 , a2 ,L , a p ) , previamente escolhida. Isso significa que as variáveis a serem ajustadas são os parâmetros a1 , a2 ,L , a p . Considere que num processo de medida de duas grandezas x e y, obtemos um conjunto de n pontos experimentais que designaremos por {x1 , y1 , σ 1 }, {x2 , y 2 , σ 2 }, ..., {xn , y n , σ n }, onde a variável independente xi é considerada isenta de erros e a variável yi tem incerteza estatística dada pelo desvio padrão σ i . Na prática a variável xi também apresenta erros estatísticos. Quando esses erros forem significativos, eles podem ser transferidos para a variável yi através das regras de propagação de erros. Roteiro de Física Experimental II 46 Considere, agora, o ponto experimental { xi , yi , σ i } . Como estamos considerando que a distribuição estatística de yi é gaussiana, então, conforme o que você aprendeu na Aula 1, a probabilidade Pi de ocorrência desse ponto é determinada pela função gaussiana de densidade de probabilidade correspondente a: 1 y − µ 2 C i Pi = exp − i , σi 2 σ i onde µi é o valor médio verdadeiro correspondente a yi e C é uma constante de normalização. Como a probabilidade Ptotal de ocorrência do conjunto dos n pontos experimentais é o produto das probabilidades de ocorrência de cada ponto, pois eles são estatisticamente independentes, temos que: Ptotal 1 n y − µ 2 Cn i = ∏ i =1 Pi = exp − ∑ i . σ 1σ 2 Lσ n σ 2 i =1 i n Se substituirmos o valor médio verdadeiro µi pela função tentativa f ( x) = f ( x; a1 , a2 ,L , a p ) , teremos: Ptotal = ∏ n i =1 1 n y i − f ( xi ; a1 , a 2 , ..., a p ) 2 Cn Cn 1 = Pi = exp− ∑i =1 exp− χ 2 σ 1σ 2 ...σ n σi 2 2 σ 1σ 2 ...σ n com y i − f ( xi ; a1 , a 2 , ..., a p ) χ = ∑i =1 σi 2 2 n Segundo o princípio da máxima verossimilhança, a função f ( x) = f ( x; a1 , a2 ,L , a p ) que melhor se ajusta aos pontos experimentais é aquela que maximiza a probabilidade Ptotal , se for considerada como a função verdadeira. Portanto, tudo o que devemos fazer é determinar os parâmetros a1 , a2 ,L , a p que maximizam Ptotal . Devido à exponencial na expressão acima para Ptotal , essa probabilidade é uma função decrescente de χ 2 . Portanto, para maximizar Ptotal , basta minimizar χ 2 em relação aos parâmetros a1 , a2 ,L , a p . Resumindo, se f ( x; a1 , a2 ,L , a p ) é uma função tentativa previamente escolhida. Então, o método dos mínimos quadrados consiste em determinar os parâmetros a1 , a2 ,L , a p que minimizam a soma dos quadrados na expressão: y − f (xi ; a1 , a 2 ,..., a p ) χ = ∑i =1 i σi 2 n 2 Roteiro de Física Experimental II 47 Nas situações em que as incertezas σ i são todas iguais, ou seja, σ 1 = σ 2 = L = σ n = σ , teremos n 2 χ 2 = S / σ 2 , onde S = ∑ ( yi − f ( xi ; a1 , a2 ,L , a p ) . Nesses casos, os parâmetros a1 , a2 ,L , a p devem i =1 ser tais que minimizam S . Note que, num gráfico, S representa a soma dos quadrados das distâncias verticais dos pontos experimentais à curva que representa f ( x) . Regressão linear O problema da minimização de χ 2 , no método dos mínimos quadrados, se torna especialmente simples quando a função tentativa representa uma reta, ou seja, f ( x) = ax + b . O problema do ajuste de uma reta a um conjunto de dados experimentais se chama regressão linear. Como nesse caso a aplicação do método dos mínimos quadrados é bastante simples, vamos realizá-la aqui explicitamente para que você tenha uma idéia de como o método funciona. Nosso problema consiste em minimizar a expressão 2 y − (axi + b) χ = ∑ i , σi i =1 2 em relação aos parâmetros a e b. Para isso, vamos derivar χ em relação a a e b e igualar essas derivadas a zero: n [ y − (axi + b)] ∂χ 2 = −2∑ i xi = 0, σ i2 ∂a i =1 2 n n [ y − (axi + b)] ∂χ 2 = −2∑ i = 0. ∂b σ i2 i =1 Rearranjando os termos, podemos escrever o sistema de equações acima como: a ∑i =1 1 n σ a ∑i =1 xi2 + b ∑i =1 1 n σ 1 n 2 i σ xi + b ∑i =1 1 n 2 i 2 i σ 2 i xi = ∑ 1= ∑ 1 n i =1 n i =1 σ i2 xi y i 1 yi σ i2 Para simplificar a notação vamos definir: Sσ = ∑ n i =1 1 σ 2 i ; Sx = ∑ n i =1 xi σ 2 i ; S x2 = ∑ n i =1 xi2 σ 2 i ; Sy = ∑ n i =1 yi σ 2 i ; S xy = ∑ n xi y i i =1 σ i2 Ao utilizarmos a nova notação, obtemos o seguinte sistema de equações lineares para as variáveis a e b: a S x 2 + b S x = S xy a S x + b Sσ = S y A solução desse sistema de equações pode ser facilmente obtida, fornecendo: Roteiro de Física Experimental II a= 48 S σ S xy − S x S y b= Sσ S x 2 − S x S x e S x 2 S y − S x S xy Sσ S x2 − S x S x As grandezas a e b foram obtidas em função das variáveis yi que possuem incertezas estatísticas σ i . Portanto, a e b também estão sujeitas a erros estatísticos. Suas incertezas podem ser computadas através da fórmula de propagação de erros: ∂a σ = ∑i =1 ∂y i 2 2 2 n ∂b σ i σ i2 σ b2 = ∑i =1 y ∂ i ; S x2 Sσ σ b2 = σ a2 = Sσ S x 2 − S x S x Sσ S x2 − S x S x ; 2 a n Como as grandezas a e b foram obtidas através das mesmas grandezas yi , elas devem estar estatisticamente correlacionadas. A covariância dessas duas grandezas pode ser calculada através da n ∂a ∂b 2 2 =∑ σ i , fornecendo: fórmula σ ab i =1 ∂yi ∂yi σ ab2 = − Sx Sσ S x 2 − S x S x EXEMPLO 1 – Os resultados das medidas do índice de refração da luz no quartzo, n, como função do comprimento de onda λ, são listados na tabela abaixo. A imprecisão estimada para as medidas de n é de δ n = 0,0020 (note que n é adimensional) e consideramos δλ = 0 : λ (µm ) n ± 0, 0020 0,400 0,425 0,450 0,475 0,500 0,525 0,550 0,575 0,600 0,625 0,650 0,675 0,700 1,5610 1,5540 1,5500 1,5430 1,5410 1,5350 1,5340 1,5290 1,5280 1,5240 1,5230 1,5220 1,5200 ( x = λ−2 µm −2 6,25 5,53633 4,93827 4,43213 4 3,62812 3,30579 3,02457 2,77778 2,56 2,36686 2,19479 2,04082 ) Sabemos que a relação entre o índice de refração da luz em meios materiais e o comprimento de onda, pode se descrita na região do visível pela fórmula de Cauchy: n(λ ) = a λ −2 + b , que pode ser linearizada se fizermos a mudança de variável x = λ−2 → n( x) = ax + b . Veja os gráficos abaixo. Roteiro de Física Experimental II 49 Quadrático Linearizado 1,56 1,55 1,55 1,54 1,54 n n 1,56 1,53 1,53 1,52 1,52 0,40 0,45 0,50 0,55 0,60 0,65 2 0,70 3 λ(µm) 4 5 6 -2 x(µm ) O objetivo da regressão linear é encontrar os valores de a e b que caracterizam a reta que passa mais perto de todos os pontos do gráfico, ao mesmo tempo! Para utilizar a fórmula obtida anteriormente, precisamos calcular os valores de: Sσ = ∑ 1 n i =1 σ ; Sx = 2 i ∑ n i =1 xi σ 2 i ; S x2 = ∑ n i =1 xi2 σ 2 i ; Sy = ∑ n i =1 yi σ 2 i ; S xy = ∑ n xi y i i =1 σ i2 No experimento acima, as imprecisões são iguais para todas as medidas. Isto significa que σ i → σ 1 = σ 2 = ... = σ 13 = 0, 0020 logo Sσ = Sx = ∑ xi n i =1 σ 1 0,002 2 = 2 i xi2 ∑ 1 n i =1 σ = 2 i ∑ 13 i =1 1 0,002 2 ∑ 13 i =1 1= 1 × 13 = 3,25 × 10 6 2 0,002 (adimensional) xi = 2,5 ×10 5 × 47,05546 =1,1763865 ×10 7 µm − 2 1 13 x 2 = 2,5 ×10 5 × 191,83702 = 4,7959255 ×10 7 µm −4 2 ∑i =1 i 0,002 σ y n 13 1 S y = ∑i =1 i2 = y = 2,50 ×10 5 × 19,964 = 4991000 ×10 6 2 ∑i =1 i σi 0,002 (adimensional) S x2 = ∑ S xy = ∑ n i =1 n i =1 2 i xi y i σ 2 i = = 1 0,002 2 ∑ 13 i =1 xi y i = 2,5 ×10 5 × 72,47473= 1,8118683×10 7 µm − 2 Note que todas as casas decimais foram mantidas nos cálculos intermediários para evitar erros de truncamento. Aplicando a fórmula acima temos: a= Sσ S xy − S x S y Sσ S x 2 − S x S x = 0,986 × 10 − 2 µm 2 b= e S x 2 S y − S x S xy Sσ S x 2 − S x S x =1,50 Roteiro de Física Experimental II 50 Os valores de a e b acima são respectivamente o coeficiente angular e linear da reta que passa o mais próximo possível de todos os pontos experimentais, ao mesmo tempo. Veja o gráfico abaixo, onde a reta com os parâmetros acima é desenhada juntamente com os pontos experimentais: 1,56 1,55 n 1,54 1,53 1,52 2 3 4 5 6 -2 x(µm ) Regressão não-linear O método dos mínimos quadrados pode ser formalmente deduzido para qualquer função de ajuste e não apenas para retas. A seguir apresentamos um exemplo em que utilizamos um ajuste não-linear implementado com o programa de ajustes de curvas do ORIGIN. EXEMPLO 2 – Ajuste não linear de curvas. Em um experimento sobre a polarização da luz são feitas medidas da intensidade da luz transmitida através de um polarizador em função do ângulo entre a polarização da luz incidente e o eixo do polarizador. Os dados são apresentados na tabela abaixo, junto com o respectivo gráfico da intensidade I em função do ângulo θ : σ I (W / m2 ) 0,31 0,62 0,94 1,25 1,57 1,88 2,19 2,51 2,82 3,14 0,091 0,064 0,033 0,0090 0,0010 0,0080 0,035 0,066 0,091 0,10 1,2 1,0 0,8 2 Ângulo θ (rd ) I(W/m ) Intensidade I (W / m 2 ) 0,910 0,640 0,330 0,0900 0,0001 0,0800 0,350 0,660 0,910 1,02 0,6 0,4 0,2 0,0 0,0 0,5 1,0 1,5 2,0 2,5 3,0 3,5 θ(rd) Sabemos que a partir do modelo para este sistema, temos a seguinte relação entre a intensidade transmitida e o ângulo de polarização: I (θ ) = I 0 cos 2 (θ ) , onde I 0 é a intensidade incidente. Roteiro de Física Experimental II 51 Se fizermos um ajuste não-linear dos nossos dados para a função tentativa y = P1 cos 2 ( x) , a coluna das intensidades medidas fornecerá a coluna y para o ajuste, os ângulos serão a coluna x e obteremos como resultado do ajuste, o parâmetro ajustável P1 que dará o valor da intensidade incidente I 0 . Veja o resultado do ajuste no gráfico abaixo: ( ) O valor obtido no ajuste foi de I 0 = 1, 0040 ± 0, 0070 W m 2 . Isto significa que para as medidas realizadas, a função que gera pontos mais próximos dos pontos medidos, de acordo com o critério de mínimos quadrados é a função . I transmit = (1, 0040 ± 0, 0070) cos 2 (θ ) (W / m 2 ). 1,2 y = P1*cos(x)^2 Chi^2 = 0.00019 P1 1.004 ±0.007 0,8 2 I(W/m ) 1,0 0,6 0,4 0,2 0,0 0,0 0,5 1,0 1,5 2,0 2,5 3,0 3,5 θ(rd) Cuidados com os resultados do ajuste Ao analisarmos um ajuste de curva, linear ou não-linear, devemos tomar o cuidado de considerar o papel do χ 2 reduzido. Ele corresponde ao valor do χ 2 dividido pelo número de graus de liberdade (ν). O número de graus de liberdade do ajuste é o número de pontos experimentais menos o número de parâmetros ajustados, no caso de um ajuste linear com N pontos experimentais ν = N – 2, e podemos escrever: χ 2 red = χ2 N −2 . Os programas de análise usualmente fornecem o valor de χ 2 como um dos resultados do ajuste. Para obtermos o valor do χ 2 reduzido, devemos dividir o valor encontrado para χ 2 pelo número de graus de liberdade (ν). Destacamos três situações para a interpretação dos resultados: • 2 χ red > 1 : ou o modelo matemático proposto não está adequado, ou as incertezas foram • subestimadas. 2 χ red < 1 : o modelo matemático proposto está adequado, ou as incertezas foram superestimadas. Roteiro de Física Experimental II • 52 2 χ red >>1: certamente o modelo proposto não está adequado. Quanto às incertezas dos parâmetros de ajuste precisamos ter um olhar crítico. Como no cálculo das incertezas apenas os valores experimentais “xi” e as incertezas “σi” são utilizados, os dois resultados abaixo fornecem os mesmos valores de incerteza para os parâmetros “a” e “b” do ajuste de reta. Reta 1 Reta 2 Como temos 5 pontos experimentais e dois parâmetros de ajuste, os valores de χ 2 reduzido são: • Reta 1: χ 2 reduzido = 10,83; • Reta 2: χ 2 reduzido = 0,088. Assim, mesmo fornecendo valores iguais para os erros nos parâmetros “a” e “b”, é a análise do χ 2 reduzido que nos permite dizer que o ajuste da Reta 2, comparado ao ajuste da Reta 1, é o melhor. As incertezas nos parâmetros encontrados não podem ser o único critério de julgamento da qualidade do ajuste de curvas realizado.