CAP. V – AJUSTE DE CURVAS PELO MÉTODO DOS MÍNIMOS QUADRADOS No capítulo anterior estudamos uma forma de lidar com funções matemáticas definidas por tabelas de valores. Frequentemente, estas tabelas são obtidas com base em dados experimentais, contendo erros inerentes aos métodos de medição utilizado. Como os valores não são exactos, muitas vezes não é razoável recorrer à interpolação polinomial, ou seja, exigir que a função aproximante satisfaça exactamente os dados disponíveis. Assim, em vez de recorrermos a um polinómio que passe exactamente por todos os pontos, fazemos passar uma função aproximante g(x), o mais próximo possível dos pontos. Consideremos uma série de pontos (xi , yi), i=1, ..., n onde cada yi foi obtido experimentalmente e aproxima o valor de uma função no ponto xi, isto é, yi ≅ f(xi). Estes valores podem ser representados por um gráfico cartesiano formando um diagrama de dispersão. Página 1 de 20- Ajuste de Curvas pelo Método dos Mínimos Quadrados EXEMPLO 1: Construir o diagrama de dispersão da seguinte tabela: xi yi 1.3 2.0 3.4 5.2 5.1 3.8 2 4 6 6.8 6.1 8.0 5.8 7 6 5 4 3 2 1 0 0 8 10 Objectivo: procurar a curva y = g(x) que melhor se ajusta, num dado sentido, ao diagrama anterior. TIPOS DE AJUSTAMENTOS: Ajustamento linear simples; Ajustamento linear múltiplo. Página 2 de 20- Ajuste de Curvas pelo Método dos Mínimos Quadrados 5.1 AJUSTE LINEAR SIMPLES O modelo mais simples que relaciona duas variáveis x e y é a recta: y = β0 + β1.x onde β0 e β1 são os parâmetros do modelo. Consideremos: xi : valor da variável explicativa ou independente; yi : valor da variável resposta ou dependente; yˆ i (imagem de x i pela recta y i = β0 + β1.x i ) : valor predito; d i = y i - yˆ i (desvio) : distância vertical do ponto à recta. Suponha-se uma recta arbitrária desenhada no diagrama de dispersão do exemplo 1: 7 6 5 4 3 2 1 0 di ŷ i 0 2 4 6 8 10 Página 3 de 20- Ajuste de Curvas pelo Método dos Mínimos Quadrados ESCOLHA DA MELHOR RECTA: Consideremos a soma dos quadrados dos desvios de todos os n pontos: n D = ∑ di2 i =1 Medida do desvio total dos pontos à recta estimada Esta medida depende da recta considerada: D(β 0 , β 1 ) = n ∑ di2 = i =1 n ∑ (y i − yˆ i )2 = i =1 n ∑ (y i − (β 0 + β 1 .x i )) 2 i =1 Pretendemos então os valores dos coeficientes de β0 e β1 que minimizam D(β 0 , β1 ) , ou seja, o valor mínimo de D(β 0 , β1 ) . Para tal, temos de derivar D(β 0 , β1 ) em relação a β0 e β1 e resolver as equações normais (igualar as derivadas parciais a zero): ⎧ ∂ D(β0 ,β1 ) n = ∑− 2.(yi − β0 − β1.xi ) = 0 ⎪ ∂ β0 i=1 ⎪ ⎨ ⎪∂ D(β0 ,β1 ) n = ∑− 2.(yi − β0 − β1.xi ).xi = 0 ⎪ β ∂ i=1 1 ⎩ Página 4 de 20- Ajuste de Curvas pelo Método dos Mínimos Quadrados • Os valores de b0 e b1, para os quais D(β 0 , β1 ) apresenta um valor mínimo são obtidos pela resolução do sistema (equações normais): n n n ⎧ ⎧ ⎪− 2∑ (y i − b 0 − b1.x i ) = 0 ⎪nb 0 + b1 ∑ x i = ∑ y i i = 1 i =1 i =1 ⎪ ⎪ ⎪ ⎪ ⇔ ⎨ ⎨ ⎪ ⎪ n n n n ⎪− 2∑ (y i .x i − b 0 .x i − b1.x i 2 ) = 0 ⎪b 0 ∑ x i + b1 ∑ x i 2 = ∑ y i .x i ⎪⎩ i =1 ⎪⎩ i =1 i =1 i =1 Em notação matricial, ⎡ ⎢n ⎢ ⎢ ⎢n ⎢ ⎢∑ x i ⎣ i =1 ⎤ ⎡n ⎤ ∑ x i ⎥ ⎡ b ⎤ ⎢∑ y i ⎥ i =1 ⎥ 0 ⎢ i =1 ⎥ ⎢ ⎥ ⎥. ⎢ ⎥ ⎢ ⎥=⎢ ⎥ ⎥ n n ⎢ ⎥ b 1 ⎥ ⎢ ⎥ ⎣ ⎦ y .x ∑ xi2 ⎥ ∑ i i ⎢ ⎥ i =1 ⎦ ⎣ i =1 ⎦ n Resolvendo o sistema, obtemos: n n n i =1 n i =1 n.∑ x i .y i − ∑ x i . ∑ y i b1 = i =1 n n. ∑ x i 2 − ( ∑ x i ) 2 i =1 n n ∑ y i − ( ∑ x i ).b1 b 0 = i =1 i =1 n i =1 Como este método consiste em achar o mínimo de uma função quadrática, é conhecido como o método dos mínimos quadrados. Página 5 de 20- Ajuste de Curvas pelo Método dos Mínimos Quadrados A melhor recta, no sentido dos mínimos quadrados, que se ajusta aos dados do diagrama de dispersão é dada por: y= b0 + b1x EXEMPLO 1 (CONTINUAÇÃO): Determinar a recta dos mínimos quadrados que melhor se ajusta aos dados da tabela. 1.3 2.0 3.4 5.2 xi yi xi2 1.3 2.0 3.4 5.2 5.1 3.8 6.8 6.1 8.0 5.8 xi yi 5.1 3.8 6.8 6.1 8.0 5.8 Tabela auxiliar: xi yi yi2 ŷ i ∑ Página 6 de 20- Ajuste de Curvas pelo Método dos Mínimos Quadrados ri QUALIDADE DO AJUSTE: ¾ COEFICIENTE DE DETERMINAÇÃO Para simplicar a notação, o símbolo n ∑ será trocado por i =1 fôr conveniente. ∑ , sempre que O coeficiente de determinação é dado por: (∑ xi y i − R2 = 1 ∑ xi n ∑y ) 2 i sendo 0 ≤ R 2 ≤ 1 1 1 ⎡ 2 2 2⎤ ⎡ 2⎤ − − x x y y ( ) . ( ) ∑ ∑ ∑ ∑ i i i i ⎢⎣ ⎥⎦ ⎢⎣ ⎥⎦ n n Quanto mais próximo o coeficiente de determinação estiver de 1, melhor será o ajuste. ¾ RESÍDUOS Outra maneira de verificar a adequação do modelo é comparar cada valor observado yi com o respectivo valor predito ŷ i . À diferença entre estes dois valores chama-se resíduo: ri = y i - ŷ i , ∀ i onde ŷ i é dado pela equação yi=b0+b1.xi . Quando b0 e b1 são estimadores dos mínimos quadrados, então os desvios di são idênticos aos resíduos ri. Página 7 de 20- Ajuste de Curvas pelo Método dos Mínimos Quadrados 5.2 AJUSTE LINEAR MÚLTIPLO Uma maneira de relacionar uma variável dependente y com p variáveis independentes é: y = β0 + β1x1 + β2x2 + ... + βpxp onde β0 , β1 , ..., βp são os parâmetros do modelo. Para n pontos, temos o sistema: ⎧ y1 = β 0 + β 1.x11 + β 2 .x 21 + ... + β p .x p1 ⎪ ⎪ y 2 = β 0 + β 1.x12 + β 2 .x 22 + ... + β p .x p2 ⎨ ⎪... ⎪ y = β + β .x + β .x + ... + β .x 0 1 1n 2 2n p pn ⎩ n Na forma matricial: ⎡ y1 ⎤ ⎡1 x11 ⎢ y ⎥ ⎢1 x 12 ⎢ 2⎥ = ⎢ ⎢... ⎥ ⎢... ⎢ ⎥ ⎢ ⎣ y n ⎦ ⎢⎣1 x1n x 21 x 22 x 2n x p1 ⎤ ⎡β 0 ⎤ ⎥ x p 2 ⎥ ⎢⎢β1 ⎥⎥ ⎥ . ⎢... ⎥ ⇔ Y = X.β ⎥ ⎢ ⎥ x pn ⎥⎦ ⎢⎣β p ⎥⎦ Considerando a soma dos quadrados dos desvios de todos os n pontos D= n ∑ di i =1 2 = n ∑ (y i − yˆ i ) i =1 2 = n ∑ (y i − (β 0 + β 1 .x 1i i =1 + β 2 .x 2i + ... + β p .x pi )) 2 , pretende-se minimizar D(β 0 , β1 , β 2 , ... , β p ) . Página 8 de 20- Ajuste de Curvas pelo Método dos Mínimos Quadrados Para tal, derivamos D(β 0 , β1 , β 2 , ... , β p ) em relação a β0, β1, ... , βp e resolvemos as equações normais. n ∂D = − 2 ∑ (y − β − β x − β x − ... − β p x ) = 0 0 1 1i 2 2i pi ∂β i =1 i 0 n ∂D = − 2 ∑ (y − β − β x − β x − ... − β p x )x = 0 0 1 1i 2 2i pi 1i ∂β i =1 i 1 ... n ∂D = − 2 ∑ (y − β − β x − β x − ... − β p x )x = 0 0 1 1i 2 2i pi pi ∂ βp i =1 i O vector b que minimiza a soma dos quadrados dos desvios é a solução do sistema de equações lineares: ⎡n ⎢ ⎢ ⎢ ⎢∑ x1i ⎢ ⎢ ⎢∑ x 2i ⎢ ⎢.... ⎢ ⎢∑ x pi ⎢ ⎣ ∑x ∑x 1i ∑x 2 1i ∑x x 2i ∑x x pi 1i 1i ... ∑ x pi ⎤ ⎡∑ yi ⎤ ⎥ ⎢ ⎥ ⎥ ⎡b0 ⎤ ⎢ ⎥ ⎥⎢ ⎥ ⎢ ∑x 2i x1i ... ∑ x pi x1i ⎥ ⎢ ⎥ ⎢∑ x1i yi ⎥⎥ ⎥ ⎢b1 ⎥ ⎢ ⎥ ⎢ ⎥=⎢ ⎥ . ⎥ 2 ⎢ ⎥ ⎥ x y x ... x x ∑ 2i ∑ pi 2i ⎥ ⎢b ⎥ ⎢∑ 2i i ⎥ ⎢ ⎥ 2 ⎥ ⎢ ... ⎥ ⎢ ⎥ 2 ⎥ ⎢b ⎥ ⎢... ⎥ ∑x 2i x pi ... ∑ x pi ⎥ ⎣ p ⎦ ⎢ ⎥ x y ⎥ ⎢ ⎥⎦ ∑ pi i ⎣ ⎦ 2i Página 9 de 20- Ajuste de Curvas pelo Método dos Mínimos Quadrados ¾ COEFICIENTE DE DETERMINAÇÃO 2 ∑ ( yi − yˆ i ) R =1− 1 2 2 ∑ yi − ( ∑ yi ) n 2 onde ŷ i = b 0 + b1 .x 1i + b 2 .x 2i + ... + b p .x pi ¾ RESÍDUOS Para se calcular os resíduos no ajuste linear múltiplo utiliza-se a equação dos resíduos para o ajuste linear simples. Contudo, ŷ i é dado pela equação anterior. Página 10 de 20- Ajuste de Curvas pelo Método dos Mínimos Quadrados EXEMPLO 2 : Ajustar os pontos da tabela à equação y = b0 + b1x1 + b2x2 e determinar o coeficiente de determinação: x1i -1 0 1 2 4 5 5 6 x2i -2 -1 0 1 1 2 3 4 yi 13 11 9 4 11 9 1 -1 Tabela auxiliar: x1i2 x2i2 x1i x2i x1i x2i -1 -2 13 0 -1 11 1 0 9 2 1 4 4 1 11 5 2 9 5 3 1 6 4 -1 yi yix1i yix2i yi 2 ŷ i ri ∑ Página 11 de 20- Ajuste de Curvas pelo Método dos Mínimos Quadrados ri2 5.2.1 AJUSTE POLINOMIAL Um caso especial de ajuste linear múltiplo ocorre quando x1=x, x2=x2, ..., xp=xp. Deste modo, tem-se a equação: y = β0+β1x + β2x2+ ... +βpxp O vector b é determinado pela resolução do sistema: ⎡n ⎢ ⎢ ⎢ ⎢∑ x i ⎢ ⎢ ⎢∑ x i 2 ⎢ ⎢ ⎢ p ⎢∑ x i ⎢ ⎣ ¾ COEFICIENTE ∑x i ∑x i ∑x 2 ∑x i ∑x i DE 3 p +1 ∑x ⎤ ⎥ ⎥ ⎡b 0 ⎤ ⎡ y ⎤ ⎥ ⎢ ⎥ ⎢∑ i ⎥ 3 p +1 ∑ x i ... ∑ x i ⎥ ⎢ b 1 ⎥ ⎢∑ x i y i ⎥ ⎥ ⎢b ⎥ ⎢ ⎥ ⎥.⎢ 2 ⎥ = ⎢∑ x i 2 y i ⎥ 4 p+2 ⎥ ∑ x i ... ∑ x i ⎥⎥ ⎢... ⎥ ⎢... ⎢ ⎥ ⎢ ⎥ ⎥⎢ ⎥ ⎢ p x i yi ⎥ ∑ p+2 2p ⎥ ⎢ b p ⎥ ⎣ ⎦ ∑ x i ... ∑ x i ⎥ ⎣ ⎦ ⎥ ⎦ 2 i ... p i DETERMINAÇÃO 2 ∑ ( yi − yˆ i ) R =1− 1 2 2 ∑ yi − (∑ yi ) n 2 onde ŷ i = b 0 + b1 .x + b 2 .x 2 + ... + b p .x p ¾ RESÍDUOS Para se calcular os resíduos no ajuste polinomial utiliza-se a equação dos resíduos para o ajuste linear simples. Contudo, ŷ i é dado pela equação anterior. Página 12 de 20- Ajuste de Curvas pelo Método dos Mínimos Quadrados EXEMPLO 3 : Ajustar os pontos da tabela abaixo à equação y = b0 + b1x + b2x2 xi yi -2 -30.5 -1.5 -20.2 0 -3.3 1 8.9 2.2 16.8 xi 2 yi ŷ i 3.1 21.4 Tabela auxiliar: xi xi 2 xi 3 xi 4 yi -2 -30.5 -1.5 -20.2 0 -3.3 1 8.9 2.2 16.8 3.1 21.4 xi yi ri2 ∑ Página 13 de 20- Ajuste de Curvas pelo Método dos Mínimos Quadrados yi 2 5.2.2. TRANSFORMAÇÕES Alguns modelos não lineares nos parâmetros podem ser transformados em modelos lineares por substituição dos valores de uma ou mais variáveis por funções destas variáveis. EXEMPLO DE TRANSFORMAÇÕES: y = a e bx x y = ab y=ax ⎯ ⎯→ ⎯ ⎯→ y = ea + bx1 +cx2 y = a.x1 x 2 x3 b y= y= ln y = ln a + (ln b)x ⎯ ⎯→ b c d 1 a + bx1 + cx 2 1 1 + e a + b x1 +c.x2 ln y = ln a + bx ln y = ln a + b( ln x) ⎯ ⎯→ ln y = a + bx1 + cx2 ⎯ ⎯→ ln y = ln a + b ln x1 + c ln x2 + d ln x3 ⎯ ⎯→ 1 = a + b x1 + cx 2 y ⎯ ⎯→ 1 ln ( - 1) = a + b x1 + cx 2 y Página 14 de 20- Ajuste de Curvas pelo Método dos Mínimos Quadrados EXEMPLO 4 : Ajustar os pontos da tabela abaixo à equação y = a.e bx xi yi 0.1 5.9 1.5 8.8 3.3 12.0 4.5 19.8 5.0 21.5 xi 2 y' i 2 Tabela auxiliar: xi yi 0.1 5.9 1.5 8.8 3.3 12 4.5 19.8 5.0 21.5 y'i = ln(yi) xiy'i ∑ Página 15 de 20- Ajuste de Curvas pelo Método dos Mínimos Quadrados EXEMPLO 1 (CONTINUAÇÃO): Determinar a recta dos mínimos quadrados que melhor se ajusta aos dados da tabela. 1.3 2.0 3.4 5.2 xi yi xi 2 xi yi yi 2 ŷi ri 1.3 2.0 1.69 2.60 4.0 2.7 -0.7 3.4 5.2 11.56 17.68 27.04 3.8 1.4 5.1 3.8 26.01 19.38 14.44 4.7 -0.9 6.8 6.1 46.24 41.48 37.21 5.6 0.5 8.0 5.8 64.00 46.40 33.64 6.2 -0.4 24.6 22.9 149.5 127.54 116.33 xi yi 5.1 3.8 6.8 6.1 8.0 5.8 Tabela auxiliar: ∑ Determinação dos coeficientes: b1 = b0 = 5 * 127.54 − 24.6 * 22.9 5 * 149.5 − (24.6 ) 2 = 0.52241 22.9 − 24.6 * 0.52241 = 2.0097 5 Então a melhor recta que passa pelos pontos tabelados é y=2.0097+0.52241x. Cálculo do coeficiente de determinação: 2 24.6 * 22.9 ⎞ ⎛ ⎜127.54 − ⎟ 5 ⎝ ⎠ 2 R = = 0.67866 2 2 ⎡ ( ( 24.6 ) ⎤ ⎡ 22.9 ) ⎤ ⎢149.5 − ⎥ ⎢116.33 − ⎥ 5 5 ⎦ ⎣ ⎦⎣ Página 16 de 20- Ajuste de Curvas pelo Método dos Mínimos Quadrados O ajuste efectuado pelos método dos mínimos quadrados não explica bem a variação de y como função de x. EXEMPLO 2 : Ajustar os pontos da tabela à equação y = b0 + b1x1 + b2x2 e determinar o coeficiente de determinação: x1i -1 0 1 2 4 5 5 6 x2i -2 -1 0 1 1 2 3 4 yi 13 11 9 4 11 9 1 -1 ŷi Tabela auxiliar: x1i x2i X1i2 x2i2 x1ix2i yi x1iyi x2iyi yi 2 -1 -2 1 4 2 13 -13 -26 169 13.767 -0.767 0.588 0 -1 0 1 0 11 0 -11 121 10.703 0.297 0.088 1 0 1 0 0 9 9 0 81 7.639 1.361 1.852 2 1 4 1 2 4 8 4 16 4.575 -0.575 0.331 4 1 16 1 4 11 44 11 121 11.375 -0.375 0.141 5 2 25 4 10 9 45 18 81 8.311 0.689 0.475 5 3 25 9 15 1 5 3 1 1.847 -0.847 0.717 6 4 36 16 24 -1 -6 -4 1 -1.217 0.217 0.047 22 8 108 36 57 57 92 -5 591 ⎡ 8 22 8 ⎤ ⎡b 0 ⎤ ⎡ 57 ⎤ O sistema é ⎢22 108 57⎥ ⎢ b1 ⎥ = ⎢ 92 ⎥ , a solução é ⎥⎢ ⎥ ⎢ ⎥ ⎢ ⎢⎣ 8 57 36⎥⎦ ⎢⎣b 2 ⎥⎦ ⎢⎣− 5⎥⎦ ri2 ri 4.239 ⎡b 0 ⎤ ⎡ 4.239 ⎤ ⎢ b ⎥ = ⎢ 3.400 ⎥ . ⎥ ⎢ 1⎥ ⎢ ⎢⎣b 2 ⎥⎦ ⎢⎣− 6.464⎥⎦ Então a melhor recta que se ajusta aos pontos é y = 4.239 +3.400x1 -6.464x2. Página 17 de 20- Ajuste de Curvas pelo Método dos Mínimos Quadrados R2 =1 − Cálculo do coeficiente de determinação: 4.239 (57 )2 591 − = 0.977 . 8 O ajuste efectuado é muito bom. EXEMPLO 3 : Ajustar os pontos da tabela abaixo à equação y = b0 + b1.x + b2.x2 xi yi -2 -30.5 -1.5 -20.2 0 -3.3 1 8.9 2.2 16.8 3.1 21.4 Tabela auxiliar: xi xi2 xi3 xi4 yi xi yi xi2 yi ŷ i ri2 yi2 -2 4 -8 16 -30.5 61.0 -122.0 -29.57 0.865 930.25 -1.5 2.25 -3.375 5.063 -20.2 30.3 -45.45 -21.766 2.452 408.04 0 0 0 0 -3.3 0 0 -2.018 1.644 10.89 1 1 1 1 8.9 8.9 8.9 8.092 0.653 79.21 81.312 2.2 4.84 10.648 23.426 16.8 36.96 16.998 0.039 282.24 3.1 9.61 29.791 92.352 21.4 66.34 205.654 21.368 0.001 457.96 21.7 30.064 137.841 -6.9 203.5 128.416 5.654 2168.59 ∑ 2.8 2.8 21.7 ⎤ ⎡b 0 ⎤ ⎡ − 6.9 ⎤ ⎡ 6 21.7 30.064 ⎥ ⎢ b1 ⎥ = ⎢ 203.5 ⎥ , O sistema é ⎢ 2.8 ⎢ ⎥⎢ ⎥ ⎢ ⎥ ⎢⎣21.7 30.064 137.841⎥⎦ ⎢⎣b 2 ⎥⎦ ⎢⎣128.416⎥⎦ ⎡b 0 ⎤ ⎡− 2.018⎤ a solução é ⎢ b1 ⎥ = ⎢ 11.332 ⎥ . Então a melhor curva que se ajusta aos pontos é ⎢ ⎥ ⎢ ⎥ ⎢⎣b 2 ⎥⎦ ⎢⎣ − 1.222 ⎥⎦ y = -2.018 + 11.332x - 1.222x2. Página 18 de 20- Ajuste de Curvas pelo Método dos Mínimos Quadrados Cálculo do coeficiente de determinação: R2 =1 − 5.654 = 0.997 . (− 6.9 )2 2168.59 − O ajuste efectuado é muito bom. 6 EXEMPLO 4 : Ajustar os pontos da tabela abaixo à equação y = ae bx 0.1 5.9 xi yi → y = a.e bx 1.5 8.8 3.3 12.0 4.5 19.8 5.0 21.5 ln y = ln a +b.x Tabela auxiliar: ∑ xi yi y'i = ln(yi) xiy'i xi 2 y' i 2 0.1 5.9 1.77 0.177 0.01 3.1329 1.5 8.8 2.17 3.255 2.25 4.7089 3.3 12 2.48 8.184 10.89 6.1504 4.5 19.8 2.99 13.455 20.25 8.9401 5.0 21.5 3.07 15.35 25 9.4248 12.48 40.421 58.4 32.3372 14.4 Determinação dos coeficientes: b1 = 5 * 40.421 − 14.4 * 12.48 b0 = 5 * 58.4 − (14.4 ) 2 = 0.2646 12.48 − 0.2646 * 14.4 = 1.734 5 Então a melhor curva que se ajusta aos pontos tabelados é ln y =1.734 +0.2646x ⇔ y = e1.734 .e0.2646x ⇔ y = 5.6633.e0.2646x Página 19 de 20- Ajuste de Curvas pelo Método dos Mínimos Quadrados Cálculo do coeficiente de determinação: 14.4 * 12.48 5 = 0.982 R2 = 2 2 ⎡ ( ( 14.4 ) ⎤ ⎡ 12.48) ⎤ ⎢58.4 − ⎥ ⎢32.3572 − ⎥ 5 5 ⎦ ⎣ ⎦⎣ 40.421 − O ajuste efectuado é muito bom. Página 20 de 20- Ajuste de Curvas pelo Método dos Mínimos Quadrados