ME414 : Estatística para experimentalistas 2º semestre de 2007 Regressão e Correlação Exercício 01 É esperado que a massa muscular de uma pessoa diminua com a idade. Para estudar essa relação, uma nutricionista selecionou 18 mulheres, com idade entre 40 e 79 anos, e observou em cada uma delas a idade (X) e a massa muscular (Y). Massa muscular (Y) 82.0 91.0 100.0 68.0 87.0 73.0 78.0 80.0 65.0 84.0 116.0 76.0 97.0 100.0 105.0 77.0 73.0 78.0 Página 1 de 8 Idade (X) 71.0 64.0 43.0 67.0 56.0 73.0 68.0 56.0 76.0 65.0 45.0 58.0 45.0 53.0 49.0 78.0 73.0 68.0 (a) Construa o diagrama de dispersão e interprete-o. 120 M.muscular 110 100 90 80 70 60 40 50 60 70 80 Idade No gráfico de dispersão entre a variável massa muscular e idade, pode-se observar que há um forte indício de relação linear decrescente entre as variáveis em estudo. Notase que a massa muscular das pessoas diminui à medida que a idade aumenta. (b) Calcule o coeficiente de correlação linear entre X e Y. Denotamos as variáveis: Y = Massa Muscular e X = Idade n=18 18 18 Yi 2 133300 X i2 70362 Y 85 X 61,556 i 1 18 S XX X i2 18 X 2 i 1 18 Y X i 1 i i 91964 70362 18(61,556) 2 2157,460 i 1 18 S YY Yi 2 18 Y 2 133300 18(85) 2 3250 i 1 18 r ( X i X )(Yi Y ) i 1 S XX S YY 18 X Y i 1 i i 18 XY S XX S YY 91964 18(85)(61,556) (2157,460)(3250) -0,837 Segundo o resultado da correlação obtida, pode-se notar que há uma forte correlação linear entre a variável massa muscular e idade. Nota-se que à medida que a idade da pessoa aumenta a massa muscular diminui, o que é coerente com o gráfico de dispersão apresentada anteriormente. Página 2 de 8 (c) Ajuste uma reta de regressão para a relação entre as variáveis Y: massa muscular (dependente) e X: idade (independente). S 91964 18(85)(61,556) ˆ1 XY -1,027 2157,460 S XX e ˆ Y ˆ X 85 1,027(61,556) 148,218 0 1 A reta de regressão estimada da variável Massa muscular (Y) em função da Idade (X) é Y 148,218 1,027 X (d) Considerando a reta estimada dada no item (c), estime a massa muscular média de mulheres com 50 anos. Y 50 ˆ0 ˆ1 X 148,218 - 1,027(50) 96,868 Exercício 02 Os dados a seguir correspondem à variável renda familiar e gasto com alimentação (em unidades monetárias) para uma amostra de 25 famílias. Renda Familiar (X) 3 5 10 10 20 20 20 30 40 50 60 70 Gasto com Alimentação (Y) 1,5 2,0 6,0 7,0 10,0 12,0 15,0 8,0 10,0 20,0 20,0 25,0 Página 3 de 8 70 80 100 100 100 120 120 140 150 180 180 200 200 (a) 30,0 25,0 40,0 35,0 40,0 30,0 40,0 40,0 50,0 40,0 50,0 60,0 50,0 Construa o diagrama de dispersão da variável gasto com alimentação (Y) em função da renda familiar (X). Gasto com Alimentação 60 50 40 30 20 10 0 0 100 200 Renda Familiar (b) Calcular o coeficiente de correlação entre essas variáveis. Denotamos as variáveis: Y = Gasto com Alimentação e X = Renda familiar X 83,120 Y 26,660 25 X i2 271934 i 1 25 Yi 2 24899,250 i 1 Página 4 de 8 25 Y X i 1 i i 80774,500 25 S XY r (c) S X SY X Y i i i 1 25 XY 0,954 S X SY Obtenha a equação de regressão do gasto com alimentação em função da renda familiar. 25 S ˆ1 XY S XX X Y i 1 i i 25 X Y S XX 80774,5 25(83,12)( 26,66) 0,256 271934 25(83,12) 2 e ˆ0 Y ˆ1 X 26,66 0,256(83,120) 5,380 A reta de regressão estimada da variável Gasto de alimentação (Y) em função da Renda familiar (X) é Y 5,380 0,256 X (d) Qual o significado prático do valor da inclinação da reta de regressão do item (c)? O valor ˆ1 =0,256 significa que estima-se que para cada aumento de uma unidade monetária da renda familiar ocorre um acréscimo em média de 0,256 unidades no gasto com alimentação. Exercício 03 Um pesquisador deseja verificar se um instrumento para medir a concentração de determinada substância no sangue está bem calibrado. Para isto, ele tomou 15 amostras de concentrações conhecidas (X) e determinou a respectiva concentração através do instrumento (Y), obtendo: X Y 2,0 2,1 2,0 1,8 2,0 1,9 4,0 4,5 4,0 4,2 4,0 4,0 6,0 6,2 6,0 6,0 Página 5 de 8 6,0 6,5 8,0 8,2 8,0 7,8 8,0 10,0 10,0 10,0 7,7 9,6 10,0 10,1 (a) Construa o diagrama de dispersão para esses dados. Diagrama de Dispersão 10,5 9,5 8,5 7,5 Y 6,5 5,5 4,5 3,5 2,5 1,5 2 3 4 5 6 7 8 9 10 X (b) Trace no gráfico a reta com 45º de inclinação passando pela origem. Como essa reta pode ser útil na avaliação do instrumento? y 10 5 0 0 5 10 x Esta reta é útil, pois, quanto mais próximos os pontos estiverem nela, maior à precisão do instrumento, já que o ideal é Y=X. Página 6 de 8 (c) Calcule o coeficiente de correlação entre as variáveis X e Y. X 6 Y 6,040 15 X i 1 2 i 15 Y 660 i 1 15 r (X i 1 i 663,380 2 i 15 Y X i 1 X )(Yi Y ) S X SY i i 661,200 0,996 (d) Obtenha a reta de regressão da variável Y em função de X. A reta de regressão estimada da variável Y e X é Y 0,160 0,980 X (e) Com base nos itens anteriores tire conclusões sobre a eficiência do instrumento. Com base nos itens anteriores, nota-se que, o instrumento para medir a concentração de determinada substância no sangue encontra-se bem calibrado. Observa-se que existe uma alta correlação entre as medidas feitas pelo instrumento e a concentração da determinada substância, o que pode ser confirmado nos gráficos apresentados anteriormente. Além disso, a reta de regressão obtida é bem próxima da reta Y=X, indicando grande proximidade entre as medidas. O método formal para verificar se o instrumento esta bem calibrado é testar as hipóteses:(α=0,05) H 0: 1 1 H 1 : 1 1 Estatística do teste: T ˆ1 1 ˆ 2 / S XX ~ T(152) SobH 0 R.C. (α=0,05) Página 7 de 8 R.C. {T R :| T | 2,16} Valores observados T0bs 0,980 1 ˆ 2 / S XX 0.02 0.06984 / 120 0.828 Como T0bs R.C. , então aceita-se Ho. Ou seja, o instrumento esta bem calibrado. Página 8 de 8