Exemplos Regressão e Correlação

Propaganda
ME414 : Estatística para experimentalistas
2º semestre de 2007
Regressão e Correlação
Exercício 01
É esperado que a massa muscular de uma pessoa diminua com a idade. Para estudar
essa relação, uma nutricionista selecionou 18 mulheres, com idade entre 40 e 79 anos,
e observou em cada uma delas a idade (X) e a massa muscular (Y).
Massa muscular (Y)
82.0
91.0
100.0
68.0
87.0
73.0
78.0
80.0
65.0
84.0
116.0
76.0
97.0
100.0
105.0
77.0
73.0
78.0
Página 1 de 8
Idade (X)
71.0
64.0
43.0
67.0
56.0
73.0
68.0
56.0
76.0
65.0
45.0
58.0
45.0
53.0
49.0
78.0
73.0
68.0
(a) Construa o diagrama de dispersão e interprete-o.
120
M.muscular
110
100
90
80
70
60
40
50
60
70
80
Idade
No gráfico de dispersão entre a variável massa muscular e idade, pode-se observar que
há um forte indício de relação linear decrescente entre as variáveis em estudo. Notase que a massa muscular das pessoas diminui à medida que a idade aumenta.
(b) Calcule o coeficiente de correlação linear entre X e Y.
Denotamos as variáveis: Y = Massa Muscular e X = Idade n=18
18
18
 Yi 2  133300
 X i2  70362
Y  85
X  61,556
i 1
 
18
S XX   X i2  18 X
2
i 1
18
Y X
i 1
i
i
 91964
 70362  18(61,556) 2  2157,460
i 1

18
S YY   Yi 2  18 Y
2
 133300  18(85) 2  3250
i 1
18
r
 ( X i  X )(Yi  Y )
i 1
S XX S YY
18

X Y
i 1
i i
 18 XY
S XX S YY

91964  18(85)(61,556)
(2157,460)(3250)
 -0,837
Segundo o resultado da correlação obtida, pode-se notar que há uma forte correlação
linear entre a variável massa muscular e idade. Nota-se que à medida que a idade da
pessoa aumenta a massa muscular diminui, o que é coerente com o gráfico de
dispersão apresentada anteriormente.
Página 2 de 8
(c) Ajuste uma reta de regressão para a relação entre as variáveis Y: massa muscular
(dependente) e X: idade (independente).
S
91964  18(85)(61,556)
ˆ1  XY 
 -1,027
2157,460
S XX
e
ˆ  Y  ˆ X  85  1,027(61,556)  148,218
0
1
A reta de regressão estimada da variável Massa muscular (Y) em função da Idade (X) é

Y  148,218  1,027 X
(d) Considerando a reta estimada dada no item (c), estime a massa muscular média de
mulheres com 50 anos.

Y 50  ˆ0  ˆ1 X  148,218 - 1,027(50)  96,868
Exercício 02
Os dados a seguir correspondem à variável renda familiar e gasto com alimentação
(em unidades monetárias) para uma amostra de 25 famílias.
Renda Familiar (X)
3
5
10
10
20
20
20
30
40
50
60
70
Gasto com Alimentação (Y)
1,5
2,0
6,0
7,0
10,0
12,0
15,0
8,0
10,0
20,0
20,0
25,0
Página 3 de 8
70
80
100
100
100
120
120
140
150
180
180
200
200
(a)
30,0
25,0
40,0
35,0
40,0
30,0
40,0
40,0
50,0
40,0
50,0
60,0
50,0
Construa o diagrama de dispersão da variável gasto com alimentação (Y) em função
da renda familiar (X).
Gasto com Alimentação
60
50
40
30
20
10
0
0
100
200
Renda Familiar
(b)
Calcular o coeficiente de correlação entre essas variáveis.
Denotamos as variáveis: Y = Gasto com Alimentação e X = Renda familiar
X  83,120 Y  26,660
25
 X i2  271934
i 1
25
 Yi 2  24899,250
i 1
Página 4 de 8
25
Y X
i 1
i
i
 80774,500
25
S XY
r
(c)
S X SY

X Y
i i
i 1
 25 XY
 0,954
S X SY
Obtenha a equação de regressão do gasto com alimentação em função da renda
familiar.
25
S
ˆ1  XY 
S XX
X Y
i 1
i i
 25 X Y

S XX
80774,5  25(83,12)( 26,66)
 0,256
271934  25(83,12) 2
e
ˆ0  Y  ˆ1 X  26,66  0,256(83,120)  5,380
A reta de regressão estimada da variável Gasto de alimentação (Y) em função da
Renda familiar (X) é

Y  5,380  0,256 X
(d)
Qual o significado prático do valor da inclinação da reta de regressão do item (c)?
O valor ˆ1 =0,256 significa que estima-se que para cada aumento de uma unidade
monetária da renda familiar ocorre um acréscimo em média de 0,256 unidades no
gasto com alimentação.
Exercício 03
Um pesquisador deseja verificar se um instrumento para medir a concentração de
determinada substância no sangue está bem calibrado. Para isto, ele tomou 15
amostras de concentrações conhecidas (X) e determinou a respectiva concentração
através do instrumento (Y), obtendo:
X
Y
2,0
2,1
2,0
1,8
2,0
1,9
4,0
4,5
4,0
4,2
4,0
4,0
6,0
6,2
6,0
6,0
Página 5 de 8
6,0
6,5
8,0
8,2
8,0
7,8
8,0 10,0 10,0 10,0
7,7 9,6 10,0 10,1
(a) Construa o diagrama de dispersão para esses dados.
Diagrama de Dispersão
10,5
9,5
8,5
7,5
Y
6,5
5,5
4,5
3,5
2,5
1,5
2
3
4
5
6
7
8
9
10
X
(b) Trace no gráfico a reta com 45º de inclinação passando pela origem. Como essa
reta pode ser útil na avaliação do instrumento?
y
10
5
0
0
5
10
x
Esta reta é útil, pois, quanto mais próximos os pontos estiverem nela, maior à precisão
do instrumento, já que o ideal é Y=X.
Página 6 de 8
(c) Calcule o coeficiente de correlação entre as variáveis X e Y.
X 6
Y  6,040
15
X
i 1
2
i
15
Y
 660
i 1
15
r
(X
i 1
i
 663,380
2
i
15
Y X
i 1
 X )(Yi  Y )
S X SY
i
i
 661,200
 0,996
(d) Obtenha a reta de regressão da variável Y em função de X.
A reta de regressão estimada da variável Y e X é

Y  0,160  0,980 X
(e) Com base nos itens anteriores tire conclusões sobre a eficiência do instrumento.
Com base nos itens anteriores, nota-se que, o instrumento para medir a concentração
de determinada substância no sangue encontra-se bem calibrado. Observa-se que
existe uma alta correlação entre as medidas feitas pelo instrumento e a concentração
da determinada substância, o que pode ser confirmado nos gráficos apresentados
anteriormente. Além disso, a reta de regressão obtida é bem próxima da reta Y=X,
indicando grande proximidade entre as medidas. O método formal para verificar se o
instrumento esta bem calibrado é testar as hipóteses:(α=0,05)
H 0: 1  1
H 1 : 1  1
Estatística do teste:
T
ˆ1  1
ˆ 2 / S XX
~
 T(152)
SobH 0
R.C. (α=0,05)
Página 7 de 8
R.C.  {T  R :| T | 2,16}
Valores observados
T0bs 
0,980  1
ˆ 2 / S XX

 0.02
0.06984 / 120
 0.828
Como T0bs  R.C. , então aceita-se Ho. Ou seja, o instrumento esta bem calibrado.
Página 8 de 8
Download