a 2% de significância.

Propaganda
Exercícios
Testes de Hipótese
14.- Os dados abaixo representam a resistência de dez pedaços de um cabo de aço, ensaiados
por tração até a ruptura. Com base nos resultados obtidos, pretende-se saber se esse cabo
obedece à especificação, a qual exige que sua carga média de ruptura seja 1.500 Kg no
mínimo. Qual sua conclusão, ao nível de 2% de significância?.
1.508
1.507
1.518
1.510
1.492
1.505
1.505
1.496
1.515
1.498
Resolução:
Propriedade a ser utilizada: Teste de Hipótese para médias. Como 𝑛 <
30 e a variância populacional (𝜎 2 ) é desconhecida, utilizaremos o
teste t student bilateral. As hipóteses a serem formuladas são:
𝐻0 : 𝜇1 = 1500
𝐻0 : 𝜇1 ≠ 1500
G.L (Graus de Liberdade)=n-1=10-1=9
Como se trata de um teste bilateral, devemos dividir 𝛼 𝑝𝑜𝑟 2
𝛼
2
=
0,02
2
= 0,01
O próximo passo será calcular a média da amostra através do processo tradicional
para médias:
X=
1508+1518+1492+1505+1515+1507+1510+1505+1496+1498
10
= 1505,4
Em seguida, devemos calcular o desvio padrão amostral, que é
calculado através da fórmula:
∑ 𝑥𝑖 ² − 𝑛( X )²
𝑠=√
𝑛−1
∑ 𝑥𝑖 ² = (1508)2 + (1518)2 + (1492)2 + (1505)2 + (1515)2 + (1507)2
+ (1510)2 + (1505)2 + (1496)2 + (1498)2 = 22662896
𝑛 = 10, X ² = (1505,4)2 = 2266229
22662896 − 10 ∗ (1505,4)²
𝑠=√
= 8,195
10 − 1
Pela tabela do t-student, descobrimos tcrítico= -2,821 e 2,821
Para a Hipótese nula ser aceita, tcalculado deve estar no intervalo
entre –tcrítico e +tcrítico
𝑡𝑐𝑎𝑙𝑐 =
1505,4 − 1500
= 2,08
8,195
√10
Como −2,821 ≤ 2,08 ≤ 2,821, aceita-se 𝐻0 a 2% de significância.
15.- A cronometragem de certa operação industrial forneceu os seguintes valores para
diversas determinações, dados em segundos:
113
117
124
118
115
113
107
125
120
119
126
118
114
114
110
122
116
117
Podemos concluir que o tempo médio necessário para realizar essa operação não deve
exceder a 2 min, ao nível de 5% de significação?.
Resolução:
Propriedade a ser utilizada: Teste de Hipótese para médias. Como 𝑛 <
30 e a variância populacional (𝜎 2 ) é desconhecida também neste
exercício, utilizaremos o teste t student bilateral. As hipóteses a
serem formuladas são:
𝐻0 : 𝜇1 = 2
𝐻1 : 𝜇1 ≠ 2
=
X =113+124+115+107+120+126+114+110+116+117+118+113+125+119+118+114+122+117
18
117,11
Convertendo a média para minutos,
∑ 𝑥𝑖 ² − 𝑛( X )²
𝑠=√
= 5,07
𝑛−1
G.L=n-1=18-1=17
𝛼 0,05
=
= 0,025
2
2
-tcrítico= -2,110 , +tcrítico=2,110
𝑡𝑐𝑎𝑙𝑐 =
1,95 − 2
= −0,042
5,07
√18
−2,110 ≤ −0,042 ≤ 2,110
Aceita-se 𝐻0 a 5% de significância.
X =1,95 minutos
16.- A distribuição de freqüências que segue representa uma amostra retirada de uma
população aproximadamente normal. Ao nível de 5% de significância, há evidencia de que
o desvio-padrão dessa população seja diferente de 15?.
Intervalos
68 |-- 75
75 |-- 82
82 |-- 89
89 |-- 96
96 |-- 103
103 |-- 110
110 |-- 117
117 |-- 124
Freqüências
3
6
11
15
18
10
5
4
Propriedade a ser utilizada: Teste de Hipótese para variâncias e
desvio padrão bilaterais. Para este teste, utiliza-se a distribuição
qui-quadrado:
𝑥²𝑐𝑎𝑙𝑐 =
(𝑛 − 1) ∗ 𝑆²
𝜎²0
Hipótese a ser formulada:
𝐻0 : 𝜎 = 15
𝐻0 : 𝜎 ≠ 15
Se (𝑥²𝑖𝑛𝑓 ≤ 𝑥²𝑐𝑎𝑙𝑐 ≤ 𝑥²𝑠𝑢𝑝 ), 𝑎𝑐𝑒𝑖𝑡𝑎 − 𝑠𝑒 𝐻0
Como se tratam de dados tabelados, o cálculo da média e da
variância amostral (S²) é feito de forma diferente ao apresentado
nos demais exercícios. A média será igual a:
X=
∑ 𝑥𝑖 𝑓 𝑖
𝑛
Neste caso, n é a soma das frequências:
n=3+6+11+15+18+10+5+4=72
Para o cálculo da média, será necessário calcular os valores de
para depois multiplicarmos por cada uma das frequências,
somarmos o produto entre eles e por fim, dividirmos por n.
𝑥𝑖
∑ 𝑥𝑖 = 𝑠𝑜𝑚𝑎 𝑑𝑎 𝑚é𝑑𝑖𝑎 𝑑𝑜𝑠 𝑖𝑛𝑡𝑒𝑟𝑣𝑎𝑙𝑜𝑠
68 + 75 75 + 82 82 + 89 89 + 96 96 + 103 103 + 110
+
+
+
+
+
2
2
2
2
2
2
110 + 117 117 + 124
+
+
= 768
2
2
=
∑ 𝑥𝑖 𝑓𝑖 =
X=
6919
72
68 + 75
75 + 82
82 + 89
89 + 96
96 + 103
∗3+
∗6+
∗ 11 +
∗ 15 +
∗ 18
2
2
2
2
2
103 + 110
110 + 117
117 + 124
+
∗ 10 +
∗5+
∗ 4 = 6919
2
2
2
≅ 96
Agora devemos calcular o desvio padrão amostral (S). A fórmula para
o cálculo do desvio padrão amostral para dados agrupados é a
seguinte:
∑ 𝑥𝑖 ²𝑓𝑖 − 𝑛( X )²
𝑆=√
𝑛−1
68 + 75 2
75 + 82 2
82 + 89 2
89 + 96 2
96 + 103 2
∑ 𝑥𝑖 ² = (
) +(
) +(
) +(
) +(
)
2
2
2
2
2
103 + 110 2
110 + 117 2
117 + 124 2
+(
) +(
) +(
) = 75786
2
2
2
68 + 75 2
75 + 82 2
82 + 89 2
89 + 96 2
∑ 𝑥𝑖 ²𝑓𝑖 = (
) ∗3+(
) ∗6+(
) ∗ 11 + (
) ∗ 15
2
2
2
2
96 + 103 2
103 + 110 2
110 + 117 2
+(
) ∗ 18 + (
) ∗ 10 + (
) ∗5
2
2
2
117 + 124 2
+(
) ∗ 4 =𝟔𝟕𝟓𝟏𝟖𝟔
2
n=72,
X ² =(96)²=9216
675186 − 72 ∗ (96)²
𝑆=√
= 12,8
72 − 1
Agora já temos todos os dados para calcularmos o valor de 𝑥²𝑐𝑎𝑙𝑐 :
𝑥²𝑐𝑎𝑙𝑐 =
(𝑛 − 1) ∗ 𝑆²
𝜎²0
𝑥²𝑐𝑎𝑙𝑐 =
(72 − 1) ∗ (12,8)²
= 51,7
(15)2
Agora devemos encontrar os valores de 𝑥²𝑖𝑛𝑓 e 𝑥²𝑠𝑢𝑝 na tabela do qui
quadrado.
Para 𝑥²𝑖𝑛𝑓 com 71 Graus de Liberdade (n-1=72-1=71) e 1 − 𝛼 = 1 − 0,95
Não temos o valor 71 (Grau de Liberdade) na tabela. Quando isso
acontecer, devemos utilizar o grau de liberdade mais próximo (no
caso específico deste exercício, 60).
Portanto, 𝑥²𝑖𝑛𝑓 = 43,1880
Para 𝑥²𝑠𝑢𝑝 com 71 Graus de Liberdade (n-1=72-1=71) e 𝛼 = 0,05
Não temos o valor 71 (Grau de Liberdade) na tabela. Quando isso
acontecer, devemos utilizar o grau de liberdade mais próximo (no
caso específico deste exercício, 60).
Portanto, 𝑥²𝑆𝑈𝑃 = 79,0819
Como 𝑥²𝐼𝑁𝐹 ≤ 𝑥²𝐶𝑎𝑙𝑐 ≤ 𝑥²𝑆𝑈𝑃 , Aceita-se a Hipótese de que o desvio padrão
não é diferente de 15 a 5% de significância.
17.- Uma máquina foi regulada para fabricar placas de 5 mm de espessura, em média, com
coeficiente de variação de, no máximo, 3%. A distribuição das espessuras é normal.
Iniciada a produção, foi colhida uma amostra de tamanho 10, que forneceu as seguintes
medidas de espessuras, em milímetros:
5,1
4,8
5,0
4,7
4,8
5,0
4,5
4,9
4,8
5,2
Ao nível do 1%, pode-se concluir que a hipóteses de que a regulagem da máquina é
satisfatória?.
Propriedade a ser utilizada: Teste de Hipótese para médias. Como 𝑛 <
30 e a variância populacional (𝜎 2 ) é desconhecida, utilizaremos o
teste t student bilateral. As hipóteses a serem formuladas são:
𝐻𝑂 : 𝜇 = 5
𝐻1 : 𝜇 ≠ 5
X=
5,1+4,8+5+4,7+4,8+5+4,5+4,9+4,8+5,2
10
= 4,88
Desvio padrão amostral (S):
∑ 𝑥𝑖 ² − 𝑛( X )²
𝑆=√
𝑛−1
∑ 𝑥𝑖 ² = (5,1)2 + 4,8)² + (5)2 + (4,7)2 + (4,8)2 + (5)2 + (4,5)2 + (4,9)2 + (4,8)2
+ (5,2)2 = 238,52
238,52 − 10 ∗ (4,88)²
𝑆=√
≅ 0,2044
10 − 1
𝑡𝑐𝑎𝑙𝑐 =
4,88 − 5
≅ −1,86
0,2044
√10
Pela tabela do t-Student com 9 Graus de Liberdade e 0,005 de probabilidade, encontramos
−𝑡𝑐𝑟í𝑡𝑖𝑐𝑜 = −3,250 e +𝑡𝑐𝑟í𝑡𝑖𝑐𝑜= 3,250
Como −3,250 ≤ −1,86 ≤ 3,250 Aceita-se a Hipótese a 1% de significância.
18.- Em indivíduos normais, o consumo renal médio de oxigênio tem distribuição normal com
média 12 cm3/min e desvio-padrão 1,3 cm3/min. Um pesquisador coleta uma amostra do
consumo renal de oxigênio de 10 indivíduos, obtém uma média amostral de 12,5 cm 3/min
e um desvio amostral de 1,8 cm3/min, o pesquisador poderia afirmar que o consumo renal
médio de oxigênio é significativamente maior que 12 cm3/min. Use um nível de 5% de
significância.
Esta é uma situação diferente e requer muito cuidado
porque o enunciado pede um teste unilateral à direita (Num
teste unilateral, a hipótese alternativa (H1) diz que o parâmetro
é maior (unilateral à direita) ou menor (unilateral à esquerda) do
que o valor estipulado na hipótese nula)
. O que significa que não devemos dividir alfa por 2. Como a variância
populacional é conhecida (𝜎²), devemos utilizar a distribuição Z.
Ou seja, ele quer comparar com apenas um dos lados da região. Para
encontrar o valor crítico de Z (1,64), devemos proceder da seguinte
forma:
1 − 𝛼 = 1 − 0,05 = 0,95
Hipótese a ser formulada:
𝐻0 = 𝜇 ≤ 12
𝐻0 = 𝜇 > 12
𝑍𝑐𝑎𝑙𝑐 =
12,5 − 12
= 1,22
1,3
√10
𝑍𝑐𝑟í𝑡𝑖𝑐𝑜 = 1,64
Como 𝑍𝑐𝑟í𝑡𝑖𝑐𝑜 ≥ 𝑍𝑐𝑎𝑙𝑐 , Aceita-se a hipótese nula a 5% de significância
19.- Um produtor deseja obter peso especifico médio de 0,8 Kg/dm3 para certo material
necessário à sua linha de produção. Admitindo o produtor a possibilidade de uma partida
estar acima da especificação, quer saber se poderá, ao nível de 5% de significância,
devolver a partida ao fornecedor. Para tanto, colheu uma amostra de doze porções do
material, a qual forneceu média de 0,81 Kg/dm3 e desvio padrão de 0,02 Kg/dm3. O
fornecedor indica como sendo de 0,01 Kg/dm3 o desvio padrão do peso específico do
produto. Poderia concluir que se deve devolver a partida ao fornecedor?.
É a mesma situação do exercício anterior. Variância conhecida e
teste de hipótese unilateral à direita.
20.- Num estudo sobre o metabolismo de citrato no fígado foram tomadas foram tomadas
amostras da veia hepática de dez indivíduos normais e amostras de sangue arterial de
outros dez indivíduos normais, obtendo-se as seguintes determinações de citrato em cada
amostra (em mg/ml):
Sangue da
veia
Hepática
20,2
24,6
18,3
19
29,5
12,6
18,2
30,8
22,2
25,4
Sangue
Arterial
26,4
32,2
37,8
25
28,4
26,2
31,3
35
29,7
27,4
Realize um teste de hipótese a fim de verificar se existe uma diferencia significativa no
sentido de um maior conteúdo médio de citrato no sangue arterial em relação ao sangue
da veia hepática. Use =0,01.
Propriedade a ser utilizada: Teste de Hipótese para igualdade das
médias. Como a variância populacional (𝜎 2 ) é desconhecida,
utilizaremos o teste t student, a priori. Mas segundo a propriedade
da igualdade das médias para o teste t student, as variâncias
devem ser desconhecidas e iguais. Portanto, para comprovar que
as variâncias não diferem entre si, deveremos utilizar outra
propriedade: O teste de significância para igualdade de Variâncias.
Primeiramente, calculamos as médias através do método
tradicional para a população A (Sangue da veia hepática) e B
(Sangue da veia arterial) e a variância amostral de ambas as
populações foi calculada pelo seguinte método:
𝑆=(
∑ 𝑥𝑖 ² − 𝑛( X )²
)
𝑛−1
X A  22,08
X B  29,94
S A ²  31,13
S B ²  17,14
A distribuição F deve ser usada neste tipo de situação.
Hipóteses:
𝐻0 : 𝜎²1 = 𝜎²2
𝐻0 : 𝜎²1 ≠ 𝜎²2
𝐹𝑐𝑎𝑙𝑐 =
𝑆1 ² 31,13
=
= 1,816
𝑆2 ² 17,14
𝛼 = 0,01
0,01
= 0,05
2
Para calcular 𝐹𝑆𝑈𝑃 : Devemos considerar o grau de liberdade (𝑛1 − 1) e a
𝛼
probabilidade .
2
G.L=𝑛1 − 1=10-1=9
0,05 de probabilidade
Para calcular 𝐹𝐼𝑁𝐹 : Devemos considerar o grau de liberdade (𝑛2 − 1) e a
𝛼
probabilidade .
2
G.L= 𝑛2 − 1 = 10 − 1 = 9
0,05 de probabilidade
Se 𝐹𝐼𝑁𝐹 ≤ 𝐹𝐶𝐴𝐿𝐶 ≤ 𝐹𝑆𝑈𝑃 , Aceita-se a hipótese de que a variâncias sejam
iguais.
Como encontrar 𝐹𝑆𝑈𝑃 na tabela:
Como encontrar 𝐹𝐼𝑁𝐹 na tabela (Tomem cuidado, pois os Graus de
Liberdade são iguais. Nem sempre encontrarão esta situação) :
𝐹𝑆𝑈𝑃 = 6,54
𝐹𝐼𝑁𝐹 =
1
= 0,1529
6,54
Como 𝐹𝐼𝑁𝐹 ≤ 𝐹𝐶𝐴𝐿𝐶 ≤ 𝐹𝑆𝑈𝑃 , Aceita-se a hipótese nula a 1% de
significância.
Agora devemos passar para a segunda etapa da resolução. Uma vez
que as variâncias são desconhecidas e iguais, devemos utilizar a
propriedade t-student para igualdade das médias. A hipótese a ser
formulada é a seguinte:
𝐻0 : 𝜇1 = 𝜇2
𝐻1 : 𝜇1 < 𝜇2
𝑂𝑏𝑠: 𝑇𝑟𝑎𝑡𝑎 − 𝑠𝑒 𝑑𝑒 𝑢𝑚 𝑡𝑒𝑠𝑡𝑒 𝑢𝑛𝑖𝑙𝑎𝑡𝑒𝑟𝑎𝑙 à 𝑒𝑠𝑞𝑢𝑒𝑟𝑑𝑎, 𝑛ã𝑜 𝑠𝑒 𝑑𝑖𝑣𝑖𝑑𝑒 𝑎𝑙𝑓𝑎 𝑝𝑜𝑟 2.
𝑡𝑐𝑎𝑙𝑐 =
X1 − X 2
𝑛 +𝑛
𝑆𝐶 √ 𝑛1 ∗ 𝑛 2
1
2
(𝑛1 − 1) ∗ 𝑆1 ² + (𝑛2 − 1) ∗ 𝑆2 ²
𝑆𝐶 = √
𝑛1 + 𝑛2 − 2
(10 − 1) ∗ 31,13 + (10 − 1) ∗ 17,14
𝑆𝐶 = √
= 4,9
10 + 10 − 2
𝑡𝑐𝑎𝑙𝑐 =
22,08 − 29,94
10 + 10
4,9 ∗ √
10 ∗ 10
= −3,26
𝐺𝑟𝑎𝑢𝑠 𝑑𝑒 𝐿𝑖𝑏𝑒𝑟𝑑𝑎𝑑𝑒: 𝑛1 + 𝑛2 − 2
com 0,01 de probabilidade.
𝐺𝑟𝑎𝑢𝑠 𝑑𝑒 𝐿𝑖𝑏𝑒𝑟𝑎𝑑𝑒 = 10 + 10 − 2 = 18
Como encontrar o valor − 𝑡𝑐𝑟í𝑡𝑖𝑐𝑜 na tabela:
Como 𝑡𝐶𝑎𝑙𝑐 < 𝑡𝑐𝑟í𝑡𝑖𝑐𝑜
Rejeita-se a hipótese nula a 1% de significância.
21.- Em uma experiência industrial, foi executado um trabalho por 10 operários, de acordo
com o método I, e por 20 operários, de acordo com o método II. Os resultados que são o
tempo necessário para a execução do trabalho (em min)se apresentam a continuação:
Média
Variância
Método I
53
6
Método II
57
15
a) Teste se os dois métodos devem ser considerados como tendo a mesma variabilidade
do tempo.
Propriedade a ser utilizada no exercício: Teste de hipótese para
igualdade das variâncias (Teste F)
b) Diga se os dados permitem afirmar que o método I fornece um tempo médio menor
que o método II. (Use =0,05).
Propriedade a ser utilizada no exercício: Teste de hipótese para
igualdade das médias. Como a variância é conhecida, usem a
distribuição Z. Trata-se de um teste unilateral à esquerda,
portanto, não dividam alfa por 2.
22.- A qualidade de rebites é tanto melhor quanto maiores sua resistência média e sua
homogeneidade. Seis rebites de duas marcas foram ensaiados ao cisalhamento, tendo-se
obtido as seguintes cargas de ruptura:
Rebite nº
Marca A
Marca B
1
34,9
38,5
2
35,5
39
3
38,8
40,7
4
39,2
42,9
5
33,7
37,8
6
37,6
41,4
Esses resultados ratificam a afirmação, do produtor da Marca B, de que seus rebites são
melhores quanto a pelo menos um aspecto?. Use =0,05.
Teste
para
igualdade
das
médias.
Como
a
variância
é
desconhecida, utilizem a distribuição t student. Mas não se
esqueçam de antes usar o teste F para comprovar que as
variâncias são iguais. É um teste de hipótese unilateral à direita.
23.- Com o intuito de controlar a homogeneidade da produção de certas partes no tempo,
amostras semanais são retiradas da produção concorrente. Uma primeira amostra de dez
elementos forneceu uma média de 284,55 e desvio padrão de 0,320, ao passo que uma
segunda amostra forneceu nas mesmas unidades os seguintes valores:
284,6
283,9
234,8
285,2
284,3
283,7
284,0
Ao nível de 5% de significância, podemos concluir que a homogeneidade da produção
tenha variado no decorrer das duas semanas pesquisadas?.
Propriedade a ser utilizada no exercício: Teste de hipótese para
igualdade das variâncias (Teste F)
24.- A fim de comparar duas marcas de cimento, A e B, fizemos experiência com quatro corpos
de prova da marca A e 5 corpos de prova da marca B, obtendo-se as seguintes resistências
à ruptura:
Marca A
Marca B
184
189
190
188
185
183
186
186
184
Verifique se as resistências médias das duas marcas diferem entre si. Use =0,05.
Propriedade a ser utilizada no exercício: Teste de hipótese para
médias populacionais. Como a variância é desconhecida e n<30,
usa-se a distribuição t student.
Análise de Regressão Linear Simples e Correlação Linear
1. Elabore um gráfico com os seguintes dados:
(1,1)
(4,1)
(5,3)
(3,2)
(3,4)
(4,2)
(1,4)
(3,3)
Qual é a linha de regressão estimada, obtenha o coeficiente de correlação e de determinação.
Resolução: A linha de regressão ou equação de regressão tem o
seguinte formato.
𝑌 = 𝛽0 + 𝛽1 𝑥𝑖
Os parâmetros 𝛽0 𝑒 𝛽1 são calculados pelas fórmulas:
𝛽1 =
𝛽0 =
∑ 𝑥𝑖 𝑦𝑖 − 𝑛 X
Y
∑ 𝑥𝑖 ² − 𝑛 X ²
Y
− 𝛽1
X
𝑥
𝑦
1
4
5
3
3
4
1
3
𝑥𝑦
1
1
3
2
4
2
4
3
∑ 𝑥𝑖 = 24
X
=3
Y
= 2,5
𝛽1 =
𝛽0 =
∑ 𝑦𝑖 = 20
∑ 𝑥𝑖 𝑦𝑖 − 𝑛 X
Y
∑ 𝑥𝑖2 − 𝑛 X ²
Y
− 𝛽1
1
4
15
6
12
8
4
9
X
𝑌 = 2,71 − 0,07𝑥𝑖
= 𝛽1 =
1
16
25
9
9
16
1
9
∑ 𝑥𝑖 𝑦𝑖 = 59
𝑥𝑖 ²
∑ 𝑥𝑖 ² = 86
𝑦𝑖 ²
1
1
9
4
16
4
16
9
∑ 𝑦𝑖 ² = 60
59 − 8 ∗ (3) ∗ (2,5)
= −0,07
86 − 8 ∗ (3)2
= (2,5) − (0,07) ∗ 3 = 2,71
(Equação de Regressão)
Coeficiente de determinação (r²)
𝑟² =
𝛽0 ∑ 𝑦 + 𝛽1 ∑ 𝑥𝑦 − 𝑛 Y ²
=
∑ 𝑦² − 𝑛 Y ²
2,71 ∗ 20 + (−0,07) ∗ 59 − 8 ∗ (2,5)²
= 0,007
60 − 8 ∗ (2,5)²
Coeficiente de correlação:
𝑟 = √𝑟² = √0,007 = 0,084
Mas o coeficiente de correlação tem (por regra) o mesmo sinal de
𝛽1 (−0,07) na equação de regressão, então é negativo.
𝑟 = −0,084
Outro método de cálculo do coeficiente de correlação:
𝑟=
𝑛 ∑ 𝑥𝑦 − ∑ 𝑥 ∑ 𝑦
√𝑛 ∑ 𝑥² − (∑ 𝑥)² √𝑛 ∑ 𝑦² − (∑ 𝑦)²
=
8 ∗ 59 − 24 ∗ 20
√8 ∗ 86 − (24)2 √8 ∗ 60 − (20)²
= −0,084
4.5
4
3.5
y = 2,71-0,07x
3
2.5
Series1
2
Linear (Series1)
1.5
1
0.5
0
0
1
2
3
4
5
6
2. Para cinco volumes de uma solução, foram medidos os tempos de aquecimento em um
mesmo bico de gás e as respectivas temperaturas de ebulição:
Tempo(min)
Temperatura(ºC)
20
75
22
80
19
75
23
82
17
78
Faça um gráfico identifique a linha de regressão estimada, estabeleça o teste da existência
dos parâmetros.
A variável dependente corresponde à temperatura, pois o tempo de
aquecimento é determinante para o nível de temperatura no bico
do gás. Sendo assim Y= temperatura e X= tempo de aquecimento.
𝑥
𝑦
20
22
19
23
17
75
80
75
82
78
∑ 𝑦𝑖 =390
∑ 𝑥𝑖 = 101
𝛽1 =
∑ 𝑥𝑖 𝑦𝑖 − 𝑛 X
𝛽0 =
∑ 𝑥𝑖2 − 𝑛
Y
− 𝛽1
𝑥𝑦
Y
X²
X
= 𝛽1 =
1500
1760
1425
1886
1326
∑ 𝑥𝑖 𝑦𝑖 =7897
𝑥𝑖 ²
400
484
361
529
289
∑ 𝑥𝑖 ² =2063
𝑦𝑖 ²
5625
6400
5625
6724
6084
∑ 𝑦𝑖 ² = 30458
7897 − 5 ∗ (20,2) ∗ (78)
= 0,83
2063 − 5 ∗ (20,2)²
= 78 − 0,83 ∗ 20,2 = 61,23
𝑌 = 61,23 + 0,83𝑥 (Equação de Regressão)
100
90
y = 61,23+30,83x
Temperatura (y)
80
70
60
50
Series1
40
Linear (Series1)
30
20
10
0
0
5
10
15
20
25
Tempo de Aquecimento (x)
O primeiro teste de hipótese envolve a existência ou não do
coeficiente angular. Para isso, teremos que usar a Anova, cuja
tabela está expressa abaixo.
F.V.
G.L.
S.Q.
Q.M.
Fcalculado
1
SQReg
QMReg=SQReg
F=QMReg/QMErro
Erro
5-2=3
SQErro
QMErro=SQErro/(n-2)
Total
5-1=4
SQTotal
Regressão
Os Graus de Liberdade (G.L) para este caso específico dependerão
da
quantidade
de
variáveis
independentes
na
equação
de
regressão.
𝑆𝑄𝑅𝑒𝑔
𝑛
𝑛
𝑖=1
𝑖=1
(∑𝑛𝑖=1 𝑌𝑖 𝑋𝑖 − 𝑛𝑌̅𝑋̅)2
=
= 𝛽̂1 (∑ 𝑌𝑖 𝑋𝑖 − 𝑛𝑌̅𝑋̅ ) = 𝛽̂12 (∑ 𝑋𝑖2 − 𝑛𝑋̅ 2 )
∑𝑛𝑖=1 𝑋𝑖2 − 𝑛𝑋̅ 2
𝑛
𝑆𝑄𝑇𝑜𝑡𝑎𝑙 = ∑ 𝑌𝑖2 − 𝑛𝑌̅ 2
𝑖=1
𝑆𝑄𝐸𝑟𝑟𝑜 = 𝑆𝑄𝑇𝑜𝑡𝑎𝑙 − 𝑆𝑄𝑅𝑒𝑔
O teste de hipótese que comprovará ou não a existência do parâmetro 𝛽1 é o seguinte:
𝐻0 : 1 = 0 (Não existe relação linear entre Y e X)
𝐻1 : 1  0 (Existe relação linear entre Y e X)
Calculando os valores da tabela Anova:
𝑆𝑄𝑅𝑒𝑔 =
(∑𝑛𝑖=1 𝑌𝑖 𝑋𝑖 − 𝑛𝑌̅𝑋̅)2 (7897 − 5 ∗ 101 ∗ 390)²
=
≅ −730273
∑𝑛𝑖=1 𝑋𝑖2 − 𝑛𝑋̅ 2
2063 − 5 ∗ (101)²
𝑛
𝑆𝑄𝑇𝑜𝑡𝑎𝑙 = ∑ 𝑌𝑖2 − 𝑛𝑌̅ 2 = 30458 − 5 ∗ (390)2 = −730042
𝑖=1
𝑆𝑄𝐸𝑟𝑟𝑜 = −730042 + 730273 = 231
F.V.
G.L.
S.Q.
Q.M.
Fcalculado
1
-730273
QMReg=-730273
F=-730273/77=-9484
Erro
n-2
231
QMErro=231/(5-2)=77
Total
n-1
-730042
Regressão
Como há apenas uma variável independente (x) na equação, o Grau de
Liberdade do numerador é =1. E o Grau de Liberdade do numerador
é=n-2=5-2=3 para 𝛼 =0,01 (Obs: Há um equívoco no enunciado, pois
não informa o nível alfa). Neste caso, não se divide alfa por 2.
Como
𝐹𝑡𝑎𝑏𝑢𝑙𝑎𝑑𝑜 > 𝐹𝑐𝑎𝑙𝑐𝑢𝑙𝑎𝑑𝑜, 𝑎𝑐𝑒𝑖𝑡𝑎 −
𝑠𝑒 𝑎 𝐻𝑖𝑝ó𝑡𝑒𝑠𝑒 𝑛𝑢𝑙𝑎. 𝑂𝑢 𝑠𝑒𝑗𝑎, 𝑛ã𝑜 ℎá 𝑟𝑒𝑙𝑎çã𝑜 𝑙𝑖𝑛𝑒𝑎𝑟 𝑒𝑛𝑡𝑟𝑒
𝑎𝑠 𝑣𝑎𝑟𝑖á𝑣𝑒𝑖𝑠 𝑋 𝑒 𝑌.
4. Ajuste uma reta de mínimos quadrados aos dados abaixo, adotando:
a) X como variável independente;
O procedimento é o mesmo dos anteriores.
𝑥
𝑦
9
9
7
4
5
3
1
2
4
5
6
7
10
12
∑ 𝑦𝑖 =46
∑ 𝑥𝑖 = 38
𝛽1 =
∑ 𝑥𝑖 𝑦𝑖 − 𝑛 X
∑ 𝑥𝑖2 − 𝑛
𝛽0 =
Y
𝑥𝑦
Y
X²
− 𝛽1
X
18
36
35
24
35
30
12
∑ 𝑥𝑖 𝑦𝑖 =190
= 𝛽1 =
𝑥𝑖 ²
𝑦𝑖 ²
81
81
49
16
25
9
∑ 𝑥𝑖 ² = 262
∑ 𝑦𝑖 ² = 374
190 − 7 ∗ (5,43) ∗ (6,57)
= −1,07
262 − 7 ∗ (5,43)²
= 6,57 - (-)1,07*5,43=12,38
̂ 𝒊 = 12,38 − 1,07𝑥
𝒀
c) Y como variável independente.
𝛽1 =
∑ 𝑥𝑖 𝑦𝑖 − 𝑛 X
Y
∑ 𝑦𝑖2 − 𝑛² Y ²
= 𝛽1 =
190 − 7 ∗ (5,43) ∗ (6,57)
= −0,83
374 − 7 ∗ (6,57)²
4
16
25
36
49
100
144
X
𝛽0 =
− 𝛽1 Y = 5,43 - (-)0,83*6,57=10,9
̂ 𝒊 = 12,38 − 1,07𝑦
𝑿
Verifique se as duas equações obtidas correspondem à mesma função implícita.
Y
X
2
9
4
9
5
7
6
4
7
5
10
3
12
1
5. A velocidade máxima de automóveis Formula 1 com motores de mesma potencia é função,
entre outras variáveis, do peso do veículo, no intervalo entre 700 e 800 Kgs. Assim,
verificou-se qual a velocidade máxima atingida em uma reta de 1.200 m. Os resultados
foram:
Peso (Kgs)
Velocidade
Máxima (Km/h)
750
760
770
780
790
280
284
291
295
301
a) Identifique a variável Independente (X) e a variável dependente (Y).
A variável dependente corresponde à velocidade máxima,
visto que os índices da mesma dependem do Peso. Desta
forma, a variável independente é o peso.
b) Faz um gráfico desta relação.
305
y = 0.53x - 117.9
R² = 0.9933
300
295
Series1
290
Linear (Series1)
285
280
275
740
750
760
770
780
790
800
Obs: Calculei a equação de regressão pelo mesmo método
apresentado nos exercícios anteriores.
c) Qual é o modelo para esta relação, o modelo é bom porque?.
É um modelo matemático, de regressão linear, que deve
ser estimado pelo método dos mínimos quadrados. É bom
porque permite identificar a relação entre as variáveis X e
Y se o modelo for significativo. Em termos econômicos é
de suma relevância, pois estima de maneira exata a
variação na quantidade demandada de um produto, por
exemplo, quando o seu preço aumenta ou diminui.
d) Qual a velocidade esperada para um veículo de 730 Kgs.?
̂ 𝒊 = 0,53 ∗ (730) − 117,9 = 269 𝑘𝑚/ℎ
𝒀
e) Qual a velocidade esperada para um veículo de 730 Kgs.?
7. As vendas de duas firmas A e B estão relacionadas a seguir, em milhares de unidades.
Ano
Vendas A
Vendas B
1970
1
4,5
1971
1,5
5
1972
3
5,5
1973
3,5
5,5
1974
4,5
6
1975
5
6
a) Identifique a variável Independente (X) e a variável dependente (Y).
Tanto para a firma A como para a firma B, a variável
independente (X) será o ano codificado, enquanto que a
variável dependente (Y) será a venda.
b) Faz um gráfico desta relação.
Gráfico de A:
6
y = 0.8429x + 0.9762
R² = 0.9783
5
4
Series1
3
Linear (Series1)
2
1
0
0
1
2
3
4
5
6
Gráfico de B:
7
y = 0.3x + 4.6667
R² = 0.922
6
5
4
Series1
3
Linear (Series1)
2
1
0
0
1
2
3
4
5
6
c) Qual é o modelo para esta relação, o modelo é bom porque?.
Sim, pois além de explicar a relação entre as variáveis
dependentes e independentes (caso seja significativo),
permite estabelecer uma projeção para as vendas no ano
seguinte.
d) Quais serão as vendas das duas firmas no ano de 1976?.
Em relação a A:
Ano
1970
1971
1972
1973
1974
1975
Ano Codificado (X)
0
1
2
3
4
5
Vendas (Y)
1
1,5
3
3,5
4,5
5
Uma vez que identificamos as variáveis X e Y no problema, estima-se normalmente,
como nos outros exercícios, a regressão. A equação de regressão da firma A
corresponde a:
̂ 𝒊 = 0,9762 + 0,8429𝑥
𝒀
As vendas da firma A em 1976 serão de:
̂ 𝒊 = 0,9762 + 0,8429 ∗ (6) = 6,0336
𝒀
Em relação a B:
Ano
1970
1971
1972
1973
1974
1975
Ano Codificado (X)
0
1
2
3
4
5
Equação de Regressão da Firma B:
̂ 𝒊 = 𝟒, 𝟔𝟕 + 𝟎, 𝟑𝒙
𝒀
As vendas da firma B em 1976 serão de:
̂ 𝒊 = 𝟒, 𝟔𝟕 + 𝟎, 𝟑𝒙 = 𝟒, 𝟔𝟕 + 𝟎, 𝟑 ∗ (𝟔) = 𝟔, 𝟒𝟕
𝒀
Vendas (Y)
4,5
5
5,5
5,5
6
6
Download