Exercícios Testes de Hipótese 14.- Os dados abaixo representam a resistência de dez pedaços de um cabo de aço, ensaiados por tração até a ruptura. Com base nos resultados obtidos, pretende-se saber se esse cabo obedece à especificação, a qual exige que sua carga média de ruptura seja 1.500 Kg no mínimo. Qual sua conclusão, ao nível de 2% de significância?. 1.508 1.507 1.518 1.510 1.492 1.505 1.505 1.496 1.515 1.498 Resolução: Propriedade a ser utilizada: Teste de Hipótese para médias. Como 𝑛 < 30 e a variância populacional (𝜎 2 ) é desconhecida, utilizaremos o teste t student bilateral. As hipóteses a serem formuladas são: 𝐻0 : 𝜇1 = 1500 𝐻0 : 𝜇1 ≠ 1500 G.L (Graus de Liberdade)=n-1=10-1=9 Como se trata de um teste bilateral, devemos dividir 𝛼 𝑝𝑜𝑟 2 𝛼 2 = 0,02 2 = 0,01 O próximo passo será calcular a média da amostra através do processo tradicional para médias: X= 1508+1518+1492+1505+1515+1507+1510+1505+1496+1498 10 = 1505,4 Em seguida, devemos calcular o desvio padrão amostral, que é calculado através da fórmula: ∑ 𝑥𝑖 ² − 𝑛( X )² 𝑠=√ 𝑛−1 ∑ 𝑥𝑖 ² = (1508)2 + (1518)2 + (1492)2 + (1505)2 + (1515)2 + (1507)2 + (1510)2 + (1505)2 + (1496)2 + (1498)2 = 22662896 𝑛 = 10, X ² = (1505,4)2 = 2266229 22662896 − 10 ∗ (1505,4)² 𝑠=√ = 8,195 10 − 1 Pela tabela do t-student, descobrimos tcrítico= -2,821 e 2,821 Para a Hipótese nula ser aceita, tcalculado deve estar no intervalo entre –tcrítico e +tcrítico 𝑡𝑐𝑎𝑙𝑐 = 1505,4 − 1500 = 2,08 8,195 √10 Como −2,821 ≤ 2,08 ≤ 2,821, aceita-se 𝐻0 a 2% de significância. 15.- A cronometragem de certa operação industrial forneceu os seguintes valores para diversas determinações, dados em segundos: 113 117 124 118 115 113 107 125 120 119 126 118 114 114 110 122 116 117 Podemos concluir que o tempo médio necessário para realizar essa operação não deve exceder a 2 min, ao nível de 5% de significação?. Resolução: Propriedade a ser utilizada: Teste de Hipótese para médias. Como 𝑛 < 30 e a variância populacional (𝜎 2 ) é desconhecida também neste exercício, utilizaremos o teste t student bilateral. As hipóteses a serem formuladas são: 𝐻0 : 𝜇1 = 2 𝐻1 : 𝜇1 ≠ 2 = X =113+124+115+107+120+126+114+110+116+117+118+113+125+119+118+114+122+117 18 117,11 Convertendo a média para minutos, ∑ 𝑥𝑖 ² − 𝑛( X )² 𝑠=√ = 5,07 𝑛−1 G.L=n-1=18-1=17 𝛼 0,05 = = 0,025 2 2 -tcrítico= -2,110 , +tcrítico=2,110 𝑡𝑐𝑎𝑙𝑐 = 1,95 − 2 = −0,042 5,07 √18 −2,110 ≤ −0,042 ≤ 2,110 Aceita-se 𝐻0 a 5% de significância. X =1,95 minutos 16.- A distribuição de freqüências que segue representa uma amostra retirada de uma população aproximadamente normal. Ao nível de 5% de significância, há evidencia de que o desvio-padrão dessa população seja diferente de 15?. Intervalos 68 |-- 75 75 |-- 82 82 |-- 89 89 |-- 96 96 |-- 103 103 |-- 110 110 |-- 117 117 |-- 124 Freqüências 3 6 11 15 18 10 5 4 Propriedade a ser utilizada: Teste de Hipótese para variâncias e desvio padrão bilaterais. Para este teste, utiliza-se a distribuição qui-quadrado: 𝑥²𝑐𝑎𝑙𝑐 = (𝑛 − 1) ∗ 𝑆² 𝜎²0 Hipótese a ser formulada: 𝐻0 : 𝜎 = 15 𝐻0 : 𝜎 ≠ 15 Se (𝑥²𝑖𝑛𝑓 ≤ 𝑥²𝑐𝑎𝑙𝑐 ≤ 𝑥²𝑠𝑢𝑝 ), 𝑎𝑐𝑒𝑖𝑡𝑎 − 𝑠𝑒 𝐻0 Como se tratam de dados tabelados, o cálculo da média e da variância amostral (S²) é feito de forma diferente ao apresentado nos demais exercícios. A média será igual a: X= ∑ 𝑥𝑖 𝑓 𝑖 𝑛 Neste caso, n é a soma das frequências: n=3+6+11+15+18+10+5+4=72 Para o cálculo da média, será necessário calcular os valores de para depois multiplicarmos por cada uma das frequências, somarmos o produto entre eles e por fim, dividirmos por n. 𝑥𝑖 ∑ 𝑥𝑖 = 𝑠𝑜𝑚𝑎 𝑑𝑎 𝑚é𝑑𝑖𝑎 𝑑𝑜𝑠 𝑖𝑛𝑡𝑒𝑟𝑣𝑎𝑙𝑜𝑠 68 + 75 75 + 82 82 + 89 89 + 96 96 + 103 103 + 110 + + + + + 2 2 2 2 2 2 110 + 117 117 + 124 + + = 768 2 2 = ∑ 𝑥𝑖 𝑓𝑖 = X= 6919 72 68 + 75 75 + 82 82 + 89 89 + 96 96 + 103 ∗3+ ∗6+ ∗ 11 + ∗ 15 + ∗ 18 2 2 2 2 2 103 + 110 110 + 117 117 + 124 + ∗ 10 + ∗5+ ∗ 4 = 6919 2 2 2 ≅ 96 Agora devemos calcular o desvio padrão amostral (S). A fórmula para o cálculo do desvio padrão amostral para dados agrupados é a seguinte: ∑ 𝑥𝑖 ²𝑓𝑖 − 𝑛( X )² 𝑆=√ 𝑛−1 68 + 75 2 75 + 82 2 82 + 89 2 89 + 96 2 96 + 103 2 ∑ 𝑥𝑖 ² = ( ) +( ) +( ) +( ) +( ) 2 2 2 2 2 103 + 110 2 110 + 117 2 117 + 124 2 +( ) +( ) +( ) = 75786 2 2 2 68 + 75 2 75 + 82 2 82 + 89 2 89 + 96 2 ∑ 𝑥𝑖 ²𝑓𝑖 = ( ) ∗3+( ) ∗6+( ) ∗ 11 + ( ) ∗ 15 2 2 2 2 96 + 103 2 103 + 110 2 110 + 117 2 +( ) ∗ 18 + ( ) ∗ 10 + ( ) ∗5 2 2 2 117 + 124 2 +( ) ∗ 4 =𝟔𝟕𝟓𝟏𝟖𝟔 2 n=72, X ² =(96)²=9216 675186 − 72 ∗ (96)² 𝑆=√ = 12,8 72 − 1 Agora já temos todos os dados para calcularmos o valor de 𝑥²𝑐𝑎𝑙𝑐 : 𝑥²𝑐𝑎𝑙𝑐 = (𝑛 − 1) ∗ 𝑆² 𝜎²0 𝑥²𝑐𝑎𝑙𝑐 = (72 − 1) ∗ (12,8)² = 51,7 (15)2 Agora devemos encontrar os valores de 𝑥²𝑖𝑛𝑓 e 𝑥²𝑠𝑢𝑝 na tabela do qui quadrado. Para 𝑥²𝑖𝑛𝑓 com 71 Graus de Liberdade (n-1=72-1=71) e 1 − 𝛼 = 1 − 0,95 Não temos o valor 71 (Grau de Liberdade) na tabela. Quando isso acontecer, devemos utilizar o grau de liberdade mais próximo (no caso específico deste exercício, 60). Portanto, 𝑥²𝑖𝑛𝑓 = 43,1880 Para 𝑥²𝑠𝑢𝑝 com 71 Graus de Liberdade (n-1=72-1=71) e 𝛼 = 0,05 Não temos o valor 71 (Grau de Liberdade) na tabela. Quando isso acontecer, devemos utilizar o grau de liberdade mais próximo (no caso específico deste exercício, 60). Portanto, 𝑥²𝑆𝑈𝑃 = 79,0819 Como 𝑥²𝐼𝑁𝐹 ≤ 𝑥²𝐶𝑎𝑙𝑐 ≤ 𝑥²𝑆𝑈𝑃 , Aceita-se a Hipótese de que o desvio padrão não é diferente de 15 a 5% de significância. 17.- Uma máquina foi regulada para fabricar placas de 5 mm de espessura, em média, com coeficiente de variação de, no máximo, 3%. A distribuição das espessuras é normal. Iniciada a produção, foi colhida uma amostra de tamanho 10, que forneceu as seguintes medidas de espessuras, em milímetros: 5,1 4,8 5,0 4,7 4,8 5,0 4,5 4,9 4,8 5,2 Ao nível do 1%, pode-se concluir que a hipóteses de que a regulagem da máquina é satisfatória?. Propriedade a ser utilizada: Teste de Hipótese para médias. Como 𝑛 < 30 e a variância populacional (𝜎 2 ) é desconhecida, utilizaremos o teste t student bilateral. As hipóteses a serem formuladas são: 𝐻𝑂 : 𝜇 = 5 𝐻1 : 𝜇 ≠ 5 X= 5,1+4,8+5+4,7+4,8+5+4,5+4,9+4,8+5,2 10 = 4,88 Desvio padrão amostral (S): ∑ 𝑥𝑖 ² − 𝑛( X )² 𝑆=√ 𝑛−1 ∑ 𝑥𝑖 ² = (5,1)2 + 4,8)² + (5)2 + (4,7)2 + (4,8)2 + (5)2 + (4,5)2 + (4,9)2 + (4,8)2 + (5,2)2 = 238,52 238,52 − 10 ∗ (4,88)² 𝑆=√ ≅ 0,2044 10 − 1 𝑡𝑐𝑎𝑙𝑐 = 4,88 − 5 ≅ −1,86 0,2044 √10 Pela tabela do t-Student com 9 Graus de Liberdade e 0,005 de probabilidade, encontramos −𝑡𝑐𝑟í𝑡𝑖𝑐𝑜 = −3,250 e +𝑡𝑐𝑟í𝑡𝑖𝑐𝑜= 3,250 Como −3,250 ≤ −1,86 ≤ 3,250 Aceita-se a Hipótese a 1% de significância. 18.- Em indivíduos normais, o consumo renal médio de oxigênio tem distribuição normal com média 12 cm3/min e desvio-padrão 1,3 cm3/min. Um pesquisador coleta uma amostra do consumo renal de oxigênio de 10 indivíduos, obtém uma média amostral de 12,5 cm 3/min e um desvio amostral de 1,8 cm3/min, o pesquisador poderia afirmar que o consumo renal médio de oxigênio é significativamente maior que 12 cm3/min. Use um nível de 5% de significância. Esta é uma situação diferente e requer muito cuidado porque o enunciado pede um teste unilateral à direita (Num teste unilateral, a hipótese alternativa (H1) diz que o parâmetro é maior (unilateral à direita) ou menor (unilateral à esquerda) do que o valor estipulado na hipótese nula) . O que significa que não devemos dividir alfa por 2. Como a variância populacional é conhecida (𝜎²), devemos utilizar a distribuição Z. Ou seja, ele quer comparar com apenas um dos lados da região. Para encontrar o valor crítico de Z (1,64), devemos proceder da seguinte forma: 1 − 𝛼 = 1 − 0,05 = 0,95 Hipótese a ser formulada: 𝐻0 = 𝜇 ≤ 12 𝐻0 = 𝜇 > 12 𝑍𝑐𝑎𝑙𝑐 = 12,5 − 12 = 1,22 1,3 √10 𝑍𝑐𝑟í𝑡𝑖𝑐𝑜 = 1,64 Como 𝑍𝑐𝑟í𝑡𝑖𝑐𝑜 ≥ 𝑍𝑐𝑎𝑙𝑐 , Aceita-se a hipótese nula a 5% de significância 19.- Um produtor deseja obter peso especifico médio de 0,8 Kg/dm3 para certo material necessário à sua linha de produção. Admitindo o produtor a possibilidade de uma partida estar acima da especificação, quer saber se poderá, ao nível de 5% de significância, devolver a partida ao fornecedor. Para tanto, colheu uma amostra de doze porções do material, a qual forneceu média de 0,81 Kg/dm3 e desvio padrão de 0,02 Kg/dm3. O fornecedor indica como sendo de 0,01 Kg/dm3 o desvio padrão do peso específico do produto. Poderia concluir que se deve devolver a partida ao fornecedor?. É a mesma situação do exercício anterior. Variância conhecida e teste de hipótese unilateral à direita. 20.- Num estudo sobre o metabolismo de citrato no fígado foram tomadas foram tomadas amostras da veia hepática de dez indivíduos normais e amostras de sangue arterial de outros dez indivíduos normais, obtendo-se as seguintes determinações de citrato em cada amostra (em mg/ml): Sangue da veia Hepática 20,2 24,6 18,3 19 29,5 12,6 18,2 30,8 22,2 25,4 Sangue Arterial 26,4 32,2 37,8 25 28,4 26,2 31,3 35 29,7 27,4 Realize um teste de hipótese a fim de verificar se existe uma diferencia significativa no sentido de um maior conteúdo médio de citrato no sangue arterial em relação ao sangue da veia hepática. Use =0,01. Propriedade a ser utilizada: Teste de Hipótese para igualdade das médias. Como a variância populacional (𝜎 2 ) é desconhecida, utilizaremos o teste t student, a priori. Mas segundo a propriedade da igualdade das médias para o teste t student, as variâncias devem ser desconhecidas e iguais. Portanto, para comprovar que as variâncias não diferem entre si, deveremos utilizar outra propriedade: O teste de significância para igualdade de Variâncias. Primeiramente, calculamos as médias através do método tradicional para a população A (Sangue da veia hepática) e B (Sangue da veia arterial) e a variância amostral de ambas as populações foi calculada pelo seguinte método: 𝑆=( ∑ 𝑥𝑖 ² − 𝑛( X )² ) 𝑛−1 X A 22,08 X B 29,94 S A ² 31,13 S B ² 17,14 A distribuição F deve ser usada neste tipo de situação. Hipóteses: 𝐻0 : 𝜎²1 = 𝜎²2 𝐻0 : 𝜎²1 ≠ 𝜎²2 𝐹𝑐𝑎𝑙𝑐 = 𝑆1 ² 31,13 = = 1,816 𝑆2 ² 17,14 𝛼 = 0,01 0,01 = 0,05 2 Para calcular 𝐹𝑆𝑈𝑃 : Devemos considerar o grau de liberdade (𝑛1 − 1) e a 𝛼 probabilidade . 2 G.L=𝑛1 − 1=10-1=9 0,05 de probabilidade Para calcular 𝐹𝐼𝑁𝐹 : Devemos considerar o grau de liberdade (𝑛2 − 1) e a 𝛼 probabilidade . 2 G.L= 𝑛2 − 1 = 10 − 1 = 9 0,05 de probabilidade Se 𝐹𝐼𝑁𝐹 ≤ 𝐹𝐶𝐴𝐿𝐶 ≤ 𝐹𝑆𝑈𝑃 , Aceita-se a hipótese de que a variâncias sejam iguais. Como encontrar 𝐹𝑆𝑈𝑃 na tabela: Como encontrar 𝐹𝐼𝑁𝐹 na tabela (Tomem cuidado, pois os Graus de Liberdade são iguais. Nem sempre encontrarão esta situação) : 𝐹𝑆𝑈𝑃 = 6,54 𝐹𝐼𝑁𝐹 = 1 = 0,1529 6,54 Como 𝐹𝐼𝑁𝐹 ≤ 𝐹𝐶𝐴𝐿𝐶 ≤ 𝐹𝑆𝑈𝑃 , Aceita-se a hipótese nula a 1% de significância. Agora devemos passar para a segunda etapa da resolução. Uma vez que as variâncias são desconhecidas e iguais, devemos utilizar a propriedade t-student para igualdade das médias. A hipótese a ser formulada é a seguinte: 𝐻0 : 𝜇1 = 𝜇2 𝐻1 : 𝜇1 < 𝜇2 𝑂𝑏𝑠: 𝑇𝑟𝑎𝑡𝑎 − 𝑠𝑒 𝑑𝑒 𝑢𝑚 𝑡𝑒𝑠𝑡𝑒 𝑢𝑛𝑖𝑙𝑎𝑡𝑒𝑟𝑎𝑙 à 𝑒𝑠𝑞𝑢𝑒𝑟𝑑𝑎, 𝑛ã𝑜 𝑠𝑒 𝑑𝑖𝑣𝑖𝑑𝑒 𝑎𝑙𝑓𝑎 𝑝𝑜𝑟 2. 𝑡𝑐𝑎𝑙𝑐 = X1 − X 2 𝑛 +𝑛 𝑆𝐶 √ 𝑛1 ∗ 𝑛 2 1 2 (𝑛1 − 1) ∗ 𝑆1 ² + (𝑛2 − 1) ∗ 𝑆2 ² 𝑆𝐶 = √ 𝑛1 + 𝑛2 − 2 (10 − 1) ∗ 31,13 + (10 − 1) ∗ 17,14 𝑆𝐶 = √ = 4,9 10 + 10 − 2 𝑡𝑐𝑎𝑙𝑐 = 22,08 − 29,94 10 + 10 4,9 ∗ √ 10 ∗ 10 = −3,26 𝐺𝑟𝑎𝑢𝑠 𝑑𝑒 𝐿𝑖𝑏𝑒𝑟𝑑𝑎𝑑𝑒: 𝑛1 + 𝑛2 − 2 com 0,01 de probabilidade. 𝐺𝑟𝑎𝑢𝑠 𝑑𝑒 𝐿𝑖𝑏𝑒𝑟𝑎𝑑𝑒 = 10 + 10 − 2 = 18 Como encontrar o valor − 𝑡𝑐𝑟í𝑡𝑖𝑐𝑜 na tabela: Como 𝑡𝐶𝑎𝑙𝑐 < 𝑡𝑐𝑟í𝑡𝑖𝑐𝑜 Rejeita-se a hipótese nula a 1% de significância. 21.- Em uma experiência industrial, foi executado um trabalho por 10 operários, de acordo com o método I, e por 20 operários, de acordo com o método II. Os resultados que são o tempo necessário para a execução do trabalho (em min)se apresentam a continuação: Média Variância Método I 53 6 Método II 57 15 a) Teste se os dois métodos devem ser considerados como tendo a mesma variabilidade do tempo. Propriedade a ser utilizada no exercício: Teste de hipótese para igualdade das variâncias (Teste F) b) Diga se os dados permitem afirmar que o método I fornece um tempo médio menor que o método II. (Use =0,05). Propriedade a ser utilizada no exercício: Teste de hipótese para igualdade das médias. Como a variância é conhecida, usem a distribuição Z. Trata-se de um teste unilateral à esquerda, portanto, não dividam alfa por 2. 22.- A qualidade de rebites é tanto melhor quanto maiores sua resistência média e sua homogeneidade. Seis rebites de duas marcas foram ensaiados ao cisalhamento, tendo-se obtido as seguintes cargas de ruptura: Rebite nº Marca A Marca B 1 34,9 38,5 2 35,5 39 3 38,8 40,7 4 39,2 42,9 5 33,7 37,8 6 37,6 41,4 Esses resultados ratificam a afirmação, do produtor da Marca B, de que seus rebites são melhores quanto a pelo menos um aspecto?. Use =0,05. Teste para igualdade das médias. Como a variância é desconhecida, utilizem a distribuição t student. Mas não se esqueçam de antes usar o teste F para comprovar que as variâncias são iguais. É um teste de hipótese unilateral à direita. 23.- Com o intuito de controlar a homogeneidade da produção de certas partes no tempo, amostras semanais são retiradas da produção concorrente. Uma primeira amostra de dez elementos forneceu uma média de 284,55 e desvio padrão de 0,320, ao passo que uma segunda amostra forneceu nas mesmas unidades os seguintes valores: 284,6 283,9 234,8 285,2 284,3 283,7 284,0 Ao nível de 5% de significância, podemos concluir que a homogeneidade da produção tenha variado no decorrer das duas semanas pesquisadas?. Propriedade a ser utilizada no exercício: Teste de hipótese para igualdade das variâncias (Teste F) 24.- A fim de comparar duas marcas de cimento, A e B, fizemos experiência com quatro corpos de prova da marca A e 5 corpos de prova da marca B, obtendo-se as seguintes resistências à ruptura: Marca A Marca B 184 189 190 188 185 183 186 186 184 Verifique se as resistências médias das duas marcas diferem entre si. Use =0,05. Propriedade a ser utilizada no exercício: Teste de hipótese para médias populacionais. Como a variância é desconhecida e n<30, usa-se a distribuição t student. Análise de Regressão Linear Simples e Correlação Linear 1. Elabore um gráfico com os seguintes dados: (1,1) (4,1) (5,3) (3,2) (3,4) (4,2) (1,4) (3,3) Qual é a linha de regressão estimada, obtenha o coeficiente de correlação e de determinação. Resolução: A linha de regressão ou equação de regressão tem o seguinte formato. 𝑌 = 𝛽0 + 𝛽1 𝑥𝑖 Os parâmetros 𝛽0 𝑒 𝛽1 são calculados pelas fórmulas: 𝛽1 = 𝛽0 = ∑ 𝑥𝑖 𝑦𝑖 − 𝑛 X Y ∑ 𝑥𝑖 ² − 𝑛 X ² Y − 𝛽1 X 𝑥 𝑦 1 4 5 3 3 4 1 3 𝑥𝑦 1 1 3 2 4 2 4 3 ∑ 𝑥𝑖 = 24 X =3 Y = 2,5 𝛽1 = 𝛽0 = ∑ 𝑦𝑖 = 20 ∑ 𝑥𝑖 𝑦𝑖 − 𝑛 X Y ∑ 𝑥𝑖2 − 𝑛 X ² Y − 𝛽1 1 4 15 6 12 8 4 9 X 𝑌 = 2,71 − 0,07𝑥𝑖 = 𝛽1 = 1 16 25 9 9 16 1 9 ∑ 𝑥𝑖 𝑦𝑖 = 59 𝑥𝑖 ² ∑ 𝑥𝑖 ² = 86 𝑦𝑖 ² 1 1 9 4 16 4 16 9 ∑ 𝑦𝑖 ² = 60 59 − 8 ∗ (3) ∗ (2,5) = −0,07 86 − 8 ∗ (3)2 = (2,5) − (0,07) ∗ 3 = 2,71 (Equação de Regressão) Coeficiente de determinação (r²) 𝑟² = 𝛽0 ∑ 𝑦 + 𝛽1 ∑ 𝑥𝑦 − 𝑛 Y ² = ∑ 𝑦² − 𝑛 Y ² 2,71 ∗ 20 + (−0,07) ∗ 59 − 8 ∗ (2,5)² = 0,007 60 − 8 ∗ (2,5)² Coeficiente de correlação: 𝑟 = √𝑟² = √0,007 = 0,084 Mas o coeficiente de correlação tem (por regra) o mesmo sinal de 𝛽1 (−0,07) na equação de regressão, então é negativo. 𝑟 = −0,084 Outro método de cálculo do coeficiente de correlação: 𝑟= 𝑛 ∑ 𝑥𝑦 − ∑ 𝑥 ∑ 𝑦 √𝑛 ∑ 𝑥² − (∑ 𝑥)² √𝑛 ∑ 𝑦² − (∑ 𝑦)² = 8 ∗ 59 − 24 ∗ 20 √8 ∗ 86 − (24)2 √8 ∗ 60 − (20)² = −0,084 4.5 4 3.5 y = 2,71-0,07x 3 2.5 Series1 2 Linear (Series1) 1.5 1 0.5 0 0 1 2 3 4 5 6 2. Para cinco volumes de uma solução, foram medidos os tempos de aquecimento em um mesmo bico de gás e as respectivas temperaturas de ebulição: Tempo(min) Temperatura(ºC) 20 75 22 80 19 75 23 82 17 78 Faça um gráfico identifique a linha de regressão estimada, estabeleça o teste da existência dos parâmetros. A variável dependente corresponde à temperatura, pois o tempo de aquecimento é determinante para o nível de temperatura no bico do gás. Sendo assim Y= temperatura e X= tempo de aquecimento. 𝑥 𝑦 20 22 19 23 17 75 80 75 82 78 ∑ 𝑦𝑖 =390 ∑ 𝑥𝑖 = 101 𝛽1 = ∑ 𝑥𝑖 𝑦𝑖 − 𝑛 X 𝛽0 = ∑ 𝑥𝑖2 − 𝑛 Y − 𝛽1 𝑥𝑦 Y X² X = 𝛽1 = 1500 1760 1425 1886 1326 ∑ 𝑥𝑖 𝑦𝑖 =7897 𝑥𝑖 ² 400 484 361 529 289 ∑ 𝑥𝑖 ² =2063 𝑦𝑖 ² 5625 6400 5625 6724 6084 ∑ 𝑦𝑖 ² = 30458 7897 − 5 ∗ (20,2) ∗ (78) = 0,83 2063 − 5 ∗ (20,2)² = 78 − 0,83 ∗ 20,2 = 61,23 𝑌 = 61,23 + 0,83𝑥 (Equação de Regressão) 100 90 y = 61,23+30,83x Temperatura (y) 80 70 60 50 Series1 40 Linear (Series1) 30 20 10 0 0 5 10 15 20 25 Tempo de Aquecimento (x) O primeiro teste de hipótese envolve a existência ou não do coeficiente angular. Para isso, teremos que usar a Anova, cuja tabela está expressa abaixo. F.V. G.L. S.Q. Q.M. Fcalculado 1 SQReg QMReg=SQReg F=QMReg/QMErro Erro 5-2=3 SQErro QMErro=SQErro/(n-2) Total 5-1=4 SQTotal Regressão Os Graus de Liberdade (G.L) para este caso específico dependerão da quantidade de variáveis independentes na equação de regressão. 𝑆𝑄𝑅𝑒𝑔 𝑛 𝑛 𝑖=1 𝑖=1 (∑𝑛𝑖=1 𝑌𝑖 𝑋𝑖 − 𝑛𝑌̅𝑋̅)2 = = 𝛽̂1 (∑ 𝑌𝑖 𝑋𝑖 − 𝑛𝑌̅𝑋̅ ) = 𝛽̂12 (∑ 𝑋𝑖2 − 𝑛𝑋̅ 2 ) ∑𝑛𝑖=1 𝑋𝑖2 − 𝑛𝑋̅ 2 𝑛 𝑆𝑄𝑇𝑜𝑡𝑎𝑙 = ∑ 𝑌𝑖2 − 𝑛𝑌̅ 2 𝑖=1 𝑆𝑄𝐸𝑟𝑟𝑜 = 𝑆𝑄𝑇𝑜𝑡𝑎𝑙 − 𝑆𝑄𝑅𝑒𝑔 O teste de hipótese que comprovará ou não a existência do parâmetro 𝛽1 é o seguinte: 𝐻0 : 1 = 0 (Não existe relação linear entre Y e X) 𝐻1 : 1 0 (Existe relação linear entre Y e X) Calculando os valores da tabela Anova: 𝑆𝑄𝑅𝑒𝑔 = (∑𝑛𝑖=1 𝑌𝑖 𝑋𝑖 − 𝑛𝑌̅𝑋̅)2 (7897 − 5 ∗ 101 ∗ 390)² = ≅ −730273 ∑𝑛𝑖=1 𝑋𝑖2 − 𝑛𝑋̅ 2 2063 − 5 ∗ (101)² 𝑛 𝑆𝑄𝑇𝑜𝑡𝑎𝑙 = ∑ 𝑌𝑖2 − 𝑛𝑌̅ 2 = 30458 − 5 ∗ (390)2 = −730042 𝑖=1 𝑆𝑄𝐸𝑟𝑟𝑜 = −730042 + 730273 = 231 F.V. G.L. S.Q. Q.M. Fcalculado 1 -730273 QMReg=-730273 F=-730273/77=-9484 Erro n-2 231 QMErro=231/(5-2)=77 Total n-1 -730042 Regressão Como há apenas uma variável independente (x) na equação, o Grau de Liberdade do numerador é =1. E o Grau de Liberdade do numerador é=n-2=5-2=3 para 𝛼 =0,01 (Obs: Há um equívoco no enunciado, pois não informa o nível alfa). Neste caso, não se divide alfa por 2. Como 𝐹𝑡𝑎𝑏𝑢𝑙𝑎𝑑𝑜 > 𝐹𝑐𝑎𝑙𝑐𝑢𝑙𝑎𝑑𝑜, 𝑎𝑐𝑒𝑖𝑡𝑎 − 𝑠𝑒 𝑎 𝐻𝑖𝑝ó𝑡𝑒𝑠𝑒 𝑛𝑢𝑙𝑎. 𝑂𝑢 𝑠𝑒𝑗𝑎, 𝑛ã𝑜 ℎá 𝑟𝑒𝑙𝑎çã𝑜 𝑙𝑖𝑛𝑒𝑎𝑟 𝑒𝑛𝑡𝑟𝑒 𝑎𝑠 𝑣𝑎𝑟𝑖á𝑣𝑒𝑖𝑠 𝑋 𝑒 𝑌. 4. Ajuste uma reta de mínimos quadrados aos dados abaixo, adotando: a) X como variável independente; O procedimento é o mesmo dos anteriores. 𝑥 𝑦 9 9 7 4 5 3 1 2 4 5 6 7 10 12 ∑ 𝑦𝑖 =46 ∑ 𝑥𝑖 = 38 𝛽1 = ∑ 𝑥𝑖 𝑦𝑖 − 𝑛 X ∑ 𝑥𝑖2 − 𝑛 𝛽0 = Y 𝑥𝑦 Y X² − 𝛽1 X 18 36 35 24 35 30 12 ∑ 𝑥𝑖 𝑦𝑖 =190 = 𝛽1 = 𝑥𝑖 ² 𝑦𝑖 ² 81 81 49 16 25 9 ∑ 𝑥𝑖 ² = 262 ∑ 𝑦𝑖 ² = 374 190 − 7 ∗ (5,43) ∗ (6,57) = −1,07 262 − 7 ∗ (5,43)² = 6,57 - (-)1,07*5,43=12,38 ̂ 𝒊 = 12,38 − 1,07𝑥 𝒀 c) Y como variável independente. 𝛽1 = ∑ 𝑥𝑖 𝑦𝑖 − 𝑛 X Y ∑ 𝑦𝑖2 − 𝑛² Y ² = 𝛽1 = 190 − 7 ∗ (5,43) ∗ (6,57) = −0,83 374 − 7 ∗ (6,57)² 4 16 25 36 49 100 144 X 𝛽0 = − 𝛽1 Y = 5,43 - (-)0,83*6,57=10,9 ̂ 𝒊 = 12,38 − 1,07𝑦 𝑿 Verifique se as duas equações obtidas correspondem à mesma função implícita. Y X 2 9 4 9 5 7 6 4 7 5 10 3 12 1 5. A velocidade máxima de automóveis Formula 1 com motores de mesma potencia é função, entre outras variáveis, do peso do veículo, no intervalo entre 700 e 800 Kgs. Assim, verificou-se qual a velocidade máxima atingida em uma reta de 1.200 m. Os resultados foram: Peso (Kgs) Velocidade Máxima (Km/h) 750 760 770 780 790 280 284 291 295 301 a) Identifique a variável Independente (X) e a variável dependente (Y). A variável dependente corresponde à velocidade máxima, visto que os índices da mesma dependem do Peso. Desta forma, a variável independente é o peso. b) Faz um gráfico desta relação. 305 y = 0.53x - 117.9 R² = 0.9933 300 295 Series1 290 Linear (Series1) 285 280 275 740 750 760 770 780 790 800 Obs: Calculei a equação de regressão pelo mesmo método apresentado nos exercícios anteriores. c) Qual é o modelo para esta relação, o modelo é bom porque?. É um modelo matemático, de regressão linear, que deve ser estimado pelo método dos mínimos quadrados. É bom porque permite identificar a relação entre as variáveis X e Y se o modelo for significativo. Em termos econômicos é de suma relevância, pois estima de maneira exata a variação na quantidade demandada de um produto, por exemplo, quando o seu preço aumenta ou diminui. d) Qual a velocidade esperada para um veículo de 730 Kgs.? ̂ 𝒊 = 0,53 ∗ (730) − 117,9 = 269 𝑘𝑚/ℎ 𝒀 e) Qual a velocidade esperada para um veículo de 730 Kgs.? 7. As vendas de duas firmas A e B estão relacionadas a seguir, em milhares de unidades. Ano Vendas A Vendas B 1970 1 4,5 1971 1,5 5 1972 3 5,5 1973 3,5 5,5 1974 4,5 6 1975 5 6 a) Identifique a variável Independente (X) e a variável dependente (Y). Tanto para a firma A como para a firma B, a variável independente (X) será o ano codificado, enquanto que a variável dependente (Y) será a venda. b) Faz um gráfico desta relação. Gráfico de A: 6 y = 0.8429x + 0.9762 R² = 0.9783 5 4 Series1 3 Linear (Series1) 2 1 0 0 1 2 3 4 5 6 Gráfico de B: 7 y = 0.3x + 4.6667 R² = 0.922 6 5 4 Series1 3 Linear (Series1) 2 1 0 0 1 2 3 4 5 6 c) Qual é o modelo para esta relação, o modelo é bom porque?. Sim, pois além de explicar a relação entre as variáveis dependentes e independentes (caso seja significativo), permite estabelecer uma projeção para as vendas no ano seguinte. d) Quais serão as vendas das duas firmas no ano de 1976?. Em relação a A: Ano 1970 1971 1972 1973 1974 1975 Ano Codificado (X) 0 1 2 3 4 5 Vendas (Y) 1 1,5 3 3,5 4,5 5 Uma vez que identificamos as variáveis X e Y no problema, estima-se normalmente, como nos outros exercícios, a regressão. A equação de regressão da firma A corresponde a: ̂ 𝒊 = 0,9762 + 0,8429𝑥 𝒀 As vendas da firma A em 1976 serão de: ̂ 𝒊 = 0,9762 + 0,8429 ∗ (6) = 6,0336 𝒀 Em relação a B: Ano 1970 1971 1972 1973 1974 1975 Ano Codificado (X) 0 1 2 3 4 5 Equação de Regressão da Firma B: ̂ 𝒊 = 𝟒, 𝟔𝟕 + 𝟎, 𝟑𝒙 𝒀 As vendas da firma B em 1976 serão de: ̂ 𝒊 = 𝟒, 𝟔𝟕 + 𝟎, 𝟑𝒙 = 𝟒, 𝟔𝟕 + 𝟎, 𝟑 ∗ (𝟔) = 𝟔, 𝟒𝟕 𝒀 Vendas (Y) 4,5 5 5,5 5,5 6 6