Estatística II – Antonio Roque – Aula 10 Exemplos de Testes de Hipóteses para Médias Populacionais Vamos considerar exemplos de testes de hipóteses para a média de uma população para os dois casos mais importantes na prática: • O tamanho da amostra selecionada é grande (maior do que 30); • O tamanho da amostra selecionada é pequeno (menor do que 30), mas a distribuição populacional é aproximadamente normal. 1. A cervejaria BebeBier vende cervejas em embalagens cujos rótulos indicam um conteúdo de 600 ml. O Instituto Nacional de Pesos e Medidas (INPM) seleciona aleatoriamente 50 garrafas de cerveja produzidas pela companhia, mede seu conteúdo e obtém uma média amostral igual a 596,25 ml com desvio padrão de 14,06 ml. Com um nível de significância de 0,01, teste a hipótese de que a cervejaria esta enganando seus consumidores. O que o INPM quer testar é se a quantidade média de cerveja nas garrafas é diferente de 600 ml. Portanto, vai se adotar como hipótese nula a hipótese de que a quantidade média de cerveja por garrafa é igual a 600 ml. A hipótese alternativa é que a quantidade média de cerveja por garrafa é diferente de 600 ml: H0: µ = 600 ml H1: µ ≠ 600 ml. Portanto, o teste a ser feito é do tipo bilateral. Como a amostra escolhida é grande (n > 30), o Teorema Central do Limite nos diz que a distribuição amostral das médias é aproximadamente normal. 1 Estatística II – Antonio Roque – Aula 10 Como o desvio padrão da população σ é desconhecido, podemos estimá-lo pelo desvio padrão da amostra. Desta forma, a distribuição amostral dos volumes médios de cerveja por garrafa será normal com, µ x = 600 ml; σx = s n = 14,06 50 = 1,99. A variável normal reduzida associada a x = 596,25 é: z = (596,25 – 600)/1,99 = −1,88. Utilizando a tabela da distribuição normal padrão, obtemos que a área sob a curva à direita de −z vale 0,5 – 0,4699 = 0,03. Portanto P = 2x0,03 = 0,06. Como o valor P é maior que 0,01, não se pode rejeitar a hipótese nula. Devese concluir que não há base suficiente para se mover um inquérito contra a cervejaria. O que se deve fazer num caso assim é repetir o estudo com uma nova amostra maior. 2 Estatística II – Antonio Roque – Aula 10 2. Um nutricionista faz propaganda na televisão afirmando: “você perderá peso em uma semana seguindo a minha dieta”. O PROCON faz um teste sobre esta afirmação selecionando 33 pessoas que se submeteram à dieta do nutricionista. Após uma semana de dieta essas pessoas perderam, em média, 510 g com um desvio padrão de 984 g. Com um nível de significância de 0,05, o PROCON pode dizer que a afirmação do anuncio é enganosa? A afirmação do anuncio diz que o peso médio das pessoas que fazem a dieta diminui após uma semana. Representando a média da perda de peso da amostra por µ, a afirmação do nutricionista corresponde a dizer que µ > 0. Vamos adotar como hipótese nula a afirmação contrária, ou seja, que a média da perda de peso é nula ou negativa (note que um valor negativo para a perda de peso corresponde, de fato, a um ganho de peso): H0: µ ≤ 0 g; H1: µ > 0 g. Portanto, temos que fazer um teste unilateral. Como o tamanho da amostra é grande (maior do que 30), a distribuição amostral da perda de peso será aproximadamente normal. Não conhecemos o desvio padrão da população de perdas de peso, mas podemos usar o desvio padrão da amostra, s, para estimá-lo. Temos então que a distribuição amostral da perda de peso é normal com parâmetros: µ x = 0 g; 3 Estatística II – Antonio Roque – Aula 10 σx = s n = 984 33 = 171,29 g. A variável normal reduzida associada a x = 510 g é: z = (510 – 0)/171,29 = 2,98. Utilizando a tabela da distribuição normal padrão, obtemos que a área sob a curva à direita de z vale 0,5 – 0,4986 = 0,0014. Portanto P = 0,014. Como o valor P é menor que 0,05, rejeita-se a hipótese nula. As evidencias experimentais não permitem dizer que o nutricionista está fazendo propaganda enganosa. 3. Pesquisadores coletaram valores de amilase no soro de uma amostra aleatória de 15 pessoas aparentemente saudáveis. Os pesquisadores desejam saber, com um nível de significância de α = 0,05, se é possível concluir que o valor médio de amilase no soro da população de pessoas saudáveis é diferente de 120 unidades/ml. O valor médio para a amostra foi de x = 96 unidades/ml e o seu desvio padrão foi de s = 35 unidades/ml. 4 Estatística II – Antonio Roque – Aula 10 Como a hipótese que se quer verificar é que µ ≠ 120, a hipótese nula a ser adotada é que µ = 120: H0: µ = 120 unidades/ml; H1: µ ≠ 120 unidades/ml. O teste a ser feito é bilateral. Neste caso, o tamanho da amostra é pequeno (menor do que 30), mas é razoável supor que a distribuição dos valores de amilase entre a população é normal. Portanto, pode-se usar a distribuição t de Student com o desvio padrão populacional σ sendo estimado pelo desvio padrão amostral s. Com os dados fornecidos, obtemos o seguinte valor para t: t= x − µ 96 − 120 − 2,4 = = = −2,65. s 35 9,04 n 15 Consultando a tabela da distribuição t de Student para gl = n – 1 = 14, vemos que na linha para gl = 14 não existe um valor de t igual a –2,65 ou +2,65. Porém, existem valores maiores e menores do que 2,65, de maneira que se pode calcular um intervalo dentro do qual o valor P deve estar. O valor 2,65 é maior que 2,5096, que está na tabela (na linha de gl = 14) e é o valor de t para o qual a área pintada abaixo da distribuição t (o valor P) é igual a 0,025. O valor 2,65 é menor que 2,9768, que está na tabela (na linha de gl = 14) e é o valor de t para o qual o valor P é igual a 0,01. Portanto, o valor P para t = 2,65 deve estar entre 0,025 e 0,01 (veja a figura a seguir). 0,01 < P < 0,025. 5 Estatística II – Antonio Roque – Aula 10 O valor P é menor do que 0,05. Logo, deve-se rejeitar a hipótese nula com um nível de significância de 0,05. Sendo assim, a conclusão dos pesquisadores deve ser a de que o valor médio de amilase no soro da população de pessoas saudáveis não é igual a 120 unidades/ml. 4. Um fabricante de pisos afirma que uma lajota de um certo tipo de piso produzido por ele pode agüentar um peso superior a 800 kg sem trincar. Uma agência de controle de qualidade seleciona uma amostra de 7 lajotas produzidas pela fábrica e determina que o peso médio suportado pela amostra sem trincar é de 1225,2 kg com desvio padrão de 425,8 kg. Esse estudo experimental permite concluir, com um nível de significância de 0,05, que a afirmação do fabricante de pisos esta correta? A afirmação da fábrica de pisos corresponde a dizer que o peso médio suportado por uma lajota é maior que 800 kg. Portanto, a afirmação contrária será utilizada como hipótese nula: 6 Estatística II – Antonio Roque – Aula 10 H0: µ ≤ 800 kg; H1: µ > 800 kg. Portanto, o teste a ser feito é do tipo unilateral. Neste caso, o tamanho da amostra é pequeno (n = 7). Porém, é razoável supor que a distribuição dos pesos suportados pelas lajotas é normal. Neste caso, podemos usar a distribuição t de Student com o desvio padrão populacional sendo estimado pelo desvio padrão amostral. Temos então que: t= x − µ 1225,2 − 800 = = 2,64. s 425,8 n 7 Consultando a tabela da distribuição t de Student para gl = 7 – 1 = 6, vemos que não existe o valor 2,64. Existem apenas os números 2,4469, correspondendo a um valor de P = 0,05, e 2,9687, correspondendo a um valor de P = 0,025. Note que os valores de P dados pela tabela são para um teste bilateral (eles são dados pela soma das áreas à esquerda e à direita de – t e t, respectivamente). Como no nosso caso estamos interessados em um teste unilateral, devemos dividir esses valores de P por 2 para obter a área apenas à direita de t. Portanto, temos que: 2,4469 < t < 2,9687 ⇒ 0,0125 < P < 0,025, ou seja, o valor P para o nosso caso é menor que 0,05. Isto implica que a hipótese nula deve ser rejeitada. Deve-se concluir que as evidências experimentais indicam que as lajotas podem suportar mais que 800 kg. 7 Estatística II – Antonio Roque – Aula 10 5. Em um estudo sobre as condições de saúde de uma certa comunidade, entrevistou-se 150 pessoas. Uma das perguntas dizia respeito à quantidade de remédios diferentes consumida por cada pessoa no último ano. Para a amostra de 150 pessoas, o número meio de remédios consumidos foi de 5,8 com desvio padrão de 3,1. Deseja-se saber se esses dados fornecem evidências suficientes para indicar que a média do número de remédios diferentes consumidos pela comunidade é maior do que 5. Utilize um nível de significância de 0,05. Neste caso, não se sabe se a distribuição do número de remédios consumidos pela comunidade é normal ou não. Em situações como esta, deve-se procurar tomar amostras grandes (maiores do que 30) e usar o desvio padrão amostral para estimar o desvio padrão populacional. Isto é o que foi feito na pesquisa, pois a amostra escolhida contém 150 pessoas. Neste caso o Teorema Central do Limite garante que a distribuição amostral de x será aproximadamente normal. Como σ é desconhecido, usa-se s em seu lugar. A pergunta feita pelos pesquisadores é se a média populacional é maior do que 5. A afirmação contrária a esta é a de que a média populacional é menor ou igual a 5. Portanto, as hipóteses nula e alternativa para este caso são: H0: µ ≤ 5; H1: µ > 5. O teste a ser feito para este caso é unilateral. Como a distribuição amostral das médias para este caso é aproximadamente normal, vamos calcular o valor z: 8 Estatística II – Antonio Roque – Aula 10 z= x − µ 5,8 − 5,0 0,8 = = = 3,2. s 3,1 0,25 n 150 Para este valor, a tabela da distribuição normal reduzida nos dá que a área a direita de z vale 0,5 – 0,49931 = 0,0007. Este é o valor P para este problema. Como ele é menor do que α = 0,05, deve-se rejeitar a hipótese nula e considerar que as evidências experimentais apóiam a afirmação de que as pessoas da comunidade consumiram, no último ano, um número de remédios diferentes maior do que 5. 6. O gerente de uma agência bancária afirma que a média dos saldos dos clientes da sua agência no fim do mês é positiva, ou seja, que, em média, os seus clientes terminam o mês no positivo. Seleciona-se uma amostra aleatória de 15 clientes da agência e a média dos seus saldos bancários no fim do mês é de – R$ 126,70 com desvio padrão de R$ 84,30. Suponha que a distribuição dos saldos dos clientes da agência no fim do mês seja aproximadamente normal e teste a afirmação do gerente com um nível de significância de 0,05. A afirmação do gerente é a de que µ > 0. A afirmação contrária é a de que µ ≤ 0. Esta será nossa hipótese nula. Portanto: H0: µ ≤ 0; H1: µ > 0. O teste a ser feito deve ser do tipo unilateral. 9 Estatística II – Antonio Roque – Aula 10 Supondo que a distribuição populacional é aproximadamente normal, mas com uma amostra de tamanho pequeno (menor do que 30) devemos usar a distribuição t de Student. O valor de t para este caso é: t= − 126,70 − 0 − 126,70 = = −5,82. 84,30 21,77 15 Procurando na tabela da distribuição t de Student para gl = 15 – 1 = 14, vemos que o menor valor que aparece é t = –3,3257. Para este valor, a área sob a curva à sua esquerda vale 0,0025 (metade de 0,005). Como –5,82 é menor do que –3,3257, a área sob a curva à esquerda de –5,82 será menor do que 0,0025 (veja a figura abaixo). Portanto, o valor P para este caso é menor do que 0,05 e a hipótese nula deve ser rejeitada. Isto significa que, mesmo que a média dos saldos da amostra coletada seja negativa, isto não constitui evidência estatisticamente significante para se concluir que a afirmação do gerente da agência está errada. Pelo contrário, a evidência é compatível com a afirmação do gerente de que a média dos saldos dos seus clientes ao fim do mês é positiva. 10