Exemplos de Testes de Hipóteses para Médias

Estatística II – Antonio Roque – Aula 10
Exemplos de Testes de Hipóteses para Médias Populacionais
Vamos considerar exemplos de testes de hipóteses para a média de uma
população para os dois casos mais importantes na prática:
• O tamanho da amostra selecionada é grande (maior do que 30);
• O tamanho da amostra selecionada é pequeno (menor do que 30), mas a
distribuição populacional é aproximadamente normal.
1. A cervejaria BebeBier vende cervejas em embalagens cujos rótulos indicam
um conteúdo de 600 ml. O Instituto Nacional de Pesos e Medidas (INPM)
seleciona aleatoriamente 50 garrafas de cerveja produzidas pela companhia,
mede seu conteúdo e obtém uma média amostral igual a 596,25 ml com desvio
padrão de 14,06 ml. Com um nível de significância de 0,01, teste a hipótese de
que a cervejaria esta enganando seus consumidores.
O que o INPM quer testar é se a quantidade média de cerveja nas garrafas é
diferente de 600 ml. Portanto, vai se adotar como hipótese nula a hipótese de
que a quantidade média de cerveja por garrafa é igual a 600 ml. A hipótese
alternativa é que a quantidade média de cerveja por garrafa é diferente de 600
ml:
H0: µ = 600 ml
H1: µ ≠ 600 ml.
Portanto, o teste a ser feito é do tipo bilateral.
Como a amostra escolhida é grande (n > 30), o Teorema Central do Limite nos
diz que a distribuição amostral das médias é aproximadamente normal.
1
Estatística II – Antonio Roque – Aula 10
Como o desvio padrão da população σ é desconhecido, podemos estimá-lo
pelo desvio padrão da amostra. Desta forma, a distribuição amostral dos
volumes médios de cerveja por garrafa será normal com,
µ x = 600 ml;
σx =
s
n
=
14,06
50
= 1,99.
A variável normal reduzida associada a x = 596,25 é:
z = (596,25 – 600)/1,99 = −1,88.
Utilizando a tabela da distribuição normal padrão, obtemos que a área sob a
curva à direita de −z vale 0,5 – 0,4699 = 0,03.
Portanto
P = 2x0,03 = 0,06.
Como o valor P é maior que 0,01, não se pode rejeitar a hipótese nula. Devese concluir que não há base suficiente para se mover um inquérito contra a
cervejaria.
O que se deve fazer num caso assim é repetir o estudo com uma nova amostra
maior.
2
Estatística II – Antonio Roque – Aula 10
2. Um nutricionista faz propaganda na televisão afirmando: “você perderá
peso em uma semana seguindo a minha dieta”. O PROCON faz um teste sobre
esta afirmação selecionando 33 pessoas que se submeteram à dieta do
nutricionista. Após uma semana de dieta essas pessoas perderam, em média,
510 g com um desvio padrão de 984 g. Com um nível de significância de 0,05,
o PROCON pode dizer que a afirmação do anuncio é enganosa?
A afirmação do anuncio diz que o peso médio das pessoas que fazem a dieta
diminui após uma semana. Representando a média da perda de peso da
amostra por µ, a afirmação do nutricionista corresponde a dizer que µ > 0.
Vamos adotar como hipótese nula a afirmação contrária, ou seja, que a média
da perda de peso é nula ou negativa (note que um valor negativo para a perda
de peso corresponde, de fato, a um ganho de peso):
H0: µ ≤ 0 g;
H1: µ > 0 g.
Portanto, temos que fazer um teste unilateral.
Como o tamanho da amostra é grande (maior do que 30), a distribuição
amostral da perda de peso será aproximadamente normal. Não conhecemos o
desvio padrão da população de perdas de peso, mas podemos usar o desvio
padrão da amostra, s, para estimá-lo.
Temos então que a distribuição amostral da perda de peso é normal com
parâmetros:
µ x = 0 g;
3
Estatística II – Antonio Roque – Aula 10
σx =
s
n
=
984
33
= 171,29 g.
A variável normal reduzida associada a x = 510 g é:
z = (510 – 0)/171,29 = 2,98.
Utilizando a tabela da distribuição normal padrão, obtemos que a área sob a
curva à direita de z vale 0,5 – 0,4986 = 0,0014.
Portanto
P = 0,014.
Como o valor P é menor que 0,05, rejeita-se a hipótese nula. As evidencias
experimentais não permitem dizer que o nutricionista está fazendo propaganda
enganosa.
3. Pesquisadores coletaram valores de amilase no soro de uma amostra
aleatória de 15 pessoas aparentemente saudáveis. Os pesquisadores desejam
saber, com um nível de significância de α = 0,05, se é possível concluir que o
valor médio de amilase no soro da população de pessoas saudáveis é diferente
de 120 unidades/ml. O valor médio para a amostra foi de x = 96 unidades/ml
e o seu desvio padrão foi de s = 35 unidades/ml.
4
Estatística II – Antonio Roque – Aula 10
Como a hipótese que se quer verificar é que µ ≠ 120, a hipótese nula a ser
adotada é que µ = 120:
H0: µ = 120 unidades/ml;
H1: µ ≠ 120 unidades/ml.
O teste a ser feito é bilateral.
Neste caso, o tamanho da amostra é pequeno (menor do que 30), mas é
razoável supor que a distribuição dos valores de amilase entre a população é
normal. Portanto, pode-se usar a distribuição t de Student com o desvio padrão
populacional σ sendo estimado pelo desvio padrão amostral s.
Com os dados fornecidos, obtemos o seguinte valor para t:
t=
x − µ 96 − 120 − 2,4
=
=
= −2,65.
s
35
9,04
n
15
Consultando a tabela da distribuição t de Student para gl = n – 1 = 14, vemos
que na linha para gl = 14 não existe um valor de t igual a –2,65 ou +2,65.
Porém, existem valores maiores e menores do que 2,65, de maneira que se
pode calcular um intervalo dentro do qual o valor P deve estar. O valor 2,65 é
maior que 2,5096, que está na tabela (na linha de gl = 14) e é o valor de t para
o qual a área pintada abaixo da distribuição t (o valor P) é igual a 0,025. O
valor 2,65 é menor que 2,9768, que está na tabela (na linha de gl = 14) e é o
valor de t para o qual o valor P é igual a 0,01. Portanto, o valor P para t = 2,65
deve estar entre 0,025 e 0,01 (veja a figura a seguir).
0,01 < P < 0,025.
5
Estatística II – Antonio Roque – Aula 10
O valor P é menor do que 0,05. Logo, deve-se rejeitar a hipótese nula com um
nível de significância de 0,05. Sendo assim, a conclusão dos pesquisadores
deve ser a de que o valor médio de amilase no soro da população de pessoas
saudáveis não é igual a 120 unidades/ml.
4. Um fabricante de pisos afirma que uma lajota de um certo tipo de piso
produzido por ele pode agüentar um peso superior a 800 kg sem trincar. Uma
agência de controle de qualidade seleciona uma amostra de 7 lajotas
produzidas pela fábrica e determina que o peso médio suportado pela amostra
sem trincar é de 1225,2 kg com desvio padrão de 425,8 kg. Esse estudo
experimental permite concluir, com um nível de significância de 0,05, que a
afirmação do fabricante de pisos esta correta?
A afirmação da fábrica de pisos corresponde a dizer que o peso médio
suportado por uma lajota é maior que 800 kg. Portanto, a afirmação contrária
será utilizada como hipótese nula:
6
Estatística II – Antonio Roque – Aula 10
H0: µ ≤ 800 kg;
H1: µ > 800 kg.
Portanto, o teste a ser feito é do tipo unilateral.
Neste caso, o tamanho da amostra é pequeno (n = 7). Porém, é razoável supor
que a distribuição dos pesos suportados pelas lajotas é normal. Neste caso,
podemos usar a distribuição t de Student com o desvio padrão populacional
sendo estimado pelo desvio padrão amostral.
Temos então que:
t=
x − µ 1225,2 − 800
=
= 2,64.
s
425,8
n
7
Consultando a tabela da distribuição t de Student para gl = 7 – 1 = 6, vemos
que não existe o valor 2,64. Existem apenas os números 2,4469,
correspondendo a um valor de P = 0,05, e 2,9687, correspondendo a um valor
de P = 0,025. Note que os valores de P dados pela tabela são para um teste
bilateral (eles são dados pela soma das áreas à esquerda e à direita de – t e t,
respectivamente). Como no nosso caso estamos interessados em um teste
unilateral, devemos dividir esses valores de P por 2 para obter a área apenas à
direita de t. Portanto, temos que:
2,4469 < t < 2,9687 ⇒ 0,0125 < P < 0,025,
ou seja, o valor P para o nosso caso é menor que 0,05. Isto implica que a
hipótese nula deve ser rejeitada. Deve-se concluir que as evidências
experimentais indicam que as lajotas podem suportar mais que 800 kg.
7
Estatística II – Antonio Roque – Aula 10
5. Em um estudo sobre as condições de saúde de uma certa comunidade,
entrevistou-se 150 pessoas. Uma das perguntas dizia respeito à quantidade de
remédios diferentes consumida por cada pessoa no último ano. Para a amostra
de 150 pessoas, o número meio de remédios consumidos foi de 5,8 com
desvio padrão de 3,1. Deseja-se saber se esses dados fornecem evidências
suficientes para indicar que a média do número de remédios diferentes
consumidos pela comunidade é maior do que 5. Utilize um nível de
significância de 0,05.
Neste caso, não se sabe se a distribuição do número de remédios consumidos
pela comunidade é normal ou não. Em situações como esta, deve-se procurar
tomar amostras grandes (maiores do que 30) e usar o desvio padrão amostral
para estimar o desvio padrão populacional. Isto é o que foi feito na pesquisa,
pois a amostra escolhida contém 150 pessoas. Neste caso o Teorema Central
do Limite garante que a distribuição amostral de x será aproximadamente
normal. Como σ é desconhecido, usa-se s em seu lugar.
A pergunta feita pelos pesquisadores é se a média populacional é maior do que
5. A afirmação contrária a esta é a de que a média populacional é menor ou
igual a 5. Portanto, as hipóteses nula e alternativa para este caso são:
H0: µ ≤ 5;
H1: µ > 5.
O teste a ser feito para este caso é unilateral.
Como a distribuição amostral das médias para este caso é aproximadamente
normal, vamos calcular o valor z:
8
Estatística II – Antonio Roque – Aula 10
z=
x − µ 5,8 − 5,0 0,8
=
=
= 3,2.
s
3,1
0,25
n
150
Para este valor, a tabela da distribuição normal reduzida nos dá que a área a
direita de z vale 0,5 – 0,49931 = 0,0007. Este é o valor P para este problema.
Como ele é menor do que α = 0,05, deve-se rejeitar a hipótese nula e
considerar que as evidências experimentais apóiam a afirmação de que as
pessoas da comunidade consumiram, no último ano, um número de remédios
diferentes maior do que 5.
6. O gerente de uma agência bancária afirma que a média dos saldos dos
clientes da sua agência no fim do mês é positiva, ou seja, que, em média, os
seus clientes terminam o mês no positivo. Seleciona-se uma amostra aleatória
de 15 clientes da agência e a média dos seus saldos bancários no fim do mês é
de – R$ 126,70 com desvio padrão de R$ 84,30. Suponha que a distribuição
dos saldos dos clientes da agência no fim do mês seja aproximadamente
normal e teste a afirmação do gerente com um nível de significância de 0,05.
A afirmação do gerente é a de que µ > 0. A afirmação contrária é a de que µ ≤
0. Esta será nossa hipótese nula. Portanto:
H0: µ ≤ 0;
H1: µ > 0.
O teste a ser feito deve ser do tipo unilateral.
9
Estatística II – Antonio Roque – Aula 10
Supondo que a distribuição populacional é aproximadamente normal, mas
com uma amostra de tamanho pequeno (menor do que 30) devemos usar a
distribuição t de Student. O valor de t para este caso é:
t=
− 126,70 − 0 − 126,70
=
= −5,82.
84,30
21,77
15
Procurando na tabela da distribuição t de Student para gl = 15 – 1 = 14, vemos
que o menor valor que aparece é t = –3,3257. Para este valor, a área sob a
curva à sua esquerda vale 0,0025 (metade de 0,005). Como –5,82 é menor do
que –3,3257, a área sob a curva à esquerda de –5,82 será menor do que 0,0025
(veja a figura abaixo).
Portanto, o valor P para este caso é menor do que 0,05 e a hipótese nula deve
ser rejeitada.
Isto significa que, mesmo que a média dos saldos da amostra coletada seja
negativa, isto não constitui evidência estatisticamente significante para se
concluir que a afirmação do gerente da agência está errada. Pelo contrário, a
evidência é compatível com a afirmação do gerente de que a média dos saldos
dos seus clientes ao fim do mês é positiva.
10