CAP6: Testes de Hipóteses

Propaganda
CAP6: Testes de Hipóteses
Aplica-se em situações que exigem decisão entre aceitar ou rejeitar uma afirmativa sobre algum parâmetro.
Um teste estatístico é composto de duas hipóteses:
H0: hipótese nula. Afirma valores para os parâmetros
H1: hipótese alternativa, nega o valor do parâmetro afirmado em H0.
Exemplo 6.1: O contrato de uma empresa estabelece que o percentual de certa substância num produto não
pode ultrapassar certo valor, digamos
. Assim, o parâmetro a ser testado é a proporção da substância no
produto.
Nesta situação a formulação do teste seria:
Exemplo 6.2: Caso o contrato estabelecesse que o percentual de certa substância deveria ser igual a (ou em
torno de) certo valor, digamos
, a formulação do teste seria:
Exemplo 6.3: Caso o contrato estabelecesse que o percentual de certa substância deveria ser maior do que certo
valor, digamos
, a formulação do teste seria:
Veja que nas situações acima, a hipótese nula vai de encontro à afirmativa do contrato.
O procedimento que leva a decisão sobre a verdade ou falsidade de uma hipótese é chamado de teste de uma
hipótese.
As informações de uma amostra aleatória da população de interesse é que servem de base para decisão de qual
hipótese é a verdadeira. Se a informação for consistente com a hipótese, então podemos concluir que a hipótese
é verdadeira; caso contrário, concluímos que a hipótese é falsa.
Para testar uma hipótese, devemos extrair uma amostra aleatória, calcular uma estatística de teste apropriada,
obter o p-valor desta estatística e então tomar a decisão.
Podemos pensar este p-valor como a probabilidade que dá sustentação à manutenção da hipótese nula como
verdadeira. Assim, se p-valor for muito pequeno, próximo de zero, não teremos motivos para acreditar que a
hipótese nula é a verdadeira. Neste caso, rejeitaremos a hipótese nula.
Erros possíveis
Quando se toma uma decisão usando-se a informação de uma amostra aleatória, estamos sujeitos a que?
ERROS.
Estes erros recebem convencionalmente os seguintes nomes:
Erro tipo I: rejeitar H0 quando H0 é verdadeira
Erro tipo II: aceitar H0 quando H0 é falsa
é o nível de significância do teste, é a probabilidade do erro tipo I e
probabilidade de aceitar H0 quando de fato esta hipótese é verdadeira)
é a probabilidade do erro tipo II e
quando de fato esta hipótese é falsa.)
é o nível de confiança do teste (é a
é conhecido como poder do teste (é a probabilidade de rejeitar H0
Apresentarei as formulas para os testes mais simples. As demais se complementam com a leitura da bibliografia
recomendada (Montgomery). Também recomendo o site http://www.portalaction.com.br/.
Os testes com expressões mais complexas serão estudados com o auxilio do programa R.
Teste de hipótese para uma única amostra
Teste de Hipótese para a Média de uma distribuição normal, variância conhecida
Estatística do teste:
( nesta situação é a área das caudas da distribuição
normal!)
Estatística do teste:
( nesta situação é a área da cauda superior da distribuição normal!)
Estatística do teste:
(nesta situação é a área da cauda inferior da distribuição normal!)
Regra de decisão do teste (comum a todos os testes)
implica em aceitar H0 como verdadeira
implica em rejeitar H0 como verdadeira
Para um conceito gráfico do pvalor sugiro espiar o link:
Exemplo 6.4 Ref. Montgomery pag 244 Prob e Est na Engenharia)
Considere a variável de interesse: taxa de queima de um propulsor de foguete.
As especificações exigem taxa média = 40cm/s. Suponha que se conheça
Probabilidade do erro tipo I especificada pelo analista = 0.05 (
).
Será testada uma amostra de tamanho n=25. Nesta amostra obteve-se
.
Estatística do teste:
Comparando o pvalor com o
queima não é 40cm/s.
=2*(1-0.999111)= 0.001778
, a regra diz que devemos rejeitar H0. Logo conclui-se que a taxa de
Observe que para situações com
pvalor. Teste por exemplo usar a hipótese
ou
, a estatística de teste é a mesma. O que muda é o
e verifique que pvalor será 0.000889.
Escolha do tamanho amostral
Supondo que H0 seja falsa, significa que o verdadeiro valor da média apresenta um deslocamento em relação ao
valor suposto em H0. Ou seja
Assim, a estatística do teste será
e
.
Lembre-se que
Para obtermos o tamanho da amostra para determinado valor de
deslocamento em relação à , e desse modo obter o valor de n.
Exemplo 6.5
, teríamos que fixar o tamanho do
Suponha que o analista da situação do exemplo 6.4 quisesse planejar o teste de modo que se a verdadeira taxa
de queima diferisse de 40cm/s por no máximo 1cm/s, o teste detectaria isso com alta probabilidade, digamos
0.90. Assim
;
;
; ogo
.
Desse modo teríamos
Atente para o fato de que à medida que n aumenta
Assim podemos desprezar esta parte da expressão.
Ficamos então com
acumulada, obtemos z= 1.281552.
fica cada vez mais próximo de zero.
. Na tabela da distribuição normal, para 0.90 de probabilidade
Teste de Hipótese para a Média de uma distribuição normal, variância desconhecida (teste T)
O que muda no procedimento é que não se conhece a variância da distribuição.
O procedimento deste tipo de teste se baseia na distribuição T de Student e a estatística deste teste é dada por:
Sendo S a estimativa do desvio padrão, obtido pelo cálculo do desvio padrão da amostra. O grau de liberdade da
distribuição t será
.
Para saber um pouco mais sobre a distribuição t, dê uma espiada em
.
Exemplo 6.6
A força de rompimento de uma fibra têxtil é uma variável aleatória distribuída normalmente. As especificações
exigem que a força média de rompimento seja igual a 150 psi. O fabricante gostaria de detectar qualquer
afastamento significante desse valor. Assim, ele deseja testar
Suponha que numa amostra de 15 espécimes de fibra foi testada a força de rompimento obtendo-se
Estatística do teste:
Caso você consulte uma tabela t, observará que não é possível obter precisamente
(o grau de
liberdade é 14, que ficaria entre 95 e 97,5%)
No R esse valor se obtém pelo comando pt(2.07,15-1) = 0.9712864 (ou ainda pode-se obter pt(2.07,15-1) e neste caso não se faz a diferença de 1 no calculo do pvalor.)
Assim,
Comparando o pvalor com o
evidência para rejeitar que
, a regra diz que devemos aceitar H0. Logo conclui-se que não há
Escolha do tamanho amostral
Supondo que H0 seja falsa, significa que o verdadeiro valor da média apresenta um deslocamento em relação ao
valor suposto em H0. Ou seja
Assim, a estatística do teste será
Para saber o tamanho da amostra para se detectar tal deslocamento com probabilidade p e um desvio padrão
estimado de s, usamos o seguinte comando no R:
power.t.test(power = p, delta =
, type="one.sample")
Exemplo 6.7
Considere o exemplo 6.6. Se a força de rompimento dessa fibra difere de 150 psi, por no máximo, 2.5 psi, o
analista gostaria de rejeitar a hipótese nula
com uma probabilidade de no mínimo 0.90. Que
tamanho de amostra deveria ser usado?
Observe que
power.t.test(power = 0.9, delta = 2.5,sd=4.08, type="one.sample")
Resulta em:
One-sample t test power calculation
n = 29.97268
delta = 2.5
sd = 4.08
sig.level = 0.05
power = 0.9
alternative = two.sided
O comando nos revela que o tamanho da amostra deve ser de no mínimo 30 espécimes.
Observe que no exemplo 6.5 o valor de é conhecido. Supondo que não fosse e que a estimativa para s=2,
teríamos com tamanho da amostra:
power.t.test(power = 0.9, delta = 1,sd=2, type="one.sample")
One-sample t test power calculation
n = 43.99552
delta = 1
sd = 2
sig.level = 0.05
power = 0.9
alternative = two.sided
Ou seja
um pouco maior do que o obtido com o suposto conhecimento de . Esta comparação é
interessante porque mostra que quanto menos informação sobre a variável maior deverá ser o tamanho da
amostra que neste caso subiu de 42 para 44.
Exercícios:
1) Há duas situações distintas para se determinar o tamanho da amostra quando se está testando a média de
uma variável. Por exemplo, quando definimos a magnitude do erro na estimativa do intervalo de confiança e
quando definimos o poder de detecção do teste de hipótese na mudança da média quando esta se desloca
do valor suposto da hipótese nula. Apresente um resumo do cálculo de n para estas duas situações.
2) Utilize o programa R para planejar o tamanho da amostra quando se pretende testar a hipótese nula
com probabilidade de detecção de 0.90 para um deslocamento da média de tamanho 2 (
,
considerando que a estimativa para o desvio padrão seja de 0.25.
3) Repita o exercício anterior, mas agora supondo que a estimativa para o desvio padrão seja de 5.
4) O resultado da questão anterior é surpreendente? Faça uma reflexão do porque o tamanho da amostra ficou
tão diferente do caso da questão 2.
5) O que acontece na situação das questões 2 e 3 se diminuímos o poder de detecção, por exemplo para 0.80.
6) Analise as situações e proponha a formulação da hipótese de um teste estatístico.
a. O número de peças produzidas por operários de uma fábrica é normalmente distribuído Com o
objetivo de aumentar a produção, um método de estímulo está sendo estudado. Uma amostra de 25
operários é selecionada aleatoriamente e, após ser aplicado o estímulo, é verificado o número de
peças produzidas por cada operário. A orientação do dono da fábrica é de que o método de estímulo
deve ser implementado na fábrica se a média de peças produzidas/operário for maior que a atual
que é de 260 peças/operário.
b. A tensão de ruptura dos cabos produzidos tem distribuição normal com média de 1800 Kg e desvio
padrão de 100 Kg. Na busca de um aumento da resistência desses cabos, um novo processo
produtivo foi testado. Para tanto, uma amostra com 16 cabos será testada.
c. Deseja-se verificar se o conteúdo médio de leite em caixa de uma determinada marca é realmente
de 1 litro, com base em uma amostra de 60 caixas de leite desta marca.
d. A Polícia Rodoviária Estadual fez recentemente uma pesquisa sobre as velocidades desenvolvidas em
certa rodovia no período de 23h às 2h. Sabe-se que a velocidade máxima da rodovia é de 110 Km/h.
A pesquisa deseja responder a pergunta: “A velocidade média neste período é diferente do
estabelecido pela velocidade máxima?”
7) Considere as seguintes estatísticas para cada item da questão anterior respectivamente. Obtenha a
estatística do teste em cada caso.
a.
b.
c.
d.
8) Obtenha o pvalor de cada item da questão acima e estabeleça a conclusão do teste no contexto do
problema, adotando nível de significância de 5%. (Você poderá usar uma tabela ou o programa R para obter
o pvalor)
Resposta
1) Espera-se que o aluno consulte o capítulo anterior e perceba que no primeiro caso
, e no
segundo caso este calculo é bem mais complexo pois depende de estimativa para ; do deslocamento em
relação a um suposto valor para a média, do nível de significância adotado no teste e da probabilidade de
detecção da mudança que deve ser fixada pelo pesquisador.
2) power.t.test(power = 0.9, delta = 2,sd=0.25, type="one.sample"), ou seja,
n>=3
3) power.t.test(power = 0.9, delta = 2,sd=5, type="one.sample"), ou seja,
n>=68
4) Espera-se que o aluno perceba que a dispersão tem grande influência no cálculo do tamanho da amostra.
Quanto maior a dispersão, maior será o tamanho da amostra para a mesma situação de planejamento.
5) power.t.test(power = 0.8, delta = 2,sd=0.25, type="one.sample"), ou seja,
n>=3
power.t.test(power = 0.8, delta = 2,sd=5, type="one.sample"), ou seja,
n>=51/52. No primeiro caso o tamanho da amostra não se altera; no segundo caso, devido à magnitude da
dispersão, o tamanho se reduz, pois a exigência de poder de detecção acompanha no mesmo sentido.
6)
a.
b.
c.
, do ponto de vista do consumidor que espera que a caixa cumpra com a
especificação e não com menor quantidade.
d.
7)
a. > x=300;s=120; n=25;m=260;t<-(x-m)/(s/sqrt(n))
>t
[1] 1.666667
b. > x =1810;sigma=100;s=105.3;n=16; m=1800;z<-(x-m)/(sigma/sqrt(n))
>z
[1] 0.4
c. > x=1.01;s=0.3; n=60;m=1;t<-(x-m)/(s/sqrt(n))
>t
[1] 0.2581989
d. > x=112;s=1.3; n=100;m=110;t<-(x-m)/(s/sqrt(n))
>t
[1] 15.38462
8)
a. > pt(-t,n-1)#pvalor unilateral
[1] 0.05429006
> 2*pt(-t,n-1)#pvalor bilateral
[1] 0.1085801
Neste caso o pvalor é o unilateral, logo 0.054 > 0.05 (nível de significância estabelecido). Logo o novo
método não será adotado pela fábrica, pois não apresentou melhora significativa do desempenho do
operário. Aqui como o pvalor foi muito próximo do nível de significância, o analista deve sugerir novo
teste, possivelmente aumentando o tamanho da amostra.
b. > pnorm(-z)#pvalor unilateral
[1] 0.3445783
> 2*pnorm(-z)#pvalor bilateral
[1] 0.6891565
Neste caso o pvalor é o unilateral, logo 0.35 > 0.05 (nível de significância estabelecido). Logo o novo
método não produziu melhora significativa na tensão de ruptura.
c. > pt(-t,n-1)#pvalor unilateral
[1] 0.398576
> 2*pt(-t,n-1)#pvalor bilateral
[1] 0.797152
Neste caso o pvalor é o unilateral, logo 0.40 > 0.05 (nível de significância estabelecido). Logo a
quantidade de 1l é o conteúdo médio da caixa de leite.
d. > pt(-t,n-1)#pvalor unilateral
[1] 2.668809e-28
> 2*pt(-t,n-1)#pvalor bilateral
[1] 5.337619e-28
Neste caso o pvalor é o bilateral, logo 0.00... < 0.05 (nível de significância estabelecido). Logo a hipótese
nula é rejeitada pelo teste. Assim, a pesquisa conclui que a velocidade média na rodovia é diferente da
velocidade máxima estabelecida. Se o teste unilateral fosse aplicado, a conclusão seria de que a
velocidade média é maior que o máximo estabelecido.
Download