Teste de Hipótese e Intervalo de Confiança

Propaganda
Teste de Hipótese e Intervalo de
Confiança
Suponha que estamos interessados em investigar
o tamanho da ruptura em um músculo do
ombro...
para determinar o tamanho exato da ruptura, é
necessário um exame de raio-x.
Qual seria o tamanho médio da extensão desta
lesão?
Considere algumas amostras de pacientes:
4, 3.6, 2, 1.4, 2.7, 4.3 com média = 3
1, 2.8, 3.1, 4.3, 2.6, 1.2 com média = 2.5
3.5, 4.3, 1.7, 5.2, 2.3, 4.9 com média = 3.65
Todas as 3 amostras têm 6 observações, mas cada
uma possui uma média diferente. Qual usar?
Em muitos problemas reais, precisamos fazer
conjecturas sobre um parâmetro e verificar se essa
conjectura pode ou não ser rejeitada.
Estas conjecturas são chamadas de hipóteses.
E este procedimento de tomada de decisão sobre
uma hipótese é chamado de teste de hipótese.
Poderíamos fazer conjecturas do tipo:
a média é igual a 2?
a média é maior que 3.2?
a média é menor que 2.9?
Os três exemplos são hipóteses e precisamos
testar estas hipóteses para verificar se fazem ou
não sentido.
Observe que:
O tamanho da ruptura em um músculo do ombro é
uma variável aleatória...
que possui uma distribuição de probabilidade
associada a ela.
mas a média do tamanho da ruptura também é uma
variável aleatória...
que, da mesma forma, possui uma distribuição de
probabilidade associada.
Vamos fazer uma pausa para refletir sobre o que
temos aprendido…
começamos
representando
matematicamente;
os
dados
calculando estatísticas descritivas para “olhar
para os dados”;
já sabemos que estes dados são variáveis
aleatórias que possuem uma distribuição de
probabilidade.
Voltando as amostras:
4, 3.6, 2, 1.4, 2.7, 4.3 com média = 3
1, 2.8, 3.1, 4.3, 2.6, 1.2 com média = 2.5
3.5, 4.3, 1.7, 5.2, 2.3, 4.9 com média = 3.65
Note que para cada amostra da VA tamanho da
ruptura, existe uma amostra da VA média do
tamanho da ruptura.
Formalmente…
Uma hipótese estatística é uma afirmação sobre os
parâmetros de uma ou mais populações.
Um parâmetro pode ser a média, a variância ou uma
proporção da população.
É importante dizer que as hipóteses são afirmações
sobre a população e não sobre a amostra.
População



 


População



 


Eu acho que a idade
média
desta
população é 50 anos
(hipótese).
População


 


Eu acho que a idade
média
desta
população é 50 anos
(hipótese).

Amostra aleatória
Media 
X = 20
População


 


Eu acho que a idade
média
desta
população é 50 anos
(hipótese).

Amostra aleatória
Media
X = 20 

Está longe.
Rejeita a
hipótese!
então:
... Então
rejeitamos a
hipótese de  =
50.
É improvavel que
tenhamos uma
média amostral
com este valor ...
... se a média da
população é esta
20
 = 50
Sample Mean
Hipótese Nula
É o que queremos testar. Chamamos de H0.
Hipótese Alternativa
é o complemento de H0, denotada por Ha.
Suponha que queremos testar a hipótese de que
a idade média seja igual a 50.
H0:  = 50
Ha:   50
Ha contempla valores maiores e menores que 50.
Temos aqui um teste bilateral. Teremos que nos
preocupar com os dois lados da distribuição de
probabilidade.
Podemos testar usando desigualdades
H0:  < 50
Ha:   50
ou
H0:  > 50
Ha:   50
Ha contempla valores maiores ou menores ou iguais
que 50. Temos aqui dois testes unilaterais. Teremos
que nos preocupar apenas com o lado em questão
da distribuição de probabilidade.
Quando decidir quando devemos ou não rejeitar
uma hipótese nula?
H0:  = 50
Ha:   50
Se nossas amostras apresentarem médias de idade,
por exemplo, 50.2 ou 49.8, talvez não fosse uma boa
idéia rejeitar H0.
Vamos arbitrar estes limites como 48 e 52, isto é:
As regiões para as quais a média é menor que 48 ou
maior que 52 são ditas as regiões de rejeição do
teste.
Definida a região de rejeição, precisa-se
estabelecer uma estatística para o teste.
Neste caso, a estatística é a média amostral.
Seleciona-se uma amostra e calcula-se a média. Se
ela cair na região de rejeição, rejeita-se H0. Caso
contrário não há como recusar a hipótese nula.
Definições
A rejeição da hipótese nula H0, quando ela for
verdadeira, é definida como erro tipo I.
A falha em rejeitar a hipótese nula H0, quando ela é
falsa, é definida como erro tipo II.
Algumas considerações:
Em geral, o erro tipo I é mais sério que o erro tipo II.
A hipótese nula é verdadeira até que se prove o
contrário.
A hipótese nula é escolhida de forma a ser o que o
projetista quer negar.
Nível de Significância
Denominado por .
É a probabilidade do erro tipo I, isto é,  = Prob(erro tipo
I).
Os valores típicos de  são: 0,01, 0,05, 0,10.  é também
conhecido como “tamanho do teste”.
Caracteriza a região de rejeição. Define os valores pouco
prováveis da estatística da amostra se a hipótese nula é
verdadeira.
Teste Uni-caudal
Sampling Distribution
Nível de confiança (região
de não rejeição)
Rejection
Região
de
Region
rejeição

1-
Nonrejection
Region
valor
Critical
crítico
Value
Ho
Value

Não rejeita a
hipótese nula
Sample Statistic
Valor observado da estatística
Teste Uni-caudal
Sampling Distribution
Nível de confiança (região
de não rejeição)
Rejection
Região
de
Region
rejeição

1-
Nonrejection
Region
valor
Critical
crítico
Valor observado Value
da estatística
Ho
Value

Rejeita a
hipótese nula
Sample Statistic
Teste Bi-caudal

Região de
Rejection
rejeição
Region
Rejeita a
hipótese nula
Região
de
Rejection
rejeição
Region
1-
1/2 
1/2 
Nonrejection
Region
Valor
observado da
estatística
Critical
valor
Value
crítico
Ho
Sample Statistic
Value Critical
Valor
Value
crítico
Teste de Hipótese – Passo a Passo
Identifique o parâmetro de interesse;
Estabeleça H0 e Ha;
Estabeleça o nível de significância  que determinará a
região de rejeição;
Estabeleça uma estatística apropriada de teste;
Calcule o valor da estatística;
Decida de H0 deve ou não ser rejeitada.
Download