Teste de hipóteses

Propaganda
Teste de hipóteses
Página 1 de 8
Teste de hipóteses
O teste de hipóteses serve para verificar se uma dada amostra é ou não compatível com a
população de onde foi tirada a amostra.
Um teste de hipóteses segue os seguintes passos:
1.
2.
3.
4.
Definição das hipóteses
Identificação da estatística de teste e caracterização da sua distribuição
Estabelecimento da regra de decisão, com especificação do nível de significância
Cálculo da estatística de teste e tomada de decisão
Definição das hipóteses
Definimos sempre duas amostras:
Hipótese nula: a hipótese que vai ser testada
Hipótese alternativa: a hipótese alternativa hipótese nula
•
A hipótese alternativa (H1) é a hipótese que traduz a conjectura que se pretende verificar
É sempre uma desigualdade(> ou <) ou diferença(≠), mas nunca uma igualdade(=)
H1
•
teste bilateral
≠
teste unilateral à esquerda
<
teste unilateral à direita
>
A hipótese nula (H0) é a hipótese que se testa e é complementar a H1. Considera-se
verdadeira de início e o teste rejeita-a (aceitando então H1) ou não (teste inconclusivo).
É sempre uma igualdade.
Exemplo:
O responsável pelas tecnologias da informação de uma empresa pretende avaliar a capacidade
de transmissão de dados da Intranet. Um dos testes a efectuar consiste em estimar o tempo
médio de transferência de um ficheiro de 15 Mb, sendo a finalidade do teste validar a conjectura
de que o tempo médio é inferior a 26 segundos.
Hipótese alternativa (hipótese que traduz a conjectura): H1: µ < 26
Hipótese nula (hipótese complementar a H1): H0: µ = 26
A hipótese complementar a H1 é
na verdade µ ≥ 26, mas
considera-se µ = 26 por ser a
que mais se aproxima de H1
http://www.fe.up.pt/~leec2005
Página 1 de 8
Teste de hipóteses
Página 2 de 8
Identificação da estatística de teste e caracterização da sua distribuição
A estatística que é utilizada para verificar H0 é designada por estatística de teste (ET ) sendo
necessário conhecer a sua distribuição quando se admite que H0 é verdadeira.
O parâmetro da amostra que servirá a ET tem que corresponder ao parâmetro populacional em
conjectura. ( µ ⇒ X , σ ⇒ S ).
Exemplo:
Em relação ao exemplo anterior foi retirada uma amostra de 50 elementos da qual sabemos a
média ( X = 25.51 ). Admitimos também que sabemos o desvio padrão populacional (σ = 1.84).
 σ2
X → N  µ ,
 N
Uma vez que N = 50, podemos aproximar a distribuição de X
(qualquer que ela seja) pela distribuição normal
que por sua vez é normalizada.
ET =
X −µ
σ



→ N (0,1)
N
Estabelecimento da regra de decisão e especificação do nível de significância
A regra de decisão fixa o valor VC = ET(α), valor crítico, a partir do qual se rejeita H0,
criando uma região de rejeição. A probabilidade α designa-se por nível de significância do
teste e representa a probabilidade de se rejeitar H0 quando esta hipótese é verdadeira.
Este erro designa-se por erro de tipo I.
Exemplo:
Retomando o exemplo anteriror, tinhamos ET → N (0,1) e temos agora um nível de
significância α = 5%.
http://www.fe.up.pt/~leec2005
Página 2 de 8
Teste de hipóteses
Página 3 de 8
P ( Z < VC ) = α
VC = z (α ) = z (0.05) = −1.645
Regra de decisão:
ET < -1.645
ET ≥ -1.645
rejeitar H0 e aceitar H1
não rejeitar H0 (teste inconclusivo)
Cálculo da estatística de teste e tomada de decisão
Nesta fase cálcula-se a estatística de teste e rejeita-se ou não H0 consoante o valor de ET.
Exemplo:
ET =
X −µ
σ
N
=
25.51 − 26
= −1.88 ⇒ −1.88 < −1.645 ⇒ rejeitar H0 e aceitar H1
1.84
50
O teste de hipóteses comprovou que o tempo médio de transferência de um ficheiro de 15 Mb é
inferior a 26 segundos.
Erro do tipo II
Existe ainda a possibilidade de cometer um outro tipo de erro que corresponde a não rejeitar H0
quando esta é falsa.
Este erro é designado por erro do tipo II.
A probabilidade de incorrer num erro do tipo II é denotada por β.
H0 verdadeira
H0 falsa
Erro do Tipo I
1-β
H0 rejeitada
α
Erro do tipo II
H0 não rejeitada
1-α
β
Exemplo:
•
Cálculo de um erro de tipo II, com µ = 25.8 e α = 5%:
Vimos que no exemplo anteriror para α = 0.05, o VC = -1.645. Tinhamos µ = 26, σ = 1.84 e
N=50. Vamos converter VC para normal:
http://www.fe.up.pt/~leec2005
Página 3 de 8
Teste de hipóteses
Página 4 de 8
VC = z (α ) = −1.645 =
= 26 − 1.645 ×
1.84
50
X −µ
σ
⇔ X = µ + VC ⋅
N
σ
N
=
= 25.57 ≈ 25.6
E voltamos a convertê-lo para normal reduzido, com o novo µ = 25.8.
X −µ
25.6 − 25.8
= −0.77
1.84
σ
N
50
β = P( X > 25.6) = 1 − P( Z < −0.77) =
VC =
=
= 1 − 0.2206 = 0.7794
•
Cálculo de um erro de tipo II, com µ = 25 e α = 5%:
Já temos o VC em normal. Convertemo-lo para normal
reduzido e calculamos β.
X − µ 25.6 − 25
VC =
=
= 2.31
1.84
σ
N
50
β = P( X > 25.6) = 1 − P ( Z < 2.31) =
= 1 − 0.9896 = 0.0104
Potência de teste
A potência de teste traduz a probabilidade de
rejeitar H0 quando este é falso. Como se vê na
tabela anterior, equivale a 1 - β.
Exemplo:
A potência de teste é tanto maior, quanto maior
for a diferença entre o parâmetro de H0 (µ0 = 26)
e o novo parâmetro (µ).
http://www.fe.up.pt/~leec2005
Página 4 de 8
Teste de hipóteses
Página 5 de 8
O desejável era diminuir α e β simultaneamente, visto serem os erros possíveis, mas tal não é
possível porque são inversamente proporcionais. Lembra-te que ao diminuir α, diminuis o VC e
ao diminuir o VC, aumentas β. A unica opção é aumentar o tamanho da amostra, diminuindo a
variância da distribuição da estatistica de teste.
Exercício:
Seja X o Q.I. dos estudantes de certa escola, com distribuição Normal de média
desconhecida e desvio padrão 15. Foi retirada uma amostra aleatória de 25 estudantes
cujo Q.I. médio foi 106.
a) Deveríamos concluir que a verdadeira média dos Q.I. de todos os alunos da
escola é 100 contra a alternativa de ser superior a esse valor, para α = 0.01?
b) Calcule a probabilidade de cometer um erro de tipo II (β), tomando como valor
crítico para a média x = 106 e considerando que o verdadeiro valor da média
dos Q.I. de todos os alunos da escola é 110.
Resolução:
N = 25
Temos estas informações do enunciado: σ = 15
X = 106
a) Definição das hipóteses
Hipótese nula: H0: µ = 100
Hipótese alternativa: H1: µ > 100
Identificação da estatística de teste e caracterização da sua distribuição
Como dito no enunciado, a média segue uma distribuição normal, e se o parâmetro em questão
é a média populacional, teremos que usar como estatística de teste a média amostral.
 σ2 
X −µ
 ⇒ Z =
X → N ( µ , σ 2 ) ⇒ X → N  µ ,
→ N (0,1)
σ
 N 
N
Estabelecimento da regra de decisão, com especificação do nível de significância
Temos α = 0.01.
P ( z > VC ) = α ⇔ z (α ) = 2.325
Regra de decisão:
ET ≤ 2.325 não rejeitar H0
ET > 2.325 rejeitar H0 e aceitar H1
http://www.fe.up.pt/~leec2005
Página 5 de 8
Teste de hipóteses
Página 6 de 8
Cálculo da estatística de teste e tomada de decisão
ET =
X −µ
σ
N
=
106 − 100
=2
15
25
2 ≤ 2.325 ⇒ não rejeitar H0
Não há evidência estatística para rejeitar a ideia que a média do Q.I. de todos os alunos da
escola é 100.
b) Tomamos H0 como falsa, considerando que a média µ = 110.
β = P(não rejeitar H 0 | H 0 é falsa ) = P ( ET ≤ VC | µ = 110) =







106 − 110 
x−µ
= P Z ≤
µ = 110  = P Z ≤
 = P( Z ≤ −1.33) = 0.0918
σ
15




25 
N



Exercício:
Com o intuito de investigar o tipo de audiência de certo programa televisivo seleccionaram-se
de forma aleatória 100 espectadores, cuja idade foi registada, tendo-se obtido um desvio padrão
amostral S = 2.95. Convencionando-se que a assistência é considerada heterogénea se a
variância das idades ultrapassar os 6 anos, que conclui para α = 5%?
Resolução:
Do enunciado temos: N = 100; S = 2.95; α = 0.05
Definição das hipóteses
Hipótese nula: H0: σ2 = 6
Hipótese alternativa: H1: σ2 > 6
Identificação da estatística de teste e caracterização da sua distribuição
Se o parâmetro populacional em causa é a variância σ2, a estatística de teste será a variância
amostral S2.
Para N = 100, podemos aproximar a distribuição da estatistica de teste pela distribuição quiquadrado.
( N − 1) ⋅ S 2
→ χ N2 −1
2
σ
Estabelecimento da regra de decisão, com especificação do nível de significância
Temos α = 0.05.
2
P ( χ 992 > VC ) = α ⇔ χ 992 (α ) ≈ χ 100
(α ) = 124.3
http://www.fe.up.pt/~leec2005
Regra de decisão:
ET ≤ VC
não rejeitar H0
ET > VC
rejeitar H0 e aceitar H1
Página 6 de 8
Teste de hipóteses
Página 7 de 8
Cálculo da estatística de teste e tomada de decisão
ET =
( N − 1) ⋅ S 2
σ2
=
99 × 2.95 2
= 143.59
6
143.59 > 124.3 ⇒ rejeitar H0 e aceitar H1
A assistência é heterogénea.
Testes mais comuns
Além do teste à variância de uma população normal e do teste ao valor esperado de uma
população, existem mais testes, dos quais é apresentado mais um.
Teste à proporção binomial
Numa população constituída por elementos de dois tipos, o valor p, que corresponde à
proporção de elementos de um dos dois tipos, designa-se por proporção binomial.
Se uma amostra N contem Y elementos de um dos dois tipos, a proporção amostral é Y / N.
Se a amostra for grande, temos:
Y
p ⋅ (1 − p) 

→ N  µ = p, σ 2 =

N
N


As hipóteses a considerar num teste relativo à proporção binomial são:
H0: p = p0
H1: p ≠ p0, p < p0, p > p0
A estatística de teste é:
ET =
Y
− p0
N
→ N (0,1)
p 0 ⋅ (1 − p 0 )
N
Exercício:
Um analista político admite que certo candidato possa ter 20% dos votos. Feita uma sondagem,
14 dos 100 inquiridos revelaram tencionar votar no referido candidato.
a) Que pode concluir para α = 5%?
b) No caso de em 1000 inquiridos, 850 se declararem contra o candidato em causa, que
conclusão se pode tirar para α = 1%?
Resolução:
a) Podemos fazer dois testes: bilateral e unilateral à esquerda
Unilateral à esquerda
Definição das hipóteses
http://www.fe.up.pt/~leec2005
Bilateral
Página 7 de 8
Teste de hipóteses
Página 8 de 8
Hipótese nula: H0: p = 0.2
Hipótese alternativa: H1: p < 0.2
Hipótese nula: H0: p = 0.2
Hipótese alternativa: H1: p ≠ 0.2
Identificação da estatística de teste e caracterização da sua distribuição
Y
− p0
N
ET =
→ N (0,1)
p 0 ⋅ (1 − p 0 )
N
Estabelecimento da regra de decisão, com especificação do nível de significância
Temos α = 0.05.
Temos α = 0.05.
P ( z < VC ) = α ⇔ − z (α ) = −1.645
P ( z < VC E ) = α / 2 ⇔ − z (α / 2) = −1.96
Regra de decisão:
ET ≥ VC
não rejeitar H0
ET < VC
rejeitar H0 e aceitar H1
P ( z > VC D ) = α / 2 ⇔ z (α / 2) = 1.96
Regra de decisão:
VCE ≤ ET ≤ VCD
não rejeitar H0
ET < VCE ou ET > VCD rejeitar H0
Cálculo da estatística de teste e tomada de decisão
A ET é igual para os dois testes mas a regra de decisão é diferente.
0.14 − 0.2
ET =
= −1.5
0 .2 × 0 .8
100
- 1.5 ≥ - 1.645 ⇒ não rejeitar H0
- 1.96 ≤ -1.5 ≤ 1.96 ⇒ não rejeitar H0
Não há evidência estatística para dizer que o analista político está errado.
b) Neste caso, tanto a Definição das hipóteses como a Identificação da estatística de teste e
caracterização da sua distribuição mantêm-se iguais.
Estabelecimento da regra de decisão, com especificação do nível de significância
Temos α = 0.01.
Temos α = 0.01.
P ( z < VC ) = α ⇔ − z (α ) = −2.33
P ( z < VC E ) = α / 2 ⇔ − z (α / 2) = −2.575
Regra de decisão:
ET ≥ VC
não rejeitar H0
ET < VC
rejeitar H0 e aceitar H1
P ( z > VC D ) = α / 2 ⇔ z (α / 2) = 2.575
Regra de decisão:
VCE ≤ ET ≤ VCD
ET < VCE ou ET > VCD
Cálculo da estatística de teste e tomada de decisão
Y / N = (1000 - 850) / 1000 = 0.15
0.15 − 0.2
ET =
= −3.95
0 .2 × 0 .8
1000
não rejeitar H0
rejeitar H0
- 3.95 < - 2.33 ⇒ rejeitar H0 e aceitar H1
− 3.95 < −2.575 ⇒ rejeitar H0 e aceitar H1
Podemos concluir que o analista estava errado.
http://www.fe.up.pt/~leec2005
Página 8 de 8
Download