Teste de hipóteses Página 1 de 8 Teste de hipóteses O teste de hipóteses serve para verificar se uma dada amostra é ou não compatível com a população de onde foi tirada a amostra. Um teste de hipóteses segue os seguintes passos: 1. 2. 3. 4. Definição das hipóteses Identificação da estatística de teste e caracterização da sua distribuição Estabelecimento da regra de decisão, com especificação do nível de significância Cálculo da estatística de teste e tomada de decisão Definição das hipóteses Definimos sempre duas amostras: Hipótese nula: a hipótese que vai ser testada Hipótese alternativa: a hipótese alternativa hipótese nula • A hipótese alternativa (H1) é a hipótese que traduz a conjectura que se pretende verificar É sempre uma desigualdade(> ou <) ou diferença(≠), mas nunca uma igualdade(=) H1 • teste bilateral ≠ teste unilateral à esquerda < teste unilateral à direita > A hipótese nula (H0) é a hipótese que se testa e é complementar a H1. Considera-se verdadeira de início e o teste rejeita-a (aceitando então H1) ou não (teste inconclusivo). É sempre uma igualdade. Exemplo: O responsável pelas tecnologias da informação de uma empresa pretende avaliar a capacidade de transmissão de dados da Intranet. Um dos testes a efectuar consiste em estimar o tempo médio de transferência de um ficheiro de 15 Mb, sendo a finalidade do teste validar a conjectura de que o tempo médio é inferior a 26 segundos. Hipótese alternativa (hipótese que traduz a conjectura): H1: µ < 26 Hipótese nula (hipótese complementar a H1): H0: µ = 26 A hipótese complementar a H1 é na verdade µ ≥ 26, mas considera-se µ = 26 por ser a que mais se aproxima de H1 http://www.fe.up.pt/~leec2005 Página 1 de 8 Teste de hipóteses Página 2 de 8 Identificação da estatística de teste e caracterização da sua distribuição A estatística que é utilizada para verificar H0 é designada por estatística de teste (ET ) sendo necessário conhecer a sua distribuição quando se admite que H0 é verdadeira. O parâmetro da amostra que servirá a ET tem que corresponder ao parâmetro populacional em conjectura. ( µ ⇒ X , σ ⇒ S ). Exemplo: Em relação ao exemplo anterior foi retirada uma amostra de 50 elementos da qual sabemos a média ( X = 25.51 ). Admitimos também que sabemos o desvio padrão populacional (σ = 1.84). σ2 X → N µ , N Uma vez que N = 50, podemos aproximar a distribuição de X (qualquer que ela seja) pela distribuição normal que por sua vez é normalizada. ET = X −µ σ → N (0,1) N Estabelecimento da regra de decisão e especificação do nível de significância A regra de decisão fixa o valor VC = ET(α), valor crítico, a partir do qual se rejeita H0, criando uma região de rejeição. A probabilidade α designa-se por nível de significância do teste e representa a probabilidade de se rejeitar H0 quando esta hipótese é verdadeira. Este erro designa-se por erro de tipo I. Exemplo: Retomando o exemplo anteriror, tinhamos ET → N (0,1) e temos agora um nível de significância α = 5%. http://www.fe.up.pt/~leec2005 Página 2 de 8 Teste de hipóteses Página 3 de 8 P ( Z < VC ) = α VC = z (α ) = z (0.05) = −1.645 Regra de decisão: ET < -1.645 ET ≥ -1.645 rejeitar H0 e aceitar H1 não rejeitar H0 (teste inconclusivo) Cálculo da estatística de teste e tomada de decisão Nesta fase cálcula-se a estatística de teste e rejeita-se ou não H0 consoante o valor de ET. Exemplo: ET = X −µ σ N = 25.51 − 26 = −1.88 ⇒ −1.88 < −1.645 ⇒ rejeitar H0 e aceitar H1 1.84 50 O teste de hipóteses comprovou que o tempo médio de transferência de um ficheiro de 15 Mb é inferior a 26 segundos. Erro do tipo II Existe ainda a possibilidade de cometer um outro tipo de erro que corresponde a não rejeitar H0 quando esta é falsa. Este erro é designado por erro do tipo II. A probabilidade de incorrer num erro do tipo II é denotada por β. H0 verdadeira H0 falsa Erro do Tipo I 1-β H0 rejeitada α Erro do tipo II H0 não rejeitada 1-α β Exemplo: • Cálculo de um erro de tipo II, com µ = 25.8 e α = 5%: Vimos que no exemplo anteriror para α = 0.05, o VC = -1.645. Tinhamos µ = 26, σ = 1.84 e N=50. Vamos converter VC para normal: http://www.fe.up.pt/~leec2005 Página 3 de 8 Teste de hipóteses Página 4 de 8 VC = z (α ) = −1.645 = = 26 − 1.645 × 1.84 50 X −µ σ ⇔ X = µ + VC ⋅ N σ N = = 25.57 ≈ 25.6 E voltamos a convertê-lo para normal reduzido, com o novo µ = 25.8. X −µ 25.6 − 25.8 = −0.77 1.84 σ N 50 β = P( X > 25.6) = 1 − P( Z < −0.77) = VC = = = 1 − 0.2206 = 0.7794 • Cálculo de um erro de tipo II, com µ = 25 e α = 5%: Já temos o VC em normal. Convertemo-lo para normal reduzido e calculamos β. X − µ 25.6 − 25 VC = = = 2.31 1.84 σ N 50 β = P( X > 25.6) = 1 − P ( Z < 2.31) = = 1 − 0.9896 = 0.0104 Potência de teste A potência de teste traduz a probabilidade de rejeitar H0 quando este é falso. Como se vê na tabela anterior, equivale a 1 - β. Exemplo: A potência de teste é tanto maior, quanto maior for a diferença entre o parâmetro de H0 (µ0 = 26) e o novo parâmetro (µ). http://www.fe.up.pt/~leec2005 Página 4 de 8 Teste de hipóteses Página 5 de 8 O desejável era diminuir α e β simultaneamente, visto serem os erros possíveis, mas tal não é possível porque são inversamente proporcionais. Lembra-te que ao diminuir α, diminuis o VC e ao diminuir o VC, aumentas β. A unica opção é aumentar o tamanho da amostra, diminuindo a variância da distribuição da estatistica de teste. Exercício: Seja X o Q.I. dos estudantes de certa escola, com distribuição Normal de média desconhecida e desvio padrão 15. Foi retirada uma amostra aleatória de 25 estudantes cujo Q.I. médio foi 106. a) Deveríamos concluir que a verdadeira média dos Q.I. de todos os alunos da escola é 100 contra a alternativa de ser superior a esse valor, para α = 0.01? b) Calcule a probabilidade de cometer um erro de tipo II (β), tomando como valor crítico para a média x = 106 e considerando que o verdadeiro valor da média dos Q.I. de todos os alunos da escola é 110. Resolução: N = 25 Temos estas informações do enunciado: σ = 15 X = 106 a) Definição das hipóteses Hipótese nula: H0: µ = 100 Hipótese alternativa: H1: µ > 100 Identificação da estatística de teste e caracterização da sua distribuição Como dito no enunciado, a média segue uma distribuição normal, e se o parâmetro em questão é a média populacional, teremos que usar como estatística de teste a média amostral. σ2 X −µ ⇒ Z = X → N ( µ , σ 2 ) ⇒ X → N µ , → N (0,1) σ N N Estabelecimento da regra de decisão, com especificação do nível de significância Temos α = 0.01. P ( z > VC ) = α ⇔ z (α ) = 2.325 Regra de decisão: ET ≤ 2.325 não rejeitar H0 ET > 2.325 rejeitar H0 e aceitar H1 http://www.fe.up.pt/~leec2005 Página 5 de 8 Teste de hipóteses Página 6 de 8 Cálculo da estatística de teste e tomada de decisão ET = X −µ σ N = 106 − 100 =2 15 25 2 ≤ 2.325 ⇒ não rejeitar H0 Não há evidência estatística para rejeitar a ideia que a média do Q.I. de todos os alunos da escola é 100. b) Tomamos H0 como falsa, considerando que a média µ = 110. β = P(não rejeitar H 0 | H 0 é falsa ) = P ( ET ≤ VC | µ = 110) = 106 − 110 x−µ = P Z ≤ µ = 110 = P Z ≤ = P( Z ≤ −1.33) = 0.0918 σ 15 25 N Exercício: Com o intuito de investigar o tipo de audiência de certo programa televisivo seleccionaram-se de forma aleatória 100 espectadores, cuja idade foi registada, tendo-se obtido um desvio padrão amostral S = 2.95. Convencionando-se que a assistência é considerada heterogénea se a variância das idades ultrapassar os 6 anos, que conclui para α = 5%? Resolução: Do enunciado temos: N = 100; S = 2.95; α = 0.05 Definição das hipóteses Hipótese nula: H0: σ2 = 6 Hipótese alternativa: H1: σ2 > 6 Identificação da estatística de teste e caracterização da sua distribuição Se o parâmetro populacional em causa é a variância σ2, a estatística de teste será a variância amostral S2. Para N = 100, podemos aproximar a distribuição da estatistica de teste pela distribuição quiquadrado. ( N − 1) ⋅ S 2 → χ N2 −1 2 σ Estabelecimento da regra de decisão, com especificação do nível de significância Temos α = 0.05. 2 P ( χ 992 > VC ) = α ⇔ χ 992 (α ) ≈ χ 100 (α ) = 124.3 http://www.fe.up.pt/~leec2005 Regra de decisão: ET ≤ VC não rejeitar H0 ET > VC rejeitar H0 e aceitar H1 Página 6 de 8 Teste de hipóteses Página 7 de 8 Cálculo da estatística de teste e tomada de decisão ET = ( N − 1) ⋅ S 2 σ2 = 99 × 2.95 2 = 143.59 6 143.59 > 124.3 ⇒ rejeitar H0 e aceitar H1 A assistência é heterogénea. Testes mais comuns Além do teste à variância de uma população normal e do teste ao valor esperado de uma população, existem mais testes, dos quais é apresentado mais um. Teste à proporção binomial Numa população constituída por elementos de dois tipos, o valor p, que corresponde à proporção de elementos de um dos dois tipos, designa-se por proporção binomial. Se uma amostra N contem Y elementos de um dos dois tipos, a proporção amostral é Y / N. Se a amostra for grande, temos: Y p ⋅ (1 − p) → N µ = p, σ 2 = N N As hipóteses a considerar num teste relativo à proporção binomial são: H0: p = p0 H1: p ≠ p0, p < p0, p > p0 A estatística de teste é: ET = Y − p0 N → N (0,1) p 0 ⋅ (1 − p 0 ) N Exercício: Um analista político admite que certo candidato possa ter 20% dos votos. Feita uma sondagem, 14 dos 100 inquiridos revelaram tencionar votar no referido candidato. a) Que pode concluir para α = 5%? b) No caso de em 1000 inquiridos, 850 se declararem contra o candidato em causa, que conclusão se pode tirar para α = 1%? Resolução: a) Podemos fazer dois testes: bilateral e unilateral à esquerda Unilateral à esquerda Definição das hipóteses http://www.fe.up.pt/~leec2005 Bilateral Página 7 de 8 Teste de hipóteses Página 8 de 8 Hipótese nula: H0: p = 0.2 Hipótese alternativa: H1: p < 0.2 Hipótese nula: H0: p = 0.2 Hipótese alternativa: H1: p ≠ 0.2 Identificação da estatística de teste e caracterização da sua distribuição Y − p0 N ET = → N (0,1) p 0 ⋅ (1 − p 0 ) N Estabelecimento da regra de decisão, com especificação do nível de significância Temos α = 0.05. Temos α = 0.05. P ( z < VC ) = α ⇔ − z (α ) = −1.645 P ( z < VC E ) = α / 2 ⇔ − z (α / 2) = −1.96 Regra de decisão: ET ≥ VC não rejeitar H0 ET < VC rejeitar H0 e aceitar H1 P ( z > VC D ) = α / 2 ⇔ z (α / 2) = 1.96 Regra de decisão: VCE ≤ ET ≤ VCD não rejeitar H0 ET < VCE ou ET > VCD rejeitar H0 Cálculo da estatística de teste e tomada de decisão A ET é igual para os dois testes mas a regra de decisão é diferente. 0.14 − 0.2 ET = = −1.5 0 .2 × 0 .8 100 - 1.5 ≥ - 1.645 ⇒ não rejeitar H0 - 1.96 ≤ -1.5 ≤ 1.96 ⇒ não rejeitar H0 Não há evidência estatística para dizer que o analista político está errado. b) Neste caso, tanto a Definição das hipóteses como a Identificação da estatística de teste e caracterização da sua distribuição mantêm-se iguais. Estabelecimento da regra de decisão, com especificação do nível de significância Temos α = 0.01. Temos α = 0.01. P ( z < VC ) = α ⇔ − z (α ) = −2.33 P ( z < VC E ) = α / 2 ⇔ − z (α / 2) = −2.575 Regra de decisão: ET ≥ VC não rejeitar H0 ET < VC rejeitar H0 e aceitar H1 P ( z > VC D ) = α / 2 ⇔ z (α / 2) = 2.575 Regra de decisão: VCE ≤ ET ≤ VCD ET < VCE ou ET > VCD Cálculo da estatística de teste e tomada de decisão Y / N = (1000 - 850) / 1000 = 0.15 0.15 − 0.2 ET = = −3.95 0 .2 × 0 .8 1000 não rejeitar H0 rejeitar H0 - 3.95 < - 2.33 ⇒ rejeitar H0 e aceitar H1 − 3.95 < −2.575 ⇒ rejeitar H0 e aceitar H1 Podemos concluir que o analista estava errado. http://www.fe.up.pt/~leec2005 Página 8 de 8