Teste de Hipótese e Intervalo de Confiança Suponha que estamos interessados em investigar o tamanho da ruptura em um músculo do ombro... para determinar o tamanho exato da ruptura, é necessário um exame de raio-x. Qual seria o tamanho médio da extensão desta lesão? Considere algumas amostras de pacientes: 4, 3.6, 2, 1.4, 2.7, 4.3 com média = 3 1, 2.8, 3.1, 4.3, 2.6, 1.2 com média = 2.5 3.5, 4.3, 1.7, 5.2, 2.3, 4.9 com média = 3.65 Todas as 3 amostras têm 6 observações, mas cada uma possui uma média diferente. Qual usar? Em muitos problemas reais, precisamos fazer conjecturas sobre um parâmetro e verificar se essa conjectura pode ou não ser rejeitada. Estas conjecturas são chamadas de hipóteses. E este procedimento de tomada de decisão sobre uma hipótese é chamado de teste de hipótese. Poderíamos fazer conjecturas do tipo: a média é igual a 2? a média é maior que 3.2? a média é menor que 2.9? Os três exemplos são hipóteses e precisamos testar estas hipóteses para verificar se fazem ou não sentido. Observe que: O tamanho da ruptura em um músculo do ombro é uma variável aleatória... que possui uma distribuição de probabilidade associada a ela. mas a média do tamanho da ruptura também é uma variável aleatória... que, da mesma forma, possui uma distribuição de probabilidade associada. Vamos fazer uma pausa para refletir sobre o que temos aprendido… começamos representando matematicamente; os dados calculando estatísticas descritivas para “olhar para os dados”; já sabemos que estes dados são variáveis aleatórias que possuem uma distribuição de probabilidade. Voltando as amostras: 4, 3.6, 2, 1.4, 2.7, 4.3 com média = 3 1, 2.8, 3.1, 4.3, 2.6, 1.2 com média = 2.5 3.5, 4.3, 1.7, 5.2, 2.3, 4.9 com média = 3.65 Note que para cada amostra da VA tamanho da ruptura, existe uma amostra da VA média do tamanho da ruptura. Formalmente… Uma hipótese estatística é uma afirmação sobre os parâmetros de uma ou mais populações. Um parâmetro pode ser a média, a variância ou uma proporção da população. É importante dizer que as hipóteses são afirmações sobre a população e não sobre a amostra. População População Eu acho que a idade média desta população é 50 anos (hipótese). População Eu acho que a idade média desta população é 50 anos (hipótese). Amostra aleatória Media X = 20 População Eu acho que a idade média desta população é 50 anos (hipótese). Amostra aleatória Media X = 20 Está longe. Rejeita a hipótese! então: ... Então rejeitamos a hipótese de = 50. É improvavel que tenhamos uma média amostral com este valor ... ... se a média da população é esta 20 = 50 Sample Mean Hipótese Nula É o que queremos testar. Chamamos de H0. Hipótese Alternativa é o complemento de H0, denotada por Ha. Suponha que queremos testar a hipótese de que a idade média seja igual a 50. H0: = 50 Ha: 50 Ha contempla valores maiores e menores que 50. Temos aqui um teste bilateral. Teremos que nos preocupar com os dois lados da distribuição de probabilidade. Podemos testar usando desigualdades H0: < 50 Ha: 50 ou H0: > 50 Ha: 50 Ha contempla valores maiores ou menores ou iguais que 50. Temos aqui dois testes unilaterais. Teremos que nos preocupar apenas com o lado em questão da distribuição de probabilidade. Quando decidir quando devemos ou não rejeitar uma hipótese nula? H0: = 50 Ha: 50 Se nossas amostras apresentarem médias de idade, por exemplo, 50.2 ou 49.8, talvez não fosse uma boa idéia rejeitar H0. Vamos arbitrar estes limites como 48 e 52, isto é: As regiões para as quais a média é menor que 48 ou maior que 52 são ditas as regiões de rejeição do teste. Definida a região de rejeição, precisa-se estabelecer uma estatística para o teste. Neste caso, a estatística é a média amostral. Seleciona-se uma amostra e calcula-se a média. Se ela cair na região de rejeição, rejeita-se H0. Caso contrário não há como recusar a hipótese nula. Definições A rejeição da hipótese nula H0, quando ela for verdadeira, é definida como erro tipo I. A falha em rejeitar a hipótese nula H0, quando ela é falsa, é definida como erro tipo II. Algumas considerações: Em geral, o erro tipo I é mais sério que o erro tipo II. A hipótese nula é verdadeira até que se prove o contrário. A hipótese nula é escolhida de forma a ser o que o projetista quer negar. Nível de Significância Denominado por . É a probabilidade do erro tipo I, isto é, = Prob(erro tipo I). Os valores típicos de são: 0,01, 0,05, 0,10. é também conhecido como “tamanho do teste”. Caracteriza a região de rejeição. Define os valores pouco prováveis da estatística da amostra se a hipótese nula é verdadeira. Teste Uni-caudal Sampling Distribution Nível de confiança (região de não rejeição) Rejection Região de Region rejeição 1- Nonrejection Region valor Critical crítico Value Ho Value Não rejeita a hipótese nula Sample Statistic Valor observado da estatística Teste Uni-caudal Sampling Distribution Nível de confiança (região de não rejeição) Rejection Região de Region rejeição 1- Nonrejection Region valor Critical crítico Valor observado Value da estatística Ho Value Rejeita a hipótese nula Sample Statistic Teste Bi-caudal Região de Rejection rejeição Region Rejeita a hipótese nula Região de Rejection rejeição Region 1- 1/2 1/2 Nonrejection Region Valor observado da estatística Critical valor Value crítico Ho Sample Statistic Value Critical Valor Value crítico Teste de Hipótese – Passo a Passo Identifique o parâmetro de interesse; Estabeleça H0 e Ha; Estabeleça o nível de significância que determinará a região de rejeição; Estabeleça uma estatística apropriada de teste; Calcule o valor da estatística; Decida de H0 deve ou não ser rejeitada.