Escola Politécnica de Pernambuco Departamento de Ensino Básico Capítulo 08 TESTES DE HIPÓTESES E SIGNIFICÂNCIA Prof. Sérgio Mário Lins Galdino http://epoli.pbworks.com/ Agenda Decisões Estatísticas; Hipóteses Estatísticas; Testes de Hipóteses e Significância; Erros do Tipo I e do Tipo II; Nível de Significância; Testes que Envolvem a Distribuição Normal; Agenda Testes Unilaterais e Bilaterais; Diferenças de Médias; Desvio Padrão; Erro Padrão; Testes para Diferença de Médias; Relação entre a Teoria da Estimação e o Teste de Hipóteses. Decisões Estatísticas São decisões tomadas sobre populações com base em amostras das mesmas. Hipóteses Estatísticas Para tomar decisões é útil formular hipóteses ou suposições sobre as populações em estudo. Tais hipóteses chamam-se hipóteses estatísticas e, em geral, consistem de afirmações sobre as distribuições de probabilidade das populações. Formulamos uma hipótese com o propósito de aceitá-la ou rejeitá-la. Testes de Hipóteses e Significância Quando admitimos que uma determinada hipótese é verdadeira e obtermos um resultado que difere substancialmente do resultado esperado, dizemos que as diferenças observadas são significativas. Os processos que nos permitem decidir entre aceitar ou rejeitar uma hipótese ou determinar se as amostras observadas diferem significativamente dos resultados esperados, são chamados de testes de hipóteses, testes de significância ou regras de decisão. Erros do Tipo I e do Tipo II Se rejeitamos uma hipótese quando ela deveria ser aceita, dizemos que foi cometido um erro do tipo I. Se, por outro lado, aceitamos uma hipótese quando ela deveria ser rejeitada, cometemos um erro do tipo II. Em qualquer dos casos ocorre um erro de julgamento. Nível de Significância O nível de significância representa a probabilidade de erro na rejeição de uma hipótese, ou seja, a probabilidade de um erro do tipo I. Região crítica: aceitação ou rejeição da hipótese O conjunto de valores dos extremos da estatística S exteriores ao intervalo obtido constitui o que se chama região crítica, região de rejeição da hipótese ou ainda região de significância. E o conjunto de valores extremos da estatística S interiores ao intervalo obtido pode então ser chamado de região de aceitação da hipótese ou região de não-significância. Testes que Envolvem a Distribuição Normal Suponha que sob a hipótese dada, a distribuição de amostragem de uma estatística S é uma distribuição normal com médias µS e desvio padrão σS. A distribuição desse padrão variável Z = (S - µS) / σS é a distribuição normal padrão (média 0, variância 1), e os valores extremos de Z determinam à rejeição da hipótese. Testes que Envolvem a Distribuição Normal Como indicado na figura, podemos estar 95% confiantes de que, se a hipótese for verdadeira, o escore z de uma amostra estatística S real estará entre - 1,96 a 1,96 (pois a área sob a curva normal entre esses dois valores é 0,95). Testes Unilaterais e Bilaterais Os testes são chamados bilaterais quando há interesse nos dois valores extremos da estatística S, ou seja, em seus escores z em ambos os lados da média. Já os testes unilaterais ocorrem quando há interesse em apenas um dos valores extremos de um ou de outro lado da média. A tabela abaixo mostra os valores críticos de z tanto para os testes unilaterais como para testes bilaterais, a vários níveis de significância. Valores críticos de z Valores críticos de z para os testes unilaterais e para testes bilaterais, a vários níveis de significância. Nível de Significância 0.10 0.05 0.01 0.005 Valores Críticos de z para testes unilaterais -1.28 ou 1.28 -1.645 ou 1.645 -2.33 ou 2.33 -2.58 ou 2.58 Valores Críticos de z para testes bilaterais -1.645 ou 1.645 -1.96 ou 1.96 -2.58 ou 2.58 -2.81 ou 2.81 Diferenças de Médias Comparação das médias de populações através da estimação das diferenças de médias e intervalo de confiança para esta diferença. Sejam: x1 , S1 , n1 e x2 , S2 , n2 a média, o desvio padrão e o tamanho amostral da 1ª e 2ª população respectivamente. A estimativa da diferença entre médias ( 1 2 ) é dada por ( x1 x2 ), sendo necessário determinar um erro padrão para esta estimativa. Desvio Padrão e Erro Padrão Define-se o desvio padrão combinado como sendo: DP n1S12 n2 S 22 n1 n2 2 E, a partir desse valor, define-se o erro padrão das diferenças nas médias como: EP DP 1 1 n1 n2 Teste para Diferença de Médias Um teste de hipótese para a diferença entre médias é H 0 : 1 2 0 assim como 1 2 0 Usa-se a variável: ( x1 x2 ) t EP distribuição t-Student com n1 n2 2 liberdade (pequenas amostras). graus de Exemplo Sejam as amostras das alturas de um grupo de estudantes com valores de média, desvio padrão e tamanho da amostra. Os valores com índice 1 referem-se aos homens e os com índice 2, às mulheres. As alturas estão medidas em centímetros. x1 178.85, S1 7.734, n1 20 x2 164.09, S 2 9.750, n2 17 Exemplo (continuação) Temos que: DP n1 S12 n2 S 22 n1 n2 2 20.(7,734) 2 17.(9,75) 2 DP 20 17 2 DP 8,964 EP DP 1 1 n1 n2 EP 8,964. EP 2,956 1 1 20 17 Exemplo (continuação) x1 x2 t SE 178,85 164,09 t 2,956 t 4,993 Graus de Liberdade: 20+17-2 = 35 Probabilidade de exceder o valor crítico (unilateral) 0.10 1. 3.078 0.05 0.025 0.01 0.005 0.001 6.314 12.706 31.821 63.657 318.313 35. 1.306 1.690 2.030 2.438 2.724 3.340 Conclui-se que: temos que rejeitar a hipótese = Afirma-se que as médias são diferente no nível 0.05 (t > 2.724) Tabela t-Student Graus de Liberdade 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 80% 90% 95% 99% 3.078 6.314 12.706 63.657 1.886 2.920 4.303 9.925 1.638 2.353 3.182 5.841 1.533 2.132 2.776 4.604 1.476 2.015 2.571 4.032 1.440 1.943 2.447 3.707 1.415 1.895 2.365 3.500 1.397 1.860 2.306 3.355 1.383 1.833 2.262 3.250 1.372 1.812 2.228 3.169 1.363 1.796 2.201 3.106 1.356 1.782 2.179 3.055 1.350 1.771 2.160 3.012 1.345 1.761 2.145 2.977 1.341 1.753 2.131 2.947 df infinity Graus de 80% Liiberdade 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 90% 95% 99% 1.337 1.746 2.120 2.921 1.333 1.740 2.110 2.898 1.330 1.734 2.101 2.878 1.328 1.729 2.093 2.861 1.325 1.725 2.086 2.845 1.323 1.721 2.080 2.831 1.321 1.717 2.074 2.819 1.319 1.714 2.069 2.807 1.318 1.711 2.064 2.797 1.316 1.708 2.060 2.787 1.315 1.706 2.056 2.779 1.314 1.703 2.052 2.771 1.313 1.701 2.048 2.763 1.311 1.699 2.045 2.756 1.310 1.697 2.042 2.750 80% 90% 95% 99% 1.282 1.645 1.96 2.576 Tabela t-Student Relação entre a Teoria da Estimação e o Teste de Hipóteses Relação entre a Teoria da Estimação e o Teste de Hipóteses 1,96 1,96 x x n n Pode-se notar que existe uma relação entre a teoria da estimação envolvendo intervalos de confiança e a teoria dos testes de hipóteses. Por exemplo, para aceitação de ao nível de 0,05 é equivalente ao resultado que conduz ao intervalo de confiança de 95 %