Janete Pereira Amador 1 1 Introdução Os métodos utilizados para realização de inferências a respeito dos parâmetros pertencem a duas categorias. Pode-se estimar ou prever o valor do parâmetro, através da estimação de parâmetros ou pode-se tomar decisões relativas ao mesmo, através de um teste de hipótese paramétrico (teste de significância). O teste de significância ou teste de hipóteses paramétrico consiste em verificar se a diferença entre um valor alegado de um parâmetro populacional e o valor de uma estatística amostral pode ser razoavelmente atribuído a variabilidade amostral ou se a discrepância é demasiadamente grande para ser encarada assim. A finalidade dos testes de hipóteses paramétrico é avaliar afirmações sobre os valores dos parâmetros populacionais. 2 Hipótese Estatística Uma hipótese estatística é uma afirmação que pode ou não ser verdadeira sobre o valor de um parâmetro ou sobre a distribuição de probabilidade de uma variável aleatória. Em estatística existem dois tipos de hipótese estatística. A Hipótese nula “H0” é a hipótese conservadora sempre pode ser expressa por uma igualdade a zero. Por exemplo: H 0 : 0 ou H 0 : 0 0 . A Hipótese alternativa “H1” é qualquer hipótese que diferi de uma dada hipótese nula é a Hipótese experimental. Por exemplo: H 1 : 0 ou H 1 : 0 ou H 1 : 0 . A Hipótese nula “H0” é uma afirmação que diz que o parâmetro populacional é tal como especificado (isto é, a afirmação é verdadeira). A Hipótese alternativa “H1” é uma afirmação que oferece uma alternativa à alegação (Isto é, o parâmetro é maior ou menor que o valor alegado) As hipóteses “H0” e “H1” são mutuamente excludentes, aceitando-se uma hipótese como verdadeira, a outra, automaticamente, será rejeitada. Portanto deve-se tomar cuidado para não ser cometido erros com relação aceitação e rejeição de “H0” e “H1”. 3 Tipos de Erro Quando se realiza um teste de hipótese, pode-se cometer dois tipos de erro: ­ Erro tipo I: consiste em rejeitar “H0” quando ela é verdadeira. Pode ser limitado pela escolha do nível de significância que probabilidade de rejeitar “H0” quando essa for verdadeira. ­ Erro tipo II: Consiste em aceitar “H0”, quando ela é falsa. O quadro a seguir mostra as possibilidades de se cometer os erros tipo I e tipo II. Realidade Ho Verdadeira Ho Falsa Aceitar Ho Decisão correta (1 - ) Erro Tipo II ( ) Decisão Rejeitar Ho Erro Tipo I ( ) Decisão Correta (1 - )/Eficácia Janete Pereira Amador 2 O nível de significância do teste (probabilidade de rejeitar “H0” quando essa for verdadeira) é fixada antes da extração das amostras. Os valores mais comuns para são: 0.01, 0.05 e 0.10 ou 1%, 5% e 10%. Se por exemplo, ao delinear-se um teste, escolhe-se = 0.05 ou 5%, significa que em cerca de 5% rejeitar-se-ia erroneamente H0. O coeficiente de confiança, indicado por (1 - ), é a probabilidade de que a hipótese nula H0 não seja rejeitada quando de fato for verdadeira e não deve ser rejeitada. Em termos de metodologia do teste de hipóteses, esse coeficiente representa a probabilidade de se concluir que o determinado valor do parâmetro que está sendo testado para hipótese nula seja plausível. O risco a probabilidade de se cometer um erro Tipo II identificado por é diferente do erro Tipo I que pode ser controlado pela seleção de . A probabilidade de se cometer o erro Tipo II depende da diferença entre o valor da hipótese e os verdadeiros parâmetros da população. A eficácia de um teste estatístico denotada por 1 - , é a probabilidade de se rejeitar a hipótese nula quando ela é de fato falsa e deveria ser rejeitada. A probabilidade “p” é a área, abaixo de uma curva de probabilidade, compreendida entre a estatística calculada e o infinito mais próximo, no caso do teste unilateral. Se o teste for bilateral, considera-se este valor multiplicado por dois. Se p , rejeita-se H0 (quanto menor o valor de “p” mais significativo é o teste), e se p , aceita-se H0 3.1 Controle dos erros Tipo I e Tipo II Para controlar e valem as seguintes considerações práticas: ­ Para fixo, um aumento do tamanho “n” da amostra ocasiona uma redução de ; isto é, uma amostra maior reduz a chance de cometermos o erro de não rejeitar a hipótese nula quando ela for falsa. ­ Para um tamanho “n”, fixo, de amostra, uma diminuição de acarreta um aumento de ; reciprocamente, um aumento de acarreta uma diminuição de . ­ Para reduzir e , devemos aumentar o tamanho da amostra. 4 Teste de Hipóteses Unilateral e Bilaterais Dependendo da hipótese alternativa, os testes são classificados como unilaterais e bilaterais. 4.1 Teste de hipóteses bilateral Os testes bilaterais se usam sempre que há divergência crítica em ambas as direções, tal como ocorreria na fabricação de roupas, onde camisas muito grandes ou muito pequenas não correspondem à determinação do padrão. Outro exemplo é o caso em que peças devem ajustar-se uma a outra, como o parafuso e porca. Uma variação excessiva ocasionará seja um ajuste muito frouxo, de modo que as peças não permanecerão unidas, ou um ajuste excessivo impedindo a conjugação das peças. Assim por exemplo: ­ H 0 : 0 contra H 1 : 0 é um teste bilateral, esquematicamente: Janete Pereira Amador 3 Valor tabelado também chamado de valor crítico, separa a região de aceitação H0 (RA H0) da região de rejeição (RR H0). 4.2 Teste de hipóteses unilateral a direita O teste unilateral a direita é útil para testar se determinado padrão máximo não foi excedido Como exemplo seria: teor máximo de gordura permitida em determinado tipo de leite, radiação emitida por usinas nucleares, número de passas defeituosas de uma remessa de certa mercadoria, quantidade de poluição atmosférica emitida por uma determinada fabrica. Assim por exemplo: H 0 : 0 contra , H 1 : 0 ( 0 é o valor suposto para o parâmetro) é um teste unilateral a direita, esquematicamente: 4.2 Teste de hipóteses unilateral a esquerda O teste unilateral a esquerda é útil para verificar se determinado padrão mínimo foi atingido. Como exemplo seria: conteúdo mínimo de gordura no leite, peso líquido de pacotes de determinado produto, vida de um produto tal qual como especificado no certificado de garantia. Assim por exemplo: ­ H 0 : 0 contra H 1 : 0 é um teste unilateral a esquerda, esquematicamente: 5 Procedimentos para Realização de um Teste de Hipóteses Para realizar um teste de hipótese sugere-se seguir as seguintes etapas: 1) Formular as hipóteses; Janete Pereira Amador 2) 3) 4) 5) 6) 4 Identificara a estatística do teste; Determinar o nível de significância; Calcular a estatística utilizando os valores amostrais; Comparar as estatística calculada com a estatística tabelada; Concluir. 5.1 Teste de hipóteses para média O objetivo do teste de significância para médias é avaliar afirmações feitas a respeito de médias populacionais. Há basicamente três tipos de afirmação que se podem fazer a cerca das médias populacionais e cada tipo requer um tipo diferente de avaliação. Uma afirmação pode dizer respeito a média de uma única população; a avaliação envolve então um teste de uma amostra. Ou pode-se afirmar que a média de duas populações são iguais; tem-se então um teste de duas amostras. Finalmente pode-se afirmar que a as médias de mais de duas populações são iguais, o que envolve um teste de K amostras (Análise de Variância) que será visto em um capítulo aparte. 5.1.1. Teste de significância de uma amostra para uma média amostral contra um valor paramétrico Caso I - Variância populacional conhecida 2 e/ou n > 30 De acordo com o teorema do limite central, se obtemos amostras grandes (n > 30) (de qualquer população com qualquer distribuição), a distribuição das médias pode ser aproximada por uma distribuição normal. Sendo assim, distribuição das médias amostrais será aproximadamente normal com media e desvio padrão n. Em um teste de hipóteses, o valor de corresponde a hipótese nula, e o valor do desvio padrão populacional deve ser conhecido. Se é desconhecido e as amostras são grandes, podemos usar o desvio padrão amostral “S” em substituição σ , porque grandes amostras aleatórias tendem a representar a população. Assim temos: Retira-se uma amostra de tamanho n e calcula-se X . X 0 Calcula-se o valor da estatística Z c n Sob a hipótese nula, tem-se que Zc possui uma distribuição normal padrão.Portanto, Rejeita-se H0 se Z c Z 2 (isto é, se Z < Z 2 ou Z Z 2 ) Aceita-se H0 se Z c Z 2 (isto é, Z 2 Z c 2 ), onde é o nível de significância do teste. Ex1: Uma máquina automática para encher pacotes de café enche-os segundo uma distribuição normal, com média e variância sempre igual a 400g 2. A máquina foi regulada para = 500g. Colhe-se, periodicamente uma amostra de 16 pacotes para verificar se a produção está sob controle, isto é, se = 500g ou não. Se uma dessas amostras apresentasse uma média amostral de X = 492 g, você pararia ou não a produção para regular máquina, considerando o nível de significância de 1%? Solução Janete Pereira Amador 5 0,01 2 0,005 = 2,58 H 0 : 500 H 1 : 500 492 500 Zc 1,6 400 16 Conclusão: Aceita-se a hipótese nula, ou seja, não existe evidências de que a máquina esta embalando pacotes de café com uma média diferente de 500g, sendo assim a máquina não necessita ser parada. Ex2: A tensão de ruptura dos cabos produzidos por um fabricante apresenta média de 1800 kg e desvio padrão de 100 kg. Mediante nova técnica no processo de fabricação, proclamase que a tensão de ruptura pode ter aumentado. Para testar esta declaração, ensaiou-se uma amostra de 50 cabos, tendo-se determinado a tensão média de ruptura de 1850 kg. Pode-se confirmar a declaração ao nível de significância de 0,01? Solução 0,01 2 0,005 = 2,33 H 0 : 1800 H 1 : 1800 1850 1800 50 Zc 3,53 100 14,14 50 Ao nível de significância de 0,01, a regra de decisão é: Rejeita-se H0 se Z c Z 0, 01 = 2,33 Aceita-se H0 se Z c Z 0,01 < 2,33 Conclusão: Rejeita-se H0, e confirma a declaração de que a tenção de ruptura foi aumentada. Caso II - Variância populacional desconhecida 2 e/ou n 30 Neste caso, a população original deve ter distribuição essencialmente normal, pois de acordo com o teorema do limite central.”Se a população sob amostragem tem distribuição normal, a distribuição das médias amostrais também será normal para todos os tamanhos de amostras”. Desta forma teremos que usar a distribuição t de Student utilizada para trabalhar com pequenas amostras, quando a variância populacional é desconhecida. Condições para usar a distribuição t de Student ­ A amostra é pequena n 30 2 ­ é desconhecido ­ A população original tem distribuição essencialmente normal. Desta forma para um teste de hipótese para medis têm-se: Janete Pereira Amador 6 . Sob a hipótese nula, tem-se que t possui uma distribuição t de Student com n-1 graus de liberdade. Portanto, X 0 Calcula-se a estatística: t c S n Se o teste tiver uma hipótese alternativa unilateral ( H 1 : 0 ou H 1 : ) o teste deverá rejeitar unilateralmente ( t t ,( n1) ou t t ,( n 1) ) Ex: Um fabricante afirma que seus cigarros contém não mais que 30 mg de nicotina. Uma amostra de 25 cigarros fornece média de 31,5 mg e desvio padrão de 3 mg. Ao nível de 5%, os dados refutam ou não a afirmação do fabricante? Solução: Neste caso, as hipóteses são: H 0 : 30 H 1 : 30 Como não se conhece a variância populacional, e esta foi estimada pela amostra, devemos X 0 utilizar a estatística t de Student: t c S n A regra de decisão é dada por: Rejeita-se H 0 se t t ,( n 1 t0,05, 24 1,711 Aceita-se H 0 se t 1,711 31,5 30 1,5 tc 2,5 3 0,6 25 Conclusão: Rejeita-se H0, ou seja, há evidências de que os cigarros contenham mais de 30g de nicotina. 5.1.2 Teste de significância para a diferença entre duas médias populacionais independentes. Caso I – Amostras grandes n >30 e/ou 12 e 22 (conhecidas) Os testes de duas amostras são usados para decidir se as médias de duas populações são iguais. Para a realização do teste exige que as duas amostras sejam independentes, uma de cada população. Duas amostras são independentes se a amostra extraída de uma das populações não tem qualquer relação com a amostra extraída da outra. Esses testes são freqüentemente usados para comparar dois métodos de ensino, duas marcas, duas cidades, dois distritos escolares, e outros casos análogos. Ao testar as hipóteses para diferença entre duas médias supõe-se que: Janete Pereira Amador 7 ­ As duas amostras são independentes ­ O tamanho das duas amostras são grandes n1 > 30 e n2 > 30 e/ou as variâncias são conhecidas. De acordo com o teorema do limite central quando o tamanho da amostra for maior do que 30 a distribuição normal constitui aproximação razoável da distribuição das médias amostrais.Por raciocínio análogo os valores de x1 x 2 também tendem para uma distribuição normal com media 1 2 . Quando ambas as amostras são grandes, a propriedade seguinte das variâncias leva-nos a concluir que os valores de x1 x2 tem um 12 n1 desvio padrão dado por: n 2 2 . 2 A variância da diferença entre duas variáveis aleatórias independentes é igual a soma das variâncias destas variáveis. Isto é, a variância dos valores amostrais x1 x 2 tende a ser igual a x21 x22 desde que x1 e x2 sejam independentes. Assim, 2x 1 x2 Como Z Z estatistica é um escore amostral média padronizado populaciol 12 2 2 n1 n2 corresponde x21 x22 que a: desta forma vem; desviopadrão da estatística amostral Z x 1 x2 1 2 12 2 2 n1 n2 Quanto às hipóteses temos que: A hipótese nula pode ser de que as duas populações tem médias iguais. H 0 : 1 2 Enquanto que as alternativas podem ser: H 1 : 1 2 ; H 1 : 1 2 e H1 : 1 2 note que: H 1 : 1 2 é equivalente a H1 : 1 2 Ex: Um fabricante de pneus faz dois tipos. Para o tipo A, = 2500 milhas, e para o tipo B, = 3000 milhas. Um táxi testou 50 pneus do tipo A e 40 do tipo B, obtendo 24.000 milhas e 2.600 milha de duração média dos respectivos tipos. Adotando-se um risco =4%, testar a hipótese de que a vida média dos dois tipos é a mesma. Solução: H 0 : 1 2 0 1 2 H1 : 1 2 0,04 2 0,02 Aceita-se-se H 0 se Z 2 Z Z 2 Rejeita-se H 0 se Z Z ou Z Z 2 Z = 2,05 2 2 Janete Pereira Amador 8 24.000 26.000 2000 2500 3000 353,60 474,68 50 40 Z c 2,41 Conclusão: Rejeita-se H0, ou seja, existe diferença em relação a vida média do dois tipos de pneus. Zc 5.1.3. Teste de significância para a diferença entre duas médias de populações dependentemente relacionadas Os resultados de duas amostras constituem dados emparelhados ou pareados quando estão relacionados dois a dois segundo algum critério que introduz uma influência marcante entre os diversos pares, que supõe-se, porém influir igualmente sobre os valores de cada par. Sendo assim, como os dados das duas amostras estão emparelhados, tem sentido calcular a diferença di correspondente a cada par de valores, reduzindo assim os dados a uma única amostra n de diferenças. Desta forma testa-se a hipótese de que a diferença entre as médias das duas populações seja igual a um certo valor Δ equivale atestar a hipnotese de que a media de todas as diferenças (referente as populações) seja igual a Δ, o que decorre das propriedades da média. Ou seja, testa-se simplesmente a hipótese H 0 : d Δ contra uma hipótese alternativa H 1 que poderá corresponder a um teste unilateral ou bilateral conforme seja o interesse. Ao tomar as diferenças d i, reduzimos o problema ao teste de uma única média recaindo no item acaba recaindo no item 5.1.1 – Caso II. Logo, a expressão vista neste item, pode ser aplicada à amostra das diferenças, realizando-se teste simplesmente através da comparação t-Student com o valor crítico obtido em função de com n-1 graus de liberdade. As notações para o teste de hipóteses para duas amostras dependentes correspondem; d média das diferenças d para população de dados emparelhados. d = valor médio das diferenças di (x-y) para os dados amostrais emparelhados é dado por di . d n S d desvio padrão das diferenças d i para dados amostrais emparelhados d 2 d 2 i i n . n 1 n= números de pares de dados. Sd d d Sd n Ex: Dez cobaias adultas foram submetidas ao tratamento com certa ração durante uma semana. Os animais foram identificados sendo mantidos em gaiolas individuais. Os pesos, em gramas, anotados no inicio e no final do experimento, designados respectivamente, por x e y foram anotados, sendo estes: 1 2 3 4 5 6 7 8 9 10 Cobaia 635 704 662 560 603 745 698 575 633 669 xi (peso inicial) Sendo assim, a equação para o teste é da por t c Janete Pereira Amador 9 640 712 681 558 610 740 707 585 635 682 yi(peso final) Testar a hipótese a 1% de que a ração não contribui para o aumento de peso dos animais H0, contra a hipótese alternativa H1 o peso dos animais foi afetado pela ração (o peso inicial deve ser menor que o final). Solução: H 0 : d 0 H1 : d 0 t 9;1% = 2,821 Cobaia xi (peso inicial) 1 2 3 4 5 6 7 8 9 10 Total 857 Sd 65 10 9 yi(peso final) di d i2 640 712 681 558 610 740 707 585 635 682 -5 -8 -19 2 -7 5 -9 -10 -2 -12 -65 25 64 361 4 49 25 81 100 4 144 857 635 704 662 560 603 745 698 575 633 670 2 48,27 6,94 65 6,5 10 6,5 6,6 2,96 6,94 2,34 10 d tc Conclusão: Rejeita-se H0 , ou seja, com 99% de confiança conclui-se que o uso da ração contribui para o aumento dos pesos dos animais. 5.2 Teste de Hipótese para proporção Os testes para proporções são adequados quando os dados sob análise consistem em contagens ou freqüências de itens em duas ou mais classes. A finalidade de tais testes é avaliar afirmações sobre a proporção ou percentagem de uma população. Os testes se baseiam na premissa de que uma proporção amostral, isto é, x ocorrências em n observações, ou x/n, será igual a verdadeira proporção populacional. Os testes focalizam geralmente as diferenças entre um número esperado de ocorrências (supondo-se verdadeira uma afirmação) e o número efetivamente observado. A diferença é então comparada com a variabilidade prescrita por uma distribuição amostral baseada na hipótese de que H0 é realmente verdadeira. Em muitos aspectos, os testes para proporção se assemelham grandemente aos testes para médias; apenas, nos testes para proporções, os dados amostrais se apresentam e termos de contagens, ao invés de medidas. Por exemplo, os testes tanto para médias como para proporções podem ser usados para avaliar alegações sobre: Janete Pereira Amador 10 ­ ­ ­ Um parâmetro de uma única população (teste de uma amostra). Igualdade de parâmetros de duas amostras (teste de duas amostras ). Igualdade de parâmetros de mais de duas amostras (teste de k amostras) Além disso, para grandes amostras, a distribuição amostral apropriada para testes de proporções de uma e duas amostras é aproximadamente normal, tal como no caso de testes para médias de uma e duas amostras. 5.2.1 Teste de significância de uma amostra para a proporção Seja a proporção dos elementos de uma população que possuem uma determinada característica. Por exemplo, é igual a proporção ou percentagem dos habitantes, de uma determinada localidade, que possuem automóvel. Se quisermos testar a hipótese de que essa proporção é igual a determinado valor, contra a alternativa dessa proporção ser maior de que o valor especificado, lança-se as hipóteses: H0: = 0 Contra uma das hipóteses alternativas: H1 : > 0 H1 : 0 H1 : 0 Um bom estimador do parâmetro é a proporção amostral P, que para grandes amostras segue uma distribuição aproximadamente normal com média e a variância (1 ) (1 ) ou seja, P ~ N , . n n Portanto pode-se usar a variável normal padronizada. P ~ N (0,1) Z sendo: (1 ) n número de sucessos na amostra x P= = n tamanho da amostra proporção de sucesso a partir da hipótese nula Para proceder ao teste de hipóteses, como nos casos anteriores, o valor de Zc. calculado deve ser comparado com o de Z dado em função de , o nível de significância do teste. “Ex: Um industrial deseja certificar-se de que a fração de mercado que prefere seu produto ao de seu concorrente é superior a 70%. Para tanto colheu uma amostra aleatória de 165 opiniões, das quais 122 lhe foram favoráveis. Pode o industrial ficar satisfeito com esse resultado, adotado o nível de significância de 5%?” Solução: H0 : = 70% = 0.7 H1 : > 0.7 x 122 P= = 0,739 n 165 Janete Pereira Amador Z P 11 0,739 0,7 (1 ) 0,7(1 0,7 ) n 165 5% z 165 . Teste unilateral 0,039 0,50 0,0778 Conclusão: Não há evidência, ao nível de 5%, de que a proporção seja superior a 70%. 5.2.2 Teste de significância para a diferença entre duas poporções populacionais independentes. Sejam P1 e P2 as proporções obtidas em duas amostras de tamanho n1 e n2 . Se quisermos testar a hipótese de que as proporções 1 1 e 2 das proporções das quais foram retiradas as amostras são iguais, formula-se as hipóteses de acordo com o tipo de deste que poderá ser: Teste bicaudal Teste unicaudal a direita Teste unicaudal a esquerda H0 : 1 2 H 0 : 1 2 H0 : 1 2 H1 : 1 2 H1 : 1 2 H1 : 1 2 Para realizar o teste usa-se a variável padronizada: ( P1 P2 ) ( 1 2 ) Z , que para grandes amostras segue uma 1 (1 ) 2 (1 2 ) n1 n2 distribuição aproximadamente normal com média zero e variância 1. Comparando-se o valor calculado Z (Zcalc) com o valor crítico, obtido na tabela da distribuição normal padronizada, a um nível dado de significância , decide-se pela rejeição ou não de H0. Deve-se observar que por H0: 1 - 2 = 0 e assim caso esses parâmetros sejam desconhecidos, pode-se substituí-los pelos valores estimados P1 e P2 (são os estimadores) de na população) no cálculo de Z. Assim: p1 p 2 x x Zc sendo : P1 1 e P1 2 n1 n2 p1 (1 p1 ) p (1 p 2 ) 2 n1 n2 Ex: Um empresário deseja saber se o percentual de satisfação de seus clientes em relação a dois produtos oferecidos por sua empresa são similares. Para isso entrevistou 150 pessoas, das quais 80 disseram estar satisfeitas com o produto A e 100 com o produto B. Use = 5% e conclua a respeito. Solução: Janete Pereira Amador 12 H0 : 1 2 H1 : 1 2 0,05 0,025 =1,96 teste bicaudal 2 80 PA 0,533 150 100 PB 0,666 150 Zc 0,533 0,666 0,133 0,133 1,821 0,0730 0,533(1 0,533) 0,66(1 0,666) 0,00311 0,00222 80 100 Conclusão: Aceita-se H0, ou seja, não existe diferença entre o percentual e satisfação dos clientes em relação aos produtos A e B.