Prof. Janete Pereira Amador 1 1 Introdução Os métodos utilizados para realização de inferências a respeito dos parâmetros pertencem a duas categorias. Pode-se estimar ou prever o valor do parâmetro, através da estimação de parâmetros ou pode-se tomar decisões relativas ao mesmo, através de um teste de hipótese paramétrico (teste de significância). O teste de significância ou teste de hipóteses paramétrico consiste em verificar se a diferença entre um valor alegado de um parâmetro populacional e o valor de uma estatística amostral pode ser razoavelmente atribuído a variabilidade amostral ou se a discrepância é demasiadamente grande para ser encarada assim. A finalidade dos testes de hipóteses paramétrico é avaliar afirmações sobre os valores dos parâmetros populacionais. 2 Hipótese Estatística Uma hipótese estatística é uma afirmação que pode ou não ser verdadeira sobre o valor de um parâmetro ou sobre a distribuição de probabilidade de uma variável aleatória. Em estatística existem dois tipos de hipótese estatística. A Hipótese nula “H0” é a hipótese conservadora sempre pode ser expressa por uma igualdade a zero. Por exemplo: H 0 : 0 ou H 0 : 0 0 . A Hipótese alternativa “H1” é qualquer hipótese que diferi de uma dada hipótese nula é a Hipótese experimental. Por exemplo: H 1 : 0 ou H 1 : 0 ou H 1 : 0 . A Hipótese nula “H0” é uma afirmação que diz que o parâmetro populacional é tal como especificado (isto é, a afirmação é verdadeira). A Hipótese alternativa “H1” é uma afirmação que oferece uma alternativa à alegação (Isto é, o parâmetro é maior ou menor que o valor alegado) As hipóteses “H0” e “H1” são mutuamente excludentes, aceitando-se uma hipótese como verdadeira, a outra, automaticamente, será rejeitada. Portanto deve-se tomar cuidado para não ser cometido erros com relação aceitação e rejeição de “H0” e “H1”. 3 Tipos de Erro Quando se realiza um teste de hipótese, pode-se cometer dois tipos de erro: ­ Erro tipo I: consiste em rejeitar “H0” quando ela é verdadeira. Pode ser limitado pela escolha do nível de significância que probabilidade de rejeitar “H0” quando essa for verdadeira. ­ Erro tipo II: Consiste em aceitar “H0”, quando ela é falsa. O nível de significância do teste (probabilidade de rejeitar “H0” quando essa for verdadeira) é fixada antes da extração das amostras. Os valores mais comuns para são: 0.01, 0.05 e 0.10 ou 1%, 5% e 10%. Se por exemplo, ao delinear-se um teste, escolhe-se = 0.05 ou 5%, significa que em cerca de 5% rejeitar-se-ia erroneamente H0. O coeficiente de confiança, indicado por (1 - ), é a probabilidade de que a hipótese nula H0 não seja rejeitada quando de fato for verdadeira e não deve ser rejeitada. Em termos de metodologia do teste de hipóteses, esse coeficiente representa a probabilidade de Prof. Janete Pereira Amador 2 se concluir que o determinado valor do parâmetro que está sendo testado para hipótese nula seja plausível. 4 Teste de Hipóteses Unilateral e Bilaterais Dependendo da hipótese alternativa, os testes são classificados como unilaterais e bilaterais. 4.1 Teste de hipóteses bilateral Os testes bilaterais se usam sempre que há divergência crítica em ambas as direções, tal como ocorreria na fabricação de roupas, onde camisas muito grandes ou muito pequenas não correspondem à determinação do padrão. Outro exemplo é o caso em que peças devem ajustar-se uma a outra, como o parafuso e porca. Uma variação excessiva ocasionará seja um ajuste muito frouxo, de modo que as peças não permanecerão unidas, ou um ajuste excessivo impedindo a conjugação das peças. Assim por exemplo: ­ H 0 : 0 contra H 1 : 0 é um teste bilateral, esquematicamente: Valor tabelado também chamado de valor crítico, separa a região de aceitação H0 (RA H0) da região de rejeição (RR H0). 4.2 Teste de hipóteses unilateral a direita O teste unilateral a direita é útil para testar se determinado padrão máximo não foi excedido Como exemplo seria: teor máximo de gordura permitida em determinado tipo de leite, radiação emitida por usinas nucleares, número de passas defeituosas de uma remessa de certa mercadoria, quantidade de poluição atmosférica emitida por uma determinada fabrica. Assim por exemplo: H 0 : 0 contra , H 1 : 0 ( 0 é o valor suposto para o parâmetro) é um teste unilateral a direita, esquematicamente: Prof. Janete Pereira Amador 3 4.2 Teste de hipóteses unilateral a esquerda O teste unilateral a esquerda é útil para verificar se determinado padrão mínimo foi atingido. Como exemplo seria: conteúdo mínimo de gordura no leite, peso líquido de pacotes de determinado produto, vida de um produto tal qual como especificado no certificado de garantia. Assim por exemplo: ­ H 0 : 0 contra H 1 : 0 é um teste unilateral a esquerda, esquematicamente: 5 Procedimentos para Realização de um Teste de Hipóteses Para realizar um teste de hipótese sugere-se seguir as seguintes etapas: 1) Formular as hipóteses; 2) Identificara a estatística do teste; 3) Determinar o nível de significância; 4) Calcular a estatística utilizando os valores amostrais; 5) Comparar as estatística calculada com a estatística tabelada; 6) Concluir. 5.1 Teste de hipóteses para média O objetivo do teste de significância para médias é avaliar afirmações feitas a respeito de médias populacionais. Há basicamente três tipos de afirmação que se podem fazer a cerca das médias populacionais e cada tipo requer um tipo diferente de avaliação. Uma afirmação pode dizer respeito a média de uma única população; a avaliação envolve então um teste de uma amostra. Ou pode-se afirmar que a média de duas populações são iguais; tem-se então um teste de duas amostras. Finalmente pode-se afirmar que a as médias de mais de duas populações são iguais, o que envolve um teste de K amostras Análise de Variância. 5.1.1. Teste de significância de uma amostra para uma média amostral contra um valor paramétrico De acordo com o teorema do limite central, se obtemos amostras grandes (n > 30) (de qualquer população com qualquer distribuição), a distribuição das médias pode ser aproximada por uma distribuição normal. Sendo assim, distribuição das médias amostrais será aproximadamente normal com media e desvio padrão n. Em um teste de hipóteses, o valor de corresponde a hipótese nula, e o valor do desvio padrão populacional deve ser conhecido. Se é desconhecido e as amostras são Prof. Janete Pereira Amador 4 grandes ( n 30 , podemos usar o desvio padrão amostral “S” em substituição σ , porque grandes amostras aleatórias tendem a representar a população com distribuição normal. Retira-se uma amostra de tamanho n e calcula-se X . X 0 X 0 ou t c S n n Sob a hipótese nula, tem-se que Zc possui uma distribuição normal padrão.Portanto, Rejeita-se H0 se Z c Z 2 (isto é, se Zc < Z 2 ou Z c Z 2 ) ou Calcula-se o valor da estatística Z c Rejeita-se H0 se t c t 2 , n1 (isto é, se tc< t 2 , n1 ou t 2 t 2 , n 1 ) Aceita-se H0 se Z c Z 2 (isto é, Z c Z 2 ), ou Aceita-se H0 se t c t 2 , n 1 (isto é, t c t 2 , n 1 ), onde é o nível de significância do teste. Ex: Uma máquina automática para encher pacotes de café enche-os segundo uma distribuição normal, com média e variância ( 2 ) sempre igual a 400g2. A máquina foi regulada para = 500g. Colhe-se, periodicamente uma amostra de 36 pacotes para verificar se a produção está sob controle, isto é, se = 500g ou não. Se uma dessas amostras apresenta-se uma média amostral de X = 492 g, você pararia ou não a produção para regular máquina, considerando o nível de significância de 1%? Ex: Um fabricante afirma que seus cigarros contém não mais que 30 mg de nicotina. Uma amostra de 25 cigarros fornece média de 31,5 mg e desvio padrão de 3 mg. Ao nível de 5%, os dados refutam ou não a afirmação do fabricante? 5.2Teste de Hipótese para proporção Os testes para proporções são adequados quando os dados sob análise consistem em contagens ou freqüências de itens em duas ou mais classes. A finalidade de tais testes é avaliar afirmações sobre a proporção ou percentagem de uma população. Os testes se baseiam na premissa de que uma proporção amostral, isto é, x ocorrências em n observações, ou x/n, será igual a verdadeira proporção populacional. Os testes focalizam geralmente as diferenças entre um número esperado de ocorrências (supondo-se verdadeira uma afirmação) e o número efetivamente observado. A diferença é então comparada com a variabilidade prescrita por uma distribuição amostral baseada na hipótese de que H0 é realmente verdadeira. Prof. Janete Pereira Amador 5 Seja a proporção dos elementos de uma população que possuem uma determinada característica. Por exemplo, é igual a proporção ou percentagem dos habitantes, de uma determinada localidade, que possuem automóvel. Se quisermos testar a hipótese de que essa proporção é igual a determinado valor, contra a alternativa dessa proporção ser maior de que o valor especificado, lança-se as hipóteses: H0: = 0 Contra uma das hipóteses alternativas: H1 : > 0 H1 : 0 H1 : 0 Um bom estimador do parâmetro é a proporção amostral P, que para grandes amostras segue uma distribuição aproximadamente normal com média e a variância (1 ) (1 ) ou seja, P ~ N , . n n Portanto pode-se usar a variável normal padronizada. P ~ N (0,1) sendo: Z (1 ) n número de sucessos na amostra x P= = n tamanho da amostra proporção de sucesso a partir da hipótese nula Para proceder ao teste de hipóteses, como nos casos anteriores, o valor de Zc. calculado deve ser comparado com o de Z dado em função de , o nível de significância do teste. Ex: Um industrial deseja certificar-se de que a fração de mercado que prefere seu produto ao de seu concorrente é superior a 70%. Para tanto colheu uma amostra aleatória de 165 opiniões, das quais 122 lhe foram favoráveis. Pode o industrial ficar satisfeito com esse resultado, adotado o nível de significância de 5%?” Solução: Prof. Janete Pereira Amador 6 Exercícios Teste de Hipótese Para Entregar 1. Os resíduos industriais jogados nos rios, muitas vezes, absorvem oxigênio reduzindo assim o conteúdo do desse necessário à respiração dos peixes e outras formas de vida aquática. Uma lei estadual exige no mínimo de 5 ppm (partes por milhão) de oxigênio dissolvido, afim de que o conteúdo seja suficiente para manter á vida aquática. Seis amostras de água retiradas de um rio, durante a maré baixa, revelaram os índices (em partes por milhão) de oxigênio dissolvido. 4,9 5,1 4,9 5,5 5,0 4,7 Estes dados são evidência para afirmar que conteúdo de oxigênio é menor que 5 ppm.Teste considerando 5% 2. A Debug Company vende um repelente de insetos que alega ser eficiente pelo prazo de 400 horas no mínimo. Uma análise de 9 itens escolhidos aleatoriamente acusou uma média de eficiência de 380 horas. Teste a hipótese alegação da companhia, contra a alternativa que a duração é inferior a 400 horas no mínimo, com desvio padrão amostral de 60 horas. Teste considerando 1% 3. Um laboratório farmacêutico afirma que o medicamento Atchim, recentemente introduzido no mercado, tem uma eficácia de 90% na cura de certa alergia. Numa amostra aleatória de 200 pacientes sofrendo dessa alergia, registraram-se 160 curas. Avalie se aquela propaganda do laboratório é legitima. Use 3% 4. Numa pesquisa sobre possuidores de videocassete, encontram-se 120 das 200 casas pesquisadas do bairro X e 240 das 500 residências do bairro do bairro Y. Há diferença significativa entre a proporção de possuidores de vídeo nos dois bairros? Use 10% . 5. Uma experiência tem mostrado que 40% dos estudantes de uma Universidade reprovam em pelo menos 5 disciplinas cursadas. Se 40 de 90 estudantes fossem reprovados em mais de 5 disciplinas, poderíamos concluir quanto a proporção populacional use 1% 6. Numa amostra de 6 lagartas de soja obtiveram-se as medidas para os seus comprimentos (mm)10; 11; 12; 13; 14; 15. Teste as hipóteses µ = 11,5 vs µ 11,5, use um 0,05 . Interprete o resultado do teste.