Prof. Janete Pereira Amador 1 1. Introdução O objetivo da Estatística é a realização de inferência acerca de uma população, baseadas nas informações amostrais. Como as populações são caracterizados por medidas numéricas descritivas, denominadas parâmetros, a inferência estatística diz respeito à realização de inferência sobre esses parâmetros populacionais. Os métodos utilizados para realização de inferências a respeito dos parâmetros pertencem a duas categorias. Pode-se estimar ou prever o valor do parâmetro ou pode-se tomar decisões relativas ao mesmo, através de um teste de hipótese. A estimação é o processo que consiste em utilizar dados amostrais para estimar os valores de parâmetros populacionais desconhecidos. Qualquer característica de uma população pode ser estimada a partir de uma amostra aleatória. Entre as mais comuns, estão a média, variância e proporção populacional. Parâmetros ( ): são medidas descritivas da população θ Estatísticas ou Estimadores ( ̂ ):são variáveis aleatórias que assumem valores diferentes para diferentes amostras, são representados por letras romanas. Parâmetro (população) Estimador (amostra) x = média = média S² = variância ² = variância S = desvio padrão = desvio padrão P = proporção = Proporção 1 Propriedades dos Estimadores Cada parâmetro a ser estimado, poderá ter diferentes tipos de estimadores. Interessa, evidentemente, escolher o “melhor” estimador. Qualifica-se com essa designação o estimador que apresentar as seguintes propriedades. a) Estimador não tendencioso (justo ou imparcial): Seja X uma variável aleatória considerada na população, cuja distribuição de probabilidades dependa do parâmetro e seja um estimador desse parâmetro. Diz-se que é um estimador não tendencioso de se: E( ) , isto é, se o valor médio do estimador for igual ao parâmetro. b) Estimador eficiente: Sejam e , dois estimadores de um mesmo parâmetro “ ”, 1 2 1 será um estimador mais eficiente do que 2 se V (ˆ1 ) < V (ˆ2 ) , ou seja: Quanto menor a sua variância mais eficiente será o estimador. c) Estimador consistente ou coerente: um estimador é um estimador consistente do parâmetro , se além de ser justo sua variância tende para zero quando “n” é suficientemente grande ( n ). - Se E (ˆ) , isto é, é justo. - Se lim n var(ˆ) 0 ,então, ˆ é um estimador consistente de Prof. Janete Pereira Amador 2 2 Estimativas Pontuais e Intervalares A estimação de parâmetros pode ser feita por ponto e por intervalo. No primeiro caso, a estimativa do parâmetro populacional é feita através de um único valor estimado, ao passo que, no segundo, constroem-se intervalos de confiança, o qual deverá, com probabilidade conhecida, conter o valor do parâmetro. Uma suposição fundamental é que o processo de amostragem seja probabilístico. 2.1 Estimativas pontuais Estimativas pontuais são utilizadas quando a partir da amostra, procura-se obter um único valor para o parâmetro. Uma estimativa por ponto é constituída por um valor numérico simples. Por exemplo, X 30 é uma estimativa por ponto da média populacional. Seja X uma população com média , desvio padrão e com uma proporção e seja (X1, X2, ..., Xn) uma amostra aleatória simples extraída desta população. Então: ­ X é um estimador não-tendencioso e consistente da média da população . ­ P é um estimador não-tendencioso e consistente da proporção populacional . ­ S 2 é estimador não-tendencioso e consistente da variância da população 2 . 2.2 Estimativas por intervalo A estimação por ponto é em geral insuficiente quando se quer determinar um dado parâmetro. Isso decorre, porque a probabilidade de que a estimativa adotada venha coincidir com o verdadeiro valor do parâmetro é, em geral, nula ou praticamente nula. Isso se deve ao fato de que os estimadores são variáveis aleatórias, muitas vezes contínuas; logo, as estimativas obtidas provavelmente serão distintas do valor do parâmetro. Ou seja, é quase certo que esteja sendo cometido um erro de estimação, quando for utilizada a estimação por ponto de um parâmetro populacional. Devido a esse fato, surge a idéia de se construir um intervalo em torno da estimativa por ponto, de modo que esse intervalo tenha uma probabilidade conhecida de conter o verdadeiro valor do parâmetro. Esse intervalo é chamado de intervalo de confiança para parâmetro em estudo. A seguir serão vistos como construir intervalos de confiança para os parâmetros mais usuais. 3.2.1 Tipos de intervalo de confiança Intervalo de confiança para a média populacional ( ) Caso I – Desvio padrão populacional conhecido n 30 O intervalo de confiança para a média ( ) de uma população é construído em torno da estimativa pontual X . Para construir este intervalo fixa-se uma probabilidade 1-. de que o intervalo construído contenha o parâmetro populacional. Desta forma, será a probabilidade de que o intervalo obtido não contenha o valor do parâmetro, isto é, será a probabilidade de erro. Sabe-se que a média da amostra tem distribuição normal de média e desvio padrão se a população de onde for extraída a amostra for normal (ou se n a amostra for superior a 30 e retirada de qualquer população) de média e de desvio Prof. Janete Pereira Amador 3 padrão , pode-se então utilizar a curva normal para estabelecer os limites para o intervalo de confiança. Assim o intervalo de confiança (probabilidade) de 1-. para a média de uma população é dado por: P x Z . x Z . 1 2 2 n n X é a estimativa por ponto da média da população. é o desvio padrão da população e Z 2 é o valor da distribuição normal padrão cuja área à direita é igual a . 2 Ex: Uma amostra aleatória de 40 tambores de um produto químico, utilizado na produção de adubos, tem peso médio de 115 kg e desvio padrão de 5,5 kg. Construa um intervalo de confiança de 95 % para o peso dos tambores. Solução: n 40 Z 1,96 2 x 115 5,5 P x Z . x Z . 1 2 2 n n 5,5 5,5 P 115 1,96 ;115 1,96 40 40 5,5 5,5 P 115 1,96 ;115 1,96 6,324 6,324 P115 1,96 0,869;115 1,96 0,869 P115 1,703;115 1,703 P113,297kg ;116,703kg , ou seja, pode-se afirmar com uma certeza de 95% de que este intervalo conterá a média desta população (tambores de químico). Caso II - Desvio padrão populacional desconhecido ou se n 30 Quando o desvio padrão da população ( ) é desconhecido é necessário utilizar sua estimativa “S”. Só que ao substituir o desvio padrão populacional pela sua estimativa,. torna-se necessário a introdução de uma correção, isso porque “S” é um estimador viciado para .Assim, a correção consiste em usar a variável t de Student ao invés de “Z” na expressão Z sendo assim, têm-se t . σ S α2 α2 n n Neste caso, o intervalo de confiança com probabilidade “1 - “ para a média será: Onde = n-1 S S P x t . x t . 1 n n onde: X é a estimativa por ponto da média da população; S é o desvio padrão da amostra e uma estimativa do desvio padrão da população ; Prof. Janete Pereira Amador 4 t 2 é o valor da distribuição “t” cuja área à direita é igual a /2, isto é, é o valor de “t” tal que P (t t 2 ) 2 ou então P ( t 2 t t 2 ) 1 . Ex: Uma amostra de tamanho 25 foi retirada de uma população com o objetivo de estimar a sua média e forneceu os valores X = 50 e s = 10. Qual o intervalo de 95% de confiança para a média desta população? Solução: Tem-se 1 - = 95%, então = 5% e /2 = 2,5%. O coeficiente de confiança que deve ser buscado na distribuição t com = n - 1 = 25 - 1 = 24. Esta é a linha da tabela. A coluna poderá ser o valor = 5% ou então o valor /2 = 2,5%, dependendo do tipo de tabela. Em qualquer caso o que se procura é o valor “t” com grau de liberdade igual a 24, isto é, o valor t24 tal que: P ( t 2 t 24 t 2 ) 95% este valor corresponde a 2,064. Então o intervalo de confiança de 95% para média desta população será: S S = 50 2,064 10 ;50 2,064 10 P X t ;X t α2 α2 5 5 n n 45,87;54,1 3 , ou seja, pode-se afirmar com uma certeza de 95% de que este intervalo conterá a média da população. Intervalo de confiança para a proporção ( ) Seja p̂0 = proporção amostral que possui uma distribuição do tipo binomial, cuja média é próprio parâmetro populacional . Desta forma o intervalo para proporção populacional será dado por P pˆ 0 Z pˆ p pˆ 0 Z pˆ 1 2 2 onde: x e q̂ 0 1 p̂ 0 n p̂0 q̂0 é uma estimativa do erro padrão, isto é, do desvio padrão amostral. p̂ n p̂ 0 Ex1: Numa pesquisa de mercado, 400 pessoas foram entrevistadas sobre sua preferência por determinado produto. Destas 400 pessoas, 240 disseram preferir o produto. Determinar um intervalo de confiança de 95% de probabilidade para o percentual de preferência dos consumidores em geral para este produto. Solução: Tem-se 1 - = 95%, então = 5% e /2 = 2,5%. O coeficiente de confiança que deve ser buscado na normal padrão é valor Z de Z tal que: P(Z z 2 ) 2,5% 1,96 . α2 A estimativa por ponto para proporção populacional será: . Então o intervalo de confiança de 95% para a P f n 240 / 400 0,60 60% proporção populacional será: P pˆ 0 Z pˆ p pˆ 0 Z pˆ 1 2 2 Prof. Janete Pereira Amador 5 0,60 1,96 0,60( 1 0,60) ;0,60 1,96 0,60( 1 0,60) 60% 4,80%;60% 4,80% 400 400 55,20%;64,80% , ou seja pode-se afirmar com uma certeza de 95% de que este intervalo conterá a proporção populacional, isto é, a verdadeira percentagem dos consumidores que preferem o produto pesquisado. 2. Examinadas 500 peças de uma grande produção encontrou-se 260 defeituosas. Com um grau de confiança de 90% construir um intervalo de confiança para verdadeira proporção de peças defeituosas. Exercícios 1. A seguir encontra-se uma amostra de 10 árvores castanheiras todas com 8 anos de idade numa certa floresta. O diâmetro (polegadas) das árvores foram medidos à uma altura de 3 pés: Queremos encontrar um intervalo de confiança de 95% para o verdadeiro diâmetro médio de todas as árvores castanheiras dessa idade na floresta. 2. Dentre 100 peixes capturados num certo lago, 18 não estavam apropriados para consumo devido aos níveis de poluição do ambiente. Construa um intervalo de confiança de 99% para a correspondente verdadeira proporção 3. Para avaliar o peso médio de uma nova safra de limões, obteve-se uma amostra com os pesos de 25 limões, encontrando-se uma média de 115,2 gramas, com desvio padrão de 20,4 gramas. Construa um intervalo de confiança de 98%, para o verdadeiro peso médio dos limões. 2. Uma pesquisa feita em uma zona rural em 1994 mostrou que 250 famílias gastaram, em média, R$35,00 por semana com alimentação, com desvio padrão de R$ 2,50. Como há interesse em especificar, dentro de um intervalo de confiança bastante estreito, a despesa semanal real com alimentação familiar naquela área, construa um intervalo de 90% de confiança. 3. Tendo sido medido o eixo maior de 9 grãos de quartzo de um corpo arenoso em uma lâmina de arenito, obteve-se um comprimento amostral médio de 1,5mm e um desvio padrão de 0,3mm. Deseja-se construir um intervalo de confiança para o comprimento médio dos grãos de quartzo do corpo arenoso. 4. Uma amostra de 300 habitantes de uma cidade mostrou que 180 desejavam a água fluorada. Encontrar os limites de confiança de 90% para a proporção da população favorável a fluoração. 5. Para estimar a porcentagem de alunos de um curso favoráveis á modificação do currículo escolar, tomou-se uma amostra de 100 alunos, dos quais 80 foram favoráveis. Prof. Janete Pereira Amador 6 Construir um intervalo de confiança para a,proporção de todos os alunos favoráveis à modificação, use um = 4% Prof. Janete Pereira Amador 7 1 Introdução Os métodos utilizados para realização de inferências a respeito dos parâmetros pertencem a duas categorias. Pode-se estimar ou prever o valor do parâmetro, através da estimação de parâmetros ou pode-se tomar decisões relativas ao mesmo, através de um teste de hipótese paramétrico (teste de significância). O teste de significância ou teste de hipóteses paramétrico consiste em verificar se a diferença entre um valor alegado de um parâmetro populacional e o valor de uma estatística amostral pode ser razoavelmente atribuído a variabilidade amostral ou se a discrepância é demasiadamente grande para ser encarada assim. A finalidade dos testes de hipóteses paramétrico é avaliar afirmações sobre os valores dos parâmetros populacionais. 2 Hipótese Estatística Uma hipótese estatística é uma afirmação que pode ou não ser verdadeira sobre o valor de um parâmetro ou sobre a distribuição de probabilidade de uma variável aleatória. Em estatística existem dois tipos de hipótese estatística. A Hipótese nula “H0” é a hipótese conservadora sempre pode ser expressa por uma igualdade a zero. Por exemplo: H 0 : 0 ou H 0 : 0 0 . A Hipótese alternativa “H1” é qualquer hipótese que diferi de uma dada hipótese nula é a Hipótese experimental. Por exemplo: H 1 : 0 ou H 1 : 0 ou H 1 : 0 . A Hipótese nula “H0” é uma afirmação que diz que o parâmetro populacional é tal como especificado (isto é, a afirmação é verdadeira). A Hipótese alternativa “H1” é uma afirmação que oferece uma alternativa à alegação (Isto é, o parâmetro é maior ou menor que o valor alegado) As hipóteses “H0” e “H1” são mutuamente excludentes, aceitando-se uma hipótese como verdadeira, a outra, automaticamente, será rejeitada. Portanto deve-se tomar cuidado para não ser cometido erros com relação aceitação e rejeição de “H0” e “H1”. 3 Tipos de Erro Quando se realiza um teste de hipótese, pode-se cometer dois tipos de erro: ­ Erro tipo I: consiste em rejeitar “H0” quando ela é verdadeira. Pode ser limitado pela escolha do nível de significância que probabilidade de rejeitar “H0” quando essa for verdadeira. ­ Erro tipo II: Consiste em aceitar “H0”, quando ela é falsa. O nível de significância do teste (probabilidade de rejeitar “H0” quando essa for verdadeira) é fixada antes da extração das amostras. Os valores mais comuns para são: 0.01, 0.05 e 0.10 ou 1%, 5% e 10%. Se por exemplo, ao delinear-se um teste, escolhe-se = 0.05 ou 5%, significa que em cerca de 5% rejeitar-se-ia erroneamente H0. O coeficiente de confiança, indicado por (1 - ), é a probabilidade de que a hipótese nula H0 não seja rejeitada quando de fato for verdadeira e não deve ser rejeitada. Em termos de metodologia do teste de hipóteses, esse coeficiente representa a probabilidade de Prof. Janete Pereira Amador 8 se concluir que o determinado valor do parâmetro que está sendo testado para hipótese nula seja plausível. 4 Teste de Hipóteses Unilateral e Bilaterais Dependendo da hipótese alternativa, os testes são classificados como unilaterais e bilaterais. 4.1 Teste de hipóteses bilateral Os testes bilaterais se usam sempre que há divergência crítica em ambas as direções, tal como ocorreria na fabricação de roupas, onde camisas muito grandes ou muito pequenas não correspondem à determinação do padrão. Outro exemplo é o caso em que peças devem ajustar-se uma a outra, como o parafuso e porca. Uma variação excessiva ocasionará seja um ajuste muito frouxo, de modo que as peças não permanecerão unidas, ou um ajuste excessivo impedindo a conjugação das peças. Assim por exemplo: ­ H 0 : 0 contra H 1 : 0 é um teste bilateral, esquematicamente: Valor tabelado também chamado de valor crítico, separa a região de aceitação H0 (RA H0) da região de rejeição (RR H0). 4.2 Teste de hipóteses unilateral a direita O teste unilateral a direita é útil para testar se determinado padrão máximo não foi excedido Como exemplo seria: teor máximo de gordura permitida em determinado tipo de leite, radiação emitida por usinas nucleares, número de passas defeituosas de uma remessa de certa mercadoria, quantidade de poluição atmosférica emitida por uma determinada fabrica. Assim por exemplo: H 0 : 0 contra , H 1 : 0 ( 0 é o valor suposto para o parâmetro) é um teste unilateral a direita, esquematicamente: 4.2 Teste de hipóteses unilateral a esquerda O teste unilateral a esquerda é útil para verificar se determinado padrão mínimo foi atingido. Como exemplo seria: conteúdo mínimo de gordura no leite, peso líquido de Prof. Janete Pereira Amador 9 pacotes de determinado produto, vida de um produto tal qual como especificado no certificado de garantia. Assim por exemplo: ­ H 0 : 0 contra H 1 : 0 é um teste unilateral a esquerda, esquematicamente: 5 Procedimentos para Realização de um Teste de Hipóteses Para realizar um teste de hipótese sugere-se seguir as seguintes etapas: 1) Formular as hipóteses; 2) Identificar a estatística do teste; 3) Determinar o nível de significância; 4) Calcular a estatística utilizando os valores amostrais; 5) Comparar as estatística calculada com a estatística tabelada; 6) Concluir. 5.1 Teste de hipóteses para média O objetivo do teste de significância para médias é avaliar afirmações feitas a respeito de médias populacionais. Há basicamente três tipos de afirmação que se podem fazer a cerca das médias populacionais e cada tipo requer um tipo diferente de avaliação. Uma afirmação pode dizer respeito a média de uma única população; a avaliação envolve então um teste de uma amostra. Ou pode-se afirmar que a média de duas populações são iguais; tem-se então um teste de duas amostras. Finalmente pode-se afirmar que a as médias de mais de duas populações são iguais, o que envolve um teste de K amostras Análise de Variância. 5.1.1. Teste de significância de uma amostra para uma média amostral contra um valor paramétrico De acordo com o teorema do limite central, se obtemos amostras grandes (n > 30) (de qualquer população com qualquer distribuição), a distribuição das médias pode ser aproximada por uma distribuição normal. Sendo assim, distribuição das médias amostrais será aproximadamente normal com media e desvio padrão n. Em um teste de hipóteses, o valor de corresponde a hipótese nula, e o valor do desvio padrão populacional deve ser conhecido. Se é desconhecido e as amostras são grandes ( n 30 , podemos usar o desvio padrão amostral “S” em substituição σ , porque grandes amostras aleatórias tendem a representar a população com distribuição normal. Quando a amostra é pequena n 30 e/ou 2 é desconhecida utilizamos a distribuição a distribuição t de Student Prof. Janete Pereira Amador 10 Assim temos: Retira-se uma amostra de tamanho n e calcula-se X . X 0 X 0 Calcula-se o valor da estatística Z c ou t c S n n Sob a hipótese nula, tem-se que Zc possui uma distribuição normal padrão.Portanto, Rejeita-se H0 se Z c Z 2 (isto é, se Zc < Z 2 ou Z c Z 2 ) ou Rejeita-se H0 se t c t 2 , n1 (isto é, se tc< t 2 , n1 ou t 2 t 2 , n 1 ) Aceita-se H0 se Z c Z 2 (isto é, Z c Z 2 ), ou Aceita-se H0 se t c t 2 , n 1 (isto é, t c t 2 , n 1 ), onde é o nível de significância do teste. Ex1: Uma máquina automática para encher pacotes de café enche-os segundo uma distribuição normal, com média e variância ( 2 ) igual a 400g2. A máquina foi regulada para = 500g. Colhe-se, periodicamente uma amostra de 16 pacotes para verificar se a produção está sob controle, isto é, se = 500g ou não. Se uma dessas amostras apresentasse uma média amostral de X = 492 g, você pararia ou não a produção para regular máquina, considerando o nível de significância de 1%? Solução Ex: Um fabricante afirma que seus cigarros contém não mais que 30 mg de nicotina. Uma amostra de 25 cigarros fornece média de 31,5 mg e desvio padrão (S) de 3 mg. Ao nível de 5%, os dados refutam ou não a afirmação do fabricante? Solução: 5.1.2 Teste de significância para a diferença entre duas médias populacionais independentes. Os testes de duas amostras são usados para decidir se as médias de duas populações são iguais. Para a realização do teste exige que as duas amostras sejam independentes, uma de cada população. Duas amostras são independentes se a amostra extraída de uma das populações não tem qualquer relação com a amostra extraída da outra. Esses testes são freqüentemente usados para comparar dois métodos de ensino, duas marcas, duas cidades, dois distritos escolares, e outros casos análogos. A estatística utilizada será: Prof. Janete Pereira Amador ­ Zc 11 x1 x 2 1 2 . 12 22 n1 n 2 Quanto às hipóteses temos que: A hipótese nula pode ser de que as duas populações tem médias iguais. H 0 : 1 2 Enquanto que as alternativas podem ser: H 1 : 1 2 ; H 1 : 1 2 e H1 : 1 2 note que: H 1 : 1 2 é equivalente a H 1 : 1 2 EX: Um fabricante de pneus faz dois tipos. Para o tipo A, = 2500 milhas, e para o tipo B, = 3000 milhas. Um táxi testou 50 pneus do tipo A e 40 do tipo B, obtendo 24.000 milhas e 2.600 milhas de duração média dos respectivos tipos. Adotando-se um risco =4%, testar a hipótese de que a vida média dos dois tipos é a mesma. Solução: 5.2 Teste de Hipótese para proporção Os testes para proporções são adequados quando os dados sob análise consistem em contagens ou freqüências de itens em duas ou mais classes. A finalidade de tais testes é avaliar afirmações sobre a proporção ou percentagem de uma população. Os testes se baseiam na premissa de que uma proporção amostral, isto é, x ocorrências em n observações, ou x/n, será igual a verdadeira proporção populacional. Os testes focalizam geralmente as diferenças entre um número esperado de ocorrências (supondo-se verdadeira uma afirmação) e o número efetivamente observado. A diferença é então comparada com a variabilidade prescrita por uma distribuição amostral baseada na hipótese de que H0 é realmente verdadeira. Em muitos aspectos, os testes para proporção se assemelham grandemente aos testes para médias; apenas, nos testes para proporções, os dados amostrais se apresentam e termos de contagens, ao invés de medidas. Por exemplo, os testes tanto para médias como para proporções podem ser usados para avaliar alegações sobre: ­ Um parâmetro de uma única população (teste de uma amostra). ­ Igualdade de parâmetros de duas amostras (teste de duas amostras ). ­ Igualdade de parâmetros de mais de duas amostras (teste de k amostras) Além disso, para grandes amostras, a distribuição amostral apropriada para testes de proporções de uma e duas amostras é aproximadamente normal, tal como no caso de testes para médias de uma e duas amostras. Prof. Janete Pereira Amador 12 5.2.1 Teste de significância de uma amostra para a proporção Seja a proporção dos elementos de uma população que possuem uma determinada característica. Por exemplo, é igual a proporção ou percentagem dos habitantes, de uma determinada localidade, que possuem automóvel. Se quisermos testar a hipótese de que essa proporção é igual a determinado valor, contra a alternativa dessa proporção ser maior de que o valor especificado, lança-se as hipóteses: H0: = 0 Contra uma das hipóteses alternativas: H1 : > 0 H1 : 0 H1 : 0 Um bom estimador do parâmetro é a proporção amostral P̂0 , que para grandes amostras segue uma distribuição aproximadamente normal com média e a variância (1 ) (1 ) ou seja, P ~ N , . n n Portanto pode-se usar a variável normal padronizada. número de sucessos na amostra Pˆ x sendo: P̂0 = = Zc 0 n tamanho da amostra Pˆ qˆ 0 0 n proporção de sucesso a partir da hipótese nula Para proceder ao teste de hipóteses, como nos casos anteriores, o valor de Zc. calculado deve ser comparado com o de Z dado em função de , o nível de significância do teste. “Ex: Um industrial deseja certificar-se de que a fração de mercado que prefere seu produto ao de seu concorrente é superior a 70%. Para tanto colheu uma amostra aleatória de 165 opiniões, das quais 122 lhe foram favoráveis. Pode o industrial ficar satisfeito com esse resultado, adotado o nível de significância de 5%?” Solução: 5.2.2 Teste de significância para a diferença entre duas proporções. Sejam P̂1 e P̂2 as proporções obtidas em duas amostras de tamanho n1 e n2 . Se quisermos testar a hipótese de que as proporções 1 e 2 das proporções das quais foram retiradas as amostras são iguais, formula-se as hipóteses de acordo com o tipo de deste que poderá ser: Prof. Janete Pereira Amador 13 Teste bicaudal H0 : 1 2 Teste unicaudal a direita Teste unicaudal a esquerda H 0 : 1 2 H0 : 1 2 H1 : 1 2 H1 : 1 2 H1 : 1 2 Para realizar o teste usa-se a variável padronizada: ( P1 P2 ) ( 1 2 ) Z , que para grandes amostras segue uma 1 (1 ) 2 (1 2 ) n1 n2 distribuição aproximadamente normal com média zero e variância 1. Comparando-se o valor calculado Z (Zcalc) com o valor crítico, obtido na tabela da distribuição normal padronizada, a um nível dado de significância , decide-se pela rejeição ou não de H0. Deve-se observar que por H0: 1 - 2 = 0 e assim caso esses parâmetros sejam desconhecidos, pode-se substituí-los pelos valores estimados P̂1 e P̂2 (são os estimadores) de na população) no cálculo de Z. Assim: Pˆ1 Pˆ2 x x Zc sendo : Pˆ1 1 e Pˆ2 2 n1 n2 Pˆ1 qˆ1 Pˆ2 qˆ2 n1 n2 Ex: Um empresário deseja saber se o percentual de satisfação de seus clientes em relação a dois produtos oferecidos por sua empresa são similares. Para isso entrevistou 180 pessoas, das quais 80 disseram estar satisfeitas com o produto A e 100 com o produto B. Use = 5% e conclua a respeito. Solução: Exercícios 2. A tensão de ruptura dos cabos produzidos por um fabricante apresenta média de 1800 kg e desvio padrão de 100 kg. Mediante nova técnica no processo de fabricação, proclama-se que a tensão de ruptura pode ter aumentado. Para testar esta declaração, ensaiou-se uma amostra de 50 cabos, tendo-se determinado a tensão média de ruptura de 1850 kg. Pode-se confirmar a declaração ao nível de significância de 0,01? 3. Os resíduos industriais jogados nos rios, muitas vezes, absorvem oxigênio reduzindo assim o conteúdo do oxigênio necessário à respiração dos peixes e outras formas de vida aquática. Uma lei estadual exige no mínimo de 5 ppm (partes por milhão) de oxigênio dissolvido, afim de que o conteúdo de oxigênio seja suficiente para manter ávida aquática. Seis amostras de água retiradas de um rio, durante a maré baixa, revelaram os índices (em partes por milhão) de oxigênio dissolvido. 4,9 5,1 4,9 5,5 5,0 4,7 Estes dados são evidência para afirmar que conteúdo de oxigênio é menor que 5 ppm.Teste considerando 5% Prof. Janete Pereira Amador 14 4. A Debug Company vende um repelente de insetos que alega ser eficiente pelo prazo de 400 horas no mínimo. Uma análise de 9 itens escolhidos aleatoriamente acusou uma média de eficiência de 380 horas. Teste a hipótese alegação da companhia, contra a alternativa que a duração é inferior a 400 horas no mínimo, com desvio padrão amostral de 60 horas. Teste considerando 1% 5. Uma experiência tem mostrado que 40% dos estudantes de uma Universidade reprovam em pelo menos 5 disciplinas cursadas. Se 40 de 90 estudantes fossem reprovados em mais de 5 disciplinas, poderíamos concluir quanto a proporção populacional use 1% 6. Um laboratório farmacêutico afirma que o medicamento Atchim, recentemente introduzido no mercado, tem uma eficácia de 90% na cura de certa alergia. Numa amostra aleatória de 200 pacientes sofrendo dessa alergia, registraram-se 160 curas. Avalie se aquela propaganda do laboratório é legitima. Use 3% 7. Duas técnicas de vendas são aplicadas por dois grupos de vendedores: a técnica A, por 32 vendedores, e a técnica B, por 35 vendedores. Espera-se que a técnica B produza melhores resultados que a técnica A. No final de um mês, os vendedores de A venderam uma média de 68 ítens, com uma variância de 50, enquanto que os vendedores de B venderam uma média de 76 ítens com uma variância de 75. Testar, ao nível de significância de 5%, se a técnica B é realmente melhor que a técnica A. 8. Queremos testar as resistências de dois tipos de vigas de aço, A e B. Tomando-se nA = 35 vigas do tipo A e nB = 40 vigas do tipo B, obtemos os valores da tabela a seguir. Testar a hipótese que as resistências médias dos dois tipos de vigas são iguais, ao nível de significância de 5%. 9. Numa pesquisa sobre possuidores de videocassete, encontram-se 120 das 200 casas pesquisadas do bairro X e 240 das 500 residências do bairro do bairro Y. Há diferença significativa entre a proporção de possuidores de vídeo nos dois bairros? Use 10% . 10. Duas amostras foram retiradas de duas escolas de segundo grau de Santa Maria com o objetivo de estudar a proporção de alunos aprovados e reprovados no PEIS. Os resultados obtidos são os que seguem. Escola Aprovados Reprovados Estadual 16 24 Municipal 17 18 a) Teste a hipótese de que a proporção de aprovados é igual nas duas escolas ( 1% ) b) A escola estadual, estudada, sempre aprova 35% dos seus estudantes teste a hipótese de que a proporção de aprovados nesse ano é diferente da proporção histórica ( 1% ).