Intervalo de Confiança para proporções populacionais Definição, Construção de um intervalo de confiança para p, Aumento do tamanho da amostra. Introdução Estimativa pontual para a proporção populacional p. P: Probabilidade de sucesso em uma única tentativa de um experimento binomial. P é a proporção populacional Definição A estimativa pontual para p, a proporção populacional de sucesso, é dada pela proporção de sucesso em uma amostra e denotada por: 𝒙 𝒑= 𝒏 onde: x = número de sucessos na amostra n = tamanho da amostra OBS: 𝑞 = 1 − 𝑝 (Estimativa pontual para o número de fracassos) Exemplo 1 Consideremos 1024 adultos brasileiros , onde 287 preferem assistir futebol pela tv. Determine uma estimativa pontual para a proporção populacional desses adultos. 𝑥 287 𝑝= = ≈ 0,28 = 28% 𝑛 1024 Intervalo de Confiança (I.C) para p Definição: Um intervalo de confiança c para a peoporção populacional p é: 𝒑 − 𝑬 < 𝒑 < 𝒑 + 𝑬, onde: 𝑝𝑞 𝐸 = 𝑍𝑐 . 𝑛 A probabilidade de que o I.C obtenha p é c. Propriedade Importante • Uma Distribuição Binomial quando np≥ 5 e nq ≥ 5 pode ser aproximada pela distribuição normal. • Quando 𝑛𝑝 ≥ 5 e n𝑞 ≥ 5, a distribuição amostral para 𝑝 é aproximadamente normal com uma média 𝜇𝑝 = 𝑝 e um desvio padrão de 𝜇𝑝 = 𝑝𝑞 𝑛 Exemplo Construa um intervalo de confiança de 95% para a proporção de adultos brasileiros que afirmam ser o futebol o seu programa de esporte favorito. Solução: Sabemos que 𝑝 = 0,28 ⇒ 𝑞 = 1 − 0,28 = 0,72 Usando n = 1024, teremos n𝑝 ≈ 1024.0,28 ≈ 287 > 5 e n𝑞 ≈ 1024.0,72 ≈ 737 > 5. Logo a distribuição de 𝒑 pode ser aproximada pela distribuição normal. Exemplo - Cont Solução: Na tabela encontramos 𝑍𝑐 =1,96 (valor crítico correspondente ao nível de confiança c) Determinamos, então o erro máximo da estimativa E: E=𝑍𝑐 𝑝𝑞 𝑛 = 1,96 0,28.0,72 1024 ≈ 0,028 O I.C é: 𝒑 − 𝑬 < 𝒑 < 𝒑 + 𝑬, portanto: 𝟎, 𝟐𝟓𝟐 < 𝒑 < 𝟎, 𝟑𝟎𝟖 Conclusão Podemos afirmar com 95% de confiança que a proporção de adultos brasileiros que preferem assistir futebol está entre 25,2% e 30,8%. Melhorando a precisão Melhoraremos a precisão sem diminuirmos o nível de confiança, aumentando o tamanho da AMOSTRA. O mínimo tamanho necessário da amostra para estimar p é: 𝒏𝒎í𝒏 𝒁𝒄 𝟐 = 𝒑𝒒( ) 𝑬 OBSERVAÇÃO Supomos que haja uma estimativa preliminar para 𝑝 e 𝑞, caso contrário usamos 𝑝 = 0,5 e 𝑞 = 0,5 na fórmula. 𝒏𝒎í𝒏 𝒁𝒄 𝟐 = 𝒑𝒒( ) 𝑬 Em outras palavras: Se não estimarmos 𝑝 e 𝑞 somos penalizados pelo fato de usar uma amostra grande. (𝑝𝑞 é máximo) Exemplo Você é auxiliar em uma campanha política e deseja estimar, com 95% de confiança, a proporção de eleitores registrados que votarão em seu candidato. Qual é o mínimo tamanho necessário da amostra para estimar a proporção populacional com uma precisão dentro de 3%? Solução Usando 𝑝 = 𝑞 = 0,5 , 𝑍𝑐 = 1,96 e E = 0,03, teremos: 𝑍𝑐 2 1,96 2 𝑛𝑚í𝑛 = 𝑝𝑞( ) = (0,5)(0,5)( ) ≈ 1067,11 𝐸 0,03 Assim, pelo menos 1.068 eleitores registrados devem ser incluídos na AMOSTRA I.C para a variância e desvio padrão A distribuição qui-quadrado Definição: A estimativa pontual para 𝜎 2 é 𝑠 2 e a estimativa pontual para 𝜎 é s. 𝑠 2 é a melhor estimativa não enviesada para 𝜎 2 . Podemos usar a distribuição qui-quadrado para construir um intervalo de confiança para a variância e o desvio padrão. Distribuição Qui-Quadrado Definição: Se a variável aleatória x tiver uma distribuição normal, então a distribuição ᅝ2 = (𝑛−1)𝑠 2 𝜎2 formará uma distribuição qui-quadrado para amostras de qualquer tamanho n > 1. Propriedades P1: Todos os valores de qui-quadrado ᅝ2 saõ maiores ou iguais a zero. P2: A distribuição qui-quadrado é uma família de curvas, cada uma delas determinada pelos graus de liberdade. Devemos usar g.l = n – 1 P3: A área sob cada uma das curvas da distribuição qui-quadrado é igual a um. Propriedades P4: As distribuições positivamente assimétricas. qui-quadrado são 2 Valores Críticos de 𝞆 Existem dois valores críticos para cada I.C 𝞆𝑅 2 : valor crítico da cauda à direita 𝞆𝐿 2 : valor crítico da cauda à esquerda Exemplo Obtenha os valores críticos 𝞆𝑅 2 e 𝞆𝐿 2 para um intervalo de confiança de 90% quando o tamanho da amostra é 20. Exemplo Solução: g.l = n – 1 = 20 – 1 = 19 Áreas à direita e à esquerda 1 − 𝑐 1 − 0,90 2 𝐴(𝞆𝑅 ) = = = 0,05 2 2 1 + 𝑐 1 + 0,90 2 𝐴 𝞆𝐿 = = = 0,95 2 2 Basta procurar na tabela a linha 19, colunas 0,95 e 0,05 e encontraremos: 𝞆𝑅 2 = 30,144 e 𝞆𝐿 2 = 10,117. Assim, 90% da área sob a curva está entre 10,117 e 30,144. Exemplo: Conclusão Exercício Determine os valores críticos 𝞆𝑅 2 e 𝞆𝐿 2 para um intervalo de confiança de 95% quando o tamanho da amostra for de 95%. Siga o roteiro: 1. Identifique os graus de liberdade e o nível de confiança. 2 2. Obtenha 𝐴(𝞆𝑅 ) e 𝐴 𝞆𝐿 2 3. Use a tabela para obter 𝞆𝑅 2 e 𝞆𝐿 2 I.C para a Variância e o Desvio Padrão Definição: Um intervalo de confiança c para a variância e o desvio padrão estão dados a seguir: Para a Variância: (𝑛−1)𝑠 2 𝞆𝑅 2 < 𝜎2 < Para o Desvio Padrão: : (𝑛−1)𝑠 2 𝞆𝑅 2 (𝑛−1)𝑠 2 𝞆𝐿 2 <𝜎< (𝑛−1)𝑠 2 𝞆𝐿 2 A probabilidade de que o I.C contenha 𝜎 2 ou 𝜎 é c. Exemplo Selecionamos e pesamos 30 amostras de um determinado antialérgico. O desvio padrão da amostra é de 1,2mg. Supondo que os pesos tenham uma distribuição normal, construa um intervalo de confiança de 99% para a variância e o desvio padrão populacionais. Exemplo: Solução As áreas à direita de 𝟀𝑹 𝟐 e 𝟀𝑳 𝟐 são: 1 − 𝑐 1 − 0,99 𝐴(𝞆𝑅 ) = = = 0,005 2 2 1 + 𝑐 1 + 0,99 2 𝐴 𝞆𝐿 = = = 0,995 2 2 Na tabela, temos: 𝞆𝑅 2 = 52,366 e 𝞆𝐿 2 = 13,121 Considerando os dados: n = 30 ⇒ g.l = 30 – 1 = 29, c = 0,99 e s = 1,2 Teremos os I.C para 𝜎 2 e 𝜎 : 2 Exemplo: Solução • Extremo esquerdo: • Extremo direito: (𝑛−1)𝑠 2 𝞆𝑅 2 (𝑛−1)𝑠 2 𝞆𝐿 2 = = (30−1)(1,2)2 52,336 (30−1)(1,2)2 13,121 ≈ 0,798 ≈ 3,183 Assim, 0,798 < 𝜎 2 < 3,183 e 0,89 < 𝜎 < 1,78 Exemplo: Conclusão Podemos afirmar com 99% de confiança que a variância populacional está entre 0,798 e 3,183. O desvio padrão populacional está entre 0,89 e 1,78mg. Exercício Obtenha com os dados do exemplo anterior os intervalos de confiança de 90% e 95% para a variância e o desvio padrão populacionais dos pesos do antialérgico, seguindo o roteiro: 1. Obtenha os valores críticos 𝞆𝑅 2 e 𝞆𝐿 2 para cada I.C 2. Use n, s, 𝞆𝑅 2 e 𝞆𝐿 2 para obter os I.C para 𝜎 2 3. Obtenha os I.C para 𝜎 4. Especifique os I.C de 90% e 95% para 𝜎 2 e 𝜎