Intervalo de Confiança para proporções populacionais

Intervalo de Confiança para
proporções populacionais
Definição, Construção de um
intervalo de confiança para p,
Aumento do tamanho da amostra.
Introdução
Estimativa pontual para a proporção
populacional p.
P: Probabilidade de sucesso em uma única
tentativa de um experimento binomial.
P é a proporção populacional
Definição
A estimativa pontual para p, a proporção
populacional de sucesso, é dada pela proporção de
sucesso em uma amostra e denotada por:
𝒙
𝒑=
𝒏
onde:
x = número de sucessos na amostra
n = tamanho da amostra
OBS: 𝑞 = 1 − 𝑝 (Estimativa pontual para o número de fracassos)
Exemplo 1
Consideremos 1024 adultos brasileiros , onde
287 preferem assistir futebol pela tv. Determine
uma estimativa pontual para a proporção
populacional desses adultos.
𝑥
287
𝑝= =
≈ 0,28 = 28%
𝑛 1024
Intervalo de Confiança (I.C) para p
Definição:
Um intervalo de confiança c para a peoporção
populacional p é:
𝒑 − 𝑬 < 𝒑 < 𝒑 + 𝑬,
onde:
𝑝𝑞
𝐸 = 𝑍𝑐 .
𝑛
A probabilidade de que o I.C obtenha p é c.
Propriedade Importante
• Uma Distribuição Binomial quando np≥ 5 e nq ≥
5 pode ser aproximada pela distribuição normal.
• Quando 𝑛𝑝 ≥ 5 e n𝑞 ≥ 5, a distribuição amostral
para 𝑝 é aproximadamente normal com uma média
𝜇𝑝 = 𝑝 e um desvio padrão de 𝜇𝑝 =
𝑝𝑞
𝑛
Exemplo
Construa um intervalo de confiança de 95% para a
proporção de adultos brasileiros que afirmam ser o
futebol o seu programa de esporte favorito.
Solução:
Sabemos que 𝑝 = 0,28 ⇒ 𝑞 = 1 − 0,28 = 0,72
Usando n = 1024, teremos n𝑝 ≈ 1024.0,28 ≈ 287 > 5
e n𝑞 ≈ 1024.0,72 ≈ 737 > 5. Logo a distribuição de 𝒑
pode ser aproximada pela distribuição normal.
Exemplo - Cont
Solução:
Na tabela encontramos 𝑍𝑐 =1,96 (valor crítico
correspondente ao nível de confiança c)
Determinamos, então o erro máximo da estimativa E:
E=𝑍𝑐
𝑝𝑞
𝑛
= 1,96
0,28.0,72
1024
≈ 0,028
O I.C é: 𝒑 − 𝑬 < 𝒑 < 𝒑 + 𝑬, portanto:
𝟎, 𝟐𝟓𝟐 < 𝒑 < 𝟎, 𝟑𝟎𝟖
Conclusão
Podemos afirmar com 95% de confiança que a
proporção de adultos brasileiros que preferem
assistir futebol está entre 25,2% e 30,8%.
Melhorando a precisão
Melhoraremos a precisão sem diminuirmos o
nível de confiança, aumentando o tamanho da
AMOSTRA.
O mínimo tamanho necessário da amostra para
estimar p é:
𝒏𝒎í𝒏
𝒁𝒄 𝟐
= 𝒑𝒒( )
𝑬
OBSERVAÇÃO
Supomos que haja uma estimativa preliminar para
𝑝 e 𝑞, caso contrário usamos 𝑝 = 0,5 e 𝑞 = 0,5 na
fórmula.
𝒏𝒎í𝒏
𝒁𝒄 𝟐
= 𝒑𝒒( )
𝑬
Em outras palavras:
Se não estimarmos 𝑝 e 𝑞 somos penalizados pelo
fato de usar uma amostra grande. (𝑝𝑞 é máximo)
Exemplo
Você é auxiliar em uma campanha política e
deseja estimar, com 95% de confiança, a
proporção de eleitores registrados que votarão
em seu candidato. Qual é o mínimo tamanho
necessário da amostra para estimar a proporção
populacional com uma precisão dentro de 3%?
Solução
Usando 𝑝 = 𝑞 = 0,5 , 𝑍𝑐 = 1,96 e E = 0,03,
teremos:
𝑍𝑐 2
1,96 2
𝑛𝑚í𝑛 = 𝑝𝑞( ) = (0,5)(0,5)(
) ≈ 1067,11
𝐸
0,03
Assim, pelo menos 1.068 eleitores registrados
devem ser incluídos na AMOSTRA
I.C para a variância e desvio padrão
A distribuição qui-quadrado
Definição:
A estimativa pontual para 𝜎 2 é 𝑠 2 e a estimativa
pontual para 𝜎 é s.
𝑠 2 é a melhor estimativa não enviesada para 𝜎 2 .
Podemos usar a distribuição qui-quadrado para construir
um intervalo de confiança para a variância e o desvio
padrão.
Distribuição Qui-Quadrado
Definição:
Se a variável aleatória x tiver uma distribuição
normal,
então
a
distribuição
ᅝ2 =
(𝑛−1)𝑠 2
𝜎2
formará uma distribuição qui-quadrado para
amostras de qualquer tamanho n > 1.
Propriedades
P1: Todos os valores de qui-quadrado ᅝ2 saõ
maiores ou iguais a zero.
P2: A distribuição qui-quadrado é uma família de
curvas, cada uma delas determinada pelos graus de
liberdade. Devemos usar g.l = n – 1
P3: A área sob cada uma das curvas da distribuição
qui-quadrado é igual a um.
Propriedades
P4:
As
distribuições
positivamente assimétricas.
qui-quadrado
são
2
Valores Críticos de 𝞆
Existem dois valores críticos para cada I.C
𝞆𝑅 2 : valor crítico da cauda à direita
𝞆𝐿 2 : valor crítico da cauda à esquerda
Exemplo
Obtenha os valores críticos 𝞆𝑅 2 e 𝞆𝐿 2 para um
intervalo de confiança de 90% quando o
tamanho da amostra é 20.
Exemplo
Solução:
g.l = n – 1 = 20 – 1 = 19
Áreas à direita e à esquerda
1 − 𝑐 1 − 0,90
2
𝐴(𝞆𝑅 ) =
=
= 0,05
2
2
1 + 𝑐 1 + 0,90
2
𝐴 𝞆𝐿 =
=
= 0,95
2
2
Basta procurar na tabela a linha 19, colunas 0,95 e 0,05 e
encontraremos: 𝞆𝑅 2 = 30,144 e 𝞆𝐿 2 = 10,117.
Assim, 90% da área sob a curva está entre 10,117 e
30,144.
Exemplo: Conclusão
Exercício
Determine os valores críticos 𝞆𝑅 2 e 𝞆𝐿 2 para um
intervalo de confiança de 95% quando o tamanho
da amostra for de 95%.
Siga o roteiro:
1. Identifique os graus de liberdade e o nível de
confiança.
2
2. Obtenha 𝐴(𝞆𝑅 ) e 𝐴 𝞆𝐿 2
3. Use a tabela para obter 𝞆𝑅 2 e 𝞆𝐿 2
I.C para a Variância e o Desvio Padrão
Definição:
Um intervalo de confiança c para a variância e o
desvio padrão estão dados a seguir:
Para a Variância:
(𝑛−1)𝑠 2
𝞆𝑅 2
< 𝜎2 <
Para o Desvio Padrão: :
(𝑛−1)𝑠 2
𝞆𝑅 2
(𝑛−1)𝑠 2
𝞆𝐿 2
<𝜎<
(𝑛−1)𝑠 2
𝞆𝐿 2
A probabilidade de que o I.C contenha 𝜎 2 ou 𝜎 é c.
Exemplo
Selecionamos e pesamos 30 amostras de um
determinado antialérgico. O desvio padrão da
amostra é de 1,2mg. Supondo que os pesos
tenham uma distribuição normal, construa um
intervalo de confiança de 99% para a variância e
o desvio padrão populacionais.
Exemplo: Solução
As áreas à direita de 𝟀𝑹 𝟐 e 𝟀𝑳 𝟐 são:
1 − 𝑐 1 − 0,99
𝐴(𝞆𝑅 ) =
=
= 0,005
2
2
1 + 𝑐 1 + 0,99
2
𝐴 𝞆𝐿 =
=
= 0,995
2
2
Na tabela, temos: 𝞆𝑅 2 = 52,366 e 𝞆𝐿 2 = 13,121
Considerando os dados:
n = 30 ⇒ g.l = 30 – 1 = 29, c = 0,99 e s = 1,2
Teremos os I.C para 𝜎 2 e 𝜎 :
2
Exemplo: Solução
• Extremo esquerdo:
• Extremo direito:
(𝑛−1)𝑠 2
𝞆𝑅 2
(𝑛−1)𝑠 2
𝞆𝐿 2
=
=
(30−1)(1,2)2
52,336
(30−1)(1,2)2
13,121
≈ 0,798
≈ 3,183
Assim,
0,798 < 𝜎 2 < 3,183 e 0,89 < 𝜎 < 1,78
Exemplo: Conclusão
Podemos afirmar com 99% de confiança que a
variância populacional está entre 0,798 e 3,183.
O desvio padrão populacional está entre 0,89 e
1,78mg.
Exercício
Obtenha com os dados do exemplo anterior os intervalos de
confiança de 90% e 95% para a variância e o desvio padrão
populacionais dos pesos do antialérgico, seguindo o roteiro:
1. Obtenha os valores críticos 𝞆𝑅 2 e 𝞆𝐿 2 para cada I.C
2. Use n, s, 𝞆𝑅 2 e 𝞆𝐿 2 para obter os I.C para 𝜎 2
3. Obtenha os I.C para 𝜎
4. Especifique os I.C de 90% e 95% para 𝜎 2 e 𝜎