1 13 ESTIMAÇÃO DE PARÂMETROS E

Propaganda
1
13 ESTIMAÇÃO DE PARÂMETROS E DISTRIBUIÇÃO AMOSTRAL
Como visto em amostragem no primeiro bimestre, existem fatores que fazem com que a
observação de toda uma população em uma pesquisa seja impraticável, muitas vezes em virtude do
custo e do tempo gasto. Considera-se então uma amostra, e se esta for representativa, os resultados
poderão ser generalizados para a população.
Toda conclusão tirada por uma amostragem, quando generalizada para a população, virá
acompanhada de um grau de incerteza ou risco.
O conjunto de técnicas e procedimentos que permitem obter informações sobre uma
população a partir de resultados observados na amostra recebe o nome de Inferência Estatística.
Um problema importante da Inferência Estatística é a estimação de parâmetros (tais como
a média (µ ) , o desvio padrão (σ ) , a variância σ 2 , etc) correspondente.
Existem dois casos de estimação de parâmetros: a estimação por ponto e a estimação por
intervalo. No primeiro caso, obtém-se um valor único para o parâmetro, ao passo que, no segundo,
constrói-se um intervalo em torno da estimativa por ponto, o qual deverá com probabilidade
conhecida, conter o parâmetro.
( )
13.1 ESTIMADOR /ESTATÍSTICA E ESTIMATIVA
Estimador T de um parâmetro θ é a variável aleatória, função dos elementos da amostra,
que será utilizada na estimação.
O valor numérico obtido para o estimador considerado, numa certa amostra, é denominado
de estimativa.
Por exemplo, ao estimarmos a média de uma população utilizamos como estimador a
média aritmética amostral, obtendo como estimativa o valor 173,5cm, por exemplo. Assim, o
estimador é a média aritmética e a estimativa é x = 173,5 cm.
A notação utilizada para o estimador geralmente é feita por letras maiúsculas, e para a
estimativa, letras minúsculas. No caso da média, a notação do estimador será X e da estimativa
será x .
13.2 DISTRIBUIÇÃO AMOSTRAL
Considere todas as possíveis amostras de tamanho n que podem ser extraídas de
determinada população. Se para cada uma delas se calcular um valor do estimador, tem-se uma
distribuição amostral desse estimador. Ora, como o estimador é uma variável aleatória, pode-se
determinar suas características, isto é, encontrar sua média, variância e desvio padrão.
Assim, a distribuição de probabilidade de um estimador, por exemplo X , é chamada de
distribuição amostral, neste caso distribuição amostral das médias.
13.2.1 Distribuição amostral das médias
Lembrando o conceito de distribuição amostral, visto anteriormente, buscamos descobrir
qual é a distribuição de probabilidade da média aritmética X .
Figura 1: Distribuição amostral das médias
2
Teorema 1: A média da distribuição amostral das médias, denotada por µ x é igual à média
E (X ) = µ x = µ
populacional µ . Isto é:
Assim, a média das médias amostrais é igual à média populacional.
(
)
Demonstração: Primeiramente vamos relembrar que X ~ N µ , σ 2 , assim:
n
 ∑ xi  1  n  1 n
 = E  ∑ x i  = ∑ E ( x i ) = 1 ∑ µ = 1 nµ = µ
E (X ) = E 
 n  n  i =1  n i =1
n i =1
n


 ∑ xi  1
nσ 2 σ 2
=
(
)
=
=
V (X ) = V 
V
x
i
2
 n  n2 ∑
n
n


 σ2

Portanto: X ~ N  µ ,
n 

Teorema 2: Se a população é infinita, ou se a amostragem é com reposição, então o desvio padrão
(também chamado de erro padrão) da distribuição amostral das médias, denotado por σ x é dado
σx =
por:
σ
n
Teorema 3: Se a população é finita, ou se a amostragem é sem reposição, então o desvio padrão da
distribuição amostral das médias é dado por:
σ N −n
σx =
n N −1
N −n
Onde o fator
é denominado de fator de população finita.
N −1
N −n
= 1 . Dessa forma quando tiramos uma amostra grande de
N → +∞ N − 1
uma população muito maior (pelo menos o dobro), é indiferente usar o fator de população finita
para se calcular σ x , pois o erro será muito, pequeno.
Para n suficientemente grande ( n ≥ 30 ), tem-se que a distribuição amostral das médias é
aproximadamente normal, garantido pelo Teorema central do Limite1. Se a população for normal,
a distribuição amostral das médias também será normal, independente do tamanho da amostra.
Pode-se notar que lim
Teorema 4: Podemos concluir que:
 σ N −n
 σ 
 para populações finitas.
X ~ N  µ ,
 para populações infinitas, e X ~ N  µ ,

N
−
1
n
n




Para os casos de populações infinitas ou finitas, as variáveis padronizadas serão dadas,
respectivamente por:
X −µ
X −µ
Z=
ou
Z=
σ
σ N −n
n
n N −1
1
Se estivermos realizando uma amostragem de uma população que tenha uma distribuição de probabilidade
desconhecida, a distribuição amostral de média da amostra será aproximadamente normal, com média µ e variância
σ 2 n , se o tamanho da amostra for grande. Esse é um dos teoremas mais úteis em estatística. Ele é chamado de
Teorema Central do limite .
3
13.2.2 Distribuição Amostral das Variâncias
Tomando todas as amostras aleatórias possíveis, de tamanho n, de uma população, e
calculando a variância de cada amostra, obtemos a distribuição amostral das variâncias. Se as
amostras de tamanho n forem extraídas de uma população normal de variância σ 2 , então a variável
aleatória χ 2 , dada por
(n − 1)s 2
χ2 =
σ2
onde s 2 é a variância amostral, dada por
n
s2 =
∑ ( x i − x )2
i =1
n −1
que tem uma distribuição qui-quadrado com ν = n − 1 graus de liberdade.
Dessa forma, temos que :
(n − 1)s 2
σ
2
~ χ n2−1 .
Podemos dizer também, que
s2 =
σ2
n −1
⋅ χ n2−1
isto é, s 2 segue uma distribuição χ 2 , com ν = n − 1 graus de liberdade.
Figura 3: Distribuição amostral da estatística qui-quadrado
Pode-se demonstrar que a distribuição amostral das variâncias s 2 , a média µ s 2 e a variância σ s22
são dadas respectivamente por:
µ s2 = E s 2 = σ 2
( )
σ s2 = V (s 2 ) =
2
2σ 4
n −1
13.2.3 Distribuição amostral das proporções ou freqüências relativas
Seja X uma população infinita tal que p seja a probabilidade de sucesso de certo evento e
q = 1 − p a probabilidade de fracasso. Seja ( x1 , x2 , K , x n ) uma amostra aleatória de n elementos
dessa população e h o número de sucessos na amostra, identificado como uma variável aleatória
com distribuição Binomial, de média np e variância npq. Podemos determinar ainda a freqüência
4
h
. O conjunto das freqüências relativas calculadas para cada
n
amostra constitui a distribuição amostral das proporções ou freqüências relativas.
relativa ou proporção como f r = P =
Figura 3: Distribuição amostral das proporções
( )
A média (µ P ) e a variância σ P2 dessa distribuição serão dadas, respectivamente, por:
 h  np
E (P ) = E   =
= p ⇒ µP = p
n n
npq pq
pq
h 1
V (P ) = V   = 2 ⋅ V (h ) = 2 =
⇒ σ P2 =
n
n
n
n n
Logo, a distribuição amostral das médias tem uma média µ P = p e desvio padrão
σP =
pq
.
n
No caso de amostragem obtida sem reposição ou população finita, tem-se que:
µP = p e σ P =
pq  N − n 
⋅

n  N −1 
Sendo as amostras suficientemente grandes, a distribuição amostral das proporções, que
segue a distribuição binomial, poderá se aproximar de uma distribuição normal de mesma média e
mesma variância. Na prática, essa aproximação é utilizada para np ≥ 5 e nq ≥ 5. Assim, para esses
 pq 
casos, P ~ N  p,
 e os valores da variável padronizada são dados por:
n 

P − µP
Z=
pq
n
Como a distribuição amostral das proporções é Binomial, que é discreta, e vamos usar uma
1
,
aproximação pela normal, que é contínua, o cálculo de Z deve ser corrigido por meio do fator
2n
1
P±
− µP
2n
ficando: Z =
.
pq
n
Esse fator de correção corresponde à semi-amplitude dos intervalos entre dois valores
consecutivos de P. Dessa forma, um valor de P passa a ser representado por um intervalo de
1
1
.
amplitude e extremos P ±
n
2n
5
Exercícios
1) Uma população se constitui dos números 2, 3, 4 e 5. Considere todas as amostras possíveis, de
tamanho 2, que podem ser extraídas dessa população sem reposição. Determine a distribuição
amostral das médias, calculando a média e o desvio padrão dessa distribuição.
Resposta: µ x = 3,5 e σ x = 0,64
2) Seja X ~ N (80, 26) . Retira-se dessa população uma amostra de tamanho n = 25 . Calcular:
a) P( x > 83)
b) P( x < 82)
c) P ( x − 2σ x ≤ µ ≤ x + 2σ x )
Respostas: a) 0,0016
b) 0,975
c) 0,9544
3) Seja X ~ N (1200, 840) . Qual deverá ser o tamanho de uma amostra de tal forma que
P(1196 < x < 1204) = 0,9 ?
Resposta: n ≈ 144
4) Uma indústria fabrica válvulas elétricas, sendo 5% defeituosas. Foi adquirido um lote de 1000
válvulas. Qual a probabilidade de que o lote tenha:
a) exatamente 30 válvulas defeituosas?
b) mais de 60 válvulas defeituosas?
c) no máximo 50 válvulas defeituosas?
Respostas: a) 0,013
b) 0,0262
c) 0,5359
5) A granja “Ovo Bom” vende ovos aos supermercados em lotes de 100 caixas de seis dúzias. Dado
que seus lotes costumam apresentar 5% de ovos chocos, em quantas amostras de 20 caixas esperamse encontrar menos de 90% de ovos bons?
Resposta: Em no máximo 1 caixa.
6) Deseja-se saber qual a proporção de pessoas da população portadoras de determinada doença.
Retira-se uma amostra de 400 pessoas, obtendo-se 8 portadores da doença. Definir limites de
confiabilidade de 99% para a proporção populacional.
Resposta: 12 ≤ p ≤ 1488 proporção de pessoas portadoras de doenças.
4) Certa indústria remete 1000 caixas contendo 30 componentes eletrônicos cada uma. Se 4% dos
componentes são defeituosos, em quantas caixas podemos esperar que existam pelo menos 27
componentes perfeitos?
Resposta: 983 caixas
13.3 Qualidade de um bom estimador
Quanto maior o grau de concentração da distribuição amostral do estimador em torno do
verdadeiro valor do parâmetro populacional, melhor será o estimador. As principais qualidades de
um estimador devem ser:
a) Consistência (estimador consistente);
b) Ausência de vício (estimador não-tendencioso);
c) Eficiência (estimador de variância mínima);
d) Suficiência (estimador suficiente).
6
13.3.1 Estimador consistente
Um estimador Tn de um parâmetro θ é dito consistente se as seguintes condições forem
satisfeitas:
lim E (Tn ) = θ e lim V (Tn ) = 0 .
n →∞
n →∞
De forma geral, pode-se dizer que um estimador é consistente quando para amostras
suficientemente grandes tornam o erro de estimação tão pequeno quanto se queira.
Exercício 1: Mostre que a média amostral X é um estimador consistente da média populacional µ
(considere amostragem com reposição).
Resolução:
Obs :Se a população é infinita ou se a amostragem é com reposição, então o desvio padrão da
média, também chamado de erro padrão, é σ x =
 n
 ∑ xi
lim E (X ) = lim E  i =1
n →∞
n →∞ 
n


lim V ( X ) = lim
n →∞
n→∞
σ2
n
σ
.
n


n
n
n
 = lim 1 E  x  = lim 1 E ( x ) = lim 1 µ = lim 1 nµ = µ
∑
∑
∑
i
i
 n→∞ n  i =1  n→∞ n i =1
n→ ∞ n
n →∞ n
i =1


=0
13.3.2 Estimador não-tendencioso
Um estimador Tn de um parâmetro θ é dito não-tendencioso, não-viciado, justo ou nãoviesado se:
E (Tn ) = θ .
O valor da tendenciosidade B é definida como sendo B = E (t n ) − θ .
Observação: para estimadores não-tendenciosos, a condição de consistência é
simplesmente lim V (t n ) = 0 .
n →∞
(
)
Exercício 2: Seja X ~ N µ , σ 2 . Sabemos que X é um estimador não-tendencioso de µ , pois
n
como já demonstrado, E (X ) = µ . Mostre que s 2 =
σ 2 , ou seja, E (s 2 ) = σ 2 .
Resolução:
 n
2 
 ∑ ( xi − x ) 

E s 2 = E  i =1


n −1




n
1


E s2 =
E  ∑ xi2 − 2nx 2 + nx 2 
n − 1  i =1

( )
( )
( )
E s2 =
1
 n

E  ∑ xi2 − nx 2 
n − 1  i =1

∑ ( x i − x )2
i =1
n −1
é um estimador não-tendencioso de
7
( )
E s2 =
1   n 
 E  ∑ xi  − E nx 2
n − 1   i =1 
( )

1 

E (s 2 ) =
 ∑ E ( xi ) − nE (x 2 )
n − 1  i =1

n
(
(1)
)
Temos que X ~ N µ , σ 2 , então:
( ) − [E ( X )]
V (X ) = E X
2
2
( ) = V ( X ) + [E ( X )]
E (X ) = σ + µ
E X
2
2
2
2
(2)
2
E além disso:
2
V (X ) = E X 2 − [E ( X )]
σ
2
( )
= E (X ) − µ
2
n
( )=
E X
2
σ2
n
2
(3)
+ µ2
Assim:, substituindo (2) e (3) em (1) , temos:
( )
σ 2

1  n
 ∑ σ 2 + µ 2 − n
+ µ 2  


n − 1  i =1
 n

1
=
nσ 2 + nµ 2 − σ 2 − nµ 2
n −1
1
=
σ 2 (n − 1)
n −1
=σ 2
(
E s2 =
( )
E s2
( )
E (s )
E s2
2
)
(
(
)
)
Portando s 2 é um estimador não tendencioso de σ 2 .
13.3.3 Estimador de variância mínima
Dados dois estimadores T1 e T2 , usados na estimação de um mesmo parâmetro θ , diz-se
que T1 é mais eficiente que T2 como estimador de θ se, para o mesmo tamanho da amostra
E (T1 − θ ) < E (T2 − θ ) .
2
2
Se T1 e T2 forem estimadores não-tendenciosos de θ , ou seja E (T1 ) = θ e E (T2 ) = θ , essa
condição indicará que a variância de T1 é menor que a variância de T2 , ou seja, V (T1 ) < V (T2 ) .
Se T1 é mais eficiente que T2 como estimador de θ , pode-se definir a relação
[
E [(T
]
−θ ) ]
E (T1 − θ )
2
2
2
como sendo a eficiência de T2 em relação a T1 como estimador de θ . Se T1 e T2 forem ambos nãotendenciosos, a eficiência relativa se reduzirá ao quociente das respectivas variâncias, ou seja,
V (T1 )
.
V (T2 )
8
13.3.5 Estimador suficiente
Um estimador Tn de θ é suficiente se ele tem a capacidade de retirar da amostra toda
informação que ela pode fornecer.
Exemplo: A média X é um estimador suficiente de µ .
13.4 Estimação por ponto
Na estimação por ponto o parâmetro é estimado através de um valor único, que
corresponde a um ponto sobre o eixo de variação da variável. A seguir são apresentados alguns dos
principais estimadores por ponto.
13.4.1 Estimador da média populacional µ
O estimador nesse caso é a média aritmética amostral, sendo não-tendencioso, eficiente e
suficiente, dado por:
n
X =
∑ xi
i =1
n
13.4.2 Estimador da variância populacional σ 2
Quando a média populacional µ for conhecida, o estimador será a variância amostral s 2 ,
dada por:
n
s2 =
∑ ( x i − µ )2
i =1
n
.
Quando µ for desconhecida, a variância amostral s 2 será dada por:
n
s2 =
∑ ( x i − x )2
i =1
n −1
Nos dois casos temos estimativas não-tendenciosas.
13.4.3 Estimador do desvio padrão populacional σ
Sabemos que o desvio padrão é definido como a raiz quadrada da variância, porém, mesmo
sendo s um estimador não-tendencioso da variância populacional, a raiz quadrada de s 2 não é um
estimador não-tendencioso do desvio padrão populacional σ . Entretanto, a tendenciosidade de s
tende a zero no caso de grandes amostras. Portanto, para grandes amostras, quando µ for
conhecida,
2
n
s=
∑ (xi − µ )2
i =1
n
9
e quando µ for desconhecida,
n
∑ ( x i − x )2
i =1
s=
n −1
.
13.4.4 Estimador da proporção populacional p
O estimador não-tendencioso P da proporção populacional p é fornecido por:
h
P=
n
onde h é o número de sucessos na amostra.
Exercício: Uma amostra de 10 válvulas eletrônicas foi testada e os tempos de vida (em horas)
foram:
2100, 2150, 2200, 2130, 2180, 2120, 2180, 2100, 2130 e 2160
Estimar o tempo médio de vida e a variância desse tipo de válvula.
Resposta: X = 1205,56 , V (X ) = 2145h
13.5 Estimação por Intervalos
A estimação por pontos de um parâmetro não possui uma medida do possível erro
cometido na estimação. Uma maneira de expressar a precisão da estimação é estabelecer limites,
que com certa probabilidade incluam o verdadeiro valor do parâmetro da população.
Seja o parâmetro θ , tal que P(t1 ≤ θ ≤ t 2 ) = 1 − α . O intervalo t1 ≤ θ ≤ t 2 é denominado de
intervalo de confiança (IC); os extremos desse intervalo (t1 e t 2 ) são denominados de limites de
confiança; a probabilidade (1 − α ) é denominada de nível de confiança; e α é o nível de incerteza
da inferência, ou nível de significância.
A escolha do nível de confiança (1 − α ) depende da precisão com que se deseja estimar o
parâmetro. É muito comum a utilização dos níveis de 95% e 99%. Evidentemente, o aumento da
confiança no intervalo implica no aumento de sua amplitude.
13.5.1 Intervalo de confiança para a media populacional µ
1° caso: O desvio padrão populacional σ é conhecido.
Considere uma população normal com média desconhecida que desejamos estimar e
variância σ 2 conhecida, ou seja, X ~ N ?, σ 2 .
Procedimento para a construção do IC:
1. Retiramos uma amostra casual simples de tamanho n.
2. Calculamos a média amostral X .
(
)
3. Calculamos o desvio padrão da média amostral: σ x =
σ
n
4. Fixamos o nível de significância α , e com ele determinamos zα / 2 , tal que
P (Z > z α / 2 ) =
α
2
e P (Z < z α / 2 ) =
α
2
. Graficamente temos:
10
Portanto, P (− zα / 2 ≤ Z ≤ zα / 2 ) = 1 − α . Substituindo Z =
x−µ
σ
e isolando µ , temos:
n

σ
σ 
≤ µ ≤ x + zα / 2 ⋅
 = 1 − α
P x − zα / 2 ⋅
n
n

Dessa forma, o IC de (1 − α )% para µ será:
x − zα / 2 ⋅
σ
n
≤ µ ≤ x + zα / 2 ⋅
σ
n
Exercícios:
1) De uma população normal X, com σ 2 = 9 , tiramos uma amostra de 25 observações, obtendo
25
∑ xi = 152. Determinar um IC de 90% para a média populacional.
i =1
Resposta: (5,09;7,07 )
2) O desvio padrão dos comprimentos das peças produzidas por certa máquina é 2 mm. Uma
amostra de 50 peças produzidas por essa máquina apresentou média x = 25 mm. Construir o IC de
95% para o verdadeiro comprimento das peças produzidas por essa máquina.
Resposta: (24,4;25,6)
3) De uma população normal com σ = 5 , tiramos uma amostra de 50 elementos e obtemos x = 42 .
a) Determine o IC para a média ao nível de significância de 5%.
b) Qual o erro de estimação ao nível de 5%.
c) Para que o erro seja menor ou igual a 1, com probabilidade de acerto de 95%, qual deverá ser o
tamanho da amostra?
Resposta: a) (40,61;43,386)
b) 1,39
c) n ≥ 96
11
2° caso: O desvio padrão populacional σ é desconhecido.
Neste caso utilizamos a distribuição t de Student. Os procedimentos são os mesmos do
caso anterior e graficamente temos:
Devemos então, determinar o valor de tα / 2 , tal que:
P(− tα / 2 ≤ t ≤ tα / 2 ) = 1 − α
onde t =
x−µ
, com ν = n − 1 graus de liberdade.
s
n
Portanto, IC de (1 − α )% para µ será:
x − tα / 2 ⋅
s
n
≤ µ ≤ x + tα / 2 ⋅
s
n
.
Sabemos que a distribuição t de Student tende para a distribuição normal padrão quando
ν → ∞ , e como ν depende de n , podemos utilizar a distribuição normal quando n > 30 .
Exercícios
1) Uma mostra de cabos produzidos por uma indústria foi ensaiada e as tensões de ruptura obtidas
foram (em kgf): 750, 780, 745, 770 e 765. Construir o IC de 99% para a verdadeira tensão de
ruptura dos cabos.
Resposta: (7324;791,6)
2) A altura dos homens de uma cidade apresenta distribuição normal. Para estimar a altura média
150
dessa população, levantou-se uma amostra de 150 indivíduos obtendo-se
∑ xi = 25800 cm e
i =1
150
∑ xi2 = 4.440.075 cm 2 .
i =1
Resposta: (171,23;172,78)
3) Uma amostra aleatória de 80 notas de matemática de uma população com distribuição normal de
5000 notas apresenta média de 5,5 e desvio padrão de 1,25.
a) Quais os limites de confiança de 95% para a média das5000 notas?
b) Com que grau de confiança diríamos que a média das notas é maior que 5,0 e menor que 6,0?
Resposta: a) (5,23;5,77 )
b) 99,96%
12
13.5.2 Intervalo de confiança para a diferença entre duas médias populacionais µ1 e µ 2
1º caso: Os desvios padrões populacionais σ 1 e σ 2 são conhecidos
Neste caso utilizamos a estatística z dada por:
(x − x2 ) − (µ1 − µ 2 )
z= 1
σ 12
n1
+
σ 22
n2
onde P(− zα / 2 ≤ z ≤ zα / 2 ) = 1 − α .
Substituindo a estatística z na probabilidade acima e isolando µ1 − µ 2 , obtemos o IC de
(1 − α )100% para a diferença entre as médias:
(x1 − x2 ) − zα / 2 ⋅
σ 12
n1
+
σ 22
n2
≤ µ1 − µ 2 ≤ ( x1 − x 2 ) + zα / 2 ⋅
σ 12
n1
+
σ 22
n2
Exemplos:
1) Das populações normais e independentes X e Y extraem-se amostras de tamanho n x = 9 e
n y = 15 . As médias amostrais são x = 10 e y = 5 ; os desvios padrões populacionais são σ x = 6 e
σ y = 3 . Determine o IC da diferença das médias populacionais a um nível de significância de 3%.
Resposta: 0,346 ≤ µ x − µ y ≤ 9,65
2) Os desvios padrões das durações das lâmpadas elétricas fabricadas pelas indústrias A e B são,
respectivamente, 50h e 80h. Foram ensaiadas 40 lâmpadas de cada marca e as durações médias
obtidas foram 1200h e 1100h, para A e B, respectivamente. Construir o IC de 99% para a diferença
entre os tempos médios de vida das lâmpadas de marcas A e B.
Resposta: 61,5 ≤ µ A − µ B ≤ 138,5
2º caso: Os desvios padrões populacionais σ 1 e σ 2 são desconhecidos e supostamente iguais
Neste caso utilizamos a estatística t dada por:
t=
(x1 − x2 ) − (µ1 − µ 2 )
1
1 
s 2p  + 
 n1 n2 
, onde s 2p =
(n1 − 1)s12 + (n2 − 1)s 22
n1 + n 2 − 2
e ν = n1 + n2 − 2
Dessa forma, construímos o IC de (1 − α )100% para a diferença entre as médias:
1
1
1 
1 
s 2p  +  ≤ µ1 − µ 2 ≤ ( x1 − x 2 ) + tα / 2 ⋅ s 2p  + 
 n1 n2 
 n1 n2 
Exemplo: Os diâmetros (em mm) de uma amostra de 5 tubos da fábrica A sã: 45, 47, 45, 44 e 46.
Uma amostra de 6 tubos da fábrica B apresentou os diâmetros: 43, 45, 44, 44, 46 e 43 mm.
Construir o IC de 95% para a diferença entre os diâmetros médios.
Resposta: − 0,38 ≤ µ A − µ B ≤ 2,78
(x1 − x2 ) − tα / 2 ⋅
13
3º caso: Os desvios padrões populacionais σ 1 e σ 2 são desconhecidos e supostamente diferentes
Nesse caso utilizamos um método aproximado denominado Aspin-Welch, cuja estatística é
dada por:
t=
(x1 − x2 ) − (µ1 − µ 2 )
s12 s 22
+
n1 n2
com os graus de liberdade sendo o inteiro mais próximo ao resultado da relação:
ν≅
(w1 + w2 )2
w12
w22
+
n1 − 1 n 2 − 1
, onde w1 =
s12
s2
e w1 = 2
n1
n2
Exemplo: Em certo município, registros pluviométricos mostram que nos últimos 8 anos, durante o
mês de janeiro, a queda média foi de 125 mm com desvio padrão s1 = 25 mm. Outro município
apresentou nos últimos 5 anos, também no mês de janeiro, uma queda média de 100 mm cm desvio
padrão s 2 = 5 mm. Construa um IC de 99% para a diferença entre as quedas pluviométricas médias
µ1 e µ 2 .
Resposta: − 5,6 ≤ µ1 − µ 2 ≤ 55,6
13.5.3 Intervalo de confiança para a variância populacional σ 2
Observando a figura abaixo percebemos que P (χ
2
1−α / 2
≤ χ ≤ χα / 2
2
com ν = n − 1 graus de liberdade.
O IC de (1 − α )100% para σ 2 será:
(n − 1)s 2 ≤ σ 2 ≤ (n − 1)s 2
2
2
χα / 2
χ1−α / 2
2
) = 1 − α , onde χ
2
(
n − 1)s 2
=
,
σ2
14
Para construir o IC de (1 − α )100% para o desvio padrão populacional σ basta considerar a
raiz quadrada positiva do IC para a variância σ 2 . Dessa forma, temos para este caso:
(n − 1)s 2 ≤ σ
2
χα / 2
≤
(n − 1)s 2
χ12−α / 2
Exemplo: De uma amostra aleatória de dez itens de uma população normal obteve-se: x = 8 e
s 2 = 0,25 . Estime a variância e o desvio padrão populacionais, a 5% de significância.
Resposta: 0,34 ≤ σ ≤ 0,91
13.5.4 Intervalo de confiança para a proporção populacional p
Sabemos que para amostras suficientemente grandes, a distribuição amostral das proporções
P− p
é aproximadamente normal, com z =
.
pq
n
Para construirmos o IC para a proporção p populacional, determinamos p̂ na amostra,
h
onde pˆ = P = e qˆ = 1 − pˆ = 1 − P . Dessa forma, temos o IC de (1 − α )100% para p dado por:
n
P − zα / 2 ⋅
pˆ (1 − pˆ )
≤ p ≤ P + zα / 2 ⋅
n
pˆ (1 − pˆ )
n
Exemplos:
1) Em uma linha de produção de certa peça mecânica, colheu-se uma amostra de 100 itens,
constatando-se que 4 peças eram defeituosas. Construir o IC para a proporção p das peças
defeituosas ao nível de10%.
Resposta: 0,00767 ≤ p ≤ 0,00723
2) Para se estimar a porcentagem de alunos de um curso favoráveis à modificação do currículo
escolar, tomou-se uma amostra de 100 alunos, dos quais 80 foram favoráveis.
a) Construir um IC para a proporção de todos os alunos do curso favoráveis à modificação ao nível
de 4%.
b) Qual o valor do erro de estimação cometido em (a)?
Resposta: a) 0,718 ≤ p ≤ 0,88
b) e = 0,082
Download