Inferência Estatística

Capítulo 4
Slide 1
Inferência Estatística
Resenha
Intervalo de Confiança para uma proporção
Intervalo de Confiança para o valor médio de uma variável
aleatória
Intervalo de Confiança para a variância de uma variável
aleatória
Intervalo de Confiança para a diferença de duas
proporções
Intervalo de Confiança para a diferença dos valores
médios de duas variáveis aleatórias
Ana M. Abreu - 2006/07
Resenha
Slide 2
As duas maiores áreas de aplicação da
inferência estatística envolvem o uso de
amostras aleatórias para:
(1) estimar o valor de um parâmetro da
população ou de um intervalo de valores que
esse mesmo parâmetro pode tomar;
(2) testar alguma hipótese sobre a população ou,
em particular, sobre um certo parâmetro da
população.
Este capítulo aborda a primeira situação e o
capítulo 5 a segunda.
Ana M. Abreu - 2006/07
Definições
• Estimador
Slide 3
é uma fórmula ou um processo que usa os valores
da amostra para estimar um parâmetro populacional.
• Estimativa
❖
é um valor específico, ou intervalo de valores,
usado para aproximar o valor do parâmetro de uma
população.
• Estimativa pontual
❖
é um valor único usado para aproximar o valor do
parâmetro de uma população.
A proporção amostral ˆp (“p-chapéu”) é a melhor
estimativa pontual da proporção populacional p.
A média amostral “x-barra” é a melhor estimativa
pontual da média populacional µ.
Ana M. Abreu - 2006/07
Definição
Slide 4
Grau de confiança / Nível de
significância
O grau de confiança é habitualmente escrito
como 1 - α, onde α é o complementar do grau de
confiança, ou seja, é o nível de significância.
Assim, dizer que temos um grau de confiança de
0.95 (ou 95%) é o mesmo do que dizer que temos
um nível de significância α = 0.05. Do mesmo
modo, se 1 - α =0.99 (99%) então α = 0.01.
Ana M. Abreu - 2006/07
Notação para proporções
Slide 5
p=
proporção populacional
ˆp = nx
proporção amostral
(pronuncia-se
‘p-chapéu’)
de x sucessos numa amostra de
dimensão n
qˆ = 1 - pˆ = proporção amostral
de insucessos numa amostra de
dimensão n
Ana M. Abreu - 2006/07
Definição
Slide 6
Intervalo de Confiança
Um intervalo de confiança (ou intervalo de estimativas) é
um intervalo de valores usado para estimar o verdadeiro
valor de um parâmetro populacional.
O nível de confiança é a probabilidade 1—α
α
(frequentemente representada através da expressão
em percentagem) de que o intervalo de confiança, de
facto, contenha o verdadeiro valor do parâmetro.
É usual trabalhar com valores na ordem de
90%, 95%, ou 99%.
(α = 10%), (α = 5%), (α = 1%)
Ana M. Abreu - 2006/07
Definição
Slide 7
Valores críticos
Um valor crítico é um valor de referência para
“separar” os valores das estatísticas amostrais
que são prováveis de ocorrer daqueles que não o
são. O valor z1- α/2 é um valor crítico pois é um
valor de z com a característica de separar a área
igual a α/2 na cauda direita da distribuição Normal
Standard (Ver Figura 4-1).
Ana M. Abreu - 2006/07
Como determinar z1− α/2
α/ para um
intervalo de confiança de 95%
Slide 8
α =5%
α/2
α/ = 2.5% = .025
z1− α/2
zα/2
Valores Críticos
Ana M. Abreu - 2006/07
Figura 4-1
Intervalo de Confiança para a
proporção de uma população
ˆ
ˆ
p
q
pˆ ± z 1− α / 2
n
Slide 9
pˆ – z 1− α / 2
pˆ qˆ
< p < pˆ + z 1− α / 2
n
pˆ qˆ
n
(pˆ – z 1− α / 2
pˆ qˆ
pˆ qˆ , p + z
1− α / 2
ˆ
n
n
)
Ana M. Abreu - 2006/07
Procedimento para construir um
intervalo de confiança para p
Slide 10
1. Verifique que são verdadeiras as seguintes
condições:
a amostra é uma amostra aleatória
são válidas as condições da distribuição binomial, a
qual pode ser aproximada pela distribuição Normal
(recorde que para a aproximação ser válida tem que se
verificar np ≥ 5 e nq ≥ 5).
2. Na tabela correspondente à distribuição
Normal, encontre o valor crítico z 1−α2
1−α que
corresponde ao nível de confiança pretendido.
3. Calcule
pˆ qˆ
n
Ana M. Abreu - 2006/07
Procedimento para construir um
Slide 11
intervalo de confiança para p
4. Use os cálculos já efectuados para determinar
o intervalo de confiança na forma, por exemplo,
pˆ – z 1− α / 2
pˆ qˆ< p < pˆ + z
1− α / 2
n
5. Apresente os resultados com 3 casas
decimais.
Ana M. Abreu - 2006/07
pˆ qˆ
n
Dimensão da amostra para
estimar a proporção p
Quando se conhece uma estimativa de p, pˆ :
2
z


1α
2
ˆ
n=pˆ q

d 







onde d é a diferença máxima entre p e pˆ .
Quando não se conhece uma estimativa de p:







z
1 1- α 2
n
d
4







2
Ana M. Abreu - 2006/07
Slide 12
Estimação da média
populacional: σ conhecido
Slide 13
Pressupostos
1. O valor do desvio padrão
populacional, σ , é conhecido.
2. Uma ou ambas as condições
seguintes são satisfeitas:
A população tem distribuição Normal
ou n>30.
Ana M. Abreu - 2006/07
Intervalo de Confiança para a
média de uma população
Slide 14
x ± z 1− α/2 • σ/ n
x – z 1− α / 2 • σ/ n < µ < x + z 1− α / 2• σ/ n
(x – z 1− α / 2 • σ/ n , x + z 1− α / 2 • σ/ n)
Ana M. Abreu - 2006/07
Procedimento para construir um
Intervalo de Confiança para µ Slide 15
quando σ é conhecido
1. Verifique que os pressupostos são válidos.
2. Determine o valor crítico z1− α/2 que corresponde
ao nível de significância pretendido.
3. Calcule σ/
n e, em seguida, z 1− α/2 • σ/ n .
4. Calcule x –z 1− α/2 • σ/
n e x + z 1− α/2 • σ/ n .
Apresente os valores na forma:
x – z 1− α/2 • σ/ n < µ < x + z 1− α/2 • σ/ n
5. Apresente os resultados com 3 casas decimais.
Ana M. Abreu - 2006/07
Dimensão da amostra para
estimar a média µ
n=
(z1- α/2) •σ
Slide 16
2
d
onde d é a diferença máxima entre x e µ. No
caso de o valor não dar inteiro, aproxima-se
para o inteiro imediatamente a seguir.
Ana M. Abreu - 2006/07
Estimação da média
populacional: σ desconhecido
Slide 17
Pressupostos
1. O valor do desvio padrão
populacional, σ, é desconhecido.
2. Uma ou ambas as condições
seguintes são satisfeitas:
A população tem distribuição Normal
ou n>30.
Ana M. Abreu - 2006/07
Procedimento para construir um
intervalo de confiança para µ Slide 18
quando σ é desconhecido
1. Verifique que os pressupostos são satisfeitos
2. Se n 30, consulte a tabela da distribuição t de
Student para encontrar o valor do quantil 1- α/2 da
distribuição t de Student com n-1 graus de
liberdade.
3. Calcule s / n e, em seguida, t 1− α/2 • s / n .
4. Calcule x –t1− α/2 • s / n e x + t1− α/2 • s /
Apresente os valores na forma:
n.
x – t1− α/2 • s / n < µ < x + t1− α/2 • s / n
5. Apresente os resultados com 3 casas decimais.
Ana M. Abreu - 2006/07
Procedimento para construir um
intervalo de confiança para µ Slide 19
quando σ é desconhecido
1. Verifique que os pressupostos são satisfeitos
2. Se n>30, consulte a tabela da distribuição Normal
para encontrar o valor do quantil 1- α/2.
n e, em seguida, z1− α/2 • s / n .
4. Calcule x –z1− α/2 • s / n e x + z1− α/2 • s / n .
3. Calcule s /
Apresente os valores na forma:
x – z1− α/2 • s / n < µ < x + z1− α/2 • s / n
5. Apresente os resultados com 3 casas decimais.
Ana M. Abreu - 2006/07
Estimação da variância
populacional:
Slide 20
Pressupostos
1. A amostra é uma amostra aleatória.
2. A população deve ter distribuição Normal
(mesmo se a amostra for de dimensão
grande).
Ana M. Abreu - 2006/07
Intervalo de Confiança para a
variância de uma população
(n-1)s2
χ2(α/2
α/2;
α/2 n-1)
< σ2 <
Slide 21
(n-1)s2
χ2(1-α/2
α/2;
α/2 n-1)
onde:
n é a dimensão da amostra
s2 é a variância da amostra
χ2(α/2
α/2;
α/2
n-1) é o quantil α/2 da distribuição qui-
quadrado com n-1 graus de liberdade
Ana M. Abreu - 2006/07
Procedimento para construir um
intervalo de confiança para σ2 ou σ
Slide 22
1. Verifique que os pressupostos são válidos.
2. Consulte a tabela da distribuição χ2 para encontrar
2
os valores críticos χ2(α/2
e
χ
α/2;
(1-α/2
α/2;
α/2 n-1)
α/2 n-1) .
3. Determine os extremos do intervalo de confiança
pretendido usando as seguintes desigualdades:
(n-1)s2
χ2(α/2
α/2;
α/2 n-1)
< σ2 <
(n-1)s2
χ2(1-α/2
α/2;
α/2 n-1)
4. Se pretender obter um intervalo de confiança para σ,
calcule a raiz quadrada dos extremos do intervalo
anterior e substitua σ2 por σ.
Ana M. Abreu - 2006/07
Notação para
Duas Proporções
Para a população 1, seja:
p1 = proporção populacional
n1 = dimensão da amostra
x1 = nº de sucessos na amostra
^
p = x1 (a proporção amostral)
1
n1
q^ = 1 – p^
1
1
^,
Com o mesmo significado temos p2, n2, x2, p^
e
q
2
2
mas provenientes da população 2.
Ana M. Abreu - 2006/07
Slide 23
Intervalo de Confiança para
estimar p1 -
Slide 24
p2
( p^1 – p^ 2 ) ± z 1− α/2
α/
p^1 q^1
p^2 q^2
n1 + n2
Este intervalo só se aplica se as amostras forem
grandes, isto é, se n1>30 e n2>30.
Ana M. Abreu - 2006/07
Definições
Slide 25
Duas Amostras Independentes
Os valores de uma amostra aleatória de uma
população não estão relacionados ou
emparelhados com os valores da outra amostra
aleatória proveniente da outra população.
Se os valores de uma amostra estiverem
relacionados com os valores da outra amostra,
as amostras são dependentes. Um exemplo de
tais amostras são as designadas por amostras
emparelhadas.
Ana M. Abreu - 2006/07
Pressupostos
Slide 26
1. As duas amostras são independentes.
2. Ambas as amostras são amostras
aleatórias.
3. Uma ou ambas as condições seguintes
são satisfeitas: As amostras têm
dimensão grande (com n1 > 30 e n2 > 30)
ou ambas as amostras são provenientes
de populações com distribuição Normal.
Ana M. Abreu - 2006/07
Intervalo de Confiança
Slide 27
Quando σ1 e σ2 são desconhecidos:
(x1 – x2) ± z 1− α/2
α/
s2 2
s12
+
n2
n1
onde x1 é a média da amostra 1, s12 é a variância da
amostra 1 e
n1
é a dimensão da amostra 1.
Analogamente no que diz respeito a
relativamente à amostra 2.
Ana M. Abreu - 2006/07
x2, s22
e
n2,
Intervalo de Confiança
Slide 28
Quando σ1 e σ2 são conhecidos:
(x1 – x2) ± z 1− α/2
α/
onde
x1 é
σ +σ
n
n
2
1
2
2
1
2
a média da amostra 1,
da população 1 e
n1 é
σ 2 é a variância
1
a dimensão da amostra 1.
Analogamente no que diz respeito a x2,
relativamente à amostra e à população 2.
Ana M. Abreu - 2006/07
σ2
2
e
n2 ,
Pressupostos
Slide 29
1. As amostras são emparelhadas.
2. As amostras são amostras aleatórias.
3. Uma ou ambas as seguintes condições são
satisfeitas: O nº de pares da amostra é grande (n
> 30) ou as diferenças entre os pares de valores
são provenientes de uma população com
distribuição aproximadamente Normal.
Ana M. Abreu - 2006/07
Notação para Amostras
Emparelhadas
Slide 30
µd
= valor médio das diferenças resultantes
de cada par de indivíduos da população.
d
= valor médio das diferenças resultantes
de cada par de observações
(x1-y1=d1, …, xn-yn=dn).
sd
= desvio padrão das diferenças
resultantes de cada par de observações.
n
= nº de pares de observações.
Ana M. Abreu - 2006/07
Intervalo de Confiança
d – t1−α/2
sd
n
< µd < d + t1−α/2
onde t1−α/2 tem n –1 graus de
liberdade.
Ana M. Abreu - 2006/07
Slide 31
sd
n