Estimativa por Intervalo de Confiança

Propaganda
Estatística II
Aula 3
Prof.: Patricia Maria Bortolon, D. Sc.
Estimação por Intervalo
Objetivos
Nesta semana, veremos:
 Como construir e interpretar estimativas por
intervalos de confiança para a média e a proporção
 Como determinar o tamanho da amostra necessário
para desenvolver um intervalo de confiança para a
média e a proporção
 Como usar estimativas por intervalo de confiança
em auditoria
Tópicos
Intervalos de confiança para a média
populacional, μ
 Quando o desvio-padrão σ da população é
conhecido
 Quando o desvio-padrão σ é desconhecido
2. Intervalos de confiança para a proporção
populacional, π
3. Determinação do tamanho de amostra
requerido
1.
Estimativa Pontual

Uma estimativa pontual é um número único. Para a
média populacional (e o desvio-padrão
populacional), uma estimativa pontual é a média
de uma amostra (e o desvio-padrão de uma
amostra).
 Um intervalo de confiança traz informação
adicional sobre a variabilidade da informação
Limite Inferior de
Confiança
Estimativa Pontual
Largura do Intervalo de
Confiança
Limite Superior de
Confiança
Estimativas por Intervalo de Confiança
 Um intervalo de confiança dá uma estimativa
intervalar para os valores:
 Leva em consideração a variação nas estatísticas
amostrais que ocorrem de amostra para amostra
 Baseia-se em todas as observações de uma amostra
 Dá informações sobre quão próxima aquela informação
está do parâmetro populacional
 É estabelecido em termos do nível de confiança
 Ex. 95% de confiança, 99% de confiança
 Nunca pode ser 100% de confiança
Estimativa por Intervalo de Confiança
 A fórmula geral para todos os intervalos
de confiança é:
Estimativa Pontual
(Valor Crítico) (Erro Padrão)
Nível de Confiança
 Nível de Confiança
 Confiança em que o intervalo definido irá conter o
parâmetro populacional desconhecido.
 É um percentual (menor que 100%)
Nível de Confiança
 Suponha nível de confiança = 95%
 Também escrito (1 - ) = 0,95
 Uma interpretação em termos de frequência
relativa:
 No longo prazo, 95% de todos os intervalos de
confiança que puderem ser construídos, irão conter
o verdadeiro parâmetro populacional desconhecido.
 Um intervalo específico pode conter ou não o
verdadeiro parâmetro populacional.
Intervalo de Confiança
 Por que não levar o nível de confiança o mais
próximo de 100% possível?
 Porque isto implicaria aumentar também o intervalo de
confiança diminuindo a precisão;
 Intervalos maiores são piores para a tomada de decisões;
 Até aqui, quanto maior o nível de confiança maior o
intervalo de confiança!
Intervalo de Confiança para a Média
(σ conhecido)
Premissas:
 População com desvio-padrão conhecido
 População com distribuição nos moldes da
distribuição normal
 Se a população não for normal, use amostras
grandes
Estimativa do Intervalo de Confiança:
σ
XZ
n
(onde Z é o valor crítico para uma probabilidade α/2 em
cada cauda, de uma distribuição normal padronizada)
Encontrando o Valor Crítico, Z
Considere um intervalo com um nível de
confiança igual a 95%:
1   .95
α
 .025
2
Z unidades:
X unidades:
α
 .025
2
Z= -1,96
Limite Inferior
do Intervalo de
Confiança
0
Estimativa
Pontual
Z= 1,96
Limite Superior
do Intervalo de
Confiança
Encontrando o Valor Crítico, Z
Os intervalos de confiança mais comuns são 90%,
95%, e 99%
Nível de
Confiança
Coeficiente
de confiança
Valor-Z
80%
90%
95%
98%
99%
99.8%
99.9%
.80
.90
.95
.98
.99
.998
.999
1,28
1,645
1,96
2,33
2,58
3,08
3,27
Intervalos e Níveis de Confiança
Distribuição da Média
Amostral
/2
Intervalos se
extendem de
σ
X Z
n
1 
x
μx  μ
x1
x2
até
σ
X Z
n
/2
Intervalos de Confiança
(1-)x100%
dos intervalos
construídos
contém μ;
()x100% não
contém.
Intervalo de Confiança para μ
(σ conhecido) Exemplo
 Uma amostra de 11 circuitos retirada de uma
população que segue a distribuição normal, tem
resistência média de 2,20 ohms. Nós sabemos, de
testes passados, que o desvio padrão da população
é .35 ohms.
 Determine um intervalo de confiança a 95% de
confiança para a verdadeira resistência média da
população de circuitos.
Intervalo de Confiança para μ
(σ conhecido) Exemplo
σ
X Z
n
 2,20  1,96 (.35/ 11)
 2,20  .2068
(1,9932; 2,4068)

Nós estamos 95% confiantes de que o intervalo 1,9932 a 2,4068
ohms contém a verdadeira média da população.

Apesar da verdadeira média poder ou não estar dentro deste
intervalo, 95% dos intervalos formados desta maneira conterão
a verdadeira média.
Intervalo de Confiança para μ
(σ Desconhecido)
 Se o desvio-padrão da população é desconhecido,
nós podemos usar o desvio-padrão da amostra, S
 Isso introduz uma incerteza adicional, já que S é
varia de amostra para amostra
 Então, utiliza-se a distribuição t ao invés da
distribuição normal
Intervalo de Confiança para μ
(σ Desconhecido)
Premissas:
 População com desvio-padrão desconhecido
 População normalmente distribuída
 Se a população não for normal, use amostras
grandes
Use a distribuição t de Student
Estimativa do Intervalo de Confiança:
X  t n-1
S
n
(onde t é o valor crítico de uma distribuição t
com n-1 g.l. e áreas α/2 em cada cauda)
Distribuição t de Student
 O valor t depende dos graus de liberdade (g.l.)
 Número de observações que são livres para variar
depois que a média da amostra foi calculada
g.l. = n - 1
Graus de Liberdade
Idéia: Número de observações que são livres para
variar depois que a média da amostra foi
calculada
Exemplo: Suponha que a média de 3 números
seja igual a 8.0
 Seja X1 = 7
 Seja X2 = 8
 Qual deve ser o valor de X3?
Se a média dos três valores é
8.0, então
X3 tem que ser igual a 9
(i.e., X3 não é livre para variar)
Aqui, n = 3, então os graus de liberdade são = n – 1 = 3 – 1 = 2
(2 números podem assumir qualquer valor, mas o terceiro não está
livre para variar dada uma certa média)
Distribuição t de Student
Obs: t
Z à medida que n aumenta
Normal Padrão
(t com gl = ∞)
t (gl = 13)
Distribuições t são em forma
de sino, simétricas, mas com
caudas mais “gordas” que a
distribuição normal
t (gl = 5)
0
t
Tabela da Distribuição t de Student
Area Cauda Sup.
gl
.25
.10
.05
1 1,000 3,078 6,314
Seja: n = 3
gl = n - 1 = 2
 = .10
/2 =.05
2 0,817 1,886 2,920
/2 = .05
3 0,765 1,638 2,353
O corpo da tabela contém
valores t, não probabilidades
0
2,920
t
Intervalo de Confiança para μ
(σ Desconhecido) Exemplo
Uma amostra aleatória com n = 25 elementos tem X
= 50 e S = 8. Construa um intervalo de confiança
para a média μ a um nível de confiança de 95%
 g.l. = n – 1 = 24, então
 O intervalo de confiança é
X  t/2, n -1
S
8
 50  (2,0639)
n
25
(46,698 ; 53,302)
Intervalo de Confiança para a Proporção
Populacional, π
 Uma estimativa de intervalo para a proporção
populacional ( π ) pode ser calculada
acrescentando uma incerteza à proporção na
amostra ( p )
Intervalo de Confiança para a Proporção
Populacional, π
Lembre que a distribuição da proporção amostral é
aproximadamente normal, se o tamanho da amostra
for grande, com desvio-padrão
σp 
 (1   )
n
que pode ser estimado a partir dos dados da
amostra com:
p(1 p)
n
Intervalo de Confiança para a Proporção
Populacional, π
Os limites superiores e inferiores do intervalo de
confiança para a proporção populacional são
calculados a partir da fórmula
p(1  p)
pZ
n
onde
 Z é o valor crítico para o intervalo de
confiança desejado, obtido na distribuição
normal padronizada
 p é a proporção na amostra
 n é o tamanho da amostra
Intervalo de Confiança para a Proporção
Populacional, Exemplo
Uma amostra aleatória de 100 pessoas mostrou
que 25 delas fizeram saques em seus fundos para
aposentadoria no último ano. Construa um
intervalo de confiança a 95% para a verdadeira
proporção da população que recorreu aos fundos
de aposentadoria.
p  Z p(1  p)/n
 25/100 1,96 .25(.75)/100
 .25  1,96 (.0433)
(0,1651 ; 0,3349)
Intervalo de Confiança para a Proporção
Populacional, Exemplo
 Com 95% de confiança podemos afirmar que o
intervalo entre 16,51% e 33,49% contém a
verdadeira proporção da população que fez saques
em seus fundos de aposentadoria. Apesar do
intervalo .1651 a .3349 poder ou não conter a
verdadeira proporção, 95% dos intervalos formados
desta maneira a partir de amostras de tamanho 100,
conterão a verdadeira proporção.
Determinando o Tamanho da Amostra
 O tamanho da amostra pode ser definido de tal
forma que a margem de erro (e) fique em
determinado tamanho com um nível de confiança
(1 - ) especificado.
 A margem de erro é também chamada erro
amostral
 É a imprecisão na estimativa do parâmetro populacional
 É o tamanho do intervalo que se soma e se subtrai da
estimativa pontual para construir o intervalo de confiança
Determinando o Tamanho da Amostra
 Para determinar o tamanho da amostra necessário
à estimativa da média, você deve conhecer:
 O nível de confiança desejado (1 - ), que
determina o valor crítico Z
 O erro amostral aceitável (margem de erro), e
 O desvio-padrão, σ
σ
XZ
n
σ
eZ
n
Resolvendo
para n
Z σ
n
2
e
2
2
Determinando o Tamanho da Amostra
Se  = 45, qual o tamanho da amostra necessária
para estimar a média com erro igual a ± 5 com
90% de confiança?
Z 2 σ 2 (1,645)2 (45)2
n 2 
 219,19
2
e
5
Então o tamanho da amostra necessária é n = 220
Determinando o Tamanho da Amostra
Para determinar o tamanho da amostra necessário à
estimativa da proporção populacional, você deve
conhecer:
 O nível de confiança desejado (1 - ), que determina o
valor crítico Z
 O erro amostral aceitável (margem de erro), e
 A verdadeira proporção de “sucessos”, π
 π pode ser estimado a partir de uma amostra piloto, se
necessário (ou para ser conservador use π = .50)
eZ
 (1   )
n
Resolvendo
para n
Z  (1   )
n
e2
2
Determinando o Tamanho da Amostra
 Qual o tamanho da amostra necessária a uma
estimativa da proporção de defeituosos em uma
grande população, com margem de erro menor ou
igual a ±3%, com 95% de confiança?
 (Assuma que uma amostra piloto identificou 12% de
defeituosos, ou seja, p = .12)
Determinando o Tamanho da Amostra
Solução:
Para 95% de confiança, use Z = 1.96
e = .03
p = .12, então use este valor para estimar π
Z 2  (1   ) (1,96)2 (.12)(1 .12)
n

 450,74
2
2
e
(.03)
Então use n = 451
Aplicações em Auditoria

Sete vantagens da amostragem em auditoria
 Consome menos tempo
 Custa menos
 Proporciona resultados que são objetivos e
defensáveis. Uma vez que o tamanho da amostra
é baseado em princípios estatísticos que podem
ser demonstrados, a auditoria é defensável
perante superiores hierárquicos e perante um
tribunal
 Permite estimar antecipadamente o tamanho da
amostra
Aplicações em Auditoria

Sete vantagens da amostragem em auditoria
 Proporciona uma estimativa para o erro de
amostragem
 Permite que os auditores combinem e
posteriormente avaliem, coletivamente, amostras
coletadas por diferentes indivíduos
 Permite que os auditores generalizem para a
população as suas descobertas, com um erro de
amostragem conhecido
Estimando o Valor Total da População
 Estimativa Pontual:
Total  NX
 Intervalo de Confiança para a Estimativa:
S
NX  N ( t n1 )
n
Nn
N 1
(Como a amostragem é sem reposição, use o fator de correção para
populações finitas na fórmula do intervalo de confiança)
Estimando o Valor Total da População
Exemplo
 Uma firma tem uma população de 1000 faturas e
deseja estimar o valor total das mesmas.
 Uma amostra de 80 faturas é selecionada com valor
médio de $87,6 e desvio padrão de $22,3.
 Encontre o intervalo de confiança para o valor total
das faturas a um nível de confiança de 95%.
Estimando o Valor Total da População
Exemplo
N  1000, n  80, X  87,6, S  22,3
N X  N (t n 1 )
S
n
Nn
N 1
 (1000)(87,6)  (1000)(1,9905)
22,3 1000  80
80 1000  1
 87.600  4.762,48
O intervalo de confiança para o valor total das faturas a 95%
de confiança é $82.837,52 to $92.362,48
Estimativa do Intervalo de Confiança Unilateral da Taxa
de Não-Conformidade com Controles Internos
Intervalo de Confiança Unilateral para uma Proporção
Aplicação: encontrar o limite superior para a proporção de itens que
não atendem a requisitos de controle
p(1  p)
Limite Superior  p  Z
n
Nn
N 1
Onde:
 Z é o valor crítico da normal padronizada para um
determinado nível de confiança desejado
 p é a proporção de itens na amostra que não atendem aos
requisitos
 n é o tamanho da amostra
 N é o tamanho da população
Intervalo de Confiança Unilateral para uma Proporção
Exemplo

Uma grande empresa de eletrônicos preenche 1 milhão de
cheques por ano. Uma norma interna da empresa estabelece
que cada cheque só pode ser assinado depois de um
documento ter sido gerado por um supervisor do setor de
contas a pagar. A taxa de exceção tolerável da empresa para
esse controle é de 4%. Se forem encontrados desvios em
relação ao controle em 8 dos 400 pagamentos selecionados
para a amostra, o que o auditor deve fazer? Para solucionar
este problema, utilize um nível de confiança de 95%.
Intervalo de Confiança Unilateral para uma Proporção
Exemplo

Solução: o auditor constrói um intervalo de confiança unilateral de
95% para a proporção de faturas em desacordo com os padrões de
conformidade e compara esse resultado com a taxa de exceção
tolerável:
8
 0,02 e Z  1,645 para um nível de confiança de 95%
400
p (1  p ) N  n
Limite Superior  p  Z
n
N 1
p
0,02(1  0,02) 1.000.000  400
Limite Superior  0,02  1,645
400
1.000.000  1
Limite Superior  0,02  1,645(0,007)(0,9998) 0,02  0,0115
Limite Superior  0,0315

Com 95% de confiança o auditor conclui que a taxa de não
conformidade é inferior a 3,15%. Como ela é inferior à taxa de
exceção tolerável, o auditor conclui que os processos estão
adequados.
Questões Éticas
 Um intervalo de confiança (refletindo o erro de
amostragem) deveria ser sempre reportado
juntamente com a estimativa pontual
 O nível de confiança deve sempre ser informado
 O tamanho da amostra deve ser informado
 Uma interpretação do intervalo de confiança
também deve ser realçada
Download