Estimação de parâmetros

Propaganda
ESTATÍSTICA AULA 13
Estimação de Parâmetros –
Unidade 9
Professor Marcelo Menezes Reis
1
Aulas prévias




Planejamento da pesquisa, técnicas de
amostragem: generalização.
Análise exploratória de dados: organização
dos dados.
Probabilidade, variável aleatória, modelos.
Conceito
de
inferência
estatística,
distribuição amostral.
2
Conteúdo desta aula




Conceito de estimação de parâmetros.
Estimação por ponto: propriedades dos
estimadores, estimador de média e de
proporção.
Estimação por intervalo: de média e de
proporção.
Tamanho mínimo de amostra para
estimação por intervalo.
3
Estimação de parâmetros



Parâmetros (medidas populacionais) são
desconhecidos.
Inviável pesquisar toda a população:
retirar amostra aleatória.
A partir da amostra estimar os parâmetros:
por ponto, por intervalo.
4
Estimação por ponto



Há
várias
estatísticas
amostrais
(estimadores) disponíveis .
Determinar qual é o melhor estimador
para o parâmetro de interesse.
Estatísticas são variáveis aleatórias: então
os estimadores TAMBÉM são variáveis
aleatórias.
5
Critérios para escolha de
estimadores

Parâmetro , estimador T:
 T é justo se E(T) = .
 T é consistente se, além de justo,
lim n-> V(T) = 0.
 Se há 2 ou mais estimadores justos de
, o mais eficiente é o que apresentar
menor variância.
6
Estimação por ponto da média

Melhor estimador da média populacional  é a
média amostral.
2
E( x )  

V( x ) 
n
Justo
Consistente
7
Estimação por ponto da proporção

Melhor
estimador
da
proporção
populacional  é a proporção amostral.
E ( p)  
  (1  )
V ( p) 
n
Justo
Consistente
8
ˆ 2
(x  x)


2
i
n
n 1 2
E (ˆ ) 

n
2
 Tendencioso
s2 
2
(
x

x
)
 i
n 1
E (s )  
2
2
 Não-tendencioso
9
Estimação por intervalo



Estimação por ponto é insuficiente.
Chance de “acertar” o valor real do
parâmetro?
 “Pescar com lança...”
Serve como referência: pôr um intervalo
de confiança em torno da estimativa.
 “Pescar com rede...”
10
Nível de confiança (1- )



Probabilidade de que o valor do parâmetro
esteja dentro do intervalo de confiança.
Nível de significância (): probabilidade de
que o valor NÃO esteja dentro do intervalo
de confiança.
Fixado arbitrariamente: espera-se que
1-  próximo de 1 (100%).
11
Determinação do intervalo de
confiança




Consiste em calcular os limites do
intervalo.
Dependerão do nível de confiança.
Dependerão da distribuição amostral do
estimador.
Dependerão do próprio tamanho da
amostra.
12
Para média e proporção
Z1 = - Z2
Z1
Z2
P(Z< Z1) = /2 = P(Z> Z2)
P(Z>Zcrítico) = /2
13
Limites do intervalo

LI = “média” – Zcrítico × “desvio padrão”

LS = “média” + Zcrítico × “desvio padrão”

Precisão = e0 = Zcrítico × “desvio padrão”
14
Intervalo de confiança para média
L I  x  e0
LS  x  e 0
P(x  e0    x  e 0 )  1  

e0 dependerá de alguns aspectos:
conhecimento da 2, e do tamanho de
amostra.
15
2 conhecida

e0  Zcritico 
n

Fixar 1 - , obter Zcrítico, calcular e0, obter
os limites e interpretar o resultado.
16
2 desconhecida


Usar s (desvio padrão amostral) como
estimativa de .
Mas, observar o tamanho de amostra:
 Grandes amostras (n > 30): distribuição
normal, usar Zcrítico.
 Pequenas amostras: distribuição t, usar
tn-1, crítico.
17
2 desconhecida, grandes amostras
s
e 0  Zcritico 
n

Fixar 1 - , obter Zcrítico, calcular e0,
obter os limites e interpretar o resultado.
18
2 desconhecida, pequenas
amostras
s
e0  t n 1,critico 
n

Fixar 1 - , obter tn-1crítico, calcular e0, obter
os limites e interpretar o resultado.
19
Exemplo 1


Ver 1o exemplo da Unidade 9.
Retirou-se uma amostra aleatória de 4
elementos de uma produção de cortes
bovinos no intuito de estimar a média do
peso do corte. Obteve-se média de 8,2 kg
e desvio padrão de 0,4 kg. Supondo
população normal.Determinar um intervalo
de confiança para a média populacional
com 1% de significância.
20
1-  = 0,99
x  8,2
s = 0,4
n=4
2 desconhecida, n < 30 => usar t n-1,crítico
t3;0,005 = 5,84
21
s
0,4
e0  t n 1,critico 
 5,84 
 1,168kg
n
4
LI  x  e0  8,2  1,168  7,032kg
LS  x  e0  8,2  1,168  9,368kg

Há 99% de probabilidade de que a
verdadeira média populacional do peso de
corte esteja entre 7,032 e 9,368 kg.
22
Intervalo de confiança para
proporção
L I  p  e0
LS  p  e 0
P(p  e0    p  e0 )  1  

Possível aproximar distribuição de p por
uma normal se:
 n × p ≥ 5 E n × (1-p) ≥ 5
23
Intervalo de confiança para
proporção
p  (1  p)
e0  Zcritico 
n

Fixar 1 - , obter Zcrítico, calcular e0,
obter os limites e interpretar o resultado.
24
Exemplo 2


Ver 2o exemplo Unidade 9.
Retirou-se uma amostra aleatória de 1000
peças de um lote. Verificou-se que 35
eram defeituosas. Determinar um intervalo
de confiança de 95% para a proporção
peças defeituosas no lote.
25
1-  = 0,95 n = 1000 p = 0,035 1- p = 0,965
n × p = 35 n × (1-p) = 965 => Usar Zcrítico
Zcrítico = 1,96
26
p  (1  p)
0,035  0,965
e0  Zcritico 
 1,96 
 0,0114
n
1000
LI  p  e0  0,035  0,0114  0,0236
LS  p  e0  0,035  0,0114  0,0464

Há 95% de probabilidade de que a
verdadeira proporção populacional de
defeituosos esteja entre 2,36% e 4,64%.
27
Correção de e0

Se n/N > 0,05, necessário corrigir e0 com o
tamanho da população.
Nn
e0 corrigido e0 
N 1
N = tamanho da população
28
Tamanho mínimo de amostra para
Estimação por intervalo



e0 depende de n.
Dilema para o mesmo valor de n:
 ↑ 1-  => ↑ e0 => ↓ precisão.
 ↓ e0 => ↑ precisão => ↓ 1-  .
Solução: obter n que satisfaça:
 Nível de confiança 1-  E a precisão e0.
29
Tamanho de amostra para média
2
conhecida
2 desconhecida
 Zcritico  s 

n  
 e0

2
 Zcritico   

n  
e0


2
Usar amostra piloto, n*
 t n 1,critico  s 

n  
e0


2
30
Tamanho de amostra para proporção
2
Com amostra piloto:
 Zcritico 
  p  (1  p)
n  
 e0 
Sem amostra piloto, estimativa exagerada,
2
2
p = 1- p = 0,5:
 Zcritico 
1  Zcritico 
  0,25   

n  
4  e0 
 e0 
31
Decisão e correção



Se n ≤ n*, amostra piloto suficiente.
Se n > n*, amostra piloto INSUFICIENTE,
coletar mais elementos.
Correção de n com tamanho da
população:
Nn
n corrigido 
Nn
32
Exemplo 3


Ver 3o exemplo da Unidade 9.
De acordo com os dados do Exemplo 1.
Para estimar a média, com 1% de
significância e precisão de 0,2 kg, esta
amostra é suficiente
33
1-  = 0,99
x  8,2
s = 0,4
n=4
2 desconhecida, n < 30 => usar t n-1,crítico
t3;0,005 = 5,84
e0 = 0,2 kg
34
Exemplo 3
2
 t n 1,critico  s   5,84  0,4 
  
n  
  136,42  137 elementos
e0

  0,2 


2
Amostra piloto de 4 elementos
INSUFICIENTE para a confiança
precisão exigidas.
Devemos coletar mais 133 elementos.
é
e
35
Exemplo 4


Ver 4o exemplo da Unidade 9.
Para o caso do Exemplo 2. Supondo 99%
de confiança e precisão de 1%, esta
amostra é suficiente para estimar a
proporção populacional
36
1-  = 0,99 n = 1000 p = 0,035 1- p = 0,965
n × p = 35 n × (1-p) = 965 => Usar Zcrítico
Zcrítico = 2,58
e0 = 0,01 (1%)
37
Exemplo 4
2
 Zcritico 
 2,58 
  p  (1  p)  
n  
  0,035  0,965
 0,01 
 e0 
2
n  2248,14  2249 elementos


Amostra piloto de 1000 elementos é
INSUFICIENTE para a confiança e
precisão exigidas.
Devemos coletar mais 1249 elementos.
38
Empate técnico
Opinião
LI %
LS %
Godofredo Astrogildo
31%
37%
Filismino Arquibaldo
14%
20%
Urraca Hermengarda
13%
19%
Salustiano Quintanilha
22%
28%
Indecisos
11%
17%
39
Para saber mais

Sobre propriedades e características
desejáveis de um estimador:
 BARBETTA, P.A., REIS, M.M., BORNIA,
A.C. Estatística para Cursos de
Engenharia e Informática. São Paulo:
Atlas, 2004, capítulo 7.
40
Tô afim de saber...


Sobre estimadores e intervalos de
confiança para variância:
 TRIOLA, M. Introdução à Estatística,
Rio de Janeiro: LTC, 1999, capítulo 6.
Para entender melhor o conceito de
distribuição amostral, e sua relação com
estimação de parâmetros, veja o arquivo
Estima.xls,no ambiente virtual.
41
Para saber mais

Sobre a utilização do Microsoft Excel 
para realizar estimação por intervalo, veja
LEVINE,
D.
M.,
STEPHAN,
D.,
KREHBIEL, T. C., BERENSON, M. L.
Estatística: Teoria e Aplicações - Usando
Microsoft Excel em Português. 5ª ed. –
Rio de Janeiro: LTC, 200, capítulo 6.
42
Próxima aula

Testes de hipóteses
 Lógica dos testes de hipóteses.
 Tipos de hipóteses.
43
Download