to get the file

Propaganda
ESTATÍSTICA EXPLORATÓRIA
Prof Paulo Renato A. Firmino
[email protected]
Aulas 17-18
Inferência Indutiva - Estimadores
•
Usualmente, a cada realização de um procedimento amostral uma
amostra diferente das anteriores será definida
ƒ
•
Amostras são essencialmente aleatórias
Um estimador é uma função de uma amostra aleatória
ƒ
É destinado a inferir sobre um parâmetro populacional
ƒ
Como relaciona-se a amostras (essencialmente aleatórias) ele é uma
função de VAs observáveis
•
•
Considera-se (Xi, i=1, 2, ..., n) uma amostra aleatória (cada Xi é uma VA)
Ele é uma variável aleatória
⎛
⎜
VA ⎜ X =
⎜
⎜
⎝
⎞
X
∑
i ⎟
i=1
⎟
n ⎟
⎟
⎠
n
ƒ
Exemplo: A média amostral é uma
ƒ
Estimativa: é o valor assumido pelo estimador diante das observações
•
Função dos valores amostrados (observados)
Estatí
Estatística Explorató
Exploratória - Paulo Renato A. Firmino
2
Inferência Indutiva - Estimadores
Amostra 1
Amostra 2
Amostra 3
x1
x2
x3
x
...
Amostra k
xk
x
3
Inferência Indutiva – Estimadores
Exercício 2
•
1.
2.
3.
Recorra a sua calculadora para montar três amostras aleatórias
simples envolvendo (n=) 4 colegas de classe, cada uma. O
propósito será estudar a variável “proporção amostral de
recifenses”.
Qual amostra de proporções você obteve?
Qual é a média desta amostra?
Qual é a proporção de recifenses da amostra envolvendo todos
os colegas selecionados?
Estatí
Estatística Explorató
Exploratória - Paulo Renato A. Firmino
5
Inferência Indutiva – Qualidade de Estimadores
ƒ
A qualidade de um estimador é medida através de outras
funções estatísticas
1.
ƒ
T é dito um estimador centrado (não-viesado) para um parâmetro θ se
E(T) = θ
Exemplo: A média amostral é um estimador centrado para μ:
•
( )
. X =μ
E
n
X=
∑X
i=1
i
n
Estatí
Estatística Explorató
Exploratória - Paulo Renato A. Firmino
6
Inferência Indutiva – Estimadores Importantes
•
Dentre os estimadores mais importantes, destacam-se
ƒ
Média e Variância amostrais
1. Média amostral
ƒ
Para uma amostra aleatória de tamanho n, X1, X2, ..., Xn
(como dependem de sorteio, são variáveis):
n
X=
ƒ
ƒ
∑X
i=1
i
⎛
n
⎜
Note que a proporção amostral ⎜ p̂ =
⎜
onde Xi~Binomial(n=1, p)
⎜
⎝
Sabe-se que
ƒ
ƒ
⎞
X
∑
i ⎟
i=1
⎟ é uma média,
n ⎟
⎟
⎠
n
Se E(Xi) = μ: E(X) = μ
2
σ
Se X1, X2, ..., Xn são independentes, com V(Xi) = σ2: V (X) =
n
Estatí
Estatística Explorató
Exploratória - Paulo Renato A. Firmino
7
Inferência Indutiva – Estimadores Importantes
2. Variância amostral
n
S =
2
ƒ
∑ ( X − X)
2
i
i=1
n −1
S2 é um estimador centrado para a variância populacional, σ2
•
E(S2) = σ2
n
∑ ( X − X)
•
O estimador T =
•
⎛ n − 1⎞ 2
2
⎟σ ≠ σ
E(T) = ⎜
⎝ n ⎠
i=1
i
n
2
não é centrado para σ2
Estatí
Estatística Explorató
Exploratória - Paulo Renato A. Firmino
8
Inferência Indutiva – Distribuição Amostral de
Estimadores
ƒ
Modela a variabilidade do estimador
ƒ
É a distribuição de probabilidades do estimador
ƒ
Qual é a distribuição da média amostral?
ƒ
ƒ
E da proporção amostral?
Qual é a distribuição da variância amostral?
Estatí
Estatística Explorató
Exploratória - Paulo Renato A. Firmino
9
Inferência Indutiva – Estimadores
Média & Teorema Central do Limite (TCL)
•
Quando o tamanho da amostra (n) cresce, X tende a se
distribuir normalmente, com média μ e variância σ2/n
ƒ
Supõe-se que a amostra aleatória (X1, X2, ..., Xn) é tal que
•
•
•
ƒ
X1, X2, ..., Xn são VAs independentes entre si
E(Xi)= μ
V(Xi) = σ2
Veja que se Xi ~ Binomial (n=1, p), então a proporção
amostral (p̂ ) tenderá a uma Normal com média p e variância
p·(1-p)/n quando n crescer
Estatí
Estatística Explorató
Exploratória - Paulo Renato A. Firmino
10
Inferência Indutiva – Estimadores
Média & TCL: Exercício 3
1.
2.
3.
4.
5.
Suponha que a proporção de mulheres em uma turma seja de 50%. Qual é
a probabilidade de que, em uma amostra de 25 alunos da turma, a
proporção amostral de mulheres seja: (a) Inferior a 30%? (b) Superior a
40%? (c) Algo entre 60% e 70%?
Suponha que a porcentagem de brasileiros que votam em B seja de 46%.
Qual é a probabilidade de que, em uma amostra de 3265 eleitores, a
proporção de votantes em B seja: (a) Inferior a 30%? (b) Superior a 40%?
(c) Algo entre 60% e 70%?
O governo de um país assegura que, em média, o custo da cesta básica é
de R$300.00, sob um desvio-padrão de R$50.00. Qual é a probabilidade
de que o custo médio da cesta de uma amostra com 30 cidades seja: (a)
Superior a R$400.00? (b) Menor que R$200.00? (c) Entre R$100.00 e R$
350.00?
Um frabricante de lâmpadas assegura que o tempo de vida destas segue
uma distribuição normal com media de 6000 horas e desvio-padrão de
1000 horas. Qual é a probabilidade de que o tempo de vida médio de uma
amostra com 100 lâmpadas seja: (a) Inferior a 4000 horas? (b) Superior a
8000 horas? (c) Algo entre 5000 horas e 7000 horas?
Quais suposições embasam as análises acima?
Estatí
Estatística Explorató
Exploratória - Paulo Renato A. Firmino
11
Inferência Indutiva – Estimadores
Média: Distribuição t-Student
•
Estudando a média, caso σ2 seja desconhecida
ƒ
ƒ
•
Usa-se sua respectiva estimativa provinda de uma amostra (s2)
Considera-se a distribuição t-Student ao invés da Normal
Distribuição t-Student
ƒ
A distribuição t-Student é uma aproximação da Normalpadrão (com média zero e variância um)
•
•
Onde é necessário estimar a variância σ2
Sua principal utilidade se dá na modelagem de estimadores de medidas
de posição tais como a média amostral
Estatí
Estatística Explorató
Exploratória - Paulo Renato A. Firmino
12
Inferência Indutiva – Estimadores
Média: Distribuição t-Student
ƒ
Ωx = {x real}
ƒ
.
ƒ
k – graus de liberdade para X (k > 2)
Se k for inteiro positivo: Γ(k) = (k-1)!
E(X) = 0 e V(X) = k / (k-2)
Assim como a Normal, a t faz uso de valores tabelados
ƒ
ƒ
ƒ
Inferência Indutiva – Estimadores
Média: Distribuição t-Student
•
⎛ σ2
Supondo X ~ N⎜⎜ μ, n
⎝
⎞
X−μ
⎟⎟ ⇒ Z =
~ N(0,1)
σ
⎠
n
•
Utilizando o estimador da variância amostral (S2) de σ2:
X−μ
T=
~ t(n − 1)
S
n
•
A princípio, tem-se n (≡tamanho da amostra) graus de liberdade para
um dado estimador
ƒ
Contudo, perde-se um grau de liberdade por cada estimador adicional
requerido
•
T baseia-se em S
Inferência Indutiva – Estimadores
Média & Distribuição t-Student: Exercício 4
1.
2.
3.
Um frabricante assegura que o tempo de vida médio de suas lâmpadas é de
6000 horas. A partir de uma amostra com 25 lâmpadas, estima-se um
desvio-padrão de 1000 horas e questiona-se sobre a probabilidade de que o
tempo de vida médio (de uma amostra com 25 lâmpadas) seja: (a)
Inferior a 4000 horas? (b) Superior a 8000 horas? (c) Algo entre
5000 horas e 7000 horas?
Estuda-se o custo da cesta básica de dado estado. De uma
amostra aleatória de 30 cidades, obteve-se um desvio-padrão de
R$50.00. O governo assegura que, em média, o custo da cesta
básica é de R$300.00. Qual é a probabilidade de que o custo
médio de uma amostra com 30 cidades seja: (a) Superior a
R$400.00? (b) Menor que R$200.00? (c) Entre R$100.00 e R$
350.00?
Quais suposições embasam as análises acima?
Estatí
Estatística Explorató
Exploratória - Paulo Renato A. Firmino
15
Download