ESTATÍSTICA EXPLORATÓRIA Prof Paulo Renato A. Firmino [email protected] Aulas 17-18 Inferência Indutiva - Estimadores • Usualmente, a cada realização de um procedimento amostral uma amostra diferente das anteriores será definida • Amostras são essencialmente aleatórias Um estimador é uma função de uma amostra aleatória É destinado a inferir sobre um parâmetro populacional Como relaciona-se a amostras (essencialmente aleatórias) ele é uma função de VAs observáveis • • Considera-se (Xi, i=1, 2, ..., n) uma amostra aleatória (cada Xi é uma VA) Ele é uma variável aleatória ⎛ ⎜ VA ⎜ X = ⎜ ⎜ ⎝ ⎞ X ∑ i ⎟ i=1 ⎟ n ⎟ ⎟ ⎠ n Exemplo: A média amostral é uma Estimativa: é o valor assumido pelo estimador diante das observações • Função dos valores amostrados (observados) Estatí Estatística Explorató Exploratória - Paulo Renato A. Firmino 2 Inferência Indutiva - Estimadores Amostra 1 Amostra 2 Amostra 3 x1 x2 x3 x ... Amostra k xk x 3 Inferência Indutiva – Estimadores Exercício 2 • 1. 2. 3. Recorra a sua calculadora para montar três amostras aleatórias simples envolvendo (n=) 4 colegas de classe, cada uma. O propósito será estudar a variável “proporção amostral de recifenses”. Qual amostra de proporções você obteve? Qual é a média desta amostra? Qual é a proporção de recifenses da amostra envolvendo todos os colegas selecionados? Estatí Estatística Explorató Exploratória - Paulo Renato A. Firmino 5 Inferência Indutiva – Qualidade de Estimadores A qualidade de um estimador é medida através de outras funções estatísticas 1. T é dito um estimador centrado (não-viesado) para um parâmetro θ se E(T) = θ Exemplo: A média amostral é um estimador centrado para μ: • ( ) . X =μ E n X= ∑X i=1 i n Estatí Estatística Explorató Exploratória - Paulo Renato A. Firmino 6 Inferência Indutiva – Estimadores Importantes • Dentre os estimadores mais importantes, destacam-se Média e Variância amostrais 1. Média amostral Para uma amostra aleatória de tamanho n, X1, X2, ..., Xn (como dependem de sorteio, são variáveis): n X= ∑X i=1 i ⎛ n ⎜ Note que a proporção amostral ⎜ p̂ = ⎜ onde Xi~Binomial(n=1, p) ⎜ ⎝ Sabe-se que ⎞ X ∑ i ⎟ i=1 ⎟ é uma média, n ⎟ ⎟ ⎠ n Se E(Xi) = μ: E(X) = μ 2 σ Se X1, X2, ..., Xn são independentes, com V(Xi) = σ2: V (X) = n Estatí Estatística Explorató Exploratória - Paulo Renato A. Firmino 7 Inferência Indutiva – Estimadores Importantes 2. Variância amostral n S = 2 ∑ ( X − X) 2 i i=1 n −1 S2 é um estimador centrado para a variância populacional, σ2 • E(S2) = σ2 n ∑ ( X − X) • O estimador T = • ⎛ n − 1⎞ 2 2 ⎟σ ≠ σ E(T) = ⎜ ⎝ n ⎠ i=1 i n 2 não é centrado para σ2 Estatí Estatística Explorató Exploratória - Paulo Renato A. Firmino 8 Inferência Indutiva – Distribuição Amostral de Estimadores Modela a variabilidade do estimador É a distribuição de probabilidades do estimador Qual é a distribuição da média amostral? E da proporção amostral? Qual é a distribuição da variância amostral? Estatí Estatística Explorató Exploratória - Paulo Renato A. Firmino 9 Inferência Indutiva – Estimadores Média & Teorema Central do Limite (TCL) • Quando o tamanho da amostra (n) cresce, X tende a se distribuir normalmente, com média μ e variância σ2/n Supõe-se que a amostra aleatória (X1, X2, ..., Xn) é tal que • • • X1, X2, ..., Xn são VAs independentes entre si E(Xi)= μ V(Xi) = σ2 Veja que se Xi ~ Binomial (n=1, p), então a proporção amostral (p̂ ) tenderá a uma Normal com média p e variância p·(1-p)/n quando n crescer Estatí Estatística Explorató Exploratória - Paulo Renato A. Firmino 10 Inferência Indutiva – Estimadores Média & TCL: Exercício 3 1. 2. 3. 4. 5. Suponha que a proporção de mulheres em uma turma seja de 50%. Qual é a probabilidade de que, em uma amostra de 25 alunos da turma, a proporção amostral de mulheres seja: (a) Inferior a 30%? (b) Superior a 40%? (c) Algo entre 60% e 70%? Suponha que a porcentagem de brasileiros que votam em B seja de 46%. Qual é a probabilidade de que, em uma amostra de 3265 eleitores, a proporção de votantes em B seja: (a) Inferior a 30%? (b) Superior a 40%? (c) Algo entre 60% e 70%? O governo de um país assegura que, em média, o custo da cesta básica é de R$300.00, sob um desvio-padrão de R$50.00. Qual é a probabilidade de que o custo médio da cesta de uma amostra com 30 cidades seja: (a) Superior a R$400.00? (b) Menor que R$200.00? (c) Entre R$100.00 e R$ 350.00? Um frabricante de lâmpadas assegura que o tempo de vida destas segue uma distribuição normal com media de 6000 horas e desvio-padrão de 1000 horas. Qual é a probabilidade de que o tempo de vida médio de uma amostra com 100 lâmpadas seja: (a) Inferior a 4000 horas? (b) Superior a 8000 horas? (c) Algo entre 5000 horas e 7000 horas? Quais suposições embasam as análises acima? Estatí Estatística Explorató Exploratória - Paulo Renato A. Firmino 11 Inferência Indutiva – Estimadores Média: Distribuição t-Student • Estudando a média, caso σ2 seja desconhecida • Usa-se sua respectiva estimativa provinda de uma amostra (s2) Considera-se a distribuição t-Student ao invés da Normal Distribuição t-Student A distribuição t-Student é uma aproximação da Normalpadrão (com média zero e variância um) • • Onde é necessário estimar a variância σ2 Sua principal utilidade se dá na modelagem de estimadores de medidas de posição tais como a média amostral Estatí Estatística Explorató Exploratória - Paulo Renato A. Firmino 12 Inferência Indutiva – Estimadores Média: Distribuição t-Student Ωx = {x real} . k – graus de liberdade para X (k > 2) Se k for inteiro positivo: Γ(k) = (k-1)! E(X) = 0 e V(X) = k / (k-2) Assim como a Normal, a t faz uso de valores tabelados Inferência Indutiva – Estimadores Média: Distribuição t-Student • ⎛ σ2 Supondo X ~ N⎜⎜ μ, n ⎝ ⎞ X−μ ⎟⎟ ⇒ Z = ~ N(0,1) σ ⎠ n • Utilizando o estimador da variância amostral (S2) de σ2: X−μ T= ~ t(n − 1) S n • A princípio, tem-se n (≡tamanho da amostra) graus de liberdade para um dado estimador Contudo, perde-se um grau de liberdade por cada estimador adicional requerido • T baseia-se em S Inferência Indutiva – Estimadores Média & Distribuição t-Student: Exercício 4 1. 2. 3. Um frabricante assegura que o tempo de vida médio de suas lâmpadas é de 6000 horas. A partir de uma amostra com 25 lâmpadas, estima-se um desvio-padrão de 1000 horas e questiona-se sobre a probabilidade de que o tempo de vida médio (de uma amostra com 25 lâmpadas) seja: (a) Inferior a 4000 horas? (b) Superior a 8000 horas? (c) Algo entre 5000 horas e 7000 horas? Estuda-se o custo da cesta básica de dado estado. De uma amostra aleatória de 30 cidades, obteve-se um desvio-padrão de R$50.00. O governo assegura que, em média, o custo da cesta básica é de R$300.00. Qual é a probabilidade de que o custo médio de uma amostra com 30 cidades seja: (a) Superior a R$400.00? (b) Menor que R$200.00? (c) Entre R$100.00 e R$ 350.00? Quais suposições embasam as análises acima? Estatí Estatística Explorató Exploratória - Paulo Renato A. Firmino 15