Distribuições Amostrais Introdução à Inferência parte II Erica Castilho Rodrigues 16 de Abril de 2012 Referências: ◮ Estatística Básica - Wilton Bussab (Capítulo 10) Erica Castilho Rodrigues Introdução à Inferência parte II Distribuições Amostrais Distribuições Amostrais Distribuição da média amostral Distribuição da proporção amostral Erica Castilho Rodrigues Introdução à Inferência parte II Distribuições Amostrais Distribuição da média amostral Distribuição da proporção amostral Distribuições Amostrais Erica Castilho Rodrigues Introdução à Inferência parte II Distribuições Amostrais ◮ Distribuição da média amostral Distribuição da proporção amostral Inferência estatística: ◮ tomar decisões sobre a população a partir da amostral. ◮ Podemos estar interessados no volume médio de enchimento de uma lata de refrigerante. ◮ O volume médio requerido é 300 mililitros. ◮ Um engenheiro retira uma amostra de 25 latas. ◮ O volume médio observado é x̄ = 298. ◮ Você diria que a média verdadeira é 300 mililitros? ◮ Sim. ◮ Mesmo que a média da população seja 300 mililitros é muito provável que apareça uma amostra com média 298. Erica Castilho Rodrigues Introdução à Inferência parte II Distribuições Amostrais ◮ ◮ ◮ ◮ ◮ ◮ Distribuição da média amostral Distribuição da proporção amostral Temos uma população objetivo. (Alunos da UFOP) Uma variável de interesse. (Altura do alunos) Atribuímos um modelo, uma função densidade (f (x, θ)) para essa população. (Altura segue uma distribuição normal com média desconhecida.) Coletamos uma amostra. Observamos a estatística. (Médias das alturas) Fazemos inferência sobre o parâmetro desconhecido. Erica Castilho Rodrigues Introdução à Inferência parte II Distribuições Amostrais Distribuição da média amostral Distribuição da proporção amostral Ligação entre os modelos de probabilidade e os dados: ◮ O valor numérico dos dados é o valor observado de uma variável aleatória. ◮ As variáveis são consideradas: ◮ ◮ independentes e identicamente distribuídas. Essas variáveis são conhecidas com uma amostra aleatória. Erica Castilho Rodrigues Introdução à Inferência parte II Distribuições Amostrais Distribuição da média amostral Distribuição da proporção amostral Exemplo: ◮ O engenheiro quer medir o enchimento de uma lata de refrigerante. ◮ Ele retira uma amostra de tamanho n. ◮ A amostra aleatória é X1 , X2 , . . . Xn . ◮ Não sabemos o valor da primeira medida X1 ⇒ é uma variável aleatória. ◮ Consideramos que as medidas são independentes e têm a mesma distribuição. Erica Castilho Rodrigues Introdução à Inferência parte II Distribuições Amostrais Distribuição da média amostral Distribuição da proporção amostral Amostra aleatória ◮ As variáveis aleatórias X1 , . . . Xn ◮ são uma amostra aleatória de tamanho n. Devem satisfazer as seguintes condições: ◮ ◮ os Xi ’s são independentes; cada Xi tem a mesma distribuição de probabilidade. Erica Castilho Rodrigues Introdução à Inferência parte II Distribuições Amostrais Distribuição da média amostral Distribuição da proporção amostral ◮ Suponha que queremos investigar a proporção de pessoas que preferem uma marca de refrigerante. ◮ Seja p o valor desconhecido dessa proporção. ◮ Selecionamos uma amostra de tamanho n. ◮ Como podemos estimar p? ◮ Usando a proporção de pessoas p̂ que preferem a marca é uma estimativa de p. ◮ Temos que p̂ = número de indivíduos que preferem a marca . n ◮ p̂ é uma função dos dados observados. ◮ Dizemos que p̂ é uma estatística. Erica Castilho Rodrigues Introdução à Inferência parte II Distribuição da média amostral Distribuição da proporção amostral Distribuições Amostrais Estatística ◮ É qualquer função das observações em uma amostra aleatória. ◮ Exemplos: ◮ média amostral n X Xi X̄ = i=1 ◮ variância amostral 2 S = ◮ n desvio-padrão Erica Castilho Rodrigues P − X̄ )2 (n − 1) i (Xi √ S2 . Introdução à Inferência parte II Distribuições Amostrais Distribuição da média amostral Distribuição da proporção amostral ◮ A estatística é uma variável aleatória. ◮ Ela tem distribuição de probabilidade: distribuição amostral. Distribuição Amostral A distribuição de probabilidades de uma estatística é chamada de uma distribuição amostral. Erica Castilho Rodrigues Introdução à Inferência parte II Distribuições Amostrais ◮ ◮ ◮ Distribuição da média amostral Distribuição da proporção amostral Colhida uma amostra, observamos o valor da estatística T. Baseado nesse valor faremos uma afirmação sobre θ. Seria interessante saber: ◮ ◮ como T se comportaria se analisássemos todas amostras possíveis? qual a distribuição de T quando (X1 , . . . , Xn ) assume todos valores possíveis? Erica Castilho Rodrigues Introdução à Inferência parte II Distribuições Amostrais Distribuição da média amostral Distribuição da proporção amostral Exemplo: ◮ Considere o seguinte conjunto de números do exmplo anterior {1, 3, 5, 5, 7} . ◮ Retiramos dois números com reposição. ◮ Queremos encontrar a distribuição da estatatística X= ◮ X1 + X2 . 2 Por exemplo, X = 1 apenas se (X1 , X2 ) = (1, 1), logo P(X = 1) = P(X1 = 1, X2 = 1) = Erica Castilho Rodrigues 1 11 = . 55 25 Introdução à Inferência parte II Distribuições Amostrais Distribuição da média amostral Distribuição da proporção amostral Exemplo: (continuação) ◮ Obteremos X = 3 se ocorrer o evento A = {(1, 5), (3, 3), (5, 1)} . ◮ Logo P(X = 3) = P(A) = ◮ 1 12 11 21 + + = . 55 55 55 5 Já vimos que a distribuição conjunta de (X1 , X2 ) é dada por HH X H 2 1 3 5 7 Total X1 HH H 1 1/25 1/25 2/25 1/25 1/5 1/25 1/25 2/25 1/25 1/5 3 5 2/25 2/25 4/25 2/25 2/5 1/25 1/25 2/25 1/25 1/5 7 Total 1/5 1/5Introdução 2/5à Inferência 1/5parte II 1 Erica Castilho Rodrigues Distribuição da média amostral Distribuição da proporção amostral Distribuições Amostrais Exemplo: (continuação) ◮ Repetindo o procedimento anterior podemos encontrar a distribuição de X 1 1/25 2 2/25 3 5/25 4 6/25 5 6/25 6 4/25 0.05 0.10 f(x) 0.15 0.20 Distribuição de X 0.00 x P(X = x ) 1 2 3 4 5 6 7 x Erica Castilho Rodrigues Introdução à Inferência parte II 7 1/25 Total 1,00 Distribuições Amostrais Distribuição da média amostral Distribuição da proporção amostral Exemplo: ◮ Lançamos uma moeda honesta três vezes. ◮ Se sair cara ganhamos 1 ponto, se sair coroa perdemos 1. ◮ Xi são os pontos obtidos em cada lançamento 1 com probabilidade 1/2 Xi = − 1 com probabilidade 1/2. ◮ ◮ ◮ Nesse caso podemos enumerar todas amostras possíveis e calcular X̄ e S 2 . Por exemplo 1 4 1 e X̄ = 1/3, S 2 = . P((X1 , X2 , X3 ) = (1, 1, −1)) = 3 = 8 3 2 Considerando todos os casos encontramos as distribuições de X̄ e S 2 -1 -1/3 1/3 1 X̄ S2 0 4/3 pi 1/8 3/8 3/8 1/8 pi 1/4 3/4 Erica Castilho Rodrigues Introdução à Inferência parte II Distribuições Amostrais Distribuição da média amostral Distribuição da proporção amostral ◮ Na maioria das vezes não é viável enumerar todos resultados possíveis. ◮ Precisamos de ferramentas para encontrar as distribuições. Erica Castilho Rodrigues Introdução à Inferência parte II Distribuições Amostrais Distribuição da média amostral Distribuição da proporção amostral Exemplo: ◮ Queremos verificar se uma moeda é honesta (p=1/2). ◮ Lançamos moeda 50 vezes. ◮ A amostra aleatória é formada por uma sequência de variáveis Bernoulli. ◮ Estatística: número de caras nos 50 lançamentos (Y). ◮ Sabemos que Y ∼ Bin(50, p). ◮ Não precisamos enumerar todos casos possíveis, já sabemos a distribuição amostral. Erica Castilho Rodrigues Introdução à Inferência parte II Distribuições Amostrais Distribuição da média amostral Distribuição da proporção amostral Exemplo: (continuação) ◮ Suponha que observamos 36 caras. ◮ Temos que se p = 1/2 P(Y ≥ 36) = 0, 0013 . ◮ ◮ Você diria que essa moeda é honesta? Não. Se a moeda é honesta, ◮ a probabilidade de observarmos 36 caras ou mais em 50 lançamentos é muito baixa. Erica Castilho Rodrigues Introdução à Inferência parte II Distribuições Amostrais Distribuição da média amostral Distribuição da proporção amostral ◮ Precisamos de ferramentas para encontrarmos distribuições amostrais em casos mais gerais. ◮ Nem sempre teremos uma distribuição exata. ◮ E muito menos poderemos enumerar todos os casos possíveis. Veremos agora como encontrar a distribuição de duas estatísticas importantes: ◮ ◮ ◮ média; proporção. Erica Castilho Rodrigues Introdução à Inferência parte II Distribuições Amostrais Distribuição da média amostral Distribuição da proporção amostral Distribuição da média amostral: ◮ Vamos estudar a distribuiçã da estatística X . ◮ Considere que X seja variável de interesse. ◮ Vamos supor que E (X ) = µ e Var (X ) = σ 2 . ◮ Suponha que retiramos todas amostras possíveis de tamanho n. ◮ Para cara amostra calculamos a média amostral (x i ). ◮ Analisamos então qual sua distribuição. Erica Castilho Rodrigues Introdução à Inferência parte II Distribuições Amostrais Distribuição da média amostral Distribuição da proporção amostral Exemplo: ◮ Vamos considerar novamente a população formada pelos números {1, 3, 5, 5, 7} . ◮ Seja X uma variável que pode assumir qualquer um desses valores com igual probabilidade. ◮ Temos que E (X ) = µ = Var (X ) = σ 2 = 21 1+3+5+5+7 = = 4, 2 5 5 (1 − 4, 2)2 + (5 − 4, 2)2 + (5 − 4, 2)2 + (7 − 4, 2)2 5 = 4, 16 Erica Castilho Rodrigues Introdução à Inferência parte II Distribuição da média amostral Distribuição da proporção amostral Distribuições Amostrais Exemplo: (continuação) ◮ Vimos que a distribuição de X é dada por x P(X = x ) ◮ 1 1/25 2 2/25 3 5/25 4 6/25 5 6/25 6 4/25 X i xi pi = 1 × 1 2 5 6 6 +2× +3× +4× +5× 25 25 25 25 25 1 4 +7× = 4, 2 . 25 25 De maneira análoga temos que +6 × Var (X ) = 2, 08 . ◮ Notamos que E(X ) = µ = E(X ) ◮ Total 1,00 Notamos então que E(X ) = ◮ 7 1/25 Var (X ) = σ2 σ2 = . 2 n Veremos que isso é sempre verdade. Erica Castilho Rodrigues Introdução à Inferência parte II Distribuição da média amostral Distribuição da proporção amostral Distribuições Amostrais Teorema ◮ Seja X uma variável tal que E (X ) = µ ◮ e Var (X ) = σ 2 . Considere (X1 , X2 , . . . , Xn ) uma amostra aleatória simples ce X . ◮ Temos então que E (X ) = µ Erica Castilho Rodrigues e Var (X ) = σ2 . n Introdução à Inferência parte II Distribuições Amostrais Distribuição da média amostral Distribuição da proporção amostral Demontração: ◮ Temos que E (X ) = E (X1 ) + · · · + E (Xn ) µ + ··· + µ = =µ n n e como X1 , . . . , Xn são independentes Var (X̄ ) = ◮ σ2 + · · · + σ2 σ2 Var (X1 ) + · · · + Var (Xn ) = = . n n2 n2 Vejamos agora como obter a distribuição dessa estatística. Erica Castilho Rodrigues Introdução à Inferência parte II Distribuições Amostrais Distribuição da média amostral Distribuição da proporção amostral Exemplo: ◮ Vamos considerar novamente a população formada pelos números {1, 3, 5, 5, 7} . ◮ Vamos construir histogramas para X para n=1, 2 e 3. n=1 0.20 Distribuição de x Var (X ) = 4, 16. f(x) 0.10 0.05 E (X ) = 4, 2 0.15 A ditribuição de X é igual a de X . 0.00 ◮ 0 Erica Castilho Rodrigues 2 4 x Introdução à Inferência parte II 6 8 Distribuições Amostrais Distribuição da média amostral Distribuição da proporção amostral n=2 0.4 0.5 Distribuição de x f(x) 0.2 4, 08 . 2 0.0 0.1 Var (X ) = 2, 08 = 0.3 E (X ) = 4, 2 1 2 3 4 x Erica Castilho Rodrigues Introdução à Inferência parte II 5 6 7 Distribuições Amostrais Distribuição da média amostral Distribuição da proporção amostral n=3 0.4 Distribuição de x f(x) 0.2 0.1 4, 08 . 3 0.0 Var (X ) = 1, 39 = 0.3 E (X ) = 4, 2 1 2 3 4 x Erica Castilho Rodrigues Introdução à Inferência parte II 5 6 7 Distribuições Amostrais Distribuição da média amostral Distribuição da proporção amostral n=4 0.3 Distribuição de x 0.2 0.1 4, 08 . 4 0.0 Var (X ) = 1, 02 = f(x) E (X ) = 4, 2 1 2 3 4 x Erica Castilho Rodrigues Introdução à Inferência parte II 5 6 7 Distribuições Amostrais Distribuição da média amostral Distribuição da proporção amostral n = 10 0.5 0.6 Distribuição de X f(x) 0.3 0.2 4, 08 . 10 0.0 0.1 Var (X ) = 0, 408 = 0.4 E (X ) = 4, 2 2 3 4 x Erica Castilho Rodrigues Introdução à Inferência parte II 5 6 Distribuições Amostrais Distribuição da média amostral Distribuição da proporção amostral n = 30 0.8 1.0 Distribuição de x 0.4 4, 08 . 30 0.0 0.2 Var (X ) = 0, 136 = f(x) 0.6 E (X ) = 4, 2 2.5 3.0 3.5 4.0 x Erica Castilho Rodrigues Introdução à Inferência parte II 4.5 5.0 5.5 Distribuições Amostrais Distribuição da média amostral Distribuição da proporção amostral Observações ◮ À medida que n cresce: ◮ ◮ ◮ ◮ a variância diminui, histograma tende a se concentrar em torno da média, a distribuição se aproxima da normal. Esse resultado é conhecido como Teorema Central do Limite. Erica Castilho Rodrigues Introdução à Inferência parte II Distribuições Amostrais ◮ ◮ Distribuição da média amostral Distribuição da proporção amostral Suponha que não conhecemos a distribuição. Podemos aproximar a distribuição da média por uma normal: ◮ Teorema Central do Limite. Teorema Central do Limite ◮ Considere uma amostra de tamanho n X1 , . . . , Xn . ◮ Essa amostra é retirada de uma população com média µ e variância σ 2 . ◮ Seja X̄ a média dessa amostra. ◮ Então Z = X̄ − µ √ σ/ n tende para uma N(0, 1) quando n → ∞. Erica Castilho Rodrigues Introdução à Inferência parte II Distribuições Amostrais Distribuição da média amostral Distribuição da proporção amostral ◮ A aproximação normal para X̄ depende do tamanho da amostra n. ◮ A figura abaixo mostra a distribuição obtida arremessando um dado com seis faces. Erica Castilho Rodrigues Introdução à Inferência parte II Distribuições Amostrais Distribuição da média amostral Distribuição da proporção amostral ◮ A distribuição da população está longe da normal. ◮ Porém as médias são aproximadas razoavelmente por uma normal. ◮ Geralmente é necessário um tamanho de amostra grande. ◮ Valores como n = 4 ou n = 5 não costumam ser suficientes. ◮ Uma regra prática é usar a aproximação se n ≥ 30. ◮ Se n < 30 o teorema funcionará se a distribuição da população não for muito diferente da normal. Erica Castilho Rodrigues Introdução à Inferência parte II Distribuições Amostrais Distribuição da média amostral Distribuição da proporção amostral ◮ Se X tem distribuição normal ⇒ X tem distribuição normal. ◮ Isso vale para qualquer n: ◮ ◮ Esse resultado decorre do fato de que: ◮ ◮ mesmo n muito pequeno. combinação linear de variáeis normais é também normal. Então se X ∼ N(µ, σ 2 ) pode-se mostrar que σ2 X ∼ N µ, n Erica Castilho Rodrigues Introdução à Inferência parte II Distribuições Amostrais Distribuição da média amostral Distribuição da proporção amostral Exemplo: ◮ Uma companhia eletrônica fabrica resistores. ◮ Os resistores têm resistência média de 100 ohms e desvio padrão de 10 ohms. ◮ A distribuição das resistências é normal. ◮ Uma amostra aleatória de tamanho n = 25 é selecionada. ◮ Qual probabilidade da média ser menor que 95 ohms? ◮ Temos que X̄ ∼ N(µ, σ 2 /n) . ◮ Portanto a probabilidade requerida é X̄ − µ 95 − 100 √ √ < P(X̄ < 95) = P σ/ n 10/ 25 = P(Z < −2, 5) = 0, 0062 . Erica Castilho Rodrigues Introdução à Inferência parte II Distribuições Amostrais Distribuição da média amostral Distribuição da proporção amostral Exemplo: ◮ Seja X uma variável com distribuição uniforme ( 1 se 4 ≤ x ≤ 6 f (x) = 2 0 caso contrário. ◮ ◮ Encontre a distribuição da média de uma amostra aleatória de tamanho n = 40. Temos que E (X ) = µ = 5 ◮ Var (X ) = σ 2 = Então E (X̄ ) = µ = 5 ◮ (6 − 4)2 1 = . 12 3 Var (X̄ ) = σ2 1/3 = . 40 40 Pelo Teorema do Limite do Central X̄ ∼ N(5, 1/((3)40)) . Erica Castilho Rodrigues Introdução à Inferência parte II Distribuições Amostrais Distribuição da média amostral Distribuição da proporção amostral Exemplo: (continuação) ◮ A figura abaixo mostra os gráficos de X e X̄ . Erica Castilho Rodrigues Introdução à Inferência parte II Distribuições Amostrais Distribuição da média amostral Distribuição da proporção amostral Exemplo: ◮ Seja X o consumo mensal em minutos por conta de celular de uma região. ◮ X tem média 40 e desvio padrão 12 minutos. ◮ Toma-se uma amostra de 24 usuários. ◮ Encontre: ◮ ◮ a probabilidade do tempo médio de uso na amostra exceder 45 minutos? a probabilidade do tempo médio de uso na amostra ser menor que 50 minutos? Erica Castilho Rodrigues Introdução à Inferência parte II Distribuições Amostrais Distribuição da média amostral Distribuição da proporção amostral Exemplo: (solução) ◮ A média amostral é uma variável com média e variância: E (X̄ ) = 40 ◮ Var (X̄ ) = 122 =6. 24 A primeira probabilidade requerida é 45 − 40 P(X̄ > 45) = P Z > √ = P(Z > 2, 0412) = 6 1 − 0, 9794 = 0, 0206 . ◮ A segunda probabilidade requerida é 50 − 40 P(X̄ < 50) = P Z < √ = P(Z < 4, 0824) = 1 . 6 Erica Castilho Rodrigues Introdução à Inferência parte II Distribuições Amostrais Distribuição da média amostral Distribuição da proporção amostral Exemplo: ◮ As notas num certo exame padronizado têm média 450 e desvio padrão 50. ◮ Uma nota acima de 480 é considerada muito boa. ◮ Uma pessoa entra em uma Universidade se ela obtém acima de 480 neste exame. ◮ Numa certa sala onde o exame foi aplicado, 25 pessoas fizeram o teste. ◮ A nota média destas pessoas foi 490. ◮ Isso é estranho? ◮ Você acha que houve fraude? ◮ Dica: use o Teorema Central do Limite. Erica Castilho Rodrigues Introdução à Inferência parte II Distribuições Amostrais Distribuição da média amostral Distribuição da proporção amostral Exemplo: (solução) ◮ Seja X a nota no teste. ◮ X tem média 450 e desvio padrão 50. ◮ Temos que E (X̄ ) = 450 P(X̄ > 490) = P Var (X̄ ) = 490 − 450 Z > p 50/25 ! (50)2 . 25 = P(Z > 4) = 0 . ◮ Qual sua conclusão? ◮ É absolutamente improvável que a nota média daquelas 25 pessoas tenha superado 490. ◮ Há um indício claro de fraude no teste? Sim. Erica Castilho Rodrigues Introdução à Inferência parte II Distribuições Amostrais Distribuição da média amostral Distribuição da proporção amostral Distribuição da proporção amostral Erica Castilho Rodrigues Introdução à Inferência parte II Distribuições Amostrais Distribuição da média amostral Distribuição da proporção amostral ◮ A proporção é, no fundo uma média de variáveis binárias. ◮ Exemplo: vamos encontrar a proporção de alunos do sexo masculino. ◮ Seja xi uma variável tal que ( 1 se o i-ésimo aluno é do sexo masculino xi = 0 caso contrário. ◮ A proporção de alunos do sexo masculido é dada por P xi p= i n é uma média das xi . ◮ Têm as mesmas propriedades da média amostral. Erica Castilho Rodrigues Introdução à Inferência parte II Distribuições Amostrais Distribuição da média amostral Distribuição da proporção amostral Exemplo: ◮ Considere uma população em que uma proporção p tem certa característica. ◮ Defina a variável ( 1 se o indivíduo é portador da característica X= 0 caso contrário. ◮ Logo E (X ) = p ◮ ◮ Var (X ) = p(1 − p) . Seja Yn o total de indivíduos portadores da característica em uma amostra de tamanho n. Sabemos que Yn ∼ Bin(n, p) . Erica Castilho Rodrigues Introdução à Inferência parte II Distribuições Amostrais Distribuição da média amostral Distribuição da proporção amostral Exemplo: (continuação) ◮ Seja p̂ a proporção de indivíduos portadores da característica na amostra p̂ = ◮ Yn X + · · · + Xn = 1 . n n Como p̂ é uma média, pelo TCL Var (Xi ) p̂ ∼ N E (Xi ), n ou seja p(1 − p) p̂ ∼ N p, n Erica Castilho Rodrigues Introdução à Inferência parte II Distribuições Amostrais Distribuição da média amostral Distribuição da proporção amostral Exemplo: ◮ Considere uma escola em que p = 30% dos estudantes são mulheres. ◮ Retiramos uma amostra de 10 estudantes. ◮ Calculamos p̂ = proporção de mulheres na amostra. ◮ Qual a probabilidade de que p̂ difira de p em menos de 0,01? Erica Castilho Rodrigues Introdução à Inferência parte II Distribuição da média amostral Distribuição da proporção amostral Distribuições Amostrais Exemplo: (Resolução) ◮ Essa probabilidade é dada por P(|p̂ − p| < 0, 01) = P(−0, 01 < p̂ − p < 0, 01) . ◮ Mas p(1 − p) p̂ ∼ N p, n como p = 0, 3 temos que (0, 3)(0, 7) p̂ ∼ N 0, 3, . 10 ◮ Então P(−0, 01 < p̂ − p < 0, 01) = P(−0, 01 + p < p̂ < 0, 01 + p) =P p̂ − p 0, 01 + p − p −0, 01 + p − p < < p(1 − p)/n p(1 − p)/n p(1 − p)/n Erica Castilho Rodrigues Introdução à Inferência parte II Distribuições Amostrais Distribuição da média amostral Distribuição da proporção amostral Exemplo: (Resolução) −0, 01 0, 01 <Z < P 0, 03(1 − 0, 03)/n 0, 03(1 − 0, 03)/10 = P (−0, 07 < Z < 0, 07) = 0, 056 Erica Castilho Rodrigues Introdução à Inferência parte II