Amostras, Distribuição Amostral da Média e Teorema do Limite Central Introdução à Inferência Estatística Distribuição amostral • Observe: Muitas amostragens são possíveis ► Duas amostragens da mesma população geralmente serão diferentes ► Amostragens são probabilísticas, portanto, estatísticas baseadas nas amostragens também são ► Se as características da amostragem e a composição da população são conhecidas, a probabilidade de cada resultado pode ser determinada ► Diferentes amostragens produzirão amostras com estatísticas diferenciadas ► 20 20 15 15 10 10 5 5 0 0 20 18 16 14 12 10 8 6 4 2 0 78 81 84 87 90 93 96 99 102 105 108 111 114 117 120 78 81 84 87 90 93 96 99 102 105 108 111 114 117 120 Histograma n= 5 Histograma n = 60 20 15 10 10 5 5 0 0 78 81 84 87 90 93 96 99 102 105 108 111 114 117 120 Histograma n = 30 78 80,5 83 85,5 88 90,5 93 95,5 98 100,5 103 105,5 108 110,5 113 115,5 118 120,5 78 81 84 87 90 93 96 99 102 105 108 111 114 117 120 Vejamos a nossa simulação (População = X~N(100:152) Histograma n= 10 Histograma n =100 20 15 Tabela comparativa n 5 10 30 60 100 Das médias média 100,66 99,46 99,83 100,06 100,02 dpad 6,890 4,738 2,697 2,086 1,301 mín 82,06 89,92 93,89 95,06 96,95 Amplitude das amostras médias desvios-padrão máx ampl. mín máx ampl. 118,20 36,13 3,646 25,699 22,053 112,54 22,62 7,808 22,231 14,424 106,15 12,25 10,762 18,576 7,814 106,31 11,24 11,374 18,813 7,438 103,72 6,78 11,613 17,891 6,278 População = X~N(100:152) Há alguma relação entre o tamanho da amostra e o desvio-padrão das médias? Distribuição amostral da média • Seja X uma v.a. com média μ e variância σ2, e seja (X1, X2,..., Xn) uma Amostra Aleatória Simples (AAS) de X, de tamanho n, então: E( X ) = = X n n 2 2 X = Erro amostral da média • A diferença entre a estatística x e o parâmetro μ é chamada de erro amostral da média, definido assim: e = X • Verifica-se que a distribuição de e aproxima-se de uma normal com média 0 (zero) e variância σ2/n Teorema do Limite Central • Quando o tamanho da amostra aumenta, independente da forma de distribuição da população, a distribuição amostral de X aproximase cada vez mais de uma distribuição normal. Histogramas de distribuição da média para amostras de algumas populações Distribuição amostral de uma proporção • Consideramos X uma v.a. onde: 1, se portador da característica X= 0, se não for portador da característica ► Ex.: 1, se doador de órgãos; 0, se não doador • Podemos aproximar a distribuição binomial para uma normal, onde: μ= E(X) = p σ2 = Var(X) = p(1-p) p(1 p) pˆ ~ N p; n Exercícios básicos: uso da curva normal 1. Um levantamento realizado pela ANAC* verificou que a altura dos usuários de aviação segue uma distribuição normal com média de 171,3cm e desvio-padrão de 7,3cm. Com base nesses dados determine: Probabilidade de um usuário ter mais de 1,90m de altura = P(X>190) Dica: desenhe a curva normal e marque a área b. P(165<X<180) a ser determinada c. P(X<140) d. Um intervalo simétrico em relação à média que exclua apenas 5% dos indivíduos a. * SILVA, S. C; MONTEIRO, D.. Levantamento do perfil antropométrico da população brasileira usuária do transporte aéreo nacional: projeto conhecer. Relatório Técnico Final. Agência Nacional de Aviação Civil. 2009. Disponível em http://www2.anac.gov.br/arquivos/pdf/Relatorio_Final_Projeto_Conhecer.pdf Exercícios básicos: uso da curva normal 2. Uma v.a. X tem distribuição normal, com média 100 e desvio-padrão 10. Qual a P(90<X<110)? b. Se X for a média de uma amostra de 16 elementos tirados dessa população, calcule P(90<X<110)? c. Que tamanho deveria ter a amostra para que P(90<X<110) = 0,95? a. Exercícios básicos: binomial como normal 3. Um processo produtivo foi planejado para ter 5% de itens defeituosos. A cada 4 horas sorteia-se uma amostra de 25 peças e, havendo-se mais de 8% de defeituosos, interrompe-se a produção para calibragem. Calcule a probabilidade de uma parada desnecessária. Sugestão de exercícios • Capítulo 5 (Larson; Farber, 2010) • 5.4: Exercícios (228-31) ► 25 → 38 • 5.5: Exercícios (238-40) ► 19; 21; 22; 23