AULA12: Inferência Estatística Josemar Rodrigues Estatística 2 3 Inferência Estatística é dividida em duas partes: • Estimação dos parâmetros; • Teste de hipóteses. Definição: População é o conjunto de todos os elementos ou resultados sob investigação Definição: Uma amostra é um subconjunto selecionadas a partir de uma população. de observações Definição: As variáveis aleatórias X1 , X n são uma amostra aleatória de tamanho n , se (a) os Xi’s forem variáveis aleatórios independentes e (b) cada Xi tiver a mesma distribuição de probabilidade. 4 Exemplo 1: Considera-se uma população com 5 elementos, que correspondem aos seguintes valores da variável aleatória X: {1,3,5,5,7}. Escolhemos todas as amostras possíveis de tamanho 2, com reposição desta população. Distribuição de probabilidade da variável aleatória X. X 1 3 5 f(x)=P(X=x) 1/5 1/5 2/5 7 1/5 E(X)=1(1/5)+2(1/5)+5(2/5)+7(1/5)=21/5=4,2 Var(X)=2,08. 5 X 2 \ X1 1 3 5 7 1 (1,1) (1,3) (1,5) (7,1) 3 (3,1) (3,3) (3,5) (3,7) 5 (5,1) (3,3) (5,5) (5,7) X 2 \ X1 1 1/25 1 1/25 3 2/25 5 1/25 7 f X ( x1 ) 1/5 7 (7,1) (7,3) (7,1) (7,7) 1 3 1/25 1/25 2/25 1/25 1/5 5 2/25 2/25 4/25 1/25 2/5 7 1/25 1/25 2/25 1/25 1/5 f X ( x2 ) 2 1/5 1/5 2/5 1/5 1 Observação: (i ) f X ( xi ) f X ( x), i 1,2; i (ii) f ( x1 , x2 ) f X ( x1 ) f X ( x1 ), ( x1 , x2 ). 1 1 6 Definição: Uma estatística é uma característica da amostra, ou seja, uma estatística T é uma função de X1 , X n As estatísticas mais comuns são: n X 1 / n X i , média da amostra, i 1 n S2 X (1) (Xi X ) i 1 2 , Variância da amostra, n 1 min( X 1 , X n ), o menor valor da amostra, X (n) max( X 1 , X n ), o maior valor da amostra. Definição: Uma parâmetro é uma medida usada para descrever uma característica da população. 7 Denominação Média Mediana Variância Nª de elementos Proporção Função densidade População E (X ) Md V ar ( X ) 2 N p f(x) Amostra X Md S2 n p̂ Histograma 8 Distribuições amostrais A distribuição de probabilidades de uma estatística é chamada de distribuição amostral da estatística. Exemplo 1: Considera-se uma população com 5 elementos, que correspondem aos seguintes valores da variável aleatória X: {1,3,5,5,7}. Escolhemos todas as amostras possíveis de tamanho 2, com reposição desta população. Distribuição de probabilidade da variável aleatória X. X 1 3 5 f(x)=P(X=x) 1/5 1/5 2/5 7 1/5 E(X)=4,2 Var(X)=2,08. Determine a distribuição da média amostral. 9 Amostra (1,1) (1,3) (3,1) (1,5) (5,1) (3,3) (3,5) (1,7) (5,3) (7,1) (5,5) (3,7) (7,3) (5,7) (7,5) (7,7) X X1 X 2 2 Probabilidade 1 2 3 4 5 6 7 1/25 2/25 5/25 6/25 6/25 4/25 1/25 Distribuição de probabilidade da variável aleatória X. 1 2 3 4 5 6 x f (x ) 1/25 2/25 5/25 6/25 6/25 4/25 7 1/25 E ( X ) 4,2; Var ( X ) 2,08 4,16 / 2 10 Resultado 4 (Teorema Central do Limite) Sejam X1 , X n uma amostra aleatória de tamanho n retirada de uma população com média e variância 2 finita. Então a média amostral X , tem distribuição normal com média e variância 2 / n , para n suficientemente grande. Isto é, X Z / n ~ aproximadamente N (0,1), para n grande. Observação: (i ) X ~ aproximadamente 2 N , ; n n (ii) X i i 1 ~ aproximadamente N n , n 2 11 12 Exemplo (Aproximação da distribuição Binomial pela Normal) Sejam X1 , X n uma amostra aleatória de tamanho n retirada de uma população Bernoulli com parâmetro p (0<p<1). Então, n y Y X i ~ Binomial (n, p), f ( y ) p (1 p) n y , y 0,1,, n. i y n 13 Distribuição Binomial com parâmetros n=10 e p 4 6 8 0 6 p=0,8 4 6 x 8 8 0.00 0.20 p=0,5 0.15 2 4 x 0.00 0 2 x P(X=x) 2 0.00 P(X=x) 0.2 0.0 P(X=x) P(X=x) 0 0.20 p=0,3 0.4 p=0,1 0 2 4 6 8 x 14 Distribuição Binomial com parâmetros n=20 e p 5 0.15 0 5 10 15 20 x p=0,5 p=0,8 10 15 20 x 0.15 x 0.00 0.10 0 0.00 10 15 20 0.00 5 P(X=x) 0 P(X=x) p=0,3 P(X=x) 0.20 0.00 P(X=x) p=0,1 0 5 10 15 20 x 15 Distribuição Binomial com parâmetros n=30 e p 20 0.10 30 0 10 20 x p=0,5 p=0,8 20 x 30 0.00 P(X=x) 10 30 0.15 x 0.00 0 0.00 P(X=x) 0.15 10 0.10 0 P(X=x) p=0,3 0.00 P(X=x) p=0,1 0 10 20 30 x 16 Exemplo: Sabe-se que 25% das crianças expostas a um particular agente infeccioso adquirem uma certa doença. Considere um grupo de 100 crianças com igual exposição ao agente infeccioso. Determinar a probabilidade de no mínimo 15 e no máximo 30 crianças adoeçam. Solução:Seja a v.a. Y: número de crianças que adoecem dentre as 100 crianças expostas. Então, Y~B(100;0,25). 100 x 100 x 0,25 0,75 , y 0,1,,100 f ( y) y 0, c.c P(15 Y 30) f (15) f (16) f (30) 0,848 17 Pelo Teorema Central do Limite temos: n Y Xi i 1 ~ aproximadamente N np, np(1 p) N (25;18,75) 15 25 Y - 25 30 25 P(15 Y 30) P 18,75 18,75 18,75 P- 2,31 Z 1,15 (1,15) (2,31) 0,874928 - 0,01044408 0,864484 18