Distribuição normal ou de Gauss Um pouco da história Primeiro crédito: Abraham de Moivre (1667-1754), matemático francês, protestante, que migrou para Londres por motivos de perseguição religiosa. Propôs a distribuição normal como uma aproximação da Binomial. Definiu o problema, mas não o apresentou como uma “curva”. No início de 1800, o alemão Carl Friedrich Gauss (17771855) astrônomo e matemático, e o francês Pierre Simon Laplace (1749-1829) derivaram a curva normal. Aplicação imediata em física e astronomia. Gauss acreditava que a média era uma medida-resumo fundamental e utilizou-a de modo axiomático, no princípio de “mínimos quadrados”. Laplace propôs o teorema do limite central em 1810 utilizando a distribuição normal como um modelo de variabilidade aleatória. Robert Adrain (1775-1843), irlandês-americano trabalhou com erros de mensuração e com a distribuição normal, nomeada de Gaussiana. Outras distribuições contínuas já eram conhecidas: Siméon Denis Poisson (17811840) pesquisou a distribuição hoje conhecida com o nome de Augustin Louis Cauchy. As discussões eram matemáticas e filosóficas uma vez que tratava-se de descrever estados da natureza. Lambert Adolphe Jacques Quetelet (1796-1874) astrônomo, meteorologista, estatístico belga defendia a aplicação universal da distribuição normal foi responsável pela utilização da distribuição normal nas ciências sociais. Aula 10 - Distribuição normal, distribuição amostral da média 1 Distribuição normal ou de Gauss Os dados abaixo são medidas do tórax (polegadas) de 5732 soldados escoceses, tomadas pelo matemático belga, Adolphe Quetelet (1796-1874). medidas | Freq, Percent Cum, ------------+----------------------------------33 | 3 0,05 0,05 34 | 19 0,33 0,38 35 | 81 1,41 1,80 36 | 189 3,30 5,09 37 | 409 7,14 12,23 38 | 753 13,14 25,37 39 | 1062 18,53 43,89 40 | 1082 18,88 62,77 41 | 935 16,31 79,08 42 | 646 11,27 90,35 43 | 313 5,46 95,81 44 | 168 2,93 98,74 45 | 50 0,87 99,62 46 | 18 0,31 99,93 47 | 3 0,05 99,98 48 | 1 0,02 100,00 ------------+----------------------------------Total | 5732 100,00 Aula 10 - Distribuição normal, distribuição amostral da média 2 Distribuição normal ou de Gauss Distribuição de medidas do tórax (polegadas) de soldados escoceses 1000 Frequency 800 600 400 200 0 33 34 35 36 37 38 39 40 41 42 medidas 43 44 45 46 47 48 Fonte: Daly F et al. Elements of Statistics, 1999 Função densidade de probabilidade da distribuição normal: 2 Se a variável aleatória X é normalmente distribuída com média e desvio padrão (variância ), f ( x) 1 2 a função densidade de probabilidade de X é dada por onde Aula 10 - Distribuição normal, distribuição amostral da média [ e ( x )2 2 2 ] , x , 3 Distribuição normal ou de Gauss Aula 10 - Distribuição normal, distribuição amostral da média 4 Distribuição normal ou de Gauss Depois de tomarmos várias amostras, decidiu-se adotar um modelo para as medidas de perímetro do tórax de uma população de homens adultos com os parâmetros: média ( desvio padrão ( ) = 2 polegadas. ) = 40 polegadas e 40 43 X Qual a probabilidade de um indivíduo, sorteado desta população, ter um perímetro de tórax entre 40 e 43 polegadas? 43 [ 1 P(40 X 43) e 40 2 2 ( x 40) 2 ] 2x4 dx Quantos desvio padrão 43 está em torno da média? Aula 10 - Distribuição normal, distribuição amostral da média 5 Distribuição normal ou de Gauss Normal reduzida: Z ~ N 0;1 onde Z P(40 X 43) P( x- 40 40 X 43 40 ) P(0 Z 1,5) 2 2 0 1,5 Z Utilizando a tabela da curva normal reduzida, P(0<Z<1,5)=0,43319=43,3%. Aula 10 - Distribuição normal, distribuição amostral da média 6 Distribuição normal ou de Gauss Com base na distribuição de X~N( =40, =2), calcular: a) a probabilidade de um indivíduo, sorteado desta população, ter um perímetro de tórax maior ou igual a 43 polegadas. 40 43 P ( X 43) P ( X 0 1,5 X 43 40 ) P ( Z 1,5) 2 Z Utilizando a tabela da curva normal reduzida, P(Z>1,5)=0,5-0,43319=0,06681= 6,7% Aula 10 - Distribuição normal, distribuição amostral da média 7 Distribuição normal ou de Gauss b) a probabilidade de um indivíduo, sorteado desta população, ter um perímetro de tórax entre 35 e 40 polegadas; c) a probabilidade de um indivíduo, sorteado desta população, ter um perímetro de tórax menor que 35; d) Qual o valor do perímetro do tórax, que deixaria 75% da população abaixo dele? Exercício Considerar a altura de 351 mulheres idosas como seguindo uma distribuição normal com média 160cm e desvio padrão 6 cm. Sorteia-se uma mulher; qual a probabilidade de que ela tenha a) altura entre 160 cm e 165 cm? b) altura maior do que 170 cm? c) altura menor do que 150 cm? Aula 10 - Distribuição normal, distribuição amostral da média 8 Distribuição normal ou de Gauss Distribuição amostral da média Apresentação do Teorema que fornece as bases teóricas necessárias para inferência estatística e estimação. Teorema central do limite: X é variável aleatória com média μ e variância σ2, então X ~ N ( , ) n Supor a situação onde uma população é composta por 6 elementos, para os quais observou-se a característica X, cujos valores estão apresentados abaixo. Elementos Xi A 11 B 16 C 12 D 15 E 16 F 14 Fonte: Dixon WJ e Massey FJ. Introduction to Statistical Analysis. 2nd edit. The Maple Press Company, York, 1957 Parâmetros População Média ( ) valor Estimador amostra 14 x Valor (estimativa) Par(A,D)=(11,15) 13 2 Variância ( ) 3,67 S2 8 1,91 S 2,828 Desvio padrão ( ) Aula 10 - Distribuição normal, distribuição amostral da média 9 Distribuição normal ou de Gauss Todas as possíveis amostras de tamanho 2, determinadas pelo processo de amostragem aleatório, com reposição (N=6, n=2) Amostra Elementos que compõem valores Amostra Elementos que valores xi ) xi Média( Média( a amostra 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 A,A A,B A,C A,D A,E A,F B,A B,B B,C B,D B,E B,F C,A C,B C,C C,D C,E C,F (11,11) (11,16) (11,12) (11,15) (11,16) (11,14) (16,11) (16,16) (16,12) (16,15) (16,16) (16,14) (12,11) (12,16) (12,12) (12,15) (12,16) (12,14) 11 13,5 11,5 13 13,5 12,5 13,5 16 14 15,5 16 15 11,5 14 12 13,5 14 13 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 compõem a amostra D,A D,B D,C D,D D,E D,F E,A E,B E,C E,D E,E E,F F,A F,B F,C F,D F,E F,F Aula 10 - Distribuição normal, distribuição amostral da média (15,11) (15,16) (15,12) (15,15) (15,16) (15,14) (16,11) (16,16) (16,12) (16,15) (16,16) (16,14) (14,11) (14,16) (14,12) (14,15) (14,16) (14,14) 13 15,5 13,5 15 15,5 14,5 13,5 16 14 15,5 16 15 12,5 15 13 14,5 15 14 10 ) Distribuição de freqüência de todas as possíveis médias: Distribuição amostral da média i xi 8 11 11,5 12 12,5 13 13,5 14 14,5 15 15,5 16 1 2 1 2 4 6 5 2 5 4 4 36 6 Frequency 1 2 3 4 5 6 7 8 9 10 11 Total freqüência 4 2 0 10 10.65 11.3 11.95 12.6 13.25 medias 13.9 14.55 15.2 15.85 11 Média das médias ( x ) x i 1 i fi 14 n 11 Variância das médias x2 (x i 1 i x)2 fi n 1,833 2 Desvio padrão das médias = erro padrão da média = x x Erro padrão da média = 1,833 1,354 No exemplo, X ~ N ( 14, 1,915) , portanto X ~ N ( x 14, x 1,915 2 Aula 10 - Distribuição normal, distribuição amostral da média 1,354) 11 Distribuição normal ou de Gauss Exercícios 1 - Entre homens adultos sadios, a concentração de ferro sérico segue uma distribuição normal com média 120 microgramas para 100ml e desvio padrão 15 microgramas para 100ml. Calcule a probabilidade que uma amostra de 50 homens resulte em nível médio de ferro sérico entre 115 e 125 microgramas por 100ml. 2 - Suponha que o peso em gramas do conteúdo de pacotes de salgadinho siga uma distribuição normal com média 500g e desvio padrão 85g. Sorteia-se uma amostra de 50 pacotes. Calcule: a) a probabilidade de obter peso médio entre 500 e 530 gramas b) a probabilidade de obter peso médio entre 450 e 500 gramas. Aula 10 - Distribuição normal, distribuição amostral da média 12 Aproximação da distribuição Binomial pela Normal Representação gráfica da distribuição Binomial(n=10;p=0,5) 0,3 P(X=x) 0,25 0,2 0,15 0,1 0,05 0 0 1 2 3 4 5 6 7 8 9 10 Aproximação da Binomial(n=10,p=0,5) pelaX distribuição normal 0,3 P(x1<X<x2) 0,25 0,2 0,15 0,1 0,05 0 0 1 2 3 4 5 6 7 8 9 10 X Aula 10 - Distribuição normal, distribuição amostral da média 13 Aproximação da binomial pela normal Parâmetros da distribuição: p (probabilidade de sucessos); n (número de realizações) Binomial possui média=np; variância =npq e desvio padrão = npq Para n suficientemente grande (np ? 5 e nq ? 5), a variável X pode ser aproximada para uma distribuição Normal(média=np, e desvio padrão= npq ) Aula 10 - Distribuição normal, distribuição amostral da média 14 Aproximação da binomial pela normal Supor X~B(n,p), onde X:número de sucessos Parâmetros da distribuição: p (probabilidade de sucessos); n (número de realizações) Binomial possui média=np; variância =npq e desvio padrão = npq Para n suficientemente grande (np ≥ 5 e nq ≥ 5), a variável X pode ser aproximada para uma distribuição Normal(média=np, e desvio padrão= npq ) Aula 10 - Distribuição normal, distribuição amostral da média 15 Aproximação da binomial pela normal X Supor a proporção de sucessos dada por n Média de X p n e desvio padrão de X n pq n porque: X X 1 1 E ( ) E ( X ) np p ; média de n n n n X X 1 1 pq V ( ) V ( X ) npq variância de n n n n2 n2 X X pq V ( ) desvio padrão de n n n Para n suficientemente grande (np maior ou igual a 5 e nq maior ou igual a 5), a X distribuição de n pode ser aproximada para a distribuição Normal(média=p, e pq desvio padrão= n ) Aula 10 - Distribuição normal, distribuição amostral da média 16 Aproximação da binomial pela normal Y: número de sucessos; Y~B(n=10; p=0,5) P (3 Y 6) =P(Y=3)+P(Y=4)+P(Y=5)=0,11719+0,20508+0,24609=0,5684 Pela distribuição normal: Y~N(np=5; dp= 10 x 0,5 x 0,5 1,581 ) P (3 Y 6 ) =P( 2,5 5 Y 5 5,5 5 1,581 npq 1,581 )= P ( 1,581 Z Y 0,316) =0,44295+0,12552=0,5685 Aula 10 - Distribuição normal, distribuição amostral da média 17 Aproximação da binomial pela normal Trabalhando-se com a proporção de sucessos: Y : proporção de sucessos n Pela distribuição Binomial: P(0,3 Y 0,6) P(3 Y 6) 0,11719 0,20508 0,24609 0,5684 n Y pq 0,5x 0,5 0,1581 ) Pela distribuição normal: n ~N(p=0,5; dp= n 10 Y 0,5 0 , 25 0 , 5 0,55 0,5 n P(3 Y 6) =P( )= 0,1581 0 , 1581 pq n P ( 1,581 Z Y 0,316 ) =0,44295+0,12552 = 0,5685 Aula 10 - Distribuição normal, distribuição amostral da média 18