Distribuição normal ou de Gauss

Propaganda
Distribuição normal ou de Gauss
Um pouco da história
Primeiro crédito: Abraham de Moivre (1667-1754), matemático francês,
protestante, que migrou para Londres por motivos de perseguição religiosa. Propôs
a distribuição normal como uma aproximação da Binomial. Definiu o problema,
mas não o apresentou como uma “curva”.
No início de 1800, o alemão Carl Friedrich Gauss (17771855) astrônomo e matemático, e o francês Pierre Simon
Laplace (1749-1829) derivaram a curva normal.
Aplicação imediata em física e astronomia. Gauss
acreditava que a média era uma medida-resumo
fundamental e utilizou-a de modo axiomático, no princípio
de “mínimos quadrados”.
Laplace propôs o teorema do limite central em 1810
utilizando a distribuição normal como um modelo de variabilidade aleatória. Robert
Adrain (1775-1843), irlandês-americano trabalhou com erros de mensuração e
com a distribuição normal, nomeada de Gaussiana.
Outras distribuições contínuas já eram conhecidas: Siméon Denis Poisson (17811840) pesquisou a distribuição hoje conhecida com o nome de Augustin Louis
Cauchy. As discussões eram matemáticas e filosóficas uma vez que tratava-se de
descrever estados da natureza.
Lambert Adolphe Jacques Quetelet (1796-1874) astrônomo, meteorologista,
estatístico belga defendia a aplicação universal da distribuição normal foi
responsável pela utilização da distribuição normal nas ciências sociais.
Aula 10 - Distribuição normal,
distribuição amostral da média
1
Distribuição normal ou de Gauss
Os dados abaixo são medidas do tórax (polegadas) de 5732 soldados escoceses, tomadas pelo
matemático belga, Adolphe Quetelet (1796-1874).
medidas |
Freq,
Percent
Cum,
------------+----------------------------------33 |
3
0,05
0,05
34 |
19
0,33
0,38
35 |
81
1,41
1,80
36 |
189
3,30
5,09
37 |
409
7,14
12,23
38 |
753
13,14
25,37
39 |
1062
18,53
43,89
40 |
1082
18,88
62,77
41 |
935
16,31
79,08
42 |
646
11,27
90,35
43 |
313
5,46
95,81
44 |
168
2,93
98,74
45 |
50
0,87
99,62
46 |
18
0,31
99,93
47 |
3
0,05
99,98
48 |
1
0,02
100,00
------------+----------------------------------Total |
5732
100,00
Aula 10 - Distribuição normal,
distribuição amostral da média
2
Distribuição normal ou de Gauss
Distribuição de medidas do tórax (polegadas) de soldados escoceses
1000
Frequency
800
600
400
200
0
33
34
35
36
37
38
39
40 41 42
medidas
43
44
45
46
47
48
Fonte: Daly F et al. Elements of Statistics, 1999
Função densidade de probabilidade da distribuição normal:
2



Se a variável aleatória X é normalmente distribuída com média
e desvio padrão
(variância
),
f ( x) 
1
 2
a função densidade de probabilidade de X é dada por
onde
Aula 10 - Distribuição normal,
distribuição amostral da média
[
e
( x )2
2 2
]
,
   x   ,
3
Distribuição normal ou de Gauss
Aula 10 - Distribuição normal,
distribuição amostral da média
4
Distribuição normal ou de Gauss
Depois de tomarmos várias amostras, decidiu-se adotar um modelo para as medidas de perímetro do
tórax de uma população de homens adultos com os parâmetros: média (
desvio padrão (
 ) = 2 polegadas.
 ) = 40 polegadas e
40 43
X
Qual a probabilidade de um indivíduo, sorteado desta população, ter um perímetro de tórax entre 40
e 43 polegadas?
43
[
1
P(40  X  43)  
e
40 2 2
( x 40) 2
]
2x4
dx
Quantos desvio padrão 43 está em torno da média?
Aula 10 - Distribuição normal,
distribuição amostral da média
5
Distribuição normal ou de Gauss
Normal reduzida:
Z ~ N 0;1 onde Z 
P(40  X  43)  P(
x-

40  40 X   43  40


)  P(0  Z  1,5)
2

2
0 1,5
Z
Utilizando a tabela da curva normal reduzida, P(0<Z<1,5)=0,43319=43,3%.
Aula 10 - Distribuição normal,
distribuição amostral da média
6
Distribuição normal ou de Gauss
Com base na distribuição de X~N(  =40,
 =2), calcular:
a) a probabilidade de um indivíduo, sorteado desta população, ter um perímetro de tórax maior ou
igual a 43 polegadas.
40 43
P ( X  43)  P (
X  

0

1,5
X
43  40
)  P ( Z  1,5)
2
Z
Utilizando a tabela da curva normal reduzida,
P(Z>1,5)=0,5-0,43319=0,06681= 6,7%
Aula 10 - Distribuição normal,
distribuição amostral da média
7
Distribuição normal ou de Gauss
b) a probabilidade de um indivíduo, sorteado desta população, ter um
perímetro de tórax entre 35 e 40 polegadas;
c) a probabilidade de um indivíduo, sorteado desta população, ter um
perímetro de tórax menor que 35;
d) Qual o valor do perímetro do tórax, que deixaria 75% da população
abaixo dele?
Exercício
Considerar a altura de 351 mulheres idosas como seguindo uma
distribuição normal com média 160cm e desvio padrão 6 cm. Sorteia-se
uma mulher; qual a probabilidade de que ela tenha
a) altura entre 160 cm e 165 cm?
b) altura maior do que 170 cm?
c) altura menor do que 150 cm?
Aula 10 - Distribuição normal,
distribuição amostral da média
8
Distribuição normal ou de Gauss Distribuição amostral da média
Apresentação do Teorema que fornece as bases teóricas necessárias para inferência estatística e estimação.
Teorema central do limite:
X é variável aleatória com média μ e variância σ2, então X ~ N (  ,

)
n
Supor a situação onde uma população é composta por 6 elementos, para os quais observou-se a
característica X, cujos valores estão apresentados abaixo.
Elementos
Xi
A
11
B
16
C
12
D
15
E
16
F
14
Fonte: Dixon WJ e Massey FJ. Introduction to Statistical Analysis. 2nd edit. The Maple Press Company,
York, 1957
Parâmetros
População
Média (  )
valor
Estimador
amostra
14
x
Valor (estimativa)
Par(A,D)=(11,15)
13
2
Variância (  )
3,67
S2
8
1,91
S
2,828
Desvio padrão (
)
Aula 10 - Distribuição normal,
distribuição amostral da média
9
Distribuição normal ou de Gauss
Todas as possíveis amostras de tamanho 2, determinadas pelo processo de
amostragem aleatório, com reposição (N=6, n=2)
Amostra
Elementos que compõem valores
Amostra
Elementos que
valores
xi )
xi
Média(
Média(
a amostra
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
A,A
A,B
A,C
A,D
A,E
A,F
B,A
B,B
B,C
B,D
B,E
B,F
C,A
C,B
C,C
C,D
C,E
C,F
(11,11)
(11,16)
(11,12)
(11,15)
(11,16)
(11,14)
(16,11)
(16,16)
(16,12)
(16,15)
(16,16)
(16,14)
(12,11)
(12,16)
(12,12)
(12,15)
(12,16)
(12,14)
11
13,5
11,5
13
13,5
12,5
13,5
16
14
15,5
16
15
11,5
14
12
13,5
14
13
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
compõem a
amostra
D,A
D,B
D,C
D,D
D,E
D,F
E,A
E,B
E,C
E,D
E,E
E,F
F,A
F,B
F,C
F,D
F,E
F,F
Aula 10 - Distribuição normal,
distribuição amostral da média
(15,11)
(15,16)
(15,12)
(15,15)
(15,16)
(15,14)
(16,11)
(16,16)
(16,12)
(16,15)
(16,16)
(16,14)
(14,11)
(14,16)
(14,12)
(14,15)
(14,16)
(14,14)
13
15,5
13,5
15
15,5
14,5
13,5
16
14
15,5
16
15
12,5
15
13
14,5
15
14
10
)
Distribuição de freqüência de todas as possíveis médias:
Distribuição amostral da média
i
xi
8
11
11,5
12
12,5
13
13,5
14
14,5
15
15,5
16
1
2
1
2
4
6
5
2
5
4
4
36
6
Frequency
1
2
3
4
5
6
7
8
9
10
11
Total
freqüência
4
2
0
10
10.65
11.3
11.95
12.6
13.25
medias
13.9
14.55
15.2
15.85
11
Média das médias ( x ) 
x
i 1
i
fi
 14
n
11
Variância das médias  x2 
 (x
i 1
i
 x)2 fi
n
 1,833
2
Desvio padrão das médias = erro padrão da média =  x   x
Erro padrão da média =
1,833  1,354
No exemplo, X ~ N (   14,   1,915) , portanto X ~ N (  x  14,  x 
1,915
2
Aula 10 - Distribuição normal,
distribuição amostral da média
 1,354)
11
Distribuição normal ou de Gauss
Exercícios
1 - Entre homens adultos sadios, a concentração de ferro sérico segue uma distribuição
normal com média 120 microgramas para 100ml e desvio padrão 15 microgramas para
100ml. Calcule a probabilidade que uma amostra de 50 homens resulte em nível médio de
ferro sérico entre 115 e 125 microgramas por 100ml.
2 - Suponha que o peso em gramas do conteúdo de pacotes de salgadinho siga uma distribuição
normal com média 500g e desvio padrão 85g. Sorteia-se uma amostra de 50 pacotes. Calcule:
a) a probabilidade de obter peso médio entre 500 e 530 gramas
b) a probabilidade de obter peso médio entre 450 e 500 gramas.
Aula 10 - Distribuição normal,
distribuição amostral da média
12
Aproximação da distribuição Binomial pela Normal
Representação gráfica da distribuição Binomial(n=10;p=0,5)
0,3
P(X=x)
0,25
0,2
0,15
0,1
0,05
0
0
1
2
3
4
5
6
7
8
9
10
Aproximação da Binomial(n=10,p=0,5) pelaX distribuição normal
0,3
P(x1<X<x2)
0,25
0,2
0,15
0,1
0,05
0
0
1
2
3
4
5
6
7
8
9
10
X
Aula 10 - Distribuição normal,
distribuição amostral da média
13
Aproximação da binomial pela normal
Parâmetros da distribuição: p (probabilidade de sucessos); n (número de
realizações)
Binomial possui média=np; variância =npq e desvio padrão = npq
Para n suficientemente grande (np ? 5 e nq ? 5), a variável X pode ser
aproximada para uma distribuição Normal(média=np, e desvio padrão= npq )
Aula 10 - Distribuição normal,
distribuição amostral da média
14
Aproximação da binomial pela normal
Supor X~B(n,p), onde X:número de sucessos
Parâmetros da distribuição: p (probabilidade de sucessos); n (número de realizações)
Binomial possui média=np; variância =npq e desvio padrão =
npq
Para n suficientemente grande (np ≥ 5 e nq ≥ 5), a variável X pode ser aproximada para uma
distribuição Normal(média=np, e desvio padrão= npq )
Aula 10 - Distribuição normal,
distribuição amostral da média
15
Aproximação da binomial pela normal
X
Supor a proporção de sucessos dada por
n
Média de
X
p
n
e desvio padrão de
X

n
pq
n
porque:
X
X
1
1

E
(
)

E
(
X
)

np  p ;
média de n
n
n
n
X
X
1
1
pq

V
(
)

V
(
X
)

npq

variância de n
n
n
n2
n2
X
X
pq

V
(
)

desvio padrão de
n
n
n
Para n suficientemente grande (np maior ou igual a 5 e nq maior ou igual a 5), a
X
distribuição de n pode ser aproximada para a distribuição Normal(média=p, e
pq
desvio padrão= n )
Aula 10 - Distribuição normal,
distribuição amostral da média
16
Aproximação da binomial pela normal
Y: número de sucessos;
Y~B(n=10; p=0,5)
P (3  Y  6) =P(Y=3)+P(Y=4)+P(Y=5)=0,11719+0,20508+0,24609=0,5684
Pela distribuição normal: Y~N(np=5; dp= 10 x 0,5 x 0,5  1,581 )
P (3  Y  6 )
=P(
2,5  5 Y  5 5,5  5


1,581
npq 1,581
)=
P ( 1,581  Z Y  0,316) =0,44295+0,12552=0,5685
Aula 10 - Distribuição normal,
distribuição amostral da média
17
Aproximação da binomial pela normal
Trabalhando-se com a proporção de sucessos:
Y
: proporção de sucessos
n
Pela distribuição Binomial:
P(0,3 
Y
 0,6)  P(3  Y  6)  0,11719  0,20508  0,24609  0,5684
n
Y
pq
0,5x 0,5

 0,1581 )
Pela distribuição normal: n ~N(p=0,5; dp=
n
10
Y
 0,5
0
,
25

0
,
5
0,55  0,5
n
P(3  Y  6) =P(
)=


0,1581
0
,
1581
pq
n
P ( 1,581  Z Y  0,316 )
=0,44295+0,12552 = 0,5685
Aula 10 - Distribuição normal,
distribuição amostral da média
18
Download