Função Densidade de Probabilidade para a Distribuição Normal

Propaganda
CAPÍTULO 7
DISTRIBUIÇÕES CONTÍNUAS DE PROBABILIDADE
7.1. Introdução
As variáveis aleatórias contínuas são muito usadas para descrever fenômenos físicos,
principalmente aqueles que envolvem o tempo. Este capítulo apresentará as distribuições de
probabilidade mais usadas para descrever a funcionalidade entre as variáveis aleatórias contínuas.
As distribuições contínuas de probabilidade discutidas aqui são: distribuição normal ou
gaussiana, distribuição exponencial, distribuição uniforme e distribuição gama.
7.2. Distribuição Normal
A distribuição normal foi estudada inicialmente no século 18, quando uma análise de erros
experimentais levou a uma curva em forma de sino. Embora ela tenha aparecido pela primeira vez
em 1733 através de DeMoivre, a distribuição normal recebe o nome de distribuição gaussiana, em
homenagem ao cientista alemão Karl Friedrick Gauss, que foi o primeiro a utilizá-la em 1809.
Nos séculos 18 e 19, matemáticos e físicos desenvolveram uma função densidade de
probabilidade que descrevia bem os erros experimentais obtidos em medidas físicas. Esta função
densidade de probabilidade resultou na bem conhecida curva em forma de sino, chamada de
distribuição normal ou gaussiana. Esta distribuição fornece uma boa aproximação de curvas de
freqüência para medidas de dimensões e características humanas, como a altura de uma população.
Uma variável aleatória contínua X, que assuma valores entre - < x < , tem uma
distribuição normal ou gaussiana se a função densidade de probabilidade for dada por:
f ( x) 
1
2 

e
( x )2
2 2
para
- < x <  , - <  <  e 2 > 0
(1)
em que , média da população, e , desvio-padrão, são parâmetros que especificam completamente
uma distribuição normal. Uma forma resumida de dizer que a variável X tem distribuição normal é
X~N( , 2).
A forma gráfica da Equação (1) é mostrada na Figura 7.1, em que a ordenada é a freqüência
relativa e a abscissa representa os valores que a variável X assume. Cada curva de freqüência
normal é centrada na média da população, sendo simétrica em torno deste ponto. Para a
distribuição normal, a moda e a mediana coincidem com a média. A curva normal nunca toca a
abscissa, uma vez que f(x) não será zero no intervalo de - < x < .
1
Figura 7.1 – Curva Normal ou Curva de Freqüência.
Como foi dito anteriormente, os parâmetros  e  especificam completamente a posição e a
forma de uma curva normal. A média posiciona o centro, enquanto o desvio-padrão fornece o grau
de dispersão. A Figura 7.2 apresenta três curvas normais, representando 3 diferentes populações.
Pode-se observar a influência do desvio-padrão no grau de dispersão da curva. Quanto maior o
desvio-padrão, mais achatada será a curva.
Figura 7.2 – Influência do Desvio-Padrão na Forma da Curva Normal.
A área abaixo da curva entre dois valores da variável x representa a probabilidade para
variáveis contínuas. Por exemplo, a área central é igual a 0.6826 e isto significa dizer que existe
68% de probabilidade da variável x está na faixa de 10.001 ou entre 0.99 e 1.001. Então a função
de distribuição de probabilidade normal é dada por:
x
F ( x)  P( X  x) 


1
2 

e
( y  )2
2 2
dy
(2)
A Figura 7.3 apresenta a função densidade de probabilidade para a variável X, enquanto a
Figura 7.4 apresenta a função distribuição de probabilidade. Percebe-se que para x=1,0005, a área
abaixo da curva, entre os pontos - a 1,0005 é igual a 0,6915, o que corresponde ao valor da
probabilidade de X. Assim:
F (1.0005)  P( X  1.0005)  0.6915
(3)
2
f(x)
=0,001”
P(X1,0005)=0,6915
 1.0005”
Figura 7.3 – Função Densidade de Probabilidade Normal
x
F(x)
1.0
F(1,0005”)=0,6915
0,6915
x
 1,0005”
Figura 7.4 – Função Distribuição de Probabilidade
A integral da Equação (2) não tem solução analítica, tendo-se que resolvê-la numericamente.
Uma forma prática de apresentar a solução para esta equação é usar tabelas. A literatura apresenta
uma tabela contendo as probabilidades de uma distribuição normal específica, chamada de
distribuição normal padrão. Esta distribuição caracteriza uma variável aleatória normal padrão,
chamada Z, representada por uma curva normal com =0 e =1. Conseqüentemente, a Equação (2)
é modificada para:
z
( z )  P( Z  z ) 


1
2

e
y2
2
dy
(4)
Valores tabelados da integral acima são dados em anexo. Por exemplo, a probabilidade de Z
ser menor ou igual a 1.5 é igual a:
(1.5)  P( Z  1.5)  0.9332
(5)
A probabilidade de Z<15 é também igual a 0.9332, uma vez que Z é uma variável contínua e
a probabilidade de um simples ponto é igual a zero neste caso. Assim, P(Z=1.5)=0. A probabilidade
de Z>2 é:
P( Z  2.0)  1  (2.0)  1  0.9772  0.0228
A probabilidade de Z estar entre dois valores é dada por:
(6)
P( z1  Z  z 2 )  ( z 2 )  ( z1 )
(7)
3
A distribuição normal padrão pode ser usada para se obter a probabilidade aplicável a
qualquer distribuição normal. A seguinte mudança de variável deve ser feita:
x
z
(8)

A função distribuição de probabilidade para qualquer variável aleatória normal X é igual a:
x
 X  x

 x
F ( x )  P ( Z  z )  P

(9)
  P Z 
  

 
 
 

  
Exemplo 1: A força (em Newton) com que um tecido sintético se parte é representada por uma
distribuição normal, dada por: X~N(800,144). O comprador do tecido requer que o mesmo tenha no
mínimo uma força de ruptura igual a 772 N. A amostra de tecido é escolhida aleatoriamente.
Calcule P(X  772N).
Solução:
 X   772  800 
P( X  772)  P

  P( Z  2.33)  (2.33)  0.01
12
 

P( X  772)  1  0.01  0.99
(10)
A Figura 7.5 apresenta as distribuições normal e a normal padronizada.
(a)
(b)
2=144
2=1
772
=800
x
-2.33 =0
Figura 7.5 – Distribuição Normal (a) e Distribuição Normal Padronizada (b).
x
7.2.1 Valor Esperado e Variância
O valor esperado e a variância de uma distribuição normal são expressas por:
E( X )  
Var ( X )   2
(11)
(12)
7.2.2. Percentil de uma População
Considere uma população de esferas. Seja X a variável aleatória contínua que representa o
diâmetro destas esferas. Considere que  = 1” e  = 0,001”. O diâmetro x de modo que 95% das
esferas tenham um diâmetro abaixo ou igual a este diâmetro é calculado por:
x    z
em que z = 1,64, aproximadamente, para 0,95, pela tabela em anexo. Então:
(13)
x  1.  1.64 * 0.001  1.00164
(14)
Assim, tem-se que 95% de todas as esferas da população têm diâmetros menores ou iguais a
1,00164”.
4
7.2.3. Aproximação das Distribuições Binomial e Hipergeométrica pela Distribuição Normal
As distribuições que tenham as probabilidades descritas por curvas em forma de sino podem
ser aproximadas pela distribuição normal, que é a mais usada em estatística.
7.2.3.1. Aproximação da Distribuição Binomial
A equivalência entre as distribuições binomial e normal é dada por:
  n
(15)
  n (1   )
k 
k  n
z


n (1   )
(16)
(17)
A distribuição binomial cumulativa pode ser aproximada pela distribução normal
cumulativa, através da seguinte equação:
 k  0.5  n 

(18)
P ( X  k )  B ( k )  
 n (1   ) 


A Figura 7.6 apresenta as distribuições cumulativas binomial e normal para n=10 e =0,40,
em que a distribuição binomial foi calculada pela Equação (10) do Capítulo 2 e a sua aproximação
foi calculada pela Equação (18) e os dados da tabela em anexo. Pela figura, percebe-se que a
aproximação foi boa, mesmo para um valor baixo de n.
Vale ressaltar que a aproximação deve ser usada quando não se dispõe de valores da
distribuição cumulativa binomial, como por exemplo, n=350 com =0,578 ou n=1200 com
=0,035.
Exemplo 2: Um problema comum em engenharia industrial é decidir quando reparos na maquinaria
são necessários. Uma maneira eficiente de detectar problemas na linha de produção de uma fábrica
é coletar amostras tão logo os itens sejam produzidos. Uma cervejaria amostra rotineiramente 16
latas de cerveja, a fim de determinar se o número de latas cheias de forma incompleta é grande.
Cada hora, uma amostra de 100 latas é tirada da linha de produção, sendo seus volumes
precisamente medidos. Considere X o número de latas incompletas e  a probabilidade de existir
lata incompleta. A política da cervejaria é:
 Parar a produção e ajustar a máquina, se X>6;
 Continuar o processo se X6.
Verifique se as seguintes exigências foram atendidas:
a) Pode haver no máximo 5% de chance de parar o processo, se =0.03;
b) Deve haver no máximo 15% de chance de continuar o processo, se =0.10.
5
Figura 7.6 – Funções de Distribuições de Probabilidade para Distribuições Binomial e Normal
Solução:
P( X  6 |   0.03)  1  P( X  6) |   0.03)
 6  0.5  100 * 0.03 
  1   (2.05)
a) P( X  6 |   0.03)  1  
 100 * 0.03 * (1  0.03) 


P( X  6 |   0.03)  1  0.9798  0.0202  0.05
Assim, conclui-se que o item (a) é satisfeito.
 6  0.50  100 * 0.10 
  (1.17)  0.1210
b) P( X  6) |   0.10)  
 100 * 0.10 * (1  0.10) 


que satisfaz o item (b).
(19)
(20)
A aproximação da distribuição binomial pela distribuição normal é tanto melhor quanto
maior for o valor de n e tanto mais próximo de 0.50 for a probabilidade de sucesso, . Existem
algumas regras usadas para saber se esta aproximação pode ser usada. Uma delas diz que as duas
condições abaixo devem ser satisfeitas para que se possa aproximar a distribuição binomial pela
normal:
n  5
n(1   )  5
(21)
7.2.3.2. Aproximação da Distribuição Hipergeométrica
Como já visto anteriormente, é possível usar a distribuição binomial para aproximar a
distribuição hipergeométrica. Neste caso, a variável z seria dada por:
z
x  0.50  n
n (1   )
N n
N 1
(22)
6
7.2.4. Testes para a Distribuição Normal
Muitos testes usados em estatística partem do princípio que os dados são provenientes de
uma população normal. Dessa forma, testes estatísticos devem ser feitos para verificar esse fato.
Existem os testes qualitativos e quantitativos. Dentre os testes qualitativos, existem três
gráficos que são comumente utilizados: o de probabilidade normal (normal probability plot), o da
probabilidade normal positiva (half-normal probability plot) e o da probabilidade normal sem
tendências (detrended normal probability plot). O gráfico de metade da probabilidade normal
considera apenas os valores positivos da variável normal padrão. O gráfico da probabilidade normal
sem tendências remove a tendência linear antes da elaboração do gráfico. O seu objetivo é mostrar
de forma mais clara se existe alguma tendência de comportamento dos dados.
Todos os gráficos ordenam, de forma crescente, o valor da variável em estudo (aquela que
se quer testar a normalidade) e o transforma na variável normal padrão, calculada pela seguinte
fórmula:
 3 j 1
z j   1 
para o gráfico da probabilidade normal
(23)

 3n  1 
 3n  3 j  1 
z j   1 
para o gráfico da probabilidade normal positiva
(24)

 6n  1 
 3 j 1 x j  
para o gráfico da probabilidade normal sem tendência
z j   1 

s
 3n  1 
(25)
As Figuras 7.7 a 7.9 apresentam esses gráficos gerados pelo Statistica, usando o módulo
Basic Statistics, Descriptive statistics e selecionando-se a variável Pressão. Caso os pontos caiam
próximas à linha reta, pode-se dizer que os dados seguem uma distribuição normal. No caso da
Figura 7.9, fica claro que não há qualquer tendência característica de comportamento dos dados de
pressão.
G
rá
fic
o
d
a
P
ro
b
a
b
ilid
a
d
e
N
o
rm
a
l
P
re
s
s
ã
o
2
,0
1
,5
1
,0
0
,5
ValorNormalEsperado
0
,0
-0
,5
-1
,0
-1
,5
-2
,0
8
0
9
0
1
0
0
1
1
0
1
2
0
1
3
0
P
re
s
s
ã
o
Figura 7.7 Gráfico da Probabilidade Normal.
7
G
rá
fic
o
d
a
P
ro
b
a
b
ilid
a
d
e
N
o
rm
a
lP
o
s
itiv
a
P
re
s
s
ã
o
2
,2
1
,8
1
,4
ValorNormalEsperado
1
,0
0
,6
0
,2
-0
,2
8
0
9
0
1
0
0
1
1
0
1
2
0
1
3
0
P
re
s
s
ã
o
Figura 7.8 Gráfico da Probabilidade Normal Positiva.
G
rá
fic
o
d
a
P
ro
b
a
b
ilid
a
d
e
N
o
rm
a
ls
e
m
T
e
n
d
ê
n
c
ia
P
re
s
s
ã
o
0
,4
0
,3
0
,2
0
,1
DesviodoValorEsperado
0
,0
-0
,1
-0
,2
-0
,3
-0
,4
8
0
9
0
1
0
0
1
1
0
1
2
0
1
3
0
P
re
s
s
ã
o
Figura 7.9 Gráfico da Probabilidade Normal sem Tendência.
Os testes quantitativos são mais eficientes, pois independem de qualquer interpretação
subjetiva. Eles consistem em calcular uma estatística, característica de cada teste, e verificar se o
seu valor é significativo (abaixo de 0,05 ou 0,01, dependendo do nível de significância escolhido).
Caso seja, então a hipótese de que os dados seguem uma distribuição normal deve ser rejeitada. Os
testes mais usados são:
a) Kolmogorov-Smirnov (d) – usado quando a média e o desvio-padrão da população são
desconhecidos. Os valores de probabilidade reportados são baseados naqueles tabelados
por Massey (1951), que são válidos quando a média e o desvio-padrão da distribuição
normal são conhecidos a priori e não estimados a partir dos dados. Entretanto,
geralmente esses parâmetros são calculados a partir dos dados reais.
b) Lilliefors – usado quando a média e o desvio-padrão da população são conhecidos.
c) Shapiro-Wilks (W)– tornou-se o teste preferido devido às suas boas propriedades.
Caso se verifique que a população não seja normal, transformações da variável devem ser
feitas, a fim de torná-la normal. A transformação de Box-Cox é uma das transformações mais
utilizadas. Ela consiste em extrair a raiz quadrada da ou aplicar o logaritmo à variável em estudo.
8
7.2.5. Distribuição Normal Bidimensional
Seja X e Y uma variável aleatória bidimensional , tomando todos os valores do plano
Euclidiano. Diz-se que (X,Y) tem uma distribuição normal bidimensional se a sua fdp conjunta
obedecer à seguinte equação:
f X ,Y ( x, y ) 
1
2 X  Y 1   2
*
(23)

 (x   X )2
( x   X )( x   Y ) ( y   Y ) 2 
1


exp 
 2

2 
2
2


2
(
1


)


X Y
X
Y



para - < x <  , - < y <  , - < X <  , - < Y <  , X > 0, Y > 0 e –1 <  < 1, onde  é o
coeficiente de correlação.
A Figura 7.10 mostra a fdp expressa pela Equação (23).
Figura 7.10 – Função Densidade de Probabilidade para a Distribuição Normal Bidimensional.
A distribuição de probabilidade é calculada por:
y x
FX ,Y ( x, y )  P( X  x e Y  y ) 
f
X ,Y
( x, y )dudv
(24)
  
7.3 Distribuição Lognormal
A distribuição lognormal é muito usada em ciências físicas e sociais e em engenharia, neste
último caso para descrever tamanho de partículas, o tempo para haver uma falha no processo
(confiabilidade) e o tempo para consertar algo no processo (manutenção).
Uma variável X, definida na faixa 0  x < , tem uma distribuição lognormal se logX for
normalmente distribuída com média e desvio-padrão dados por:
 ln X  E (ln X )
(25)
 ln2 X  Var (ln X )
A função densidade de probabilidade de X é expressa por:
 (ln x   ) 2 
1

,
f ( x) 
exp  
2 2
 2


com valor esperado e variância calculados por:
(26)
9
Var (ln X ) 


2


Var ( X )  exp 2 E (ln X )  Var (ln X )(e Var(ln X )  1)
 X  exp  E (ln X ) 


(27)
7.4 Distribuição Exponencial
A distribuição exponencial tem larga aplicação em engenharia. Essa distribuição calcula
probabilidades para um certo tempo e espaço entre eventos sucessivos, ocorrendo em um processo
de Poisson. É comumente usada para tempos entre chegadas a, por exemplo, cabines de pedágios.
Pode-se usar também esta distribuição para calcular probabilidades de falhas, quando do estudo de
confiabilidade; ou seja, o intervalo de tempo decorrido entre o instante em que uma peça é sujeita a
um esforço mecânico e o instante em que ocorre uma falha (a quebra da peça, por exemplo).
A função densidade de probabilidade para uma distribuição exponencial é expressa por:
para t  0
(28)
f (t )  e t
f (t )  0
para t<0
,
(29)
em que  é a taxa média do processo, que reflete, em média, quantos eventos ocorrem em uma
unidade de tempo.
A probabilidade que uma variável T esteja ente [a,b] é:
b
P(a  T  b)   f (t )dt
(30)
a
A função distribuição exponencial de probabilidade é calculada fazendo-se o limite inferior,
a, ser igual a zero e o limite superior, b, ser igual a t, ficando-se com:
F (t )  P(T  t )  1  e t
t0
(31)
As Figuras 7.11 e 7.12 apresentam a função densidade de probabilidade e a distribuição
exponencial de probabilidade, respectivamente.
O valor esperado e a variância são calculados por:
1
1
E( T ) 
Var( T )  2
(32)


Exemplo 3: Calcule a probabilidade de que o tempo entre chegadas sucessivas de carros na cabine
de pedágio da ponte Rio-Niterói seja menor ou igual a 6 segundos (0.1 minuto), sabendo que a taxa
média do processo é igual a 5 carros por minuto.
Solução:
f(t)
P(T  0.1)  F (0.1)  1  e 5*0.1  1  e 0.5  1  0.6065  0.3935
(33)
Área=P(T0.1)=0.3935
t (tempo entre as chegadas)
0,1
Figura 7.11 – Função Densidade de Probabilidade para a Distribuição Exponencial
10
F(t)
F(t)=1-e-t
1.0
P(T0.1)=0.3935
t (tempo entre as chegadas)
0.1
Figura 7.12 – Função Distribuição de Probabilidade
7.5 Distribuição Gama
Aplica-se a distribuição gama à análise de tempo de vida de equipamentos, de tempo de
retorno de mercadorias com falhas e a testes de confiabilidade.
A função densidade de probabilidade para a distribuição gama é dada por:
r
f ( x) 
x r 1e x
para x0
(34)
( r )
f ( x)  0
para x<0
,
(35)
onde os parâmetros da distribuição gama, que podem assumir qualquer valor positivo, são: , taxa
média do processo; r, número específico de eventos que ocorrem até que a variável X (tamanho do
segmento de tempo ou espaço) seja atingida.e (r) é a função gama, definida por:

(r )   x r 1 e  x dx
para r>0
(36)
0
Esta função é tabelada, sendo alguns valores dados na tabela em anexo. Algumas
propriedades da função gama são:
a) (1)  1
b) (r  1)  r(r )
c) (r )  (r  1)(r  1)
d) ( k  1)  k!
e) (1 / 2)  
f) (k  1 / 2) 
1 * 3 * 5 * ... * (2k  1)

2k
A Figura 7.13 apresenta a função f(x) para vários valores de r.
f(x)
r=1
r=2
r=3
x
Figura 7.13 – Função Densidade de Probabilidade para a Distribuição Gama.
No caso especial de r=1, tem-se a distribuição exponencial, pois (1)=1, ficando-se com:
(37)
f ( x)  e x
11
A distribuição gama se reduz à distribuição qui-quadrado, que será vista adiante, quando
=1/2 e r=d/2, onde d é um parâmetro inteiro positivo.
A distribuição de probabilidade é expressa por:
x
P( X  x)   f ( y)dy
(38)
0
O valor esperado e a variância são calculados por:
r
r
E( X ) 
Var( X )  2


(39)
Exemplo 4: Calcule a probabilidade de passado um minuto no máximo, dois carros tenham chegado
a uma cabine de pedágio, considerando que =5 carros por minuto.
Solução: Neste caso, r=2, ficando-se com:
P( X  x)  
2
1!
y 21e y dy  1  e x (1   )
(40)
Como =5, tem-se que:
P( X  1)  1  e 5*1 (1  5)  1  0.006738 * 6  0.96
(41)
7.6 Distribuição de Weibull
A distribuição de Weibull é muito similar à distribuição gama, tendo o mesmo uso. A
função densidade de probabilidade é expressa por:

(42)
f (t )    t  1 e  t
0t 
onde  e  (dito taxa de falha) são constantes positivas.
A Figura 7.14 apresenta a fdp para a distribuição de Weibull, considerando três valores
diferentes do parâmetro .
f(x)
=1
=2
=3
x
Figura 7.14 – Função Densidade de Probabilidade para a Distribuição de Weibull.
O valor esperado e a variância são calculados por:
1

E ( X )   1 /    1


Var ( X )  
2 / 
2
  2
  1
 
  1    1 
  
 
  
(43)
12
7.7 Distribuição Uniforme
Embora com menos aplicações que as demais, a distribuição uniforme é uma das mais
importantes em estatística, sendo usada para avaliar avarias causadas para desastres naturais, como
o rastro de destruição causado por um tornado, acidentes, guerras.
A função densidade de probabilidade é calculada por:
1
f ( x) 
a xb
(44)
ba
f ( x)  0
caso contrário
Todos os valores entre a e b são igualmente prováveis. A probabilidade cumulativa é igual
a:
x
x
1
y
F ( x)  P( X  x)  
dy 
ba
ba a
a
F ( x)  0
xa
xa
F ( x)  P( X  x) 
a xb
ba
F ( x)  1
xb
O valor esperado e a variância são iguais a:
ab
( b  a )2
E( X ) 
Var( X ) 
2
12
(45)
(46)
(47)
Exemplo 5: Calcule a probabilidade de um arranhão em um móvel ser no máximo igual a 7” de
comprimento e a probabilidade deste arranhão estar entre 4 e 8”. Calcule também o valor esperado e
a variância da distribuição. Considere que todos os arranhões entre 1” e 11” são igualmente
prováveis.
Solução: As Figuras 7.12 e 7.13 apresentam a fdp e distribuição uniforme de probabilidade para o
exemplo em questão.
f(x)
Área=0.60
1/(b-a)
a
b
x
1”
7” 11”
Figura 7.12 – Função Densidade de Probabilidade para a Distribuição Uniforme
F(x)
P(X7)
0.60
a=1”
7” b=11”
x
Figura 7.13 – Distribuição de Probabilidade para a Distribuição Uniforme
13
7 1
 0,60
11  1
(8  1)  (4  1)
P(4  X  8)  F (8)  F (7) 
 0,40
11  1
1  11
E( X ) 
6
2
(11  1) 2
Var ( X ) 
 8,33 polegadas 2
12
SD( X )  8,33  2,89"
P ( X  7 )  F (7) 
(48)
(49)
14
Download