Distribuições de Probabilidade

Propaganda
Distribuições de Probabilidade
Departamento de Matemática
Escola Superior de Tecnologia de Viseu
(DepMAT ESTV)
Distribuições de Probabilidade
2007/2008
1 / 31
Introdução
Introdução
Já vimos como caracterizar a distribuição de probabilidades de uma
variável aleatória.
Vamos estudar alguns tipos particulares de distribuições de
probabilidades usadas numa grande diversidade de aplicações
estatı́sticas.
Distribuições discretas:
distribuição de Bernoulli
distribuição Binomial
distribuição de Poisson
Distribuições contı́nuas:
distribuição Normal
distribuição Lognormal
(DepMAT ESTV)
Distribuições de Probabilidade
2007/2008
2 / 31
Distribuições Discretas
Distribuição de Bernoulli
Prova de Bernoulli
Prova de Bernoulli
Uma experiência aleatória que tem apenas dois resultados possı́veis:
S = Sucesso
F = Fracasso
é uma prova de Bernoulli, onde
p = P(S)
(DepMAT ESTV)
e
q = 1 − p = P(F )
Distribuições de Probabilidade
Distribuições Discretas
2007/2008
3 / 31
Distribuição de Bernoulli
Distribuição de Bernoulli
Seja X a v.a. que assume dois valores: o valor 1 quando o resultado
da prova de Bernoulli é sucesso e o valor 0 quando o resultado é
fracasso. Então a função de probabilidade de X é dada por:
x
x
0
1
ou por
p (1 − p)1−x , x = 0, 1
fX (x) =
fX (x) 1 − p p
0,
c.c.
Definição
Uma v.a. discreta com função de probabilidade assim definida diz-se
que tem distribuição de Bernoulli de parâmetro p (0 ≤ p ≤ 1)
E(X ) = p
Var (X ) = p(1 − p) = pq
(DepMAT ESTV)
Distribuições de Probabilidade
2007/2008
4 / 31
Distribuições Discretas
Distribuição Binomial
Distribuição Binomial
Considere-se a experiência aleatória caracterizada pelo seguinte:
realizam-se n provas de Bernoulli em idênticas condições;
cada prova tem apenas dois resultados possı́veis:“sucesso”ou
“fracasso”;
as provas são independentes umas das outras, isto é, o resultado
de cada prova não influencia os resultados das restantes;
as probabilidades de sucesso, p, e de fracasso, q = 1 − p,
mantêm-se inalteradas de prova para prova.
(DepMAT ESTV)
Distribuições de Probabilidade
Distribuições Discretas
2007/2008
5 / 31
Distribuição Binomial
Distribuição Binomial
Definição
Seja X o no de sucessos obtidos em n provas de Bernoulli.
Então X tem distribuição Binomial de parâmetros n e p e a sua função
de probabilidade é dada por:
⎧ n
⎨
× px × (1 − p)n−x , x = 0, 1, 2, ..., n
x
fX (x) =
⎩
0,
c.c.
Abreviadamente escreve-se: X ∼ B(n, p)
E(X ) = np
Var (X ) = np(1 − p) = npq
(DepMAT ESTV)
Distribuições de Probabilidade
2007/2008
6 / 31
Distribuições Discretas
Distribuição Binomial
Distribuição Binomial
Exemplo
O Luı́s joga o seguinte jogo: escolhe, ao acaso, um número de 1 a 6 e
em seguida lança 3 vezes um dado equilibrado com as faces
numeradas de 1 a 6. Se o número escolhido pelo Luı́s sai x vezes
(num total de 3 lançamentos) ele ganha x Euros. Em contrapartida, se
o número escolhido pelo Luı́s nunca ocorre então ele perde 5 Euros.
Determine o ganho médio do Luı́s ao jogar este jogo.
Pretende-se calcular o valor esperado da v.a.
Y ≡ Ganho do Luı́s
(DepMAT ESTV)
Distribuições de Probabilidade
Distribuições Discretas
2007/2008
7 / 31
Distribuição Binomial
Exemplo - cont.
Considere-se também a v.a.
X ≡ no de vezes que ocorre o no escolhido pelo Luı́s, em 3 lançamentos
Cada lançamento é uma prova de Bernoulli onde o sucesso é:
S ≡ sai o no escolhido pelo Luı́s
e a probabilidade de sucesso
p = P(S) =
1
6
Então,
X ∼ B(3, 1/6)
(DepMAT ESTV)
Distribuições de Probabilidade
2007/2008
8 / 31
Distribuições Discretas
Distribuição Binomial
Exemplo - cont.
Para já vamos calcular a probabilidade de, em 3 lançamentos do
dado, o no escolhido pelo Luı́s ocorrer 2 vezes, i.e., P(X = 2).
Sejam
Si ≡ ocorre o no escolhido pelo Luı́s no i−ésimo lançamento
Fi ≡ não ocorre o no escolhido pelo Luı́s no i−ésimo lançamento
De quantas maneiras pode ocorrer o acontecimento {X = 2}? i.e.,
num total de 3 lançamentos, de quantas maneiras se pode obter 2
vezes o no escolhido pelo Luı́s?
S1 ∩ S2 ∩ F3 ≡ SSF
3
→
S1 ∩ F2 ∩ S3 ≡ SFS
=3
2
F1 ∩ S2 ∩ S3 ≡ FSS
Então, P(X = 2) = P(SSF ) + P(SFS) + P(FSS)
(DepMAT ESTV)
Distribuições de Probabilidade
Distribuições Discretas
2007/2008
9 / 31
Distribuição Binomial
Exemplo - cont.
Uma vez que os lançamentos são independentes, tem-se
2
1
P(SSF ) = P(S1 ∩ S2 ∩ F3 ) = P(S1 )P(S2 )P(F3 ) = p (1 − p) =
×
6
2
1
×
P(SFS) = P(S1 ∩ F2 ∩ S3 ) = P(S1 )P(F2 )P(S3 ) = p2 (1 − p)1 =
6
2
1
P(FSS) = P(F1 ∩ S2 ∩ S3 ) = P(F1 )P(S2 )P(S3 ) = p2 (1 − p)1 =
×
6
2
1
5
6
5
6
5
6
Logo,
2
1
5
P(X = 2) = P(SSF ) + P(SFS) + P(FSS) = 3 × p (1 − p) = 3 ×
×
6
6
2
1
3
é o no de maneiras diferentes de se obterem 2
2
sucessos em 3 provas de Bernoulli e p2 (1 − p) é a probabilidade que
corresponde a cada uma delas.
onde, 3 =
(DepMAT ESTV)
Distribuições de Probabilidade
2007/2008
10 / 31
Distribuições Discretas
Distribuição Binomial
Exemplo - cont.
Determinemos agora a função de probabilidade da v.a. Y .
P(Y = −5) = P(X = 0) =
P(Y = 1) = P(X = 1) =
P(Y = 2) = P(X = 2) =
P(Y = 3) = P(X = 3) =
y
fY (y)
−5
0.5787
3
0
3
1
3
2
3
3
0 3
1
5
×
= 0.5787
6
6
1 2
5
1
×
= 0.3472
6
6
2 1
5
1
×
= 0.0694
6
6
3 0
5
1
×
= 0.0046
6
6
1
0.3472
2
0.0694
3
0.0046
E(Y ) = −5 × 0.5787 + 1 × 0.3472 + 2 × 0.0694 + 3 × 0.0046 = −2.3937
(DepMAT ESTV)
Distribuições de Probabilidade
Distribuições Discretas
2007/2008
11 / 31
Distribuição de Poisson
Distribuição de Poisson
A distribuição de Poisson é usada para tratar fenómenos aleatórios
que envolvem a contagem de ocorrências num dado intervalo,
geralmente de tempo ou de espaço.
Exemplos
no de chamadas telefónicas recebidas por uma empresa numa
hora;
no de nós existentes num metro de tecido de uma peça acabada
de fabricar;
no de clientes que entra numa loja de conveniência no perı́odo de
almoço;
no de acidentes que ocorrem na A25 numa semana;
no de peixes doentes num metro quadrado de área de uma baı́a
poluı́da.
(DepMAT ESTV)
Distribuições de Probabilidade
2007/2008
12 / 31
Distribuições Discretas
Distribuição de Poisson
Distribuição de Poisson
Nem todos os fenómenos de contagem de ocorrências podem ser
convenientemente modelados usando a distribuição de Poisson. No entanto,
se:
o número de ocorrências em determinado intervalo é independente do número
de ocorrências noutro intervalo qualquer, não coincidente com o primeiro;
a probabilidade de haver x ocorrências num intervalo de amplitude t, depende
exclusivamente do no x e da amplitude t. Isto é, considerando dois intervalos
distintos mas com a mesma amplitude, são iguais as probabilidades de se
registarem x ocorrências em cada um;
a probabilidade de mais de uma ocorrência num intervalo suficientemente
pequeno é aproximadamente igual zero, portanto desprezável;
a probabilidade de haver exactamente uma ocorrência num intervalo
suficientemente pequeno é aproximadamente proporcional ao tamanho do
intervalo
então, o número de ocorrências num intervalo qualquer de amplitude t, é
uma variável aleatória X com distribuição de Poisson
(DepMAT ESTV)
Distribuições de Probabilidade
Distribuições Discretas
2007/2008
13 / 31
Distribuição de Poisson
Distribuição de Poisson
Se X tem distribuição de Poisson de parâmetro µ então a função de
probabilidade de X é dada por
−µ x
e µ
x! , x=0,1,2,...
fX (x) =
0,
outros valores
Escreve-se abreviadamente X ∼ Po(µ)
A média e a variância desta distribuição são iguais ao parâmetro µ:
E(X ) = µ
(DepMAT ESTV)
e
Var (X ) = µ
Distribuições de Probabilidade
2007/2008
14 / 31
Distribuições Discretas
Distribuição de Poisson
Distribuição de Poisson
Sendo
X ≡ no de ocorrências num intervalo de amplitude t
Se X tem distribuição de Poisson e se λ é o número médio de
ocorrências por unidade, então µ = λt é o número médio de
ocorrências num intervalo de amplitude t.
Assim,
e−µ µx
e−λt (λt)x
fX (x) =
=
, x = 0, 1, 2, 3, ...
x!
x!
(DepMAT ESTV)
Distribuições de Probabilidade
Distribuições Discretas
2007/2008
15 / 31
Distribuição de Poisson
Distribuição de Poisson
Exercı́cio
Suponhamos que os clientes entram num armazém à média de 60 por
hora. Usando adequadamente a distribuição de Poisson:
a) determine a probabilidade de que num intervalo de 5 minutos não
entre ninguém no armazém;
b) o intervalo de tempo tal que a probabilidade de que não entre
ninguém no armazém durante o dito intervalo seja de 0.5.
Sol: a)0.0067; b) Intervalo de aproximadamente 0.7 minutos.
(DepMAT ESTV)
Distribuições de Probabilidade
2007/2008
16 / 31
Distribuições Discretas
Relação entre a Distribuição de Poisson e a
Distribuição Binomial
A relação entre as duas distribuições pode expressar-se através da
expressão seguinte:
lim B(n, p)
≡
n→∞
(np = λ)
Poisson(λ)
O interesse prático de aproximar uma distribuição Binomial por uma de
Poisson resulta do cálculo da função de probabilidade ser mais simples no
segundo caso.
Tal aproximação só é razoável quando n for grande (n ≥ 20) e só tem
interesse quando a distribuição Binomial for assimétrica (np < 7).
Se a distribuição Binomial for simétrica (ou quase simétrica), é mais
prático aproxima-la pela distribuição Normal.
(DepMAT ESTV)
Distribuições de Probabilidade
Distribuições Contı́nuas
2007/2008
17 / 31
Distribuição Normal
Distribuição Normal
Diz-se que uma variável aleatória X tem distribuição normal, se a sua
função densidade de probabilidade for dada por:
(x−µ)2
1
−
fX (x) = √ e 2σ2
σ 2π
onde µ e σ são os parâmetros da distribuição que obedecem a: σ > 0
e −∞ < µ < +∞
Uma vez conhecidos estes parâmetros, a distribuição da v. a. X fica
completamente definida e escreve-se
X ∼ N(µ, σ 2 )
Tem-se
E(X ) = µ
(DepMAT ESTV)
e
Var (X ) = σ 2
Distribuições de Probabilidade
2007/2008
18 / 31
Distribuições Contı́nuas
Distribuição Normal
Curva de Gauss
O gráfico da função densidade de probabilidade de uma variável
aleatória com distribuição N(µ, σ 2 ) é a famosa curva em forma de sino,
também dita curva de Gauss ou curva normal, abaixo representada.
Note que P(X < µ) = P(X > µ)
(DepMAT ESTV)
Distribuições de Probabilidade
Distribuições Contı́nuas
2007/2008
19 / 31
Distribuição Normal
Caracterı́sticas da Curva de Gauss
A curva é simétrica relativamente à recta vertical que passa pelo
ponto (µ, 0);
A curva prolonga-se de −∞ a + ∞ e nunca toca no eixo das
abcissas (este eixo é uma assimptota);
A curva tem dois pontos de inflexão de abcissas: µ − σ e µ + σ;
Aos intervalos (µ − σ, µ + σ), (µ − 2σ, µ + 2σ) e (µ − 3σ, µ + 3σ)
correspondem, respectivamente, 68%, 95% e 99.7% da área total
sob a curva da função densidade:
P(µ − σ < X < µ + σ) = 0.6827
P(µ − 2σ < X < µ + 2σ) = 0.9545
P(µ − 3σ < X < µ + 3σ) = 0.9973
(DepMAT ESTV)
Distribuições de Probabilidade
2007/2008
20 / 31
Distribuições Contı́nuas
Distribuição Normal
Curva de Gauss
Distribuições normais com iguais desvios padrões mas com médias
diferentes.
(DepMAT ESTV)
Distribuições de Probabilidade
Distribuições Contı́nuas
2007/2008
21 / 31
Distribuição Normal
Curva de Gauss
Distribuições normais com médias iguais mas com desvios padrões
diferentes.
(DepMAT ESTV)
Distribuições de Probabilidade
2007/2008
22 / 31
Distribuições Contı́nuas
Distribuição Normal
Normal Padronizada
Uma variável aleatória com distribuição normal de média zero e
desvio padrão igual a um é dita uma variável aleatória normal
estandardizada, reduzida ou padronizada: Z ∼ N(0, 1)
Estandardização da v. a. X ∼ N(µ, σ 2 ) (mudança de origem e de
escala):
X −µ
∼ N(0, 1)
Z =
σ
Exemplo
Seja X ∼ N(2, 0.52 ). Calcule: P(X < 2.4) e P(1.8 < X < 2.5).
Sol: P(X < 2.4) = 0.7881 e P(1.8 < X < 2.5) = 0.4967
(DepMAT ESTV)
Distribuições de Probabilidade
Distribuições Contı́nuas
2007/2008
23 / 31
Distribuição Normal
Teorema da Aditividade da Distribuição Normal
Teorema
Sejam X1 , X2 , ..., Xn variáveis aleatórias independentes, cada uma
com distribuição normal de média µi e variância σi2 (i=1,...,n).
Então a variável aleatória
X = a1 X1 + a2 X2 + ... + an Xn
com ai ∈ R (i = 1, ..., n),
tem distribuição normal de média
µX = a1 µ1 + a2 µ2 + ... + an µn
e variância
(DepMAT ESTV)
σX2 = a12 σ12 + a22 σ22 + ... + an2 σn2
Distribuições de Probabilidade
2007/2008
24 / 31
Distribuições Contı́nuas
Distribuição Normal
Teorema da Aditividade da Distribuição Normal
Exemplo
Suponha que o gestor de uma empresa desenvolve software por
encomenda. Estudos recentes indicam que são 4 as fases principais da
criação de um novo software. Os valores esperados (em dias) e o respectivo
desvio-padrão são os indicados na tabela:
Actividade
Reunir com o cliente
“Desenhar”o sistema
Fazer o código
Testar o software
Valor Esperado
5
8
10
6
Desvio-Padrão
1.6
3
3.3
2.2
Admita que o tempo gasto naquelas fases segue uma distribuição normal.
Se assinar um contrato com um cliente que estipule uma grande penalização
no caso de não entregar o software num perı́odo máximo de 40 dias calcule
a probabilidade de pagar essa penalização.
Sol.: 0.0174
(DepMAT ESTV)
Distribuições de Probabilidade
Distribuições Contı́nuas
2007/2008
25 / 31
Distribuição Normal
Aproximação da Distribuição Binomial à Normal
Para n suficientemente grande, a distribuição binomial de parâmetros
n e p pode aproximar-se à distribuição normal com a mesma média,
np, e a mesma variância, npq.
Isto é, sendo X uma v. a. com distribuição B(n, p) e n suficientemente
grande, então,
X − E(X )
X − np .
∼ N(0, 1)
= √
npq
Var (X )
Na prática fazemos esta aproximação quando n > 20 e tanto np como
nq são superiores a 5.
(DepMAT ESTV)
Distribuições de Probabilidade
2007/2008
26 / 31
Distribuições Contı́nuas
Distribuição Normal
Aproximação da Distribuição Binomial à Normal
Correcção de continuidade
X ∼ B(n, p) e Y ∼ N(np, npq)
P(X = k ) ∼
= P(k − 0.5 ≤ Y ≤ k + 0.5);
P(X ≥ k ) ∼
= P(Y > k − 0.5);
P(X > k ) ∼
= P(Y > k + 0.5);
P(a ≤ X ≤ b) ∼
= P(a − 0.5 ≤ Y ≤ b + 0.5);
P(a < X < b) ∼
= P(a + 0.5 ≤ Y ≤ b − 0.5).
(DepMAT ESTV)
Distribuições de Probabilidade
Distribuições Contı́nuas
2007/2008
27 / 31
Distribuição Normal
Aproximação da Distribuição Binomial à Normal
Exemplo
Um avião pode acomodar 300 passageiros, 30 dos quais em 1a classe
e 270 em classe turismo. A companhia aérea reservou 30 lugares em
1a classe e 300 em turismo. Sabendo que a probabilidade de não
comparecimento de quem faz reserva é de 0.15, qual é a
probabilidade de que todos os passageiros que comparecem sejam
acomodados, se os lugares em 1a classe puderem ser utilizados pelos
passageiros de turismo?
Sol.: 0.999
(DepMAT ESTV)
Distribuições de Probabilidade
2007/2008
28 / 31
Distribuições Contı́nuas
Distribuição Lognormal
Distribuição Lognormal
Admita que X > 0 é uma variável aleatória contı́nua.
Se X é uma variável aleatória cujo logaritmo é normalmente
distribuı́do, isto é,
Y = ln(X ) ∼ N(µ, σ 2 )
então X tem uma distribuição lognormal e escreve-se
X ∼ LN(µX , σX2 )
A função densidade de probabilidade de X é dada pela expressão:
fX (x) =
2
(ln(x) − µ)
1 1
√
exp −
2σ 2
σ 2π x
(DepMAT ESTV)
, 0 < x < +∞, −∞ < µ < +∞, σ > 0
Distribuições de Probabilidade
Distribuições Contı́nuas
2007/2008
29 / 31
Distribuição Lognormal
Distribuição Lognormal
Tem-se ainda que
σ2
µX = E(X ) = exp µ +
2
e
σX2
2
2
− exp 2µ + σ
= Var (X ) = exp 2 µ + σ
A distribuição lognormal é assimétrica à direita sendo a sua moda e
mediana dadas, respectivamente, por
2
e
ξX = exp µ − σ
ηX = exp(µ)
(DepMAT ESTV)
Distribuições de Probabilidade
2007/2008
30 / 31
Distribuições Contı́nuas
Distribuição Lognormal
Distribuição Lognormal
A sua função densidade de probabilidade de uma distribuição
lognormal tem o seguinte aspecto:
Se X ∼ LN(µX , σX2 ) prova-se que Y = ln(X ) tem valor médio e
variância dados por:
4
2
σX
µX
1
2
µY = ln
=
ln
+1
e
σ
Y
2
σX2 + µ2X
µ2X
(DepMAT ESTV)
Distribuições de Probabilidade
2007/2008
31 / 31
Download