Distribuições de Probabilidade Departamento de Matemática Escola Superior de Tecnologia de Viseu (DepMAT ESTV) Distribuições de Probabilidade 2007/2008 1 / 31 Introdução Introdução Já vimos como caracterizar a distribuição de probabilidades de uma variável aleatória. Vamos estudar alguns tipos particulares de distribuições de probabilidades usadas numa grande diversidade de aplicações estatı́sticas. Distribuições discretas: distribuição de Bernoulli distribuição Binomial distribuição de Poisson Distribuições contı́nuas: distribuição Normal distribuição Lognormal (DepMAT ESTV) Distribuições de Probabilidade 2007/2008 2 / 31 Distribuições Discretas Distribuição de Bernoulli Prova de Bernoulli Prova de Bernoulli Uma experiência aleatória que tem apenas dois resultados possı́veis: S = Sucesso F = Fracasso é uma prova de Bernoulli, onde p = P(S) (DepMAT ESTV) e q = 1 − p = P(F ) Distribuições de Probabilidade Distribuições Discretas 2007/2008 3 / 31 Distribuição de Bernoulli Distribuição de Bernoulli Seja X a v.a. que assume dois valores: o valor 1 quando o resultado da prova de Bernoulli é sucesso e o valor 0 quando o resultado é fracasso. Então a função de probabilidade de X é dada por: x x 0 1 ou por p (1 − p)1−x , x = 0, 1 fX (x) = fX (x) 1 − p p 0, c.c. Definição Uma v.a. discreta com função de probabilidade assim definida diz-se que tem distribuição de Bernoulli de parâmetro p (0 ≤ p ≤ 1) E(X ) = p Var (X ) = p(1 − p) = pq (DepMAT ESTV) Distribuições de Probabilidade 2007/2008 4 / 31 Distribuições Discretas Distribuição Binomial Distribuição Binomial Considere-se a experiência aleatória caracterizada pelo seguinte: realizam-se n provas de Bernoulli em idênticas condições; cada prova tem apenas dois resultados possı́veis:“sucesso”ou “fracasso”; as provas são independentes umas das outras, isto é, o resultado de cada prova não influencia os resultados das restantes; as probabilidades de sucesso, p, e de fracasso, q = 1 − p, mantêm-se inalteradas de prova para prova. (DepMAT ESTV) Distribuições de Probabilidade Distribuições Discretas 2007/2008 5 / 31 Distribuição Binomial Distribuição Binomial Definição Seja X o no de sucessos obtidos em n provas de Bernoulli. Então X tem distribuição Binomial de parâmetros n e p e a sua função de probabilidade é dada por: ⎧ n ⎨ × px × (1 − p)n−x , x = 0, 1, 2, ..., n x fX (x) = ⎩ 0, c.c. Abreviadamente escreve-se: X ∼ B(n, p) E(X ) = np Var (X ) = np(1 − p) = npq (DepMAT ESTV) Distribuições de Probabilidade 2007/2008 6 / 31 Distribuições Discretas Distribuição Binomial Distribuição Binomial Exemplo O Luı́s joga o seguinte jogo: escolhe, ao acaso, um número de 1 a 6 e em seguida lança 3 vezes um dado equilibrado com as faces numeradas de 1 a 6. Se o número escolhido pelo Luı́s sai x vezes (num total de 3 lançamentos) ele ganha x Euros. Em contrapartida, se o número escolhido pelo Luı́s nunca ocorre então ele perde 5 Euros. Determine o ganho médio do Luı́s ao jogar este jogo. Pretende-se calcular o valor esperado da v.a. Y ≡ Ganho do Luı́s (DepMAT ESTV) Distribuições de Probabilidade Distribuições Discretas 2007/2008 7 / 31 Distribuição Binomial Exemplo - cont. Considere-se também a v.a. X ≡ no de vezes que ocorre o no escolhido pelo Luı́s, em 3 lançamentos Cada lançamento é uma prova de Bernoulli onde o sucesso é: S ≡ sai o no escolhido pelo Luı́s e a probabilidade de sucesso p = P(S) = 1 6 Então, X ∼ B(3, 1/6) (DepMAT ESTV) Distribuições de Probabilidade 2007/2008 8 / 31 Distribuições Discretas Distribuição Binomial Exemplo - cont. Para já vamos calcular a probabilidade de, em 3 lançamentos do dado, o no escolhido pelo Luı́s ocorrer 2 vezes, i.e., P(X = 2). Sejam Si ≡ ocorre o no escolhido pelo Luı́s no i−ésimo lançamento Fi ≡ não ocorre o no escolhido pelo Luı́s no i−ésimo lançamento De quantas maneiras pode ocorrer o acontecimento {X = 2}? i.e., num total de 3 lançamentos, de quantas maneiras se pode obter 2 vezes o no escolhido pelo Luı́s? S1 ∩ S2 ∩ F3 ≡ SSF 3 → S1 ∩ F2 ∩ S3 ≡ SFS =3 2 F1 ∩ S2 ∩ S3 ≡ FSS Então, P(X = 2) = P(SSF ) + P(SFS) + P(FSS) (DepMAT ESTV) Distribuições de Probabilidade Distribuições Discretas 2007/2008 9 / 31 Distribuição Binomial Exemplo - cont. Uma vez que os lançamentos são independentes, tem-se 2 1 P(SSF ) = P(S1 ∩ S2 ∩ F3 ) = P(S1 )P(S2 )P(F3 ) = p (1 − p) = × 6 2 1 × P(SFS) = P(S1 ∩ F2 ∩ S3 ) = P(S1 )P(F2 )P(S3 ) = p2 (1 − p)1 = 6 2 1 P(FSS) = P(F1 ∩ S2 ∩ S3 ) = P(F1 )P(S2 )P(S3 ) = p2 (1 − p)1 = × 6 2 1 5 6 5 6 5 6 Logo, 2 1 5 P(X = 2) = P(SSF ) + P(SFS) + P(FSS) = 3 × p (1 − p) = 3 × × 6 6 2 1 3 é o no de maneiras diferentes de se obterem 2 2 sucessos em 3 provas de Bernoulli e p2 (1 − p) é a probabilidade que corresponde a cada uma delas. onde, 3 = (DepMAT ESTV) Distribuições de Probabilidade 2007/2008 10 / 31 Distribuições Discretas Distribuição Binomial Exemplo - cont. Determinemos agora a função de probabilidade da v.a. Y . P(Y = −5) = P(X = 0) = P(Y = 1) = P(X = 1) = P(Y = 2) = P(X = 2) = P(Y = 3) = P(X = 3) = y fY (y) −5 0.5787 3 0 3 1 3 2 3 3 0 3 1 5 × = 0.5787 6 6 1 2 5 1 × = 0.3472 6 6 2 1 5 1 × = 0.0694 6 6 3 0 5 1 × = 0.0046 6 6 1 0.3472 2 0.0694 3 0.0046 E(Y ) = −5 × 0.5787 + 1 × 0.3472 + 2 × 0.0694 + 3 × 0.0046 = −2.3937 (DepMAT ESTV) Distribuições de Probabilidade Distribuições Discretas 2007/2008 11 / 31 Distribuição de Poisson Distribuição de Poisson A distribuição de Poisson é usada para tratar fenómenos aleatórios que envolvem a contagem de ocorrências num dado intervalo, geralmente de tempo ou de espaço. Exemplos no de chamadas telefónicas recebidas por uma empresa numa hora; no de nós existentes num metro de tecido de uma peça acabada de fabricar; no de clientes que entra numa loja de conveniência no perı́odo de almoço; no de acidentes que ocorrem na A25 numa semana; no de peixes doentes num metro quadrado de área de uma baı́a poluı́da. (DepMAT ESTV) Distribuições de Probabilidade 2007/2008 12 / 31 Distribuições Discretas Distribuição de Poisson Distribuição de Poisson Nem todos os fenómenos de contagem de ocorrências podem ser convenientemente modelados usando a distribuição de Poisson. No entanto, se: o número de ocorrências em determinado intervalo é independente do número de ocorrências noutro intervalo qualquer, não coincidente com o primeiro; a probabilidade de haver x ocorrências num intervalo de amplitude t, depende exclusivamente do no x e da amplitude t. Isto é, considerando dois intervalos distintos mas com a mesma amplitude, são iguais as probabilidades de se registarem x ocorrências em cada um; a probabilidade de mais de uma ocorrência num intervalo suficientemente pequeno é aproximadamente igual zero, portanto desprezável; a probabilidade de haver exactamente uma ocorrência num intervalo suficientemente pequeno é aproximadamente proporcional ao tamanho do intervalo então, o número de ocorrências num intervalo qualquer de amplitude t, é uma variável aleatória X com distribuição de Poisson (DepMAT ESTV) Distribuições de Probabilidade Distribuições Discretas 2007/2008 13 / 31 Distribuição de Poisson Distribuição de Poisson Se X tem distribuição de Poisson de parâmetro µ então a função de probabilidade de X é dada por −µ x e µ x! , x=0,1,2,... fX (x) = 0, outros valores Escreve-se abreviadamente X ∼ Po(µ) A média e a variância desta distribuição são iguais ao parâmetro µ: E(X ) = µ (DepMAT ESTV) e Var (X ) = µ Distribuições de Probabilidade 2007/2008 14 / 31 Distribuições Discretas Distribuição de Poisson Distribuição de Poisson Sendo X ≡ no de ocorrências num intervalo de amplitude t Se X tem distribuição de Poisson e se λ é o número médio de ocorrências por unidade, então µ = λt é o número médio de ocorrências num intervalo de amplitude t. Assim, e−µ µx e−λt (λt)x fX (x) = = , x = 0, 1, 2, 3, ... x! x! (DepMAT ESTV) Distribuições de Probabilidade Distribuições Discretas 2007/2008 15 / 31 Distribuição de Poisson Distribuição de Poisson Exercı́cio Suponhamos que os clientes entram num armazém à média de 60 por hora. Usando adequadamente a distribuição de Poisson: a) determine a probabilidade de que num intervalo de 5 minutos não entre ninguém no armazém; b) o intervalo de tempo tal que a probabilidade de que não entre ninguém no armazém durante o dito intervalo seja de 0.5. Sol: a)0.0067; b) Intervalo de aproximadamente 0.7 minutos. (DepMAT ESTV) Distribuições de Probabilidade 2007/2008 16 / 31 Distribuições Discretas Relação entre a Distribuição de Poisson e a Distribuição Binomial A relação entre as duas distribuições pode expressar-se através da expressão seguinte: lim B(n, p) ≡ n→∞ (np = λ) Poisson(λ) O interesse prático de aproximar uma distribuição Binomial por uma de Poisson resulta do cálculo da função de probabilidade ser mais simples no segundo caso. Tal aproximação só é razoável quando n for grande (n ≥ 20) e só tem interesse quando a distribuição Binomial for assimétrica (np < 7). Se a distribuição Binomial for simétrica (ou quase simétrica), é mais prático aproxima-la pela distribuição Normal. (DepMAT ESTV) Distribuições de Probabilidade Distribuições Contı́nuas 2007/2008 17 / 31 Distribuição Normal Distribuição Normal Diz-se que uma variável aleatória X tem distribuição normal, se a sua função densidade de probabilidade for dada por: (x−µ)2 1 − fX (x) = √ e 2σ2 σ 2π onde µ e σ são os parâmetros da distribuição que obedecem a: σ > 0 e −∞ < µ < +∞ Uma vez conhecidos estes parâmetros, a distribuição da v. a. X fica completamente definida e escreve-se X ∼ N(µ, σ 2 ) Tem-se E(X ) = µ (DepMAT ESTV) e Var (X ) = σ 2 Distribuições de Probabilidade 2007/2008 18 / 31 Distribuições Contı́nuas Distribuição Normal Curva de Gauss O gráfico da função densidade de probabilidade de uma variável aleatória com distribuição N(µ, σ 2 ) é a famosa curva em forma de sino, também dita curva de Gauss ou curva normal, abaixo representada. Note que P(X < µ) = P(X > µ) (DepMAT ESTV) Distribuições de Probabilidade Distribuições Contı́nuas 2007/2008 19 / 31 Distribuição Normal Caracterı́sticas da Curva de Gauss A curva é simétrica relativamente à recta vertical que passa pelo ponto (µ, 0); A curva prolonga-se de −∞ a + ∞ e nunca toca no eixo das abcissas (este eixo é uma assimptota); A curva tem dois pontos de inflexão de abcissas: µ − σ e µ + σ; Aos intervalos (µ − σ, µ + σ), (µ − 2σ, µ + 2σ) e (µ − 3σ, µ + 3σ) correspondem, respectivamente, 68%, 95% e 99.7% da área total sob a curva da função densidade: P(µ − σ < X < µ + σ) = 0.6827 P(µ − 2σ < X < µ + 2σ) = 0.9545 P(µ − 3σ < X < µ + 3σ) = 0.9973 (DepMAT ESTV) Distribuições de Probabilidade 2007/2008 20 / 31 Distribuições Contı́nuas Distribuição Normal Curva de Gauss Distribuições normais com iguais desvios padrões mas com médias diferentes. (DepMAT ESTV) Distribuições de Probabilidade Distribuições Contı́nuas 2007/2008 21 / 31 Distribuição Normal Curva de Gauss Distribuições normais com médias iguais mas com desvios padrões diferentes. (DepMAT ESTV) Distribuições de Probabilidade 2007/2008 22 / 31 Distribuições Contı́nuas Distribuição Normal Normal Padronizada Uma variável aleatória com distribuição normal de média zero e desvio padrão igual a um é dita uma variável aleatória normal estandardizada, reduzida ou padronizada: Z ∼ N(0, 1) Estandardização da v. a. X ∼ N(µ, σ 2 ) (mudança de origem e de escala): X −µ ∼ N(0, 1) Z = σ Exemplo Seja X ∼ N(2, 0.52 ). Calcule: P(X < 2.4) e P(1.8 < X < 2.5). Sol: P(X < 2.4) = 0.7881 e P(1.8 < X < 2.5) = 0.4967 (DepMAT ESTV) Distribuições de Probabilidade Distribuições Contı́nuas 2007/2008 23 / 31 Distribuição Normal Teorema da Aditividade da Distribuição Normal Teorema Sejam X1 , X2 , ..., Xn variáveis aleatórias independentes, cada uma com distribuição normal de média µi e variância σi2 (i=1,...,n). Então a variável aleatória X = a1 X1 + a2 X2 + ... + an Xn com ai ∈ R (i = 1, ..., n), tem distribuição normal de média µX = a1 µ1 + a2 µ2 + ... + an µn e variância (DepMAT ESTV) σX2 = a12 σ12 + a22 σ22 + ... + an2 σn2 Distribuições de Probabilidade 2007/2008 24 / 31 Distribuições Contı́nuas Distribuição Normal Teorema da Aditividade da Distribuição Normal Exemplo Suponha que o gestor de uma empresa desenvolve software por encomenda. Estudos recentes indicam que são 4 as fases principais da criação de um novo software. Os valores esperados (em dias) e o respectivo desvio-padrão são os indicados na tabela: Actividade Reunir com o cliente “Desenhar”o sistema Fazer o código Testar o software Valor Esperado 5 8 10 6 Desvio-Padrão 1.6 3 3.3 2.2 Admita que o tempo gasto naquelas fases segue uma distribuição normal. Se assinar um contrato com um cliente que estipule uma grande penalização no caso de não entregar o software num perı́odo máximo de 40 dias calcule a probabilidade de pagar essa penalização. Sol.: 0.0174 (DepMAT ESTV) Distribuições de Probabilidade Distribuições Contı́nuas 2007/2008 25 / 31 Distribuição Normal Aproximação da Distribuição Binomial à Normal Para n suficientemente grande, a distribuição binomial de parâmetros n e p pode aproximar-se à distribuição normal com a mesma média, np, e a mesma variância, npq. Isto é, sendo X uma v. a. com distribuição B(n, p) e n suficientemente grande, então, X − E(X ) X − np . ∼ N(0, 1) = √ npq Var (X ) Na prática fazemos esta aproximação quando n > 20 e tanto np como nq são superiores a 5. (DepMAT ESTV) Distribuições de Probabilidade 2007/2008 26 / 31 Distribuições Contı́nuas Distribuição Normal Aproximação da Distribuição Binomial à Normal Correcção de continuidade X ∼ B(n, p) e Y ∼ N(np, npq) P(X = k ) ∼ = P(k − 0.5 ≤ Y ≤ k + 0.5); P(X ≥ k ) ∼ = P(Y > k − 0.5); P(X > k ) ∼ = P(Y > k + 0.5); P(a ≤ X ≤ b) ∼ = P(a − 0.5 ≤ Y ≤ b + 0.5); P(a < X < b) ∼ = P(a + 0.5 ≤ Y ≤ b − 0.5). (DepMAT ESTV) Distribuições de Probabilidade Distribuições Contı́nuas 2007/2008 27 / 31 Distribuição Normal Aproximação da Distribuição Binomial à Normal Exemplo Um avião pode acomodar 300 passageiros, 30 dos quais em 1a classe e 270 em classe turismo. A companhia aérea reservou 30 lugares em 1a classe e 300 em turismo. Sabendo que a probabilidade de não comparecimento de quem faz reserva é de 0.15, qual é a probabilidade de que todos os passageiros que comparecem sejam acomodados, se os lugares em 1a classe puderem ser utilizados pelos passageiros de turismo? Sol.: 0.999 (DepMAT ESTV) Distribuições de Probabilidade 2007/2008 28 / 31 Distribuições Contı́nuas Distribuição Lognormal Distribuição Lognormal Admita que X > 0 é uma variável aleatória contı́nua. Se X é uma variável aleatória cujo logaritmo é normalmente distribuı́do, isto é, Y = ln(X ) ∼ N(µ, σ 2 ) então X tem uma distribuição lognormal e escreve-se X ∼ LN(µX , σX2 ) A função densidade de probabilidade de X é dada pela expressão: fX (x) = 2 (ln(x) − µ) 1 1 √ exp − 2σ 2 σ 2π x (DepMAT ESTV) , 0 < x < +∞, −∞ < µ < +∞, σ > 0 Distribuições de Probabilidade Distribuições Contı́nuas 2007/2008 29 / 31 Distribuição Lognormal Distribuição Lognormal Tem-se ainda que σ2 µX = E(X ) = exp µ + 2 e σX2 2 2 − exp 2µ + σ = Var (X ) = exp 2 µ + σ A distribuição lognormal é assimétrica à direita sendo a sua moda e mediana dadas, respectivamente, por 2 e ξX = exp µ − σ ηX = exp(µ) (DepMAT ESTV) Distribuições de Probabilidade 2007/2008 30 / 31 Distribuições Contı́nuas Distribuição Lognormal Distribuição Lognormal A sua função densidade de probabilidade de uma distribuição lognormal tem o seguinte aspecto: Se X ∼ LN(µX , σX2 ) prova-se que Y = ln(X ) tem valor médio e variância dados por: 4 2 σX µX 1 2 µY = ln = ln +1 e σ Y 2 σX2 + µ2X µ2X (DepMAT ESTV) Distribuições de Probabilidade 2007/2008 31 / 31