Probabilidade e Estatística I – Antonio Roque – Aula 23 Outras Distribuições de Probabilidade Contínuas Vamos agora estudar mais algumas distribuições de probabilidades para variáveis contínuas. Distribuição Exponencial Uma variável aleatória contínua X que satisfaça a distribuição exponencial é definida dentro de um intervalo I dado por [0, +∞] e tem função densidade de probabilidade fX(x) dada por f X ( x) = λe − λx , para x ≥ 0. Portanto, essa distribuição é caracterizada por apenas um parâmetro (λ). O gráfico desta função densidade está mostrado abaixo. A função de distribuição acumulada FX(x) associada à densidade fX(x) para a distribuição exponencial é dada por 1 Probabilidade e Estatística I – Antonio Roque – Aula 23 x FX ( x) = ∫ λe − λx 0 ⎛ 1 e− λx ⎞ ⎟⎟ = 1 − e− λx , para x ≥ 0. dx = λ ⎜⎜ − λ ⎠ ⎝ λ A média e a variância da distribuição exponencial podem ser calculadas com o uso da integral tabelada, ∞ −n n −u ∫λ u e du = n!λ−n . 0 Usando esta igualdade, a média da distribuição exponencial pode ser calculada como (fazendo u = λx), ∞ ∞ µ = ∫ xf X ( x)dx = ∫ λxe −λx dx = 0 0 1 λ. Da mesma forma, a variância da distribuição exponencial é dada por (mostre como exercício) ∞ ( ) 2 σ = ∫ x − 1λ λe− λx dx = 2 0 1 2 λ . A mediana da distribuição exponencial pode ser calculada resolvendo-se a equação FX ( x ) = 1 − e − λ x = 1 , 2 que nos dá (mostre como exercício): M= ln 2 λ ≈ 0,693 λ . 2 Probabilidade e Estatística I – Antonio Roque – Aula 23 Comparando a média com a mediana da distribuição exponencial, vemos que µ ≅ 1,44 M . Isto indica que a distribuição é assimétrica para a direita, como se pode ver pelo gráfico da distribuição. A distribuição exponencial é o análogo contínuo da distribuição geométrica. Isto pode ser notado observando-se o gráfico abaixo da distribuição geométrica, retirado da aula 12. Podemos estudar a relação entre a distribuição exponencial e a distribuição geométrica da seguinte forma. Suponha que a variável aleatória contínua X obedeça a uma distribuição exponencial e que Y = ⎣X ⎦ seja a parte inteira de X, isto é, o maior inteiro menor ou igual a X. Então, Prob(Y = y ) = Prob( y ≤ X < y + 1). 3 Probabilidade e Estatística I – Antonio Roque – Aula 23 Esta probabilidade pode ser calculada como, y +1 Prob(Y = y ) = ∫ λe − λx ( ) dx = e −λy − e −λ ( y +1) = e −λy 1 − e −λ , y = 0, 1, 2, … y Fazendo a identificação, e −λ = p , podemos reescrever a expressão acima como Prob(Y = y ) = p y (1 − p ), y = 0, 1, 2, …, que é exatamente a fórmula para a distribuição geométrica da variável discreta Y. Esta relação entre a distribuição exponencial e a distribuição geométrica é tão usada nas aplicações que é costume definir a distribuição geométrica pela fórmula ( P( y) = e −λy 1 − e −λ ), isto é, substituindo-se p por e − λ . Quando de faz isto, a média e a variância da distribuição geométrica (veja a aula 12) passam a ser dadas, respectivamente, por p 1 p eλ 2 µ= = ; σ = = . 1 − p eλ − 1 (1 − p )2 e λ − 1 2 ( ) 4 Probabilidade e Estatística I – Antonio Roque – Aula 23 A distribuição exponencial, assim como a distribuição geométrica, tem uma propriedade interessante que é chamada de ausência de memória. Suponha que X seja uma variável aleatória que satisfaça uma distribuição exponencial e que x1 e x2 sejam dois números positivos. Então, ( ) ( ) Prob( X ≥ x1 ) = 1 − FX ( x1 ) = 1 − 1 − e −λx1 = e −λx1 e Prob( X ≥ x2 ) = 1 − FX ( x2 ) = 1 − 1 − e −λx2 = e −λx2 . Suponha que se saiba que a variável X tem um valor maior que x1: X ≥ x1. Dado isto, qual é a probabilidade de que o valor de X seja maior que x1 + x2? Pela fórmula da probabilidade condicional, temos que Prob( X ≥ x1 + x 2 ) e − λ ( x1 + x2 ) Prob( X ≥ x1 + x 2 | X ≥ x1 ) = = = e − λx 2 . − λx1 Prob( X ≥ x1 ) e Esta equação nos diz que, Prob(X ≥ x1 + x2 | X ≥ x1 ) = Prob(X ≥ x2 ), ou seja, a probabilidade de se obter um valor de X acima de x1 a partir de um valor x2 dado que já se obteve x1 é simplesmente a probabilidade de se obter um valor de X a partir de x2. É como se a variável X não se lembrasse de que o valor x1 já havia sido obtido. 5 Probabilidade e Estatística I – Antonio Roque – Aula 23 Esta propriedade da distribuição exponencial é usada em biologia molecular para modelar o comportamento de degradação de algumas moléculas. Alguns tipos de moléculas ativas em células podem se degradar espontaneamente a qualquer momento, de forma completamente aleatória. Então, se representarmos o tempo de vida de uma molécula na sua forma ativa, antes da degradação, por uma variável aleatória X que obedece a uma distribuição exponencial, temos que a probabilidade de que ela tenha um tempo de vida maior que x1 + x2 dado que ela já teve um tempo de vida maior que x1 é igual à probabilidade de que ela tenha um tempo de vida maior que x2. O fato de ela já ter “vivido” um tempo x1 na forma ativa não significa nada para se determinar se ela ainda vai “viver” um tempo maior que x2. Esta propriedade pode ter ainda outras implicações para a modelagem do tempo de “vida” de uma molécula na forma ativa. Suponha que h é um valor pequeno. Então, a probabilidade de que uma variável aleatória X satisfazendo a uma distribuição exponencial assuma um valor no intervalo (x, x + h), dado que este valor já é maior que x é dada por x+h Prob( X ≥ x + h | X ≥ x ) = ∫ λe − λx x e − λx dx = 1 − e −λh ≈ λh, onde se usou a expansão em série de Taylor para a função exponencial, x2 x3 e = 1+ x + + +! 2 3! x x e a aproximação de que para x pequeno: e ≈ 1 + x . 6 Probabilidade e Estatística I – Antonio Roque – Aula 23 Este propriedade implica que se uma molécula já “viveu” até um tempo x na forma ativa, a probabilidade de que ela viva mais um tempo h, onde h é pequeno, é aproximadamente proporcional a h. Distribuição Gama A distribuição exponencial é um caso particular da chamada distribuição gama. A função densidade de probabilidade para a distribuição gama é definida por f X ( x) = λk x k −1e −λx Γ( k ) , x > 0. Nesta expressão, λ e k são parâmetros arbitrários e Γ(k) é a chamada função gama. A função gama é uma função analítica definida pela integral ∞ Γ(u ) = ∫ e −t t u −1 dt , u > 0. 0 A função gama possui as seguintes propriedades: Γ(u + 1) = uΓ(u), para todo u real e positivo e Γ(1) = 1. Estas propriedades implicam que, quando u for um inteiro positivo n, Γ(n) = (n − 1)! 7 Probabilidade e Estatística I – Antonio Roque – Aula 23 Por este motivo, a função gama é considerada uma extensão da função fatorial para os números reais positivos. Um valor útil para se conhecer da função gama é ⎛ 1 ⎞ Γ⎜ ⎟ = π . ⎝ 2 ⎠ Pode-se encontrar uma tabela da função gama consultando-se livros de tabelas e fórmulas matemáticas. Por exemplo: Abramowitz, M. e Stegun, I. (1972). Handbook of Mathematical Functions. Dover, New York. O gráfico da distribuição gama pode ter diferentes formas, dependendo dos seus parâmetros. A figura abaixo dá os gráficos da distribuição gama com λ = 1 para quatro diferentes valores de k. Veja que para k = 1 temos a distribuição exponencial de novo. 8 Probabilidade e Estatística I – Antonio Roque – Aula 23 A média e a variância da distribuição gama são dadas, respectivamente, por µ= k λ ; σ2 = k λ2 . Um caso especial da função gama de importância em inferência estatística ocorre quando λ = ½ e k = ν/2, onde ν é um inteiro positivo. A distribuição resultante, dada por 1 f X ( x) = x ν ν ⎛ ⎞ 2 2 Γ⎜ ⎟ ⎝ 2 ⎠ ν −1 2 − x 2 e , x>0 é chamada de distribuição do qui-quadrado com ν graus de liberdade (também denotado por gl). O seu gráfico está dado a seguir. Pode-se mostrar que se z for uma variável que satisfaz a distribuição normal padrão, então z2 satisfaz a distribuição do qui-quadrado com 1 grau de liberdade. Também pode-se mostrar que a distribuição exponencial com λ = ½ é a distribuição do qui-quadrado com 2 graus de liberdade. 9 Probabilidade e Estatística I – Antonio Roque – Aula 23 Distribuição Beta Uma variável aleatória contínua X satisfaz a uma distribuição beta com parâmetros positivos α e β se a sua função densidade de probabilidade for f X ( x) = Γ(α + β ) α −1 β −1 x (1 − x ) , 0 < x < 1. Γ(α )Γ(β ) A média e a variância da distribuição beta são dadas, respectivamente, por: µ= α α +β ; σ2 = αβ . (α + β ) (α + β + 1) 2 A distribuição uniforme (fX(x) = 1 para 0 < x < 1) é um caso especial da distribuição beta para α = β = 1. 10