86 VARIÁVEIS ALEATÓRIAS CONTÍNUAS Vamos agora estudar algumas variáveis aleatórias contínuas e respectivas propriedades, nomeadamente: • • • • • • uniforme exponencial normal qui-quadrado t-student F DISTRIBUIÇÃO UNIFORME Considere-se que a função densidade de probabilidade de uma v.a. contínua X, é constante num dado intervalo limitado [a, b] e nula fora desse intervalo. Nestas condições, a probabilidade de X tomar valores num dado sub-intervalo de [a, b] é a mesma para sub-intervalos de igual amplitude. Diz-se que a v.a. contínua X tem distribuição uniforme no intervalo [a, b], e escreve-se: X ~ U(a,b) se a sua função densidade de probabilidade for dada por: 1 b−a fX ( x ) = 0 a≤x≤b outros valores 87 Os parâmetros que caracterizam esta distribuição são a e b e satisfazem − ∞ < a < b < + ∞ . A função de distribuição de X, FX ( x ) , é dada por: 0 FX ( x ) = ∫ f u ( u ) du = ( x − a ) / ( b − a ) −∞ 1 x x<a a≤x≤b x>b Graficamente temos então que: O valor esperado e a variância para esta v.a. são facilmente obtidos a partir da definição e são dados por: +∞ b −∞ a E ( X ) = ∫ x ⋅ f X ( x ) dx = ∫ x ⋅ ( ) E X 2 +∞ 1 a+b dx = ... = b−a 2 1 b3 − a 3 = ∫ x ⋅ f X ( x ) dx = ∫ x ⋅ dx = ... = b − a 3⋅ ( b − a ) −∞ a 2 ( )− [ E( X )] Var ( X ) = E X 2 b 2 2 = ( b − a )2 12 88 Relativamente à função geradora de momentos temos que: ( )= GX ( t ) = E e t⋅x +∞ ∫ e −∞ e b⋅t − e a ⋅t = ( b − a )⋅ t t ⋅x b 1 f X ( x ) dx = ⋅ ∫ e t ⋅ x dx (b − a ) a (t≠0) ∧ G X ( 0 ) = 1 DISTRIBUIÇÃO EXPONENCIAL A distribuição exponencial está intimamente relacionada com a distribuição de Poisson. Efectivamente, admitindo que λ é o parâmetro da distribuição de Poisson que descreve o número de ocorrências por unidade de tempo (ou de distância), a variável tempo (ou distância) entre ocorrências sucessivas segue uma distribuição exponencial com parâmetro λ. Diz-se que a v.a. contínua X tem distribuição exponencial e escreve-se: X ~ E(λ) se a sua função densidade de probabilidade for dada por: λ ⋅e −λ⋅x fX ( x ) = 0 x≥0 x<0 O parâmetro que caracteriza esta distribuição é λ (λ>0). 89 A função de distribuição de X, FX ( x ) , é dada por: 1 − e −λ⋅x FX ( x ) = ∫ f u ( u ) du = 0 0 x x≥0 x<0 O valor esperado e a variância para esta v.a. são facilmente obtidos a partir da definição e são dados por: +∞ +∞ −∞ 0 E ( X ) = ∫ x ⋅ f X ( x ) dx = ∫ x ⋅ λ ⋅ e − λ ⋅ x dx = ... = ( )= E X 2 +∞ +∞ 1 λ 2 −λ⋅x dx = ... = ∫ x ⋅ f X ( x ) dx = ∫ x ⋅ λ ⋅ e 2 −∞ 0 ( ) Var ( X ) = E X 2 − [ E ( X ) ] 2 = 2 λ2 1 λ2 Relativamente à função geradora de momentos temos que: ( )= GX ( t ) = E e t⋅x +∞ ∫ e −∞ t⋅x +∞ f X ( x ) dx = ∫ λ ⋅ e − x ⋅ ( λ − t ) dx 0 +∞ λ = − ⋅ e − x ⋅( λ − t ) λ−t 0 = λ λ−t , t<λ 90 A distribuição exponencial apresenta uma propriedade particular que é a de “ não possuir memória”, isto é, dados s,t>0, quaisquer: P ( X > s + t ) e − λ ⋅( s + t ) − λ⋅t P ( X >s + t X >s ) = = = e P( X >s ) e − λ ⋅s = P( X >t ) DISTRIBUIÇÃO NORMAL A distribuição normal (ou distribuição de Gauss) é a que se utiliza mais frequentemente para descrever fenómenos que se traduzem por variáveis aleatórias contínuas. A razão para este facto, prende-se com o enunciado do teorema do limite central, como veremos mais adiante. A distribuição normal desempenha também um papel muito importante na inferência estatística. Diz-se que a v.a. contínua X tem distribuição normal e escreve-se: X ~ N(µ, σ 2 ) se a sua função densidade de probabilidade for dada por: fX ( x ) = 1 ⋅e 2 π ⋅σ x −µ − 1 ⋅ 2 σ 2 , −∞ < x < +∞ Os parâmetros que caracterizam esta distribuição são µ e σ 2 e satisfazem: − ∞ < x < + ∞ e σ > 0. 91 Pode demonstrar-se que: • f X ( x ) é uma função densidade de probabilidade, isto +∞ é: ∫ f X ( x ) dx = 1 (demonstração...) −∞ • A função densidade de probabilidade de uma v.a. X~N(µ, σ 2 ) tem a forma de sino, é simétrica em relação ao eixo x = µ (ponto de máximo) e tem pontos de inflexão em x = µ ± σ. • A função densidade de probabilidade genérica da distribuição normal representa uma família de distribuições em que cada elemento específico dessa família é representado por determinados valores dos parâmetros µ e σ. Neste caso temos distribuições normais com a mesma média µ e diferentes valores do desvio padrão (σ1>σ2>σ3). 92 Na figura acima temos distribuições normais com o mesmo desvio padrão σ, mas com médias diferentes (µ1>µ2>µ3). Neste último caso as distribuições têm diferentes valores para a média (µ1>µ2>µ3) e para o desvio padrão (σ1>σ2>σ3). x • A função de distribuição FX ( x ) = ∫ f ( u ) du não é −∞ integrável analiticamente, só podendo ser calculada por processos numéricos. 93 O valor esperado e a variância para esta v.a. podem ser obtidos a partir da definição e são dados por: E( X ) = +∞ 1 ∫ x⋅ e 2 π ⋅σ − ∞ x −µ − 1 ⋅ 2 σ 2 dx fazendo z = (x - µ)/σ temos que dx = σdz e substituindo no integral anterior vem que: E( X ) = 1 2π +∞ − 1 ⋅z2 ⋅e 2 ∫ ( σ⋅z + µ ) −∞ dz +∞ + ∞ − ⋅z − ⋅z 1 1 ⋅σ⋅ ∫ z ⋅ e 2 dz + µ ⋅ ⋅ ∫ e 2 dz 2π 2 π −∞ −∞ 1 2 = 1 2 =0 =1 O primeiro integral é nulo pois o integrando é uma função ímpar. O segundo integral assinalado é igual à unidade porque representa a área total sob a fdp de uma v.a. normal com valor médio nulo e desvio padrão unitário. Então podemos concluir que: E( X ) = µ Seguindo um procedimento análogo temos agora: ( )= E X 2 +∞ 1 2 ∫ x ⋅e 2 π ⋅σ −∞ x −µ − 1 ⋅ 2 σ 2 dx 94 + ∞ − ⋅z 1 + ∞ 2 − 2 ⋅z 1 2 2 =σ ⋅ dz + µ ⋅ ⋅ ∫ e 2 dz + ∫ z ⋅e 2 π −∞ 2π −∞ 1 2 =1 1 2 =1 − ⋅z 1 +∞ dz + 2⋅ µ⋅ σ⋅ ∫ z⋅ e 2 2 π −∞ 1 2 =0 = σ2 + µ 2 ( ) Var ( X ) = E X 2 − [ E ( X ) ] 2 = σ2 Constatamos assim que os dois parâmetros que caracterizam a distribuição normal são o valor esperado e a variância de X. Relativamente à função geradora de momentos temos que: ( )= GX ( t ) = E e t ⋅x µ ⋅ t + 1 ⋅ ( t ⋅ σ )2 2 =e ( demonstração ...) +∞ 1 t⋅x ∫ e ⋅e 2 π ⋅σ −∞ x −µ − 1 ⋅ 2 σ 2 dx 95 TEOREMA: Se X ~ N(µ, σ ) e se Y = a ⋅ X + b , então a v.a. 2 Y terá distribuição N(aµ + b, a 2 σ 2 ). (demonstração:...) X−µ , então a v.a. σ COROLÁRIO: Se X ~ N(µ, σ ) e se Y = 2 Y terá distribuição N(0,1). Se X tiver distribuição N(0,1), diz-se que X é uma variável normal reduzida (ou padronizada). Neste caso a sua fdp é dada por: f X ( x ) = ϕX ( x ) = 1 − ⋅x 1 ⋅e 2 2π 2 −∞ < x < +∞ , então: P(a ≤ X ≤ b ) = 1 2 1 b − 2⋅x dx ∫ e 2π a porém este integral não pode ser calculado analiticamente, pelo que se tem que recorrer a métodos de integração numérica. Contudo, a função de distribuição da v.a. normal reduzida, habitualmente representada por Φ X ( x ) está tabelada, pelo que pode ser utilizada para calcular a probabilidade pretendida. 96 Efectivamente: ΦX ( u ) = pelo que: 1 2 u − ⋅x 1 dx ∫ e 2 2 π −∞ P ( a ≤ X ≤ b ) = ΦX ( b ) − ΦX ( a ) É também evidente da definição de Φ X ( x ) , que: ΦX ( − x ) = 1 − ΦX ( x ) A importância da distribuição normal reduzida resulta de ser possível utilizar a sua função de distribuição (tabelada), para calcular probabilidades associadas a uma qualquer variável aleatória com distribuição normal N(µ, σ 2 ). X−µ De facto, se X ~ N(µ, σ 2 ) então fazendo Z = , temos σ que Z~N(0,1) e então: a −µ b−µ P ( a ≤ X ≤ b ) = P ≤Z≤ σ σ b−µ a −µ = φ Z − φZ σ σ 97 Finalmente, vamos calcular P ( µ − k ⋅ σ ≤ X ≤ µ + k ⋅ σ ) sendo X ~ N(µ, σ 2 ) e k ≥ 0: X−µ P ( µ − k ⋅ σ ≤ X ≤ µ + k ⋅ σ ) = P − k ≤ ≤ k σ = ΦZ ( k ) − ΦZ ( − k ) = 2⋅ΦZ ( k ) − 1 Esta probabilidade é independente de µ e de σ, isto é, a probabilidade de que uma v.a. com distribuição N(µ, σ 2 ) tome valores até k desvios padrões do valor esperado, depende somente de k e pode ser calculada pela expressão anterior. Na figura acima estão indicados valores aproximados para a probabilidade indicada anteriormente para k = 1,2,3. 98 COMBINAÇÃO LINEAR V.A. NORMAIS INDEPENDENTES A distribuição Normal tem uma importante propriedade que se traduz no teorema seguinte. TEOREMA: Sejam n variáveis aleatórias independentes X i , i=1,2,...,n em que: ( X i ~ N µi , σi2 ) então, a v.a. T definida como: n T = ∑ a i ⋅ Xi i =1 terá a seguinte distribuição: n T ~ N ∑ a i ⋅ µi ; i =1 2 2 a ∑ i ⋅ σi i =1 n A demonstração deste teorema pode fazer-se recorrendo à função geradora de momentos e afirma que: qualquer combinação linear de v.a. Normais independentes é ainda uma v.a. com distribuição Normal. RELAÇÃO ENTRE DISTRIBUIÇÃO NORMAL E BINOMIAL Quando foi estudada a distribuição binomial constatou-se que para p = 0,5 , a distribuição era simétrica, qualquer que fosse o valor de n. Verificou-se também que , mesmo para valores de p≠0,5 , se o valor de n fosse grande, a distribuicão