Estatística para Economia e Gestão REVISÕES SOBRE VARIÁVEIS ALEATÓRIAS DISCRETAS E CONTÍNUAS Primavera 2008/2009 1 Variável Aleatória: • Definição: uma variável aleatória é uma função que atribui a cada elemento do espaço de resultados S, um número real. • De uma forma simples, podemos classificar uma variável aleatória como sendo DISCRETA ou CONTÍNUA Quando S é finito ou infinito numerável Inverno 2007/2008 Quando S não é numerável 2 A- Variáveis Aleatórias Discretas: Lei de Probabilidade: uma função f é uma lei de probabilidade de uma variável aleatória discreta X se e só se: 1. 1. f ( x) ≥ 0, ∀x ∈ DX ∑ f ( x) = 1 x∈DX Inverno 2007/2008 3 A- Variáveis Aleatórias Discretas: Se X é uma variável aleatória discreta, a função real de variável real dada por F= PX ( X = ≤ x) X ( x) ∑f t≤x X (t ) para − ∞ < x < +∞ onde f X (t ) é o valor da lei de probabilidade de X em t, designa-se função distribuição ou função cumulativa da variável aleatória discreta X Inverno 2007/2008 4 A- Variáveis Aleatórias Discretas: • O Valor Esperado de uma variável discreta X, se existir, é dado por: E ( X ) = ∑ xi f ( xi ) = x1 f ( x1 ) + x2 f ( x2 ) + x3 f ( x3 ) + ... i • Note que o Valor Esperado de uma função de X é dado por: E [u ( X ) ] = ∑ u ( xi ) f ( xi ) = u ( x1 ) f ( x1 ) + u ( x2 ) f ( x2 ) + u ( x3 ) f ( x3 ) + . . . i Inverno 2007/2008 5 A- Variáveis Aleatórias Discretas: • A Variância de X é dada por: Va (rX ) =σ 2 =E ( X − µ ) 2 =E ( X 2 ) − E 2 ( X ) =∑ ( xi − µ ) 2 f ( xi ) i • Note que a Variância de uma função de X é dada por: Va = ru [ ( X )] E u ( X )2 − E 2 [u ( X )] Inverno 2007/2008 6 A- Variáveis Aleatórias Discretas: • Teoremas importantes: 1- Se ( X , Y ) for uma variável bidiomensional discreta com função probabilidade f ( X , Y ) , e se existirem E ( X ) e E (Y ) , então: E (aX + bY= ) a.E ( X ) + b.E (Y ) 2- Se X e Y forem variáveis aleatórias discretas e independentes, com função probabilidade conjunta f ( X , Y ) , e se existirem então: E ( X ) e E (Y ) , E ( XY ) = E ( X ) E (Y ) Inverno 2007/2008 7 A- Variáveis Aleatórias Discretas: 3- Se existirem segundos momentos para as variáveis aleatórias X e Y, então: Var (aX ± = bY ) a 2Var ( X ) + b 2Var (Y ) ± 2ab cov( X , Y ) X , Y ) E ( XY ) − E ( X ) E (Y ) em que cov(= 4- Se X e Y forem independentes, cov( X , Y ) = 0 , implicando que: Var (aX ± = bY ) a 2Var ( X ) + b 2Var (Y ) Inverno 2007/2008 8 A - Distribuições Discretas Clássicas 1- Uniforme Discreta 2- Bernoulli 3- Binomial 4- Hipergeométrica 5- Binomial Negativa 6- Poisson Para estas distribuições vamos rever: – Lei de probabilidade – Valor esperado – Variância (desvio padrão) Inverno 2007/2008 9 1- Distribuição Uniforme Discreta • Definição: A variável aleatória X tem uma distribuição uniforme discreta se e só se a sua lei de probabilidade é dada por 1 f ( xi ) = P ( X = xi ) = para xi = x1 , x2 ,, xn n Inverno 2007/2008 10 1- Distribuição Uniforme Discreta • Valor esperado ∑x 1 E ( X ) = ∑ xi = i n n i • Variância i ∑x V ( X ) =E ( X 2 ) − E 2 ( X ) = i Inverno 2007/2008 2 i n ∑ xi − i n 2 11 1- Distribuição Uniforme Discreta • Caso particular • Temos que xi = i, com i = 1, 2,, n 1 n 1 n E ( X ) = ∑ xi = ∑ i n i =1 n i =1 1 1 + 2+ = ( + n) n 1 1+ n = n 2 n n +1 = 2 Inverno 2007/2008 12 1- Distribuição Uniforme Discreta • Temos que 1 n 2 1 n 2 E ( X ) = ∑ xi = ∑ i n i =1 n i =1 1 = (1 + 22 + 32 + + n 2 ) n 2 1 n(n + 1)(2n + 1) = 6 n (n + 1)(2n + 1) = 6 (n + 1)(2n + 1) n + 1 n 2 − 1 V (X ) = − = 6 12 2 2 • E que Inverno 2007/2008 13 2- Distribuição de Bernoulli • Definição: A variável aleatória X tem a distribuição de Bernoulli se e só se a sua lei de probabilidade é dada por 1 − p, x = 0 f ( x) = x =1 p, com 0< p <1, ou seja, f ( x) = p x (1 − p )1− x , x = 0, 1 - Uma prova de Bernoulli só tem dois resultados: sucesso ou insucesso Inverno 2007/2008 14 2- Distribuição de Bernoulli • Valor Esperado E( X ) = 1 x 1− x xp (1 − p ) = (0)(1 − p ) + (1)( p ) = p ∑ x =0 • Variância 1 V ( X ) = ∑ ( x − p ) 2 p x (1 − p )1− x = x =0 = (0 − p ) 2 (1 − p ) + (1 − p ) 2 p = p (1 − p ) Inverno 2007/2008 15 3- Distribuição Binomial • Definição: Uma experiência aleatória binomial satisfaz as seguintes propriedades a) Uma prova de Bernoulli é repetida n vezes b) As provas são independentes c) A probabilidade de sucesso em cada prova é constante e igual a p; a probabilidade de insucesso é 1- p Inverno 2007/2008 16 3- Distribuição Binomial • Definição: A variável aleatória X tem uma distribuição binomial se e só se a sua lei de probabilidade é dada por B( x; n, p ) = n p x (1 − p ) n − x , x = 0, 1, 2, , n e p ∈ (0,1) x Trata-se da probabilidade de se obterem x sucessos em n provas de Bernoulli Inverno 2007/2008 17 3- Distribuição Binomial • Valor Esperado • Variância E ( X ) = np V ( X ) = np (1 − p ) Inverno 2007/2008 18 3- Distribuição Binomial • A Binomial diz-nos qual a probabilidade de obter x sucessos em n provas, sendo que a probabilidade de sucesso em cada prova está fixa • As provas são independentes • Isto é uma situação de amostragem com reposição A distribuição do nº de sucessos em n provas quando a amostragem é feita sem reposição segue uma distribuição Hipergeométrica Inverno 2007/2008 19 4- Distribuição Hipergeométrica • Definição: A variável aleatória X tem a distribuição hipergeométrica se e só se a sua lei de probabilidade é dada por M N − M x n − x P ( X = x) = hip( x; n, M , N ) = N n com x = 0,1,...,n , M ≥ x e N − M ≥ n − x Inverno 2007/2008 20 4- Distribuição Hipergeométrica • Valor Esperado • Variância M E( X ) = n N M N −M N −n V (X ) = n N N N −1 Inverno 2007/2008 21 5- Distribuição Binomial Negativa • É a distribuição do número de provas de bernoulli até se obter o késimo sucesso • A variável aleatória X tem distribuição binomial negativa se e só se a sua lei de probabilidade é dada por x − 1 k P( X= x= ) bin * ( x, k , p= ) p (1 − p) x −k k − 1 com x= k , k + 1, k + 2 + ... e 0 < p < 1 Inverno 2007/2008 22 5- Distribuição Binomial Negativa • Valor Esperado • Variância k E( X ) = p k1 V= (X ) − 1 p p Inverno 2007/2008 23 6- Distribuição de Poisson • Uma variável aleatória tem distribuição de Poisson se e só se a sua lei de probabilidade é dada por e−λ λ x P( X= x= ) poi ( x; λ= ) x! = com x 0,1, 2,... e λ > 0 • Esta distribuição diz-nos o número de sucessos obtidos numa determinada unidade de medida Inverno 2007/2008 24 6- Distribuição de Poisson • O número de sucessos que ocorre em intervalos de tempo não sobrepostos é independente • A probabilidade de um sucesso ocorrer num determinado intervalo de tempo é proporcional à duração desse intervalo • Valor Esperado E( X ) = λ • Variância V (X ) = λ Inverno 2007/2008 25 B- Variáveis Aleatórias Contínuas: • Uma variável aleatória X é chamada contínua se S é um intervalo ou de uma colecção de intervalos • Se X é uma variável aleatória contínua então a função f com domínio real e contradomínio [0,+∞) com as propriedades 1. 1. f ( x) ≥ 0, ∀x ∫ +∞ −∞ f ( x)dx = 1 designa-se por função densidade de X Inverno 2007/2008 26 B- Variáveis Aleatórias Contínuas: • Se X é uma variável aleatória contínua, a função real de variável real, com domínio ℜ , dada por FX ( x) = PX ( X ≤ x) = ∫−∞ f X (t )dt para − ∞ < x < +∞ x onde f X é a função densidade de X, chama-se a função de distribuição, ou função cumulativa, da variável aleatória contínua X Inverno 2007/2008 27 B- Variáveis Aleatórias Contínuas: • Propriedades da função de distribuição: 1. F (−∞) = 0 2. F (+∞) = 1 3. F é monotóna não decrescente 4. P(a < X < b)= F (b) − F (a ) Inverno 2007/2008 28 B- Variáveis Aleatórias Contínuas: • Se a função densidade da v.a. contínua X é dada por 0 ≤ x ≤1 x, f ( x) = 0 , 1< x < 2 3 − x, 2 ≤ x ≤ 3 qual é a expressão da função de distribuição de X ? Inverno 2007/2008 29 B- Variáveis Aleatórias Contínuas: x x2 t Para 0 ≤ x ≤ 1 temos F ( x) = ∫ t dt = = 0 2 0 2 2 x Para 1 < x < 2 temos F ( x) = Para 2≤ x≤3 1 2 temos x 1 1 t 1 x2 F ( x) = + ∫2 (3 − t ) dt = + 3t − = + 3 x − − 4 2 2 2 2 2 2 2 x Inverno 2007/2008 30 B- Variáveis Aleatórias Contínuas: F ( x) = ∫−∞ x x2 0 ≤ x ≤1 2 , 1 f (t )dt = , 1< x < 2 2 x2 7 3 x − 2 − 2 , 2 ≤ x ≤ 3 Inverno 2007/2008 31 B- Variáveis Aleatórias Contínuas: • O Valor Esperado de uma variável contínua X, se existir, é dado por +∞ E ( X ) = ∫−∞ x f ( x)dx = ∫D x f ( x)dx X Inverno 2007/2008 32 B- Variáveis Aleatórias Contínuas: • Se a função densidade da v.a. contínua X é dada por 1 x, 0 ≤ x ≤ 2 f ( x) = 2 0 , outros valores de x qual é o valor esperado de X ? = E( X ) ∫ 2 0 2 1 1 x 4 1 2 x = x dx = x dx = 2 ∫0 2 3 0 3 2 2 Inverno 2007/2008 3 33 B- Variáveis Aleatórias Contínuas: • A variância de uma variável aleatória contínua X, se existir, é dada por E( X − µ ) = 2 ∫ +∞ −∞ ( x − µ ) 2 f ( x)dx = E(X = ∫ DX 2 )−E(X ) 2 = E ( X 2 ) − µ2 x 2 f ( x)dx − µ 2 Inverno 2007/2008 34 B- Variáveis Aleatórias Contínuas: • Se a função densidade da v.a. contínua X é dada por 1 x, 0 ≤ x ≤ 2 f ( x) = 2 0 , outros valores de x qual é a variância de X ? 2 1 x4 2 2 21 2 V ( X ) =E ( X ) − µ =∫ x x dx − µ = − 1.52 =2 − 1.52 0 2 4 0 2 2 Inverno 2007/2008 35 B - Distribuições Contínuas Clássicas 1- Uniforme Contínua 2- Normal 3- Exponencial 4- Qui-Quadrado 5- Gama* 6- T-Student 7- F-Snedcor* * não abordadas nesta apresentação Para algumas destas distribuições vamos relembrar: – Função Densidade e Função Cumulativa – Valor esperado – Variância (desvio padrão) Inverno 2007/2008 36 1- Distribuição Uniforme Contínua • A variável aleatória X tem uma distribuição uniforme contínua se e só se a sua função densidade é dada por 1 b − a , a ≤ x ≤ b f ( x ; a, b) = 0 , outros Simbolicamente, X~U [a,b] Inverno 2007/2008 37 1- Distribuição Uniforme Contínua • Função Cumulativa F ( x) = 1 1 [t ]ax = x − a dt = ab−a b−a b−a ∫ x b 1 1 x2 a+b • Valor Esperado = E( X ) ∫ = x dx = a b−a b − a 2 a 2 b • Variância (b − a ) 2 V (X ) = 12 Inverno 2007/2008 38 2- Distribuição Normal • A variável aleatória T tem distribuição normal se e só se a sua função densidade é dada por 1 x − µ 2 1 f ( x; µ , σ ) exp − = σ 2 σ 2π com −∞ < x < +∞ e σ > 0 Inverno 2007/2008 39 2- Distribuição Normal • É a distribuição contínua mais importante devido às suas propriedades • É uma distribuição limite de outras distribuições (por exemplo Binomial e Poisson) • Função Cumulativa 1 t − µ 2 1 F ( x; µ , σ ) ∫ exp − = dt 2 σ −∞ σ 2π x Inverno 2007/2008 40 2- Distribuição Normal Se X ∩ N ( µ , σ ) então: • Valor Esperado E( X ) = µ • Variância V (X ) = σ 2 Inverno 2007/2008 41 2- Distribuição Normal • Como não se conhece a solução analítica da função cumulativa da distribuição Normal, teremos de recorrer a métodos de análise numérica • Distrbuição Normal Standardizada Se X ∩ N ( µ , σ ) →= Z E (Z ) = 0 X −µ σ ∩ N (0,1) V (Z ) = 1 Inverno 2007/2008 42 3- Distribuição Exponencial • A variável aleatória T tem distribuição exponencial se e só se a sua função densidade é dada por t<0 0 f (t , λ ) = − λt t≥0 λ e com λ > 0 Inverno 2007/2008 43 3- Distribuição Exponencial • Permite-nos calcular o tempo de espera: – Antes de ocorrer o 1º sucesso num processo de Poisson – Ente sucessos gerados por um processo de Poisson • Função Cumulativa F (t ) =P(T < t ) =1 − e − λt Inverno 2007/2008 44 3- Distribuição Exponencial • Valor Esperado • Variância E( X ) = V (X ) = 1 λ 1 λ2 Inverno 2007/2008 45 4- Distribuição do Qui-Quadrado • Uma variável aleatória tem distribuição do Qui-Quadrado se e só se a sua função densidade é dada por 1 ( r / 2 ) −1 − x / 2 f ( x; r ) = x e r/2 Γ(r / 2)2 com x ∈ [ 0; +∞) e r inteiro positivo X ∩ χ 2( r ) Inverno 2007/2008 46 4- Distribuição do Qui-Quadrado • Valor Esperado E( X ) = r • Variância V ( X ) = 2r • r é o número de graus de liberdade Inverno 2007/2008 47 6- Distribuição T-Student • Considerem-se duas variáveis aleatórias independentes, U e V, tais que U ∩ N (0,1) e V ∩ χ (2n ) . • Então, a variável T dada por = T U ∩ t ( n) V /n segue uma distribuição T-Student com n graus de liberdade Inverno 2007/2008 48 6- Distribuição T-Student X −µ ′2 − ( n 1) S • Assim, se e V = ∩ N (0,1) U = ∩ χ (2n −1) 2 σ/ n σ então, a variável X −µ ∩ t (n − 1) S′ / n segue uma distribuição T-Student com n-1 graus de liberdade Inverno 2007/2008 49 6- Distribuição T-Student • Valor Esperado • Variância E( X ) = 0 n V (X ) = n−2 (para n > 2) • Nota: à medida os graus de liberdade aumentam, a distribuição T-Student tende para a normal standardizada Inverno 2007/2008 50