UNIVERSIDADE FEDERAL DE MINAS GERAIS INSTITUTO DE CIÊNCIAS AGRÁRIAS PROPRIEDADES DA DISTRIBUIÇÃO NORMAL Uma variável aleatória contínua X tem distribuição Normal (ou Gaussiana) com parâmetros μ (‒∞ < μ < ∞) e σ2 (σ > 0) se a sua função densidade de probabilidade é dada por: ( 1 f ( x )= e σ √2 π − [ 1 x− μ 2 σ ]) 2 , −∞< x< ∞ → X ~ N ( μ , σ 2). f (x ) x μ Figura 1 – Gráfico da Distribuição Normal 1. Vamos mostrar que f(x) é uma função densidade de probabilidade. Obviamente, f(x) ≥ 0 (isso pode ser facilmente percebido analisando-se o gráfico da distribuição, apresentado na Figura 1). Devemos ainda verificar que a sua integral, no intervalo de ‒∞ a ∞, vale 1. Fazendo t = (x‒ μ)/σ, tem-se: 1 σ √2 π ( ∫e ∞ − [ 1 x− μ 2 σ ]) 2 −∞ 1 dx = √2 π ∞ ∫ ( ) dt= I. e −t 2 2 −∞ O artifício empregado para calcular essa integral é calcular I2: 1 I = 2π 2 ( ) ( ) ( ∫ e dt ∫ e ds= 21π ∫ ∫ e ∞ −∞ −t 2 2 ∞ −s2 2 −∞ ∞ ∞ 2 2 −(s + t ) 2 ) dsdt. −∞ −∞ Introduzindo coordenadas polares: s=rcos( α ) t=rsen(α ) . Assim, o elemento de área dsdt se torna rdrdα. Como s e t variam entre ‒∞ e ∞, r varia entre 0 e ∞, enquanto α varia entre 0 e 2π. Portanto, ________________________________________________________________________________________________ Estatística Básica – Instituto de Ciências Agrárias da UFMG – Renato Dourado Maia 1 2π ∞ 1 I = 2π ∫∫ 2 0 ( ) drd α = re −r 2 2 0 1 2π 2π ∫ ∞ ( ) −e ∣ −r 2 2 1 0 dα= 2π 0 2π ∫ d α =1. 0 Assim, I = 1, como se queria mostrar. 2. Vamos examinar o aspecto do gráfico de f(x). Ele apresenta a bem conhecida forma de sino, mostrada na Figura 1. Visto que f(x) depende de x somente por meio da expressão (x‒μ2), torna-se evidente que o gráfico de f(x) será simétrico em relação μ. O parâmetro σ também pode ser interpretado geometricamente: para x = μ, o gráfico de f(x) é descendente, de concavidade para baixo. Quando x → ±∞, f(x) → 0, assintoticamente. Visto que f(x) ≥ 0 para todo x, isso significa que, para valores grandes de x (positivos ou negativos), o gráfico de f(x) tem a concavidade para cima. O ponto no qual a concavidade muda é denominado ponto de inflexão, e será localizado pela resolução da equação f ''(x) = 0. Ao fazer isso, verificamos que os pontos de inflexão ocorrem para x = μ ± σ. Portanto, se σ for relativamente grande, o gráfico de f(x) tende a ser “achatado”, enquanto se σ for pequeno, o gráfico tende a ser bastante “pontiagudo”. 3. Em complemento à interpretação geométrica dos parâmetros μ e σ, o seguinte significado probabilístico pode ser associado a essas quantidades. Consideremos 1 E ( X )= σ √2 π ( ∫ xe ∞ − [ 1 x− μ 2 σ ]) 2 dx. −∞ Fazendo-se z = (x ‒ μ)/σ, tem-se: 1 E ( X )= √2 π ( ) ∫ (σ z + μ )e dz = ∞ (− ) 1 1 ∞ (− 2 ) σ ∫ ze 2 dz + μ ∫ e dz = μ . √ 2 π −∞ √ 2 π −∞ ⏟ ⏟ 2 ∞ − z 2 −∞ z 2 z I 2 II O termo I vale 0, pois o integrando g(z) é uma função ímpar (possui a propriedade g(z) = ‒ g(‒z)). O termo II representa a área total sobre a fdp Normal e, por isso, é igual à unidade e, portanto, E(X) = μ. Consideremos agora 1 E ( X )= σ √2π ( ∫x e ∞ 2 2 − [ 1 x− μ 2 σ ]) 2 dx. −∞ Fazendo-se, novamente, z = (x ‒ μ)/σ, tem-se: 1 E ( X )= √2 π 2 ( ) ∫ (σ z + μ ) e dz 2 ∞ 2 − z 2 −∞ 1 ∞ 2 (− 2 ) 1 ∞ (− 2 ) 1 ∞ (− 2 ) 2 =σ ∫ z e dz + 2 μ σ √ 2 π −∞ ∫ ze dz + μ √ 2 π −∞ ∫ e dz . √ 2 π −∞ ⏟ ⏟ ⏟ z 2 z 2 z 2 2 I II III ________________________________________________________________________________________________ Estatística Básica – Instituto de Ciências Agrárias da UFMG – Renato Dourado Maia 2 O termo II vale 0, pois o integrando g(z) é uma função ímpar (possui a propriedade g(z) = ‒ g(‒z)). O termo III representa a área total sobre a fdp Normal e, por isso, é igual à unidade. Para calcular o termo I, utiliza-se integração por partes: ( )=dv ze 2 − z 2 2 z=u → ∞ −∞ 2 2 − z 2 − z 2 − z 2 ∣ ( ) ( ) ∫ z e dz = −z( e2 π ) √ 2 1 √ 2π ( ) v =−e dz =du ∞ 1 ∞ (− 2 ) + ∫ e dz =0+ 1=1 √ 2 π −∞ −∞ ⏟ z 2 IV O termo IV representa a área total sobre a fdp Normal e, por isso, é igual à unidade. Logo, E ( X 2)=σ 2+ μ 2 . Portanto, Var ( X )=E ( X 2 )−μ 2=(σ 2+ μ 2 )−μ 2=σ 2 . Resumindo: • Os parâmetros μ e σ2, que caracterizam a distribuição Normal, são a média e a variância, respectivamente. ________________________________________________________________________________________________ Estatística Básica – Instituto de Ciências Agrárias da UFMG – Renato Dourado Maia 3