variáveis aleatórias contínuas

Propaganda
Distribuições derivadas da distribuição Normal
Distribuição Normal
2
Uma variável aleatória X tem distribuição normal com parâmetros µ e σ2, X ~ N ( µ ; σ ) ,
quando sua densidade de probabilidade é
f ( x) =
1
e
2π σ
−
( x − µ )2
2σ 2
, x real.
Teorema: Se X ~ N ( µ ; σ 2 ) , então:
E(X) = Moda (X) = Mediana (X) = µ e
Var (X) = σ2
Distribuição Normal-Padrão
Uma normal de média 0 e variância 1 é chamada de normal-padrão ou normal reduzida.
Teorema: Se X ~ N ( µ ; σ 2 ) , então Z =
X− µ
tem distribuição normal-padrão.
σ
Calcular probabilidades para uma variável normal integrando a densidade não é coisa
simples. O que se faz é aplicar o teorema acima, reduzindo o problema ao cálculo de
probabilidades para uma normal-padrão. Probabilidades para uma normal-padrão
encontram-se tabeladas. Há três tipos de tabelas:
para cada z a tabela fornece F(z) = P(Z ≤ z)
para cada z > 0 a tabela fornece A(z) = P(0 ≤ Z ≤ z); (Tabela do livro Estatística
Básica)
para cada z > 0, a tabela fornece R(z) = P(Z > z).
Exemplo 1: Supondo disponível uma tabela do tipo 2, calcularíamos:
a) P(Z < 1) = 0,5 + A(1)
b) P(Z < −1) = 0,5 − A(1)
c) P(Z > 1) = 0,5 − A(1)
d) P(Z > −1) = 0,5 + A(1)
e) P( 1 < Z < 2) = A(2) − A(1)
f) P( −1 < Z < 2) = A(2) + A(1)
g) P( −2 < Z < −1) = A(2) − A(1).
O Excel calcula probabilidades para a normal-padrão nas opções DIST.NORMP (entrando
com z o excel retorna F(z)) e INV.NORMP (entrando com o valor de F(z), o Excel retorna
z) de Estatística do Assistente de Funções.
Exemplo 2: Usando o Excel, vamos calcular as probabilidades do exemplo 1:
a) P(Z < 1) = F(1) = 0,841
b) P(Z < −1) = F(−1) = 0,159
c) P(Z > 1) = 1 − F(1) = 0,159
d) P(Z > −1) = 1 − F(−1) = 0,841
e) P( 1 < Z < 2) = F(2) − F(1) = 0,136
f) P( −1 < Z < 2) = F(2) − F(−1) = 0,819
g) P( −2 < Z < −1) = F(−2) − F(−1) = 0,136.
Exemplo 3: Considere a distribuição das alturas de homens adultos normalmente
distribuída com média 168cm e desvio-padrão 6cm. Determine a probabilidade de um
homem adulto ter altura superior a 180cm.
Solução: X ~ N (168; 62)
X − µ X − 168
=
Z=
~ N (0; 1)
σ
6
P(X > 180) = P(Z > 2) = 0,023.
Problemas:
1) Seja Z ~ N(0;1). Determine a > 0 tal que:
a) P(−a < Z < a) = 0,9 .........Resp:1,645
b) P(−a < Z < a) = 0,95 ........Resp: 1,96
c) P(−a < Z < a) = 0,99 .......Resp: 2,576
2) Figos têm massas normalmente distribuídas com média 60g e desvio-padrão 8g e são
vendidos por dúzias. Determine a probabilidade de a massa de uma dúzia ser superior a
750g.
Resp: 0,14
Qui-Quadrado
Dizemos que X tem densidade qui-quadrado com n graus de liberdade, sendo n é um
número inteiro positivo se sua densidade é:
f X ( x) =
x ( n 2) − 1 e− x 2
, para x ≥ 0 , e f X ( x) = 0 , para x < 0.
2n 2 Γ ( n 2 )
A distribuição de qui-quadrado é apenas um caso particular da distribuição gama com
parâmetros r = n/2 e α = 1/2
Notação: X ~ χ2 (n).
A seguir, gráficos de densidades de qui-quadrado (“chi-square”) com 1, 2, 5 e 10 graus de
liberdade (“degrees of freedom”).
Teorema 1: Se X ~ χ2 (n) e Y ~ χ2 (m) são independentes, então X+Y ~ χ2 (m+n).
Teorema 2: Se X ~ N(0;1), então Y=X2 ~ χ2 (1).
Corolário: Se X1,K , X n são independentes com distribuição N(0; 1), então
X12 + K + X n 2 tem distribuição de qui-quadrado com n graus de liberdade.
A partir das expressões para a média e variância de uma densidade Gama podemos obter
facilmente a média e a variância de uma qui-quadrado.
E(X) = n ; Var (X) = 2n
O Assistente de Função do Excel , na opção DIST.QUI em Estatística, fornece, para cada
x ≥ 0, o valor da função de sobrevivência R 2 ( x) .
χ
Na opção INV.QUI, dado o valor da função de sobrevivência, o Excel retorna o valor de x.
Exercícios
1) Se X ~ χ2 (6), determine P( X > 0,874). Resp: 0,99
2) Se X ~ χ2 (6), determine P( X > 12,59). Resp: 0,05
3) Se X ~ χ2 (6), determine P( X > 16,81). Resp: 0,01
Esta distribuição está relacionada com a distribuição da variância amostral obtida a partir
de uma amostra aleatória Normal. Se desejarmos construir um intervalo de confiança
baseado na variância amostral que contenha com alta probabilidade a
variância(desconhecida) da distribuição Normal, este intervalo deverá ser baseado na
distribuição qui-quadrado! O mesmo acontece com teste de hipótese sobre a variância
populacional.
t de Student
A medida
que gl
cresce a
variância
Teorema: Seja Z uma variável aleatória N (0,1) e Y uma variável aleatória χ 2 (ν ) , com
Z e Y independentes. Então a variável aleatória:
Surge a partir
Z
t=
da normal e da
Yν
qui-quadrado
Tem densidade dada por:
Γ ((ν + 1) / 2)
(1 + t 2 ν ) − (ν + 1) 2 , − ∞ < t < ∞
Γ (ν / 2) π ν
Diremos que esta variável tem distribuição t de Student com ν graus de libertada, t (ν ) .
f (t ;ν ) =
A média e a variância de uma distribuição t de Student é dada por:
E (t ) = 0
ν
ν −2
O gráfico da densidade de t aproxima-se de uma N (0,1) quando ν é grande. A densidade t
é simétrica em relação a média 0. Ela é completamente determinada pelo parâmetro ν , o
número de graus de liberdade (que é o mesmo grau de liberdade que aparece na distribuição
qui-quadrado utilizada para gerar a densidade t).
Como nos casos anteriores existem tabelas fornecendo as probabilidades referentes a esta
distribuição.
Var (t ) =
Exemplo 1: Se ν =6, então, determine:
P (− 1,9643 < t (6) < 1,9343) = 0,90
P (t (6) > 2, 447) = 0,025
Caso particular:
A densidade Cauchy é a densidade t com 1 grau de liberdade!
Esta distribuição é bastante utilizada em contexto de estimação, intervalos de confiança e
testes de hipóteses sobre média para amostras normais.
F de Snedecor
Esta variável aleatória é definida como o coeficiente de duas variáveis aleatórias com
distribuição qui-quadrado.
Teorema: Sejam U e V duas variáveis aleatórias independentes, cada uma com
distribuição qui-quadrado, com ν 1 eν 2 graus de liberdade, respectivamente. Então, a
variável aleatória:
U
ν1
W=
V
ν2
Tem densidade dada por:
Γ ((ν 1 + ν 2 ) 2)  ν 1 
 
g ( w;ν 1 ,ν 2 ) =
Γ (ν 1 2)Γ (ν 2 2)  ν 2 
ν1
2
w (ν 1 − 2 ) 2
,w > 0
(1 + ν 1 w ν 2 ) (ν 1 + ν 2 ) / 2
Diremos que W tem distribuição F de Snedecor, com ν 1 eν 2 graus de liberdade, e usaremos
a notação W ~ F (ν 1 ,ν 2 ) .
Pode-se mostrar que:
ν2
E (W ) =
ν2− 2
2ν 22 (ν 1 + ν 2 − 2)
Var (W ) =
(ν 1 (ν 2 − 2) 2 (ν 2 − 4)
Note que o primeiro parâmetro indica o número de graus de liberdade do numerador,
enquanto o segundo parâmetro indica o número de graus de liberdade do denominador. A
densidade F não é simétrica. Em geral as tabelas disponíveis com os valores da distribuição
F só dispõe de valores de "um dos lados".
A identidade a seguir é utilizada para se encontrar os valores inferiores.
1
F (ν 1 ,ν 2 ) =
F (ν 2 ,ν 1 )
Exemplo 1: Seja W ~ F (5,7)
P ( F > 3,97) = 0,05 , logo: P ( F ≤ 3,97) = 0,95
Exemplo 2: Seja W ~ F (4,10) . Encontre os pontos a e b tais que Pr(a < X < b) = 0, 95
Sol: A probabilidade de X estar fora do intervalo é 5%, e escolhemos a e b tais que, a
probabilidade de X estar abaixo de a é 2,5%, e a probabilidade de X estar acima de b é
também 2,5%.
Assim, b é encontrado fazendo-se: Pr( X > b) = 0, 025 ⇒ Pr( X < b) = 0, 975 . Como
X ~ F (4,10) . Logo, b = 4, 47 .
De maneira semelhante, a é tal que:
Pr( X < a) = 0, 025 ⇒ Pr( 1 > 1 ) = 0, 025 ⇒ Pr(Y > 1 ) = 0, 025
X
a
a
⇒ Pr(Y < 1 ) = 0, 975 sendo Y ~ F (10, 4)
a
Logo, 1 a = 8,84 ⇒ a = 18,84 = 0,113
Deste modo:
Pr(0,113 < X < 4, 47) = 0, 95 sendo X ~ F (4,10)
Esta distribuição é bastante utilizada em contexto de estimação, intervalos de confiança e
testes de hipóteses sobre a igualdade de variâncias para amostras normais.
Download