Distribuições derivadas da distribuição Normal Distribuição Normal 2 Uma variável aleatória X tem distribuição normal com parâmetros µ e σ2, X ~ N ( µ ; σ ) , quando sua densidade de probabilidade é f ( x) = 1 e 2π σ − ( x − µ )2 2σ 2 , x real. Teorema: Se X ~ N ( µ ; σ 2 ) , então: E(X) = Moda (X) = Mediana (X) = µ e Var (X) = σ2 Distribuição Normal-Padrão Uma normal de média 0 e variância 1 é chamada de normal-padrão ou normal reduzida. Teorema: Se X ~ N ( µ ; σ 2 ) , então Z = X− µ tem distribuição normal-padrão. σ Calcular probabilidades para uma variável normal integrando a densidade não é coisa simples. O que se faz é aplicar o teorema acima, reduzindo o problema ao cálculo de probabilidades para uma normal-padrão. Probabilidades para uma normal-padrão encontram-se tabeladas. Há três tipos de tabelas: para cada z a tabela fornece F(z) = P(Z ≤ z) para cada z > 0 a tabela fornece A(z) = P(0 ≤ Z ≤ z); (Tabela do livro Estatística Básica) para cada z > 0, a tabela fornece R(z) = P(Z > z). Exemplo 1: Supondo disponível uma tabela do tipo 2, calcularíamos: a) P(Z < 1) = 0,5 + A(1) b) P(Z < −1) = 0,5 − A(1) c) P(Z > 1) = 0,5 − A(1) d) P(Z > −1) = 0,5 + A(1) e) P( 1 < Z < 2) = A(2) − A(1) f) P( −1 < Z < 2) = A(2) + A(1) g) P( −2 < Z < −1) = A(2) − A(1). O Excel calcula probabilidades para a normal-padrão nas opções DIST.NORMP (entrando com z o excel retorna F(z)) e INV.NORMP (entrando com o valor de F(z), o Excel retorna z) de Estatística do Assistente de Funções. Exemplo 2: Usando o Excel, vamos calcular as probabilidades do exemplo 1: a) P(Z < 1) = F(1) = 0,841 b) P(Z < −1) = F(−1) = 0,159 c) P(Z > 1) = 1 − F(1) = 0,159 d) P(Z > −1) = 1 − F(−1) = 0,841 e) P( 1 < Z < 2) = F(2) − F(1) = 0,136 f) P( −1 < Z < 2) = F(2) − F(−1) = 0,819 g) P( −2 < Z < −1) = F(−2) − F(−1) = 0,136. Exemplo 3: Considere a distribuição das alturas de homens adultos normalmente distribuída com média 168cm e desvio-padrão 6cm. Determine a probabilidade de um homem adulto ter altura superior a 180cm. Solução: X ~ N (168; 62) X − µ X − 168 = Z= ~ N (0; 1) σ 6 P(X > 180) = P(Z > 2) = 0,023. Problemas: 1) Seja Z ~ N(0;1). Determine a > 0 tal que: a) P(−a < Z < a) = 0,9 .........Resp:1,645 b) P(−a < Z < a) = 0,95 ........Resp: 1,96 c) P(−a < Z < a) = 0,99 .......Resp: 2,576 2) Figos têm massas normalmente distribuídas com média 60g e desvio-padrão 8g e são vendidos por dúzias. Determine a probabilidade de a massa de uma dúzia ser superior a 750g. Resp: 0,14 Qui-Quadrado Dizemos que X tem densidade qui-quadrado com n graus de liberdade, sendo n é um número inteiro positivo se sua densidade é: f X ( x) = x ( n 2) − 1 e− x 2 , para x ≥ 0 , e f X ( x) = 0 , para x < 0. 2n 2 Γ ( n 2 ) A distribuição de qui-quadrado é apenas um caso particular da distribuição gama com parâmetros r = n/2 e α = 1/2 Notação: X ~ χ2 (n). A seguir, gráficos de densidades de qui-quadrado (“chi-square”) com 1, 2, 5 e 10 graus de liberdade (“degrees of freedom”). Teorema 1: Se X ~ χ2 (n) e Y ~ χ2 (m) são independentes, então X+Y ~ χ2 (m+n). Teorema 2: Se X ~ N(0;1), então Y=X2 ~ χ2 (1). Corolário: Se X1,K , X n são independentes com distribuição N(0; 1), então X12 + K + X n 2 tem distribuição de qui-quadrado com n graus de liberdade. A partir das expressões para a média e variância de uma densidade Gama podemos obter facilmente a média e a variância de uma qui-quadrado. E(X) = n ; Var (X) = 2n O Assistente de Função do Excel , na opção DIST.QUI em Estatística, fornece, para cada x ≥ 0, o valor da função de sobrevivência R 2 ( x) . χ Na opção INV.QUI, dado o valor da função de sobrevivência, o Excel retorna o valor de x. Exercícios 1) Se X ~ χ2 (6), determine P( X > 0,874). Resp: 0,99 2) Se X ~ χ2 (6), determine P( X > 12,59). Resp: 0,05 3) Se X ~ χ2 (6), determine P( X > 16,81). Resp: 0,01 Esta distribuição está relacionada com a distribuição da variância amostral obtida a partir de uma amostra aleatória Normal. Se desejarmos construir um intervalo de confiança baseado na variância amostral que contenha com alta probabilidade a variância(desconhecida) da distribuição Normal, este intervalo deverá ser baseado na distribuição qui-quadrado! O mesmo acontece com teste de hipótese sobre a variância populacional. t de Student A medida que gl cresce a variância Teorema: Seja Z uma variável aleatória N (0,1) e Y uma variável aleatória χ 2 (ν ) , com Z e Y independentes. Então a variável aleatória: Surge a partir Z t= da normal e da Yν qui-quadrado Tem densidade dada por: Γ ((ν + 1) / 2) (1 + t 2 ν ) − (ν + 1) 2 , − ∞ < t < ∞ Γ (ν / 2) π ν Diremos que esta variável tem distribuição t de Student com ν graus de libertada, t (ν ) . f (t ;ν ) = A média e a variância de uma distribuição t de Student é dada por: E (t ) = 0 ν ν −2 O gráfico da densidade de t aproxima-se de uma N (0,1) quando ν é grande. A densidade t é simétrica em relação a média 0. Ela é completamente determinada pelo parâmetro ν , o número de graus de liberdade (que é o mesmo grau de liberdade que aparece na distribuição qui-quadrado utilizada para gerar a densidade t). Como nos casos anteriores existem tabelas fornecendo as probabilidades referentes a esta distribuição. Var (t ) = Exemplo 1: Se ν =6, então, determine: P (− 1,9643 < t (6) < 1,9343) = 0,90 P (t (6) > 2, 447) = 0,025 Caso particular: A densidade Cauchy é a densidade t com 1 grau de liberdade! Esta distribuição é bastante utilizada em contexto de estimação, intervalos de confiança e testes de hipóteses sobre média para amostras normais. F de Snedecor Esta variável aleatória é definida como o coeficiente de duas variáveis aleatórias com distribuição qui-quadrado. Teorema: Sejam U e V duas variáveis aleatórias independentes, cada uma com distribuição qui-quadrado, com ν 1 eν 2 graus de liberdade, respectivamente. Então, a variável aleatória: U ν1 W= V ν2 Tem densidade dada por: Γ ((ν 1 + ν 2 ) 2) ν 1 g ( w;ν 1 ,ν 2 ) = Γ (ν 1 2)Γ (ν 2 2) ν 2 ν1 2 w (ν 1 − 2 ) 2 ,w > 0 (1 + ν 1 w ν 2 ) (ν 1 + ν 2 ) / 2 Diremos que W tem distribuição F de Snedecor, com ν 1 eν 2 graus de liberdade, e usaremos a notação W ~ F (ν 1 ,ν 2 ) . Pode-se mostrar que: ν2 E (W ) = ν2− 2 2ν 22 (ν 1 + ν 2 − 2) Var (W ) = (ν 1 (ν 2 − 2) 2 (ν 2 − 4) Note que o primeiro parâmetro indica o número de graus de liberdade do numerador, enquanto o segundo parâmetro indica o número de graus de liberdade do denominador. A densidade F não é simétrica. Em geral as tabelas disponíveis com os valores da distribuição F só dispõe de valores de "um dos lados". A identidade a seguir é utilizada para se encontrar os valores inferiores. 1 F (ν 1 ,ν 2 ) = F (ν 2 ,ν 1 ) Exemplo 1: Seja W ~ F (5,7) P ( F > 3,97) = 0,05 , logo: P ( F ≤ 3,97) = 0,95 Exemplo 2: Seja W ~ F (4,10) . Encontre os pontos a e b tais que Pr(a < X < b) = 0, 95 Sol: A probabilidade de X estar fora do intervalo é 5%, e escolhemos a e b tais que, a probabilidade de X estar abaixo de a é 2,5%, e a probabilidade de X estar acima de b é também 2,5%. Assim, b é encontrado fazendo-se: Pr( X > b) = 0, 025 ⇒ Pr( X < b) = 0, 975 . Como X ~ F (4,10) . Logo, b = 4, 47 . De maneira semelhante, a é tal que: Pr( X < a) = 0, 025 ⇒ Pr( 1 > 1 ) = 0, 025 ⇒ Pr(Y > 1 ) = 0, 025 X a a ⇒ Pr(Y < 1 ) = 0, 975 sendo Y ~ F (10, 4) a Logo, 1 a = 8,84 ⇒ a = 18,84 = 0,113 Deste modo: Pr(0,113 < X < 4, 47) = 0, 95 sendo X ~ F (4,10) Esta distribuição é bastante utilizada em contexto de estimação, intervalos de confiança e testes de hipóteses sobre a igualdade de variâncias para amostras normais.