Variáveis Aleatórias Definição: Uma variável aleatória v.a. é uma função que associa elementos do espaço amostral a valores numéricos, ou seja, X : → I , em que I R. Esquematicamente: As variáveis aleatórias são classificadas em dois tipos: VA discreta: é aquela para a qual o conjunto I é um conjunto finito ou infinito enumerável Exs.: I = {1, 2, 3, 4, 5, 6}, I = N = {0, 1, 2, 3, 4,.......∞}, etc. VA contínua: é aquela para a qual o conjunto I é um conjunto infinito não enumerável, ou seja, é uma v.a. que assume valores em intervalos de números reais Exs.: I = R = (−∞,∞), I = [0,1] R , etc. Notas: Para v.a.’s contínuas, a função que normalmente associa pontos de ao conjunto I R, é a função identidade; Para v.a.’s discretas, a função que normalmente associa pontos de ao conjunto I R, é uma contagem ou soma. Exemplo 1: Considere o nascimento de três bebês sendo o sexo da criança observado, em que M = sexo masculino e F = sexo feminino. Desta forma, para cada bebê teremos duas possibilidades, e, considerando os três nascimentos, teremos um total de 23 = 8 combinações. a) Quais são os resultados possíveis? b) Como definir uma v.a. para esse caso? c) Como associar probabilidade a essa v.a.? a) Para os sexos dos três nascimentos teremos triplas do tipo (x, y, z) em que x é o sexo do primeiro bebê, y do segundo e z do terceiro. Portanto, o resultado (MMM) indica que os três nascimentos são do sexo masculino. O espcaço amostral para este caso será: = MMM, MMF, MFM, FMM, MFF, FMF, FFM, FFF . b) Temos pelo menos duas formas para definir uma variável aleatória para esse caso: (i) X1 = número de bebê do sexo feminino nos três nascimentos ou (ii) X2 = número de bebê do sexo masculino nos três nascimentos. Com X = número de bebê do sexo feminino nos três nascimentos X(MMM) = 0 X(MMF) = X(MFM) = X(FMM) = 1 X(MFF) = X(FMF) = X(FFM) = 2 X(FFF) = 3 Vamos simplificar a notação para os possíveis valores da v.a.: X(MMM) X=0 X(MMF) = X(MFM) = X(FMM) X = 1 X(MFF) = X(FMF) = X(FFM) X=2 X(FFF) X=3 Assim pode-se escrever: P(X = 3) = P(FFF) = 0,50,50,5 = 0.125 P(X = 2) = P(MFF FMF FFM) = 30.125 = 0,375 P(X = 1) = P(MMF MFM FMM) = 30.125 = 0,375 P(X = 0) = P(MMM) = 0,125 Normalmente representam-se os valores numa tabela com a distribuição das probabilidades, chamada de função de probabilidade: Tabela 1: Função de probabilidade da v.a. X = bebês do sexo feminino nos três nascimentos. Valores da v.a. X Probabilidades 0 0,125 1 0,375 2 0,375 3 0,125 A função de probabilidade de uma v.a. discreta Função de probabilidade de uma v.a. X, discreta, é uma função que atribui probabilidade a cada de seus possíveis valores. A função de distribuição de uma v.a. discreta Função de distribuição ou função de distribuição acumulada de uma v.a. X, discreta, é definida por F ( x) P( X xi ) p( xi ) . xi x xi x Notas: i) F(x) é uma função do tipo “escada”, em que os pontos de descontinuidade ocorrem em xi, i = 1, 2, . . . ii) Dada a função de distribuição F(x), então, p( xi ) F ( xi ) F ( xi 1) , i = 1, 2,... Assim, a função que associa probabilidades aos possíveis valores de uma v.a. discreta X, é chamada de função de probabilidade (fp) ou função massa de probabilidade (fmp). Seja X assumindo valores em { x1, x2 , x3 , }, então sua função de probabilidade p(x) é definida por: p( xi ) P[w | X ( w) xi ] P( X xi ) , i = 1, 2,... Propriedades: a função de probabilidade p(x) satisfaz: i) 0 p( xi ) 1, i 1, 2,; ii) p( xi ) 1; i iii) p(x) é usualmente representada por: p(x) = P(X = x), x Ix, em que: Ix é o conjunto dos possíveis valores de X. Tabela 2: No exemplo dos 3 nascimentos, temos Ix = { 0, 1, 2, 3 } e: x p(x) função que associa probabilidades à v.a. 0 0,125 número de de bebês 1 0,375 do sexo feminino nos 2 0,375 três nascimentos. 3 0,125 Exemplo 2: Sabe-se que o percentual de pessoas com tipo sanguíneo O− na população brasileira é de 9%. Considerando que chegam ao setor de emergências de um hospital 10 pessoas necessitando de sangue, numa determinada noite: a) Defina uma variável aleatória para esse caso. Qual é a probabilidade de que, dentre essas 10 pessoas: b) exatamente um tenha sangue O− ? c) pelo menos um tenha sangue O− ? d) no máximo três tenham sangue O− ? Escrevendo as probabilidades em termos da v.a.: a) Seja a v.a. X = número de pessoas com tipo sanguíneo O− dentre as n = 10 que chegaram à emergência. Então, temos que I = { 0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 }, ou seja p(x) = P(X = x), em que x { 0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 }. b) Probabilidade de que exatamente uma pessoa tenha sangue O− é: p(1) = P(X = 1). Se a proporção de pessoas com sangue O− é de 0,09, então, uma pessoa tem probabilidades 0.09 de ter sangue O− e 0,91 de ter qualquer outro tipo. Sendo O− = sangue O negativo e n = outro tipo de sangue temos: O− n n n n n n n n n O−/n prob. 0,09 0,91 0,91 0,91 0,91 0,91 0,91 0,91 0,91 0,91 paciente 1 2 3 4 5 6 7 8 9 10 Assim, a probabilidade de que exatamente um paciente tenha sangue O−, senda este o primeiro a é igual a: (0,09)(0,91)9 Como o paciente com sangue O− o primeiro ou o segundo ou o terceiro . . . ou o décimo, então temos dez vezes essa probabilidade, i.e.: 10 P(X = 1) = 10(0,09)(0,91)9 = (0,09)1(0,91)9 = 0,3851, 1 c) Se tivermos pelo menos um dos pacientes com sangue O−, então pode ser um paciente ou dois ou três . . . ou os dez. Portanto, a probabilidade de que pelo menos um paciente tenha sangue O− é dada por: 10 P(X 1) = P( X x) x 1 = P(X = 1) + P(X = 2) + ...+ P(X = 10). Mas, utilizando o evento complementar, podemos escrever essa probabilidade como sendo um menos a probabilidade de que todos os pacientes tenham outro tipo sanguíneo, ou seja: P(X 1) = 1 – P(X = 0) = 1 – (0,09)10 = 0,6106 d) A probabilidade de que, no máximo três pessoas tenham sangue O− é escrita como: P(X 3) = P(X = 0) + P(X = 1) + P(X = 2) + P(X = 3). Em que: 10 P(X = 0) = (0,09)0 (0,91)10 = (0,91)10 = 0,3894 0 10 P(X = 1) = (0,09)1 (0,91)9 = 0,3851 1 10 P(X = 2) = (0,09)2 (0,91)8 = 0,1714 2 10 P(X = 3) = (0,09)3 (0,91)7 = 0,0452 3 Logo, P(X 3) = 0,9911. Exemplo: O Tabagismo é um hábito que preocupa muito os profissionais da área da saúde devido ao enorme número de doenças que pode provocar. Dados de relatórios produzidos no mundo inteiro apontam que os Russos estão entre os que mais fumam, com 36% de adultos fumantres na população. No Japão esse percentual é de 25% enquanto que na Alemanha, 20% de adultos são fumantes. A Verônica, por meio da internet, contactou uma pessoa de cada um desses países e prente hospedá-los em sua casa durante as Olimpíadas de 2016. Ela não fuma e está preocupada, pois não deseja que sua casa fique com aquele “cheiro” de cigarro e também acha “chato” questionar os três, pois já se comprometeu com eles. a) Considerando o hábito de fumar dos convidados da Verônica (um Russo, um Japonês e um Alemão), quais são os resultados possíveis? b) Como definir uma v.a. para esse caso? c) Como associar probabilidade a essa v.a.? Sejam os eventos: A = o alemão fuma; J = o Japonês fuma e R = o Russo fuma. a) Espaço Amostral = AJR, AcJR, AJcR, AJRc, AcJcR, AcJRc, AJcRc, AcJcRc b) Duas possibilidades para definir a variável aleatória: (i) X1 = número de fumantes dentre os três viajantes ou (ii) X2 = número de não fumantes dentre os três viajantes. Vamos considerar X = número de fumantes dentre os tês viajantes X(AJR) = 3 X(AcJR) = X(AJcR) = X(AJRc) = 2 X(AcJcR) = X(AcJRc) = X(AJcRc) = 1 X(AcJcRc) = 0 Simplificando a notação para os possíveis valores da v.a., temos: X(AJR) X=3 X(AcJR) = X(AJcR) = X(AJRc) X=2 X(AcJcR) = X(AcJRc) = X(AJcRc) X = 1 X(AcJcRc) X=0 Assim pode-se escrever: P(X = 3) = P(AJR) = 0,360,250,20 = 0,018 P(X = 2) = P(AcJR AJcR AJRc) = 0,158 P(X = 1) = P(AcJcR AcJRc AJcRc) = 0,440 P(X = 0) = P(AcJcRc) = 0,384 Normalmente representam-se os valores numa tabela com a distribuição das probabilidades, chamada de função de probabilidade: Tabela: Função de probabilidade da v.a. X = fumantes dentre os 3 viajantes. Valores da v.a. X Probabilidades 0 0,384 1 0,440 2 0,158 3 0,018 Modelos discretos de probabilidade A) O modelo de Bernoulli: O modelo de Bernoulli está associado à ensaios ou eventos aleatórios, realizados de maneira independente, com somente dois resultados possíveis: sim/não; ocorre/não ocorre; 0 ou 1. Nos ensaios deste tipo estamos interessados na ocorrência de apenas um dos resultados ao qual chamaremos de sucesso sendo que, a não ocorrência do evento de interesse vamos chamar de fracasso. As probabilidades de ocorrência de sucesso e fracasso, são, respectivamente p = P(sucesso) e (1 – p) = P(fracasso) , 0 ≤ p ≤ 1. Devido à propriedade de independência, a probabilidade de sucesso p permanece constante para todos os ensaios. Ensaios com tais características são denominados ensaios de Bernoulli. Portanto, ensaios de Bernoulli são ensaios ensaios aleatórios independentes com somente dois resultados possíveis, denotados por sucesso e fracasso, cujas probabilidades permanecem constantes em todas as suas realizações. No Exemplo 2, ocorre sucesso quando o paciente que chega na emergência tem sangue O− e fracasso quando o paciente tem um dos outros tipos sanguíneos. Para a construção do modelo de Bernoulli temos que a v.a. de Bernoulli definida como uma variável que assume os valores 1, para sucesso e 0, para fracasso, com probabilidades p e (1 − p), respectivamente. Seja X uma v.a. de Bernoulli, então, sua função de probabilidade (fp) é definida por: p ( x) P( X x) 1 p , se x 0; p( x) se x 1. p, Uma forma alternativa (e mais elegante) de apresentar a função de probabilidade de Bernoulli é dada por: P( X x) p x (1 p)1 x , x 0, 1. A função de distribuição, ou função distribuição acumulada (fda), por sua vez, é definida por: F ( x) P( X x) se x 0. 0, F ( x) 1 p , se 0 x 1; 1, se x 1. Notação: X Bernoulli( p ). Obs: p é parâmetro da distribuição de Bernoulli. B) O modelo binomial Considere, agora, a repetição de n ensaios cujos resultados podem ser expressos como: sim/não; ocorre/não ocorre; 0 ou 1, tal que a probabilidade de sucesso não se altera de um ensaio para outro, ou seja, os ensaios são independentes. Seja a v.a. X que conta o número de sucessos nos n ensaios independentes, conforme descrito acima, então, X tem distribuição binomial com parâmetros n e p, em que p = P(sucesso) e a sua função de probabilidade é dada por: n P(X = x) = px (1 – p)n – x, x x = 0, 1, 2, ..., n. O modelo binomial é caracterizado pela realização de n ensaios com somente dois resultados possíveis (sucesso e fracasso), nos quais a probabilidade de sucesso p é constante (ensaios de Bernoulli). A v.a. binomial é, então, definida como sendo ”uma v.a. que conta o número de sucessos num número fixo n de ensaios de Bernoulli”. Notação: X binomial(n; p). No exemplo dos pacientes com sangue O−, n = 10 e p = 0,09, portanto, temos que: X binomial(10; 0,09) x = 0, 1, 2, ..., 10, e, sua f.p. é dada por: 10 P(X = x) = (0,09)x (0,91)10 – x, x x = 0, 1, 2, ..., 10. A v.a. binomial como soma de Bernoulli’s Considere, agora, uma sequência de n v.a. de Bernoulli indicando, cada uma, o resultado de um ensaio. Desta forma, teremos uma sequência de zeros e uns de tamanho n. Sejam X1, X2, X3, . . . , Xn uma sequência de v.a.’s de Bernoulli. Como já vimos, a v.a. binomial conta o número de sucessos nos n ensaios, ou seja, conta o número de valores “1” na sequência de tamanho n. Uma forma prática de se contar o número de sucessos nos n ensaios de Bernoulli é através da soma de X1, X2, X3, . . . , Xn, ou seja, definindo a v.a. S como n S Xi . i 1 Então, S conta o número de sucessos nos n ensaios, tendo, assim, uma distribuição binomial com parâmetros n e p, isto é, S binomial(n, p). Exemplo 3: Considere a fabricação de pinos metálicos para montagens de motores em que o índice de produtos com defeito é de 2,5%. Se um inspetor seleciona um lote com 80 pinos para inspeção, qual a probabilidade de que: a) apenas um seja defeituoso? b) nenhum seja defeituoso? c) no máximo dois sejam defeituosos? d) Qual é o número esperado de pinos defeituosos no lote? Vamos definir a v.a. X = número de pinos defeituosos dentre os 80. Como estamos interessados nos defeitos (sucesso defeito), então: p = P(defeito) = 0,025 e X binomial(80; 0,025) 80 a) P(X = 1) = (0,025)1(0,975)79 = 0,2706 1 80 b) P(X = 0) = (0,025)0(0,975)80 = 0,1319 0 c) P(X 2) = P(X = 0) + P(X = 1) + P(X = 2) = 0,6767. d) Espera-se: 800,025 = 2 peças defeituosas no lote, ou seja, espera-se np peças com defeito. Resultado: O número esperado de sucessos em n ensaios de Bernoulli, tal que, P(sucesso) = p é dado por np. Exemplo 4: Segundo pesquisa Lance!/IBOPE (ago/2010) 9,2% dos Paulistas são torcedores do Santos. Se 21 pessoas do estado de São Paulo são escolhidas ao acaso, a) qual é a probabilidade de que pelo menos uma seja Santista? b) qual é a probabilidade de que no máximo duas sejam Santistas? c) qual o número esperado de Santistas entre as 21 pessoas? Seja a v.a. X = número de torcedores do Santos na amostra. X binomial(21; 0,092) a) P(X 1) = 1 – P(X = 0) = 1 – (0,908)21 = 0,8682 b) P(X 2) = P(X = 0) + P(X = 1) + P(X = 2) = 0,6962 c) Espera-se: 210,092 = 1,932 2 torcedores do Santos na amostra C) O modelo geométrico Considere, agora, uma sequência ilimitada de ensaios de Bernoulli e seja a v.a. X que conta o número de ensaios realizados até a ocorrência do primeiro sucesso. Então X tem distribuição geométrica com parâmetro p e sua função de probabilidade é dada por: p(x) = p (1 – p) x − 1, Notação: x = 1, 2, 3, ... (3) X geométrica(p). A função de distribuição, ou função distribuição acumulada (fda), do modelo geométrico é dado por: F ( x) P( X x) P( X xi ) xi x x p(1 p) k 1 k 1 p(1 p)0 p(1 p)1 p(1 p) 2 p(1 p) x1 Da soma dos infinitos termos da série geométrica, vamos escrever a probabilidade acima como: F ( x) P( X x) 1 P( X x 1) 1 p(1 p) k 1 k x 1 p(1 p) x 11 1 1 (1 p) p(1 p) x 1 1 (1 p) x p Logo, a f.d.a. para o modelo definido em (3) é dada por: F ( x) 1 (1 p) x , x = 1, 2, 3, ... Exemplo 5: Num processo de produção de placas eletrônicas, o índice de defeitos é de 1%. Sabendo que as peças são produzidas independentemente umas das outras, determine: a) A probabilidade de que a primeira placa com defeito seja exatamente a quinta a ser produzida? b) Existe uma norma na empresa que diz que “se a primeira placa defeituosa for produzida antes e que a 11ª placa tenha sido produzida, então o processo deve ser ajustado”. Qual a probabilidade de que o processo precise ser ajustado? Neste Exemplo 5 temos que ocorre sucesso se um defeito é observado, logo, o evento a quinta placa produzida é a primeira com defeito pode ser representado pela sequencia FFFFS, em que S = sucesso e F = fracasso. Como as placas são produzidas de maneira independentes, e, como P( S ) 0,01 e P( F ) 0,99 , temos a probabilidade: P(FFFFS) = 0,990,990,990,990,01 P(FFFFS) = (0,99)40,01 = 0,00961 Definindo a v.a. X = número de placas produzidas até a ocorrência da primeira com defeito, então X tem distribuição geométrica com parâmetro p = 0,01, logo, sua f.p. é dada por: p(x) = 0,01(0,99) x − 1, x = 1, 2, 3, ... Portanto, p(5) =P(X = 5) = 0,01(0,99) 5 − 1 = 0,00961 Para o item (b) temos que calcular: P[ (1º. defeito é a 1ª. placa produzida) ou (1º. defeito é a 2ª. placa produzida) ou . . . (1º. defeito é a 10ª. placa produzida) ] = = P[ S FS FFS FFFS . . . FFFFFFFFFS ] = P[ S ] + P[ FS ] + P[ FFS ] + . . . + P[ FFFFFFFFFS ] = 0,0956179 Sequência S FS FFS FFFS FFFFS FFFFFS FFFFFFS FFFFFFFS FFFFFFFFS FFFFFFFFFS v.a. X=1 X=2 X=3 X=4 X=5 X=6 X=7 X=8 X=8 X = 10 probabilidade 0,01 0,010,99 0,01(0,99)2 0,01(0,99)3 0,01(0,99)4 0,01(0,99)5 0,01(0,99)6 0,01(0,99)7 0,01(0,99)8 0,01(0,99)9 valor 0,01 0,0099 0,009801 0,009703 0,009606 0,0095099 0,0094148 0,0093207 0,0092274 0,0091352 0,0956179 Utilizando a f.d.a.: P( X 10) F (10) 1 (0.99)10 0,0956179 O modelo geométrico pode, ainda, ser caracterizado pela v.a. Y que conta o número de fracassos que precede o 1º. sucesso. Neste caso temos a função de probabilidade dada por: p(y) = p (1 – p) y, y = 0, 1, 2, ... Obs: a relação entre a v.a. X , definida anteriormente, e a v.a. Y é, portanto, X = Y + 1. D) O modelo de Poisson Seja uma a v.a. X que conta o número de ocorrências de um evento por unidade de tempo, sendo a taxa de ocorrências, então, X tem distribuição de Poisson com parâmetro e sua função de probabilidade é dada por: x e p ( x) , x! Notação: X Poisson(). x = 0, 1, 2, ... (4) Exemplos: número de chamadas que chegam a uma central telefônica por minuto; número de aviões que chegam para aterrissagem em um aeroporto, por intervalos de meia hora; número de carros, por hora, que passam por uma cabine de pedágio; número de caixas de cerveja vendidas num bar, por semana; etc… A distribuição de Poisson se aplica, ainda, a eventos que ocorrem por unidades de medidas que não sejam o tempo, como por exemplo: na indústria calçadista controla-se a qualidade do couro que chega para a produção pelo número de falhas por m2 e couro; no controle da qualidade da água é importante monitorar o número de coliformes fecais por amostras de 100mL de água; na indústria tipográfica a qualidade na produção de livros é quantificada pelo número de erros tipográficos, por páginas publicadas; em estudos epidemiológicos espaciais registra-se a ocorrências de casos de uma doença por unidade de área; no futebol, por exemplo, conta-se o número de gols por partida de um campeonato; etc, etc, … Exemplo 6: Um sistema que oferece um serviço via Web recebe acessos a uma taxa de 1,4 por minuto. Determine a probabilidade de que o sistema: a) receba 4 acessos num minuto? b) receba no máximo 3 acessos num minuto? c) receba pelo menos um acesso em 30 segundos? d) receba 8 acessos em 5 minutos? (fazer em sala) Seja a v.a. X = número de acessos/minuto no sistema. X Poisson(1,4) (1,4) 4 e 1,4 0,9473 0,0395 a) p(4) P( X 4) 4! 24 (1,4) x e 1,4 b) F (3) P( X 3) x! x 0 3 e 1, 4 1,4 e 1, 4 (1,4) 2 e 1,4 (1,4)3 e 1,4 2 6 0,2466 0,3452 0,2417 0,1128 0,9463 c) Se o sistema recebe acessos a uma taxa de 1,4/min, então, em 30 segundos, a taxa será de 0,7 acessos. Se Y = número de acessos em períodos de 30 segundos, então, Y Poisson(0,7) Logo, devemos calcular: P(Y 1) 1 P(Y 0) 1 e 0,7 0,5034 Uma forma de apresentar a distribuição de Poisson é através da função de probabilidade: (t ) x e t p( x) , x! x = 0, 1, 2, ..., (4) em que t é o intervalo de tempo para o cálculo da probabilidade. Notação: X Poisson(t). Desta forma, no item (c) do exemplo 6, como 30s = 0.5min, podemos considerar a taxa de ocorrência em função da unidade de tempo, ou seja, X Poisson(1,41 acessos/min), ou X Poisson(1,40,5 acessos/30s). Assim, pode-se calcular a probabilidade em (c) fazendo t = 0,5: P( X 1) 1 P( X 0) 1 e 1,40,5 0,5034 Exemplo 7: (fazer em sala) Um porto consegue atender a até 4 navios que chegam para descarga de mercadorias em um dia. Caso cheguem mais do que 4 navios num dia, o excesso deve ser enviado a um outro porto. Se os navios chegam a este porto numa taxa de 2 navios/dia, a) qual a probabilidade de que cheguem exatamente 3 navios num dia? b) qual a probabilidade de seja necessário enviar navio(s) para descarga em outro porto? c) De quanto deve ser ampliado o porto para que sejam atendidos todos os navios que cheguem para descarga em 99% dos dias? Exemplo 8: Um produtor de leite tipo A afirma que seu produto é distribuído aos consumidores com uma média de 0.1NMP/100ml (Número Mais Provável) de coliformes totais. Qual a probabilidade de que, numa amostra de 100ml seja encontrado: a) Contagem zero de coliforme totais? b) Não mais do que 1NMP? c) Exatamente 3NMP/litro? Segundo Instrução Normativa no 51, de 18/09/2002, do Ministério da Saúde, o número máximo de coliformes permitido no leite é de 0.3/100ml. d) Assim sendo, qual a probabilidade de que um litro do produto, comprado no supermercado esteja impróprio para consumo? e) Qual o número esperado de coliformes totais num galão de leite? (1gal 4.55 litros) Exemplo 9: Uma central de telefônica recebe, em média, 4 chamadas a cada minuto. Qual a probabilidade da central receber: a) Mais do que 2 ligações num minuto? b) Nenhuma ligação num período de 30 segundos? c) 25 ligações em 5 minutos? d) Sabe-se que o sistema não comporta mais do que 10 ligações simultaneamente, qual a probabilidade de que uma ligação para esse número de ocupado? Aproximação da binomial pela Poisson: Seja X binomial(n , p), então, para n grande e p pequeno, tal que = np é constante, a distribuição binomial pode ser aproximada pela Poisson. Prova: p( x) n! p x (1 p) n x x!(n x)! Para = np , temos p = /n e, x n(n 1)(n 1) (n x)! p ( x) 1 x!(n x)! n n n x x x n(n 1)(n 1) (n x 1) 1 1 n n x! n x n x n! x n n n 1 n 2 n x 1 n n n n 1 n 1 n x n! x n 1 2 x 1 1 1 1 1 1 n n n n n x p( x) n! x n x1 k 1 1 1 n n n k 1 Aplicando o limite para n em cada um dos fatores acima, temos: i) x1 k lim 1 1 n k 1 n ii) lim 1 n n x 1 n iii) lim 1 e (limite fundamental) n n Desta forma, p(x) pode ser aproximada por: x e p ( x) . x! Exemplo: O tipo sanguíneo AB− é conhecido como sangue raro, pois aparece em apenas 0.8% da população. Num grupo de 300 pessoas, qual é a probabilidade de que: a) 4 sejam AB−; b) No máximo 2 sejam AB−. Valor Esperado e Variância de uma v.a. discreta A-) O valor esperado, esperança ou média de uma variável aleatória discreta é definido por: E ( X ) x p ( x) x Propriedades de Esperança: a) Se k é uma constante, E (k ) k ; b) E g ( X ) g ( x ) p ( x ) ; x c) E (aX b) aE ( X ) b . B-) A variância de uma variável aleatória discreta é definida por: Var ( X ) EX E ( X )2 . Mostra-se facilmente que a Var (X ) pode ser escrita como: Var ( X ) E ( X 2 ) E ( X )2 , em que: E ( X 2 ) x 2 p( x) . x Propriedades de Variância: a) Se k é uma constante, Var (k ) 0 ; b) Var (aX b) a 2Var ( X ) Exemplo 8: Considere o exemplo do sexo dos bebês em três nascimentos em que a f.p. da v.a. é representada por Tabela 1: Número de bebês do sexo feminino nos três nascimentos. x p(x) 0 0,125 1 0,375 2 0,375 3 0,125 O valor esperado (ou média) de X é calculado por: E( X ) 3 x p( x) x 0 E ( X ) (0) 0,125 (1) 0,375 (2) 0,375 (3) 0,125 E ( X ) 0,375 0,75 0.375 1,5 nascimentos Para calcular a variância de X, primeiro calculamos E ( X 2 ) . E( X 2 ) 3 x 2 p( x) (0) 0,125 (1) 0,375 (4) 0,375 (9) 0,125 x 0 E ( X 2 ) 3,0 logo, a variância de X é: Var ( X ) E ( X 2 ) [ E ( X )]2 Var ( X ) 3,0 (1,5) 2 0,75 Var ( X ) 0,75 e o desvio padrão: DP ( X ) Var ( X ) 0,75 DP ( X ) 0,8660 nascimentos Exemplo 9: Seja uma v.a. discreta X com f.p. dada por: p( x) x 1 10 a) b) c) d) e) k 2 3 , k>0 x { –2, –1, 0, 2, 4 }. e Achar o valor de k para que p(x) seja uma função de probabilidade; Calcular o valor esperado de X ; Calcular a variância de X; Encontre P(–1 X < 4 ); Quais os valores de a e b para os quais (aX + b) tenha média zero e variância um? a) Achar o valor de k: p ( x) 1 2 1 10 x k 2 3 10 10 k 2 3 k 2 4 1 1 10 k 2 3 1 10 k 2 4 0 1 10 k 2 3 2 1 10 k 2 3 4 1 10 k 2 3 1 1 10 k2 4 0 k 2 Desta forma: p( x) 0.1 x 1 e, sua f.p. é representada por x p(x) –2 0.3 –1 0.2 0 0.1 2 0.1 4 0.3 1 b) Valor esperado de X: E ( X ) x p( x) (2) 0.3 (1) 0.2 (0) 0.1 (2) 0.1 (4) 0.3 x E ( X ) 0.6 c) Variância de X: E ( X 2 ) x 2 p( x) (2) 2 0.3 (1) 2 0.2 (0) 2 0.1 (2) 2 0.1 (4) 2 0.3 x 1.2 0.2 0 0.4 3.2 6.6 Var ( X ) 6.6 (0.6) 2 6.24 DP ( X ) 6.24 2.4980 d) P(–1 X < 4 ) = 0.2 + 0.1 + 0.1 = 0.4 e) E (aX b) aE ( X ) b 0.6a b 0 Var (aX b) a 2Var ( X ) 6.24a 2 1 Assim, temos que: b 0.6 0.24 6.24 a 1 0.40 6.24 Resultado: v.a. padronizada. Seja uma v.a. Y aX b , tal que Y X E( X ) , então Y é uma DP ( X ) v.a. padronizada, tendo média 0 e variância 1. Exemplo 8: Calcular E(X) e Var(X) para os modelos: i) binomial(n, p); ii) geométrica(p); iii) Poisson() - fazer como exercício. i) X binomial(n, p) E( X ) E( X ) n x p x (1 p) n x x 0 x n n x n! p x (1 p) n x x!(n x)! n n(n 1)! p x (1 p) n x x( x 1)!(n x)! x 1 E( X ) x x 1 (n 1)! p p x1 (1 p) n x x 1 ( x 1)!(n x)! n E( X ) n note que (n 1) ( x 1) n 1 x 1 n x , então, teremos E ( X ) np n n 1 x 1 p x1 (1 p) n x x 1 Fazendo y ( x 1) e m (n 1) , podemos reescrever a soma na expressão acima por m E ( X ) np p y (1 p) m y y 0 y m =1 Observe que a soma resultante na E (X ) nada mais é do que a soma das probabilidades de uma distribuição binomial(m; p), tendo como resultado o valor 1. Desta forma, E ( X ) np . Portanto, se uma v.a. tem distribuição binomial(n; p), então, sua média é E ( X ) np . Para o cálculo da variância temos que encontrar E ( X 2 ) 1: E( X ) 2 n x 2 p x (1 p) n x . x x 0 n Num procedimento semelhante ao anterior, obtém-se: E ( X 2 ) n 2 p 2 np 2 np . Logo, a variância de uma v.a. binomial(n; p) é dada por: Var ( X ) E ( X 2 ) [ E ( X )]2 Var ( X ) n 2 p 2 np 2 np (np) 2 1 Uma forma alternativa é calcular E[X(X−1)], e, a partir de E[X(X-1)] = E(X 2) − E(X), obter Var(X). Var ( X ) np(1 p) Portanto, se X é uma v.a. com distribuição binomial(n; p), então sua média e variância são dadas por: E ( X ) np ii) Var ( X ) np(1 p) . X geométrica(p) E( X ) x p(1 p) x 1 x 1 Observe que o termo x (1 p) x 1 na soma é a derivada de (1 p) x em relação a p, logo, aplicando a regra da derivada de uma soma, temos d E( X ) p (1 p) x x 1 dp d E ( X ) p (1 p) x dp x 1 Mas a soma em E (X ) é a soma de uma série geométrica, logo d (1 p) E ( X ) p dp 1 (1 p) d (1 p) E ( X ) p p dp E( X ) 1 p p (1 p) p p2 Calculando E ( X 2 ) para a distribuição geométrica, temos: E( X 2 ) 1 (1 p) p 2 , e, a variância da geométrica é dada por Var ( X ) E ( X 2 ) [ E ( X )]2 Var ( X ) Var ( X ) 1 (1 p) p2 1 p 2 (1 p) p2 Portanto, se X geométrica(p), então, sua média e variância são dadas por: E( X ) 1 p Var ( X ) (1 p) p2 iii) Poisson() - mostrar que E ( X ) Var ( X ) . Função de probabilidade de uma v.a. contínua Para modelarmos as probabilidades associadas a uma v.a. contínua, temos de considerar que estas assumem valores em intervalos dos reias. Desta forma, o conjunto de possíveis valores que uma v.a. contínua X pode assumir é dado por I = { x R | k1 x k2 }, k1 < k2. Como existem infinitos pontos no intervalo [k1, k2], não faz sentido pensarmos na probabilidade de X assumir um valor x0 I, uma vez que essa probabilidade será igual a zero. Desta forma, para uma v.a. contínua, P(X = x0) = 0. No entanto, podemos determinar a probabilidade de X assumir um valor entre dois pontos quaisquer pertencentes a I: P(a X b) ; P(X b); P(X a); etc… Definição 1: Seja um função f(x) não negativa tal que a) f(x) 0, x I; b) f ( x)dx 1; I c) lim f ( x) lim f ( x) 0 ; x x b Então para a e b , tais que a < b: P(a X b) = f ( x)dx a A função f(x) é chamada de função densidade de probabilidade (fdp) da v.a. X, ou simplesmente função densidade de X e serve para descrever a distribuição de probabilidade de uma v.a. contínua. A função de probabilidade f(x) pode ser aproximada pelo histograma da v.a. X., conforme podemos observar pela figura 2. Definição 2: Seja um função F(x) tal que x F ( x) P( X x) f (u )du . a) 0 ≤ F(x) ≤ 1, x I; b) F(x) é não decrescente: se x1 x2 F ( x1 ) F ( x2 ) ; c) F(x) é contínua à direita, ou seja, lim F ( x) F (a) ; xa d) lim F ( x) 0 e lim F ( x) 1; x x F(x) é chamada função de distribuição acumulada (fda) da v.a. X, ou simplesmente função de distribuição. Nota: Da definição de fdp segue-se que: P(a X b) = b f ( x)dx = F(b) – F(a) a Exemplo 9: Seja uma v.a. X com fdp f(x) dada por 1 f ( x) e k x , 2 {x R | x 0}. a) Para que valor de k, f(x) define uma fdp? De 0 f ( x)dx 1 k x e dx 1, 2 fazendo w = kx, segue-se que dw = kdx. Portanto, 0 1 k x 1 w dw 1 e dx e ew 2 20 k 2k de onde se obtém: 0 1 e e0 1, 2k 1 1 1 k . 2k 2 b) Encontrar a fda x 1 1 F ( x) e u / 2 du 2 e u / 2 2 02 x 0 1 e x / 2 . Portanto, F ( x) P( X x) 1 e x / 2 . Desta forma, podemos encontrar P(1 X 2) = F(2) – F(1), ou seja P(1 X 2) = 1 e 2 / 2 1 e 1 / 2 e 1 / 2 e 1 = 0.2387. Valor Esperado e Variância de uma v.a.contínua A-) O valor esperado, esperança ou média de uma variável aleatória contínua é definido por: E ( X ) x f ( x)dx x Propriedades de Esperança: a) E (k ) k , b) Eg ( X ) g ( x) f ( x)dx k constante. x c) E (aX b) aE ( X ) b B-) A variância de uma variável aleatória contínua é definida por: Var( X ) E X E ( X )2 E ( X 2 ) E ( X )2 , Propriedades de Variância: a) Var (k ) 0 , k constante. b) Var (aX b) a Var ( X ) 2 Exemplo 10: Seja uma v.a. contínua com fdp dada por: k f ( x) , k > 0 e { x R | 0 < x 1 }: x a) Achar o valor de k para que f(x) seja uma densidade de probabilidade; b) Calcular o valor esperado de X ; c) Calcular a variância de X; d) Encontre a função distribuição acumulada de X; e) Encontre P(X 1/2) e P(1/4 < X < 9/16); f) Quais os valores de k1 e k2 tal que P(X k1) = 0.05 e P(X k2) = 0.05? f ( x)dx 1 a) Achar o valor de k: x 1 k x1 / 2 k x dx 1 / 2 1 0 0 1 2k (1 0) 1 2k 1 Logo: f ( x) 1 2 x k 1 2 , 0 < x 1 , é uma fdp. b) Valor esperado de X : 1 E( X ) 0 x 2 x 1 x dx 2 0 dx 1 1 x3 / 2 1 2 3 / 2 3 0 c) Variância de X: 1 3/ 2 x2 x E( X ) dx dx 2 2 x 0 0 1 2 1 1 x5 / 2 1 2 5 / 2 5 0 2 1 1 4 Var ( X ) 5 3 45 DP ( X ) 4 0.2981 45 d) fda de X: x 1 1 u1 / 2 F ( x) du x 1/ 2 2 2 u 0 0 x 0 , Logo: F ( x) x , 1 , x0 0 x 1. x 1 E( X ) 1 3 Figura: fdp e fda, respectivamente. e) P(X 1/2) e P(1/4 X < 9/16): i) P( X 1/ 2) F (1 / 2) 1 / 2 2 2 ii) P(1 / 4 X 9 / 16) F (9 / 16) F (1 / 4) 3 1 1 4 2 4 f) k1 e k2 tal que P(X k1) = 0.05 e P(X k2) = 0.05: i) P( X k1) k1 0.05 k1 0.025 ii) P( X k2 ) 1 P( X k2 ) 1 k2 0.05 k2 0.95 k2 0.9025 Modelos contínuos de probabilidade A) O modelo Exponencial: Seja X uma v.a. contínua com fdp dada por: 1 f ( x) e x / , > 0 e {x R | x 0}. Então X tem distribuição exponencial com parâmetro . Notação: X exponencial( ). A média e variância de uma v.a. exponencial() são: E(X) = Var(X) = 2 Obs: O modelo exponencial aparece, ainda, na forma: f ( x) e x , > 0 e {x R | x 0}, em que = 1/. Como o modelo exponencial é muito utilizado na modelagem de tempos até a ocorrência de um evento (ou tempos de vida), nessas situações é a taxa de ocorrência do evento por unidade de tempo. Exemplo 11: No exemplo (9), cuja v.a. contínua, tem fdp 1 f ( x) e x / 2 , 2 temos que = 2, ou seja, X exponencial( 2 ). Ainda: x x / 2 1 x / 2 E( X ) e dx x e dx , integrando por partes, 2 20 0 E( X ) 2 . x x / 2 1 2 x / 2 E( X ) e dx x e dx , integrando p. partes, 2 2 0 0 2 2 E( X 2 ) 8 . Logo: Var ( X ) 4 . B) A distribuição de probabilidade Normal. Uma v.a. X tem distribuição normal ou Gaussiana, com parâmetros e 2 se a sua fdp for: 1 x 2 f x e 2 22 , x , e 2 0 . Notação: X normal( ; 2) ou X N( ; 2). As principais características da distribuição normal são: a) X tem média E(X) = e variância Var(X) = 2; b) f(x) é uma função simétrica em torno de : f( – k) = f( + k); c) f(x) tem pontos de inflexão em ( – ) e ( + ); d) f(x) tem o conhecido formato de sino com 95% de probabilidade entre ( – 2) e ( + 2) (ver figura). A função de distribuição acumulada (fda) do modelo normal não pode ser determinada uma vez que a integral F x x 1 w 2 22 e dw, 2 não tem solução algébrica, o que dificulta as coisas, pois temos de recorrer à programação numérica. No entanto, o resultado a seguir vem facilitar as coisas: Considere a va normal padronizada, dada pela transformação linear Z X . Essa transformação padroniza a va X em relação ao seu desvio padrão, além de centralizá-la na origem. Desta forma, tem-se que E(Z) = 0 e Var(Z) = 1. Resultado: Seja X uma va com distribuição normal com média e variância 2, então a variável Z tem distribuição normal padrão, com média 0 e variância 1, ou seja: Z N(0; 1), e a sua fdp é dada por: ( z ) 1 z2 2 e , z . 2 Nota: Com este resultado, basta construir uma única tabela de probabilidades para a distribuição normal padronizada que teremos as probabilidades para uma va normal qualquer. Exemplo 12: Seja uma va X com distribuição normal com média 220 e variância 16, ou seja, X N(220; 16). Calcular as probabilidades abaixo: a) P(X 225) X 220 225 220 PZ 1,25 = 0,8943 4 4 P(X 225) = P b) P(210 X 228) 210 220 X 220 228 220 P(210 X 228) = P 4 4 4 P 2,50 Z 2,00 PZ 2,00 PZ 2,50 0,9773 – 0,0062 = 0,9711 c) Qual o valor de k tal que P(X k) = 0,01? X 220 k 220 P(X k) = P = 0,01, 4 4 Da tabela temos que k 220 2,33 k = 210,38 4 d) Quais os valores k1 e k2 simétricos em torno de , tal que P(k1 X k2) = 0,95? k 220 k 220 Z 2 P(k1 X k2) = P 1 = 0,95, 4 4 k 220 k 220 Da tabela temos que P Z 1 P Z 2 = 0,025, e, 4 4 k1 220 1,96 k1 = 212,16 4 Como k1 e k2 simétricos em torno da média, então k2 220 1,96 k2 = 227,84 4 Exemplo 13: Suponha que o nível de dureza de uma peça de espuma tenha distribuição N 40; 36. Qual a probabilidade de que: a) Um item produzido tenha dureza inferior a 28,7? E acima de 50,5? b) A especificação para esse produto é que pelo menos 95% dos itens produzidos tenha dureza entre 28 e 52. A especificação é atendida? a) P(X < 28,7) 28,7 40 PZ 1,88 = 0,0301 6 50,5 40 1 PZ 1,75 = 0,0401 6 P(X < 28,7) = P Z P(X > 50,5) P(X > 50,5) = P Z b) P(28 < X < 52) P(28 < X < 52) = P 2,0 Z 2,0 PZ 2,0 PZ 2,0 = 0,9773 – 0,0228 = 0,9545 Exemplo 14: O tempo até a falha dos televisores da marca X-View tem distribuição normal com média 35 mil horas ( 4 anos) e desvio padrão de 2,675 mil horas ( 3,7 meses). A empresa deseja fixar a garantia do produto de forma que, no máximo 5% dos televisores apresentem problemas antes desse limite. a) Encontre o limite de garantia. L 35 P Z 0,05 2,675 P(X < L) = 0,05 L 35 1,645 2,675 L = 30,6 mil horas ( 3,5 anos) b) Os diretores da companhia traçam um plano de ação para reduzir a variabilidade do processo de produção. De quanto deve ser reduzido o desvio padrão do processo para que, mantido o limite obtido em (a), o percentual de itens abaixo do limite garantia caia pela metade? P(X < 30,6) = 0,025 4.4 30,6 35 1,96 P Z 0,025 * * * = 2,245 mil horas ( 3,1 meses) Quantis da distribuição normal Seja Zγ o quantil γ 100% da distribuição N(0, 1), então, Zγ é tal que P(Z Zγ) = γ Principais quantis da distribuição Normal γ γ = 0,01 γ = 0,025 γ = 0,05 γ = 0,10 γ = 0,5 γ = 0,90 γ = 0,95 γ = 0,975 γ = 0,99 Quantil 1% 2,5% 5% 10% 50% ou med (x) Zγ Z0,01 = –2,33 Z0,025 = –1,96 Z0,05 = –1,645 Z0,1 = –1,28 90% 95% 97,5% 99% Z0,9 = 1,28 Z0,95 = 1,645 Z0,975 = 1,96 Z0,99 = 2,33 Z0,5 = 0 Obs: 1) Note que Zγ = – Z(1–γ), por exemplo Z0,025 = – Z0,975; 2) No programa R os quantis da normal são obtidos pelo comando: qnorm(γ), 0 γ 1. Exemplo 15: O diâmetro D (cm) de esferas usadas na fabricação de um rolamento tem distribuição N (0,614 ; 6,2510-6 ) . Uma esfera é classificada como: “boa” se 0,610 D 0,618; “recuperável” se 0,608 D 0,610 ou 0,618 D 0,620 e “descarte” se D 0,608 ou D 0,620. Quais as probabilidades de uma esfera ser “boa”, “recuperável” e “descarte”? 0,004 0,004 Z 0,0025 0,0025 P(“boa”) = P(0,610 D 0,618) = P = P(Z 1,60) – P(Z –1,60) = 0,9452 – 0,0548 = 0,8904 P(“rec”) = P(0,608 D < 0,610) + P(0,618 < D 0,620) = [P(Z –1,60) – P(Z –2,40)] + [P(Z 2,40) – P(Z 1,60)] = [0,0548 – 0,0082] + [0,9918 – 0,9452] = 0,0466 + 0,0466 = 0,0932 P(“des”) = P(D < 0,608) + P(D > 0,620) = P(Z –2,40) + [1 – P(Z 2,40)] = 0,0082 + [1 – 0,9918] = 0,0164 Classificação boa recuperável descarte Probabilidade 0,8904 0,0932 0,0164 O fabricante deseja fixar limites de especificação (inferior e superior) para o produto “bom” de tal forma que apenas 0,5% dos rolamentos fiquem de fora. Quais devem ser esses limites? P(k1 D k2) = 1 – 0,005 k 0,614 k 0,614 Z 2 = P 1 = 0,995 0,0025 0,0025 k1 0,614 Z 0,0025 2,81 k1 = 0,607 0,0025 Como k1 e k2 são simétricos em torno da média, então k2 0,614 Z 0,9975 2,81 k2 = 0,621 0,0025 Logo, P( 0,607 D 0,621 ) = 0,995 Considere que cada esfera é produzida a um custo de R$ 0,15 e vendida a R$ 0,25 por unidade, calcule o lucro esperado na venda de 50 mil unidades do produto se cada peça recuperável tem um custo adicional de R$ 0,05 de retrabalho. Seja L o lucro na venda de uma esfera, então Peça boa recuperável descarte Probabilidade 0,8904 0,0932 0,0164 Custo C 0,15 0,15 + 0,05 0,15 Venda V 0,25 0,25 0 E(L) = 0,8904(0,10) + 0,0932(0,05) + 0,0164(– 0,15) = R$ 0,09124/esfera Em 50 mil esferas, temos: 50000 E(L) = 50000 (0,09124) = R$ 4.562,00 Obs: Pode-se, ainda, encontrar o lucro esperado fazendo: L = V – C E(L) = E(V) – E(C), em que V é o valor da venda de uma esfera. Como E(V) = R$ 0,2459/un., e E(C) = R$ 0,15466/un., então E(L) = R$ 0,2459 – R$ 0,15466 = R$ 0,09124/un. Lucro L 0,10 0,05 – 0,15 Exemplo 16: Um produto é vendido em pacotes de um quilograma, sendo que a distribuição do peso dos pacotes é normal com média 1005g e desvio padrão 12g. a) Qual a probabilidade de que um pacote saia com peso 15g abaixo da média? b) Num fardo com 12 pacotes, qual é a probabilidade de no máximo 2 estejam abaixo de 990g? c) Um fiscal informou o produtor de que são aceitos apenas 5% dos pacotes com peso abaixo de 995g. De quanto deve diminuir a variabilidade para que esse limite seja atendido? d) Como o processo não permite o ajuste na variabilidade, a opção seria aumentar a média para atender a especificação. De quanto deve ser a nova média? e) Com a nova média obtida no item anterior, de quanto se espera aumentar a perda do empacotador em uma tonelada do produto. C) O Modelo Uniforme: Seja X uma va contínua com distribuição Uniforme no intervalo [a , b] R, a < b, então sua fdp é dada por: f ( x) Notação: 1 , (b a) {x R | a ≤ x ≤ b}. X U(a , b) ou X uniforme(a ,b) A média e variância de uma v.a. uniforme(a , b) são: E ( x) ab 2 (b a) 2 Var ( x) 12 Caso especial: O modelo uniforme no intervalo [0 ; 1], X U(0 , 1): f ( x) 1, {x R | 0 ≤ x ≤ 1}. Para o modelo U(0 , 1): E ( x) 1 2 Var ( x) 1 12 Nota: O modelo uniforme(0 , 1) é muito importante na estatística pois ele serve de base para muitos processos de simulação, na geração de valores pseudoaleatórios devido ao resultado a seguir: Resultado: Seja a v.a. X distribuída segundo uma fdp f(x), ou seja, X f(x). Considere a transformação dada por Y = F(X), em que F(.) é a fda de X, então, Y tem distribuição uniforme(0 , 1), ou seja, Y U(0 , 1). D) O Modelo Gama: Uma v.a. X tem distribuição gama com parâmetros > 0 e > 0 se a sua fdp é dada por: x 1 e x / f ( x) , ( ) x 0, em que () y 1 e y dy é a função gama. 0 Notação: X ~ gama(, ) O parâmetro é chamado de parâmetro de forma enquanto que é o parâmetro de escala. 0.0 0.2 0.4 0.6 0.8 1.0 Gráfico da distribuição Gama 0 1 2 3 4 5 Figura: fdp gama para = 2 e = 0.5 < 1 (azul); = 1 (vermelho) e = 1.5 > 1 (verde). Notas: i) Integrando por partes o lado direito de () tem-se: () y 1 e y 0 ( 1) y 2 e y dy 0 ( 1) y ( 1) 1 e y dy 0 ( 1)( 1) Se for um inteiro, digamos, = n, então: (n) (n 1)(n 1) (n 1)(n 2)(n 2) (n 1)(n 2) 2 (1) (n 1)! Ou seja, se é um inteiro, então: () = ( − 1)! ii) Uma expressão para a função gama, conhecida como forma de Weierstrass, é dada por: 1 x x x ( x) x e ln1 , k 1 k k Em que γ é a constante de Euler-Mascheroni (com 10 casas decimais 0,5772156649 ) Tomando o logaritmo de (x) , temos que: x x ln( x) ln( x) x ln1 . k k k 1 A função gama pode, ainda, ser aproximada pela fórmula de Sterling (ver Abramowitz & Stegun2) iii) Um caso especial da função gama é: (1 / 2) . 2 Milton Abramowitz e Irene Stegun. Handbook of Mathematical Functions with Formulas, Graphs, and Mathematical Tables . 1ª ed. Nova Iorque: Dover Publications, 1964. Média e Variância Seja uma v.a. X ~ gama(, ) , então sua média e variância são dados por: E(X) = Var(X) = 2 e Prova: E( X ) x x 1 e x / ( ) 0 dx x / x e 0 ( ) 1 x dx ( 1)1 x / ( ) 0 1 ( ) 1 ( ) e dx 1( 1) 1 () Num procedimento semelhante, 2 E( X ) x 0 2 x 1 e x / ( ) dx 2 ( 1)() ( ) 2 ( 1) Logo, temos que: Var(X ) 2 ( 1) 2 2 2 2 2 2 2 2 Portanto, E (X ) e Var ( X ) 2 . Casos Particulares da distribuição gama: i) = 1 e > 0: X ~ exponencial () 1 f ( x) e x / , x 0 . ii) = n/2, n inteiro e = 2: X ~ 2n (distribuição quiquadrado) x n / 2 1 e x / 2 f ( x) n / 2 , x 0. 2 (n / 2) É a distribuição quiquadrado com n graus de liberdade. iii) = n, inteiro e = 1/ > 0: X ~ Erlang(n, ) n x n 1 ex f ( x) , x 0. ( n) Função de distribuição acumulada A f.d.a. de uma v.a. X ~ gama(, ) , é obtida de x 1 u / F (x) 0 F (x) u e du ( ) 1 ( ) x u 1 u / e du 0 Fazendo z u / , então du dz e F (x) 1 ( ) x/ 1 z z e dz 0 1 x / 1 z F (x) z e dz ( ) 0 A função F(x) acima não tem solução algébrica, sendo identificada como gama incompleta, ou seja 1 z0 1 z F ( x) IG (, z0 ) z e dz , ( ) 0 em que z0 x / . No software R a gama incompleta IG( , z0) pode ser calculada com o comando: pgamma(z0,). a) Comandos do Excel para calcular a distribuição gama: f(x) e F(x) F –1 (q) =DISTGAMA(x; ; ; Cumulativo) =INVGAMA(q, x; ; ) Em que: é o parâmetro de forma; é o de escala e Cumulativo é um valor lógico (VERDADEIRO para f.d.a. e FALSO para f.d.p.). b) Comandos do software R para calcular a distribuição gama: fdp: fda: xq: f(x) F(x) F –1 (q) dgamma(x, shape = , scale = ) pgamma(x, shape = , scale = ) qgamma(q, shape = , scale = ) O computador nos cálculos das probabilidades: o uso do Excel Os modelos de probabilidades discretos e contínuos envolvem fórmulas e somas, muitas vezes complicadas, que dificulta a obtenção dos resultados desejados. Em outras situações, os resultados não podem ser obtidos algebricamente, necessitando de métodos numéricos para a obtenção de integrais, como é o caso da normal. Diante disto, os softewares estatísticos e planilhas trazem em sua biblioteca funções pré-programadas para o cálculo das probabilidades, densidades, funções acumuladas e quantis das principais distribuições. A seguir, apresentaremos os modelos: binomial; geométrico; Poisson; uniforme contínuo; gama e normal no Excel. Para a apresentação dos modelos, vamos utilizar as seguintes abreviações: fp: função de probabilidade (para o caso discreto): p( x) P( X x) ; fdp: função densidade de probabilidade (para o caso contínuo): f (x) ; fda: função distribuição acumulada: F ( x) P( X x) ; x caso discreto F ( x) P( X k ) : k 0 x caso contínuo F ( x) f (u )du : xγ = F –1 (γ): quantil de ordem γ, é tal que P( X x ) i) Modelo binomial(n , p): =DISTR.BINOM(x; n; p; Cumulativo) Sendo que Cumulativo assume os valores lógicos: FALSO para a fp e VERDADEIRO para a fda. fp =DISTR.BINOM(x; n; p; falso) fda =DISTR.BINOM(x; n; p; verdadeiro) xγ =INV.BINOM(n; p; γ) Exemplo: Considere X ~ binomial(12 ; 0,40) ; então, n = 12 e p = 0,40. Obter: a) P( X 3) : comando: =DISTR.BINOM(3; 12; 0,40; falso) resultado: 0,141894 b) P( X 3) : comando: =DISTR.BINOM(3; 12; 0,40; verdadeiro) resultado: 0,225337 c) x0, 75 , tal que P( X x0, 75 ) 0,75 comando: =INV.BINOM(12; 0,40; 0,75) resultado: 6 ou seja, x0, 75 6 . ii) Modelo geométrico(p): =DISTR.BIN.NEG(x; 1; p; Cumulativo) O modelo geométrico é um caso especial do modelo binomial negativo quando r = 1 (por isso o valor 1 como segundo parâmetro do comando). fp =DISTR.BIN.NEG(x; 1; p) fda não tem xγ não tem Exemplo: Considere X ~ grométrica(0,20) ; então, p = 0,20. Obter: a) P( X 4) : comando: =DISTR.BIN.NEG(4; 1; 0,20) resultado: 0,08192 Nota: O modelo geométrico no Excel é definido pela va X que conta o número de fracassos (e não o número de ensaios) até o primeiro sucesso. Desta forma, a função de probabilidade é da forma: p( x) P( X x) p (1 p) x , Neste caso, a fda é dada por: F ( x) P( X x) 1 (1 p) x 1. x 0, 1, 2, iii) Modelo Poisson(): =DIST.POISSON(x; ; Cumulativo) Sendo que Cumulativo assume os valores lógicos: FALSO para a fp e VERDADEIRO para a fda. fp =DIST.POISSON(x; ; falso) fda =DIST.POISSON(x; ; verdadeiro) xγ não tem Exemplo: Considere X ~ Poisson(3,6) ; então, = 3.6. Obter: a) P( X 6) : comando: =DIST.POISSON(6; 3,6; falso) resultado: 0,082608 b) P( X 6) : comando: =DIST.POISSON(6; 3,6; verdadeiro) resultado: 0,926727 iv) Modelo exponencial(): =DISTR.EXPON(x; ; Cumulativo) Sendo que Cumulativo assume os valores lógicos: FALSO para a fp e VERDADEIRO para a fda. fdp =DISTR.EXPON(x; ; falso) fda =DISTR.EXPON(x; ; verdadeiro) xγ não tem Exemplo: Considere X ~ exponencial (0,25) ; então, = 0,25 (ou = 4). f ( x) 0,25 e 0, 25 x . Obter: a) f (2) , fdp para x = 2: comando: =DISTR.EXPON(2; 0,25; falso) resultado: 0,151633 b) F (2) P( X 2) : comando: =DISTR.EXPON(2; 0,25; verdadeiro) resultado: 0,393469 Nota: O modelo exponencial no Excel é definido pela densidade: f ( x) e x , em que é a taxa de ocorrência. v) Modelo gama(; ): =DIST.GAMA(x; ; ; Cumulativo) Sendo que Cumulativo assume os valores lógicos: FALSO para a fp e VERDADEIRO para a fda. fdp =DIST.GAMA(x; ; ; falso) fda =DIST.GAMA(x; ; ; verdadeiro) xγ =INV.GAMA(γ; ; ) Exemplo: Considere X ~ gama(4 ; 0,5) ; então, = 4 e = 0,5 f ( x) 1 x 3 e x / 0, 5 . 4 (0,5) (4) Obter: a) f (2) , fdp para x = 2: comando: =DIST.GAMA(2; 4; 0,5; falso) resultado: 0,390734 b) F (2) P( X 2) : comando: =DIST.GAMA(2; 4; 0,5; verdadeiro) resultado: 0,566530 d) x0, 25 , tal que P( X x0,25 ) 0,25 comando: =INV.GAMA(0,25; 4; 0,25) resultado: 1,268 ou seja, x0, 25 1,268. vi) Modelo N(; 2): =DIST.NORM.N(x; ; ; Cumulativo) Sendo que Cumulativo assume os valores lógicos: FALSO para a fp e VERDADEIRO para a fda. fdp =DIST.NORM.N(x; ; ; falso) fda =DIST.NORM.N(x; ; ; verdadeiro) xγ =INV.NORM.N(γ; ; ) Exemplo: Considere X ~ N (50 ; 9) ; então, = 50 e = 3 (desv. padrão). Obter: a) f (48) , fdp para x = 48: comando: =DIST.NORM.N(48; 50; 3; falso) resultado: 0,106483 b) F (48) P( X 48) : comando: =DIST.NORM.N(48; 50; 3; verdadeiro) resultado: 0,252493 e) x0,90 , tal que P( X x0,90 ) 0,90 comando: =INV.NORM.N(0,90; 50; 3) resultado: 53,845 ou seja, x0,90 53,845 . vii) Modelo normal padrão N(0; 1): =DIST.NORMP.N(z; Cumulativo) Sendo que Cumulativo assume os valores lógicos: FALSO para a fp e VERDADEIRO para a fda. fdp =DIST.NORMP.N(z; falso) fda =DIST.NORMP.N(z; verdadeiro) xγ =INV.NORMP.N(γ) Exemplo: Considere Z ~ N (0 ; 1) ; então, = 1 e = 1. Obter: a) f (1) , fdp para x = −1: comando: =DIST.NORMP.N(-1; falso) resultado: 0,241971 b) F (1) P( X 1) : comando: =DIST.NORMP.N(48; 50; 3; verdadeiro) resultado: 0,158655 f) x0,90 , tal que P( X x0,90 ) 0,90 comando: =INV.NORMP.N(0,95) resultado: 1,645 ou seja, z0,95 1,645.