Probabilidade e Modelos Probabilísticos 1ª Parte: Conceitos básicos, variáveis aleatórias, modelos probabilísticos para variáveis aleatórias discretas, modelo binomial, modelo de Poisson 1 Probabilidade Mensuração da chance de ocorrência de fenômenos aleatórios, mostrando como poderão ocorrer os fatos. Base teórica para a análise inferencial. 2 Exemplo de um experimento aleatório Selecionar uma pessoa ao acaso e observar se é homem ou mulher. Resultados possíveis: homem, mulher Espaço amostral = {homem, mulher} 3 Probabilidade de um resultado Qual a probabilidade de homem e de mulher? P(homem) = 0,5 P(mulher) = 0,5 A probabilidade é um número entre 0 e 1, sendo que a soma das probabilidades de todos os resultados possíveis deve ser 1. 50% homens 50% mulheres 4 Evento Evento = conjunto de resultados possíveis Espaço amostral = {1, 2, 3, 4, 5, 6} Probabilidades: P(1) = P(2) = ... = P(6) = 1/6 Eventos: A = número par, B = núm. menor que 3 A = {2, 4, 6} B = {1, 2} P(A) = 1/2 P(B) = 2/6 = 1/3 5 Operações com eventos A não A A P( A ) 1 P( A) 6 Operações com eventos A A B B P( A B) P( A) P( B) P( A B) Eventos Mutuamente Exclusivos: SEM intersecção AB = P() = 0 7 Probabilidade condicional Condição do peso B (B) Tipo do leite C (C) UHT (U) dentro das especificações (D) 500 4500 1500 6500 fora das especificações (F) 30 270 50 350 530 4770 1550 6850 Total 350 P( F ) 0,051 6850 Total 50 P( F | U ) 0,032 1550 50 50 P( F U ) 6850 P( F | U ) 1550 1550 P(U ) 6850 8 Probabilidade condicional Qual é a probabilidade de selecionar um pedaço com champignon supondo que houvesse calabresa nele? Qual é a probabilidade de selecionar um pedaço com calabresa supondo que houvesse champignon nele? P(Champignon Calabresa) 3 / 8 3 P(Champignon | Calabresa) P(Calabresa) 5/8 5 P(Champignon Calabresa) 3 / 8 3 P(Calabresa | Champignon) P(Champignon) 4/8 4 9 Probabilidade Condicional Qual é a probabilidade de selecionar um pedaço com champignon supondo que houvesse calabresa nele? Qual é a probabilidade de selecionar um pedaço com calabresa supondo que houvesse champignon nele? P(Champignon Calabresa) 2 / 8 2 P(Champignon | Calabresa) P(Calabresa) 4/8 4 P(Champignon Calabresa) 2 / 8 2 P(Calabresa | Champignon) 10 P(Champignon) 4/8 4 Probabilidades de eventos 1) Evento complementar: P ( A ) 1 P ( A) 2) Propriedade da soma: P ( A B ) P ( A) P ( B ) P ( A B ) 3) Propriedade da soma para eventos mutuamente exclusivos: P ( A B ) P ( A) P ( B ) 4) Propriedade do produto: P ( A B ) P ( A) × P ( B / A) 5) Propriedade do produto para eventos independentes P ( A B ) P ( A) × P ( B ) 11 Variável aleatória “Uma variável aleatória é uma função com valores numéricos, cujo valor é determinado por fatores de chance.” Associa números aos eventos do espaço amostral. X = número de coroas em 2 lançamentos de uma moeda; = {(cara, cara), (cara, coroa), {coroa, cara), (coroa, coroa)} X: 0 1 2 x 12 Exemplos de variáveis aleatórias Vida útil (em horas) de um televisor. Número de peças com defeito em um lote produzido. Número de acidentes registrados durante um mês na BR.101. Na internet, o tempo (em segundos) para que uma determinada mensagem chega ao seu destino. Se uma mensagem chega (X = 1), ou não (X = 0), ao seu destino 13 Variáveis aleatórias variável aleatória discreta os possíveis resultados estão contidos em um conjunto finito ou enumerável 0 1 2 3 4 ... número de defeitos em ... contínua os possíveis resultados abrangem todo um intervalo de números reais 0 tempo de resposta de ... 14 Construção de distribuições de probabilidades Sortear 2 bolas com reposição X = número de bolas pretas na amostra 15 Sortear 2 bolas com reposição X = número de bolas pretas na amostra (10) (20) 3/5 3/5 2/5 2/5 3/5 2/5 x 0 1 2 p(x) 9/25 (0,36) 12/25 (0,48) 4/25 (0,16) 16 Sortear 2 bolas sem reposição X = número de bolas pretas na amostra (10) (20) 3/5 2/4 2/4 2/5 3/4 1/4 x 0 1 2 p(x) 6/20 (0,30) 12/20 (0,60) 2/20 (0,10) 17 Sortear 2 bolas X = número de bolas pretas na amostra Distrib. de X com reposição x 0 1 2 p(x) 0,36 0,48 0,16 independência Distrib. de X sem reposição x 0 1 2 p(x) 0,30 0,60 0,10 18 Exemplo 1 Considere que numa grande rede de computadores, em 60% dos dias ocorre alguma falha. Construir a distribuição de probabilidades para a variável aleatória X = número de dias com falhas na rede, considerando o período de observação de três dias. (Suponha independência.) 19 Exemplo 1 Possibilidades x Probabilidade BBB BBR BRB RBB BRR RBR RRB RRR 0 1 1 1 2 2 2 3 0,4 x 0,4 x 0,4 = 0,064 0,4 x 0,4 x 0,6 = 0,096 0,4 x 0,6 x 0,4 = 0,096 0,6 x 0,4 x 0,4 = 0,096 0,4 x 0,6 x 0,6 = 0,144 0,6 x 0,4 x 0,6 = 0,144 0,6 x 0,6 x 0,4 = 0,144 0,6 x 0,6 x 0,6 = 0,216 20 Exemplo 1 Distribuição de probabilidade de X: x 0 1 2 3 Total p(x) 0,064 0,288 0,432 0,216 1 0,432 0,288 0,216 0,064 0 1 2 3 número de dias com falhas na rede 21 Valor esperado e variância x p(x) x1 x2 ... xn p1 p2 ... pn Total 1 E X xi pi V X xi pi 2 2 22 Propriedades do valor esperado e variância a)E(c) = c b)E(X + c) = E(X) + c c) E(cX) = cE(X) d)E(X + Y) = E(X) + E(Y) e) E(X – Y) = E(X) – E(Y) a)V(c) = 0 b)V(X + c) = V(X) c) V(cX) = c2V(X) d)DP(cX) = |c|DP(X) 23 Exemplo 1 X = número de dias com falhas na rede. x 0 1 2 3 p(x) 0,064 0,288 0,432 0,216 E X xi pi E(X) = 0(0,064) + 1(0,288) + 2(0,432) + 3(0,216) = 1,8 24 Exemplo 1 X = número de dias com falha na rede. x 0 1 2 3 p(x) 0,064 0,288 0,432 0,216 V X xi pi 2 2 V(X) = (0 – 1,8)2(0,064) + (1 – 1,8)2(0,288) +(2 – 1,8)2(0,432) + (3 – 1,8)2(0,216) = 0,72 25 Experimento binomial consiste cada de n ensaios; ensaio tem somente dois resultados: “sucesso” / “fracasso”; os ensaios são independentes, com P(sucesso) = p (0 < p < 1 constante ao longo dos ensaios); ====> X = número de sucesso nos n ensaios 26 Exemplos de experimentos binomiais Número de caras em 10 lançamentos de uma moeda; Número de itens defeituosos numa amostra de 20 itens (supondo amostragem aleatória e com reposição); Número de eleitores favoráveis a um determinado projeto de lei em uma amostra de 200 entrevistados (supondo amostragem aleatória de uma população muito grande). 27 Cálculo das probabilidades em experimentos binomiais X = número de caras em 3 lançamentos de uma moeda com P(cara) = p; P(X = 1) = ? X=1 CKK KCK KKC P(CKK) = p (1 - p)2 P(X = 1) = 3 p (1 - p)2 n x 28 O modelo binomial Para um particular x = 0, 1, ..., n: n x n x P( X x) p 1 p x E( X ) n p Cn , x n n! V ( X ) n p ( 1 p ) x x!(n x)! 29 Exemplo 1 (de novo) Considere que numa grande rede de computadores, em 60% dos dias ocorre alguma falha. Construir a distribuição de probabilidades para a variável aleatória X = número de dias com falhas na rede, considerando o período de observação de três dias. (Suponha independência.) 30 Exemplo 1 (de novo) X = número de dias com falhas binomial com n=3 p = 0,6 1 – p = 0,4 3 x 3 x P( X x) 0,6 0,4 x 31 Exemplo 1 (de novo) n=3 p = 0,6 3 P(X=x) = 0,6x.(1- 0,6)(3-x) x ( ) P(X=0) = 3 0,60.(1- 0,6)(3-0) = 1.0,60.0,43 = 0,064 0 ( ) 3 0 ( )= 3! =1 0! (3-0)! 1 32 Exemplo 1 (de novo) n=3 p = 0,6 3 P(X=x) = 0,6x.(1- 0,6)(3-x) x ( ) P(X=1) = 3 0,61.(1- 0,6)(3-1) = 3.0,61.0,42 = 0,288 1 ( ) 3 1 ( )= 3! =3 1! (3-1)! 33 Exemplo 1 (de novo) n=3 p = 0,6 3 P(X=x) = 0,6x.(1- 0,6)(3-x) x ( ) P(X=2) = 3 0,62.(1- 0,6)(3-2) = 3.0,62.0,41 = 0,432 2 ( ) 3 2 ( )= 3! =3 2! (3-2)! 34 Exemplo 1 (de novo) n=3 p = 0,6 3 P(X=x) = 0,6x.(1- 0,6)(3-x) x ( ) P(X=3) = 3 0,63.(1- 0,6)(3-3) = 1.0,63.0,40 = 0,216 3 ( ) 3 3 ( )= 3! =1 1 3! (3-3)! 35 Distribuição da variável X x 0 1 2 3 Total p(x) 0,064 0,288 0,432 0,216 1 0,432 0,288 0,216 0,064 E( X ) n p 3 0,6 1,8 0 V ( X ) n p (1 p) 3 0,6 0,4 0,72 1 2 3 36 Distribuição de Poisson Número de observações de uma variável em um intervalo contínuo (tempo ou espaço): distribuição de Poisson. Exemplos: chamadas telefônicas por minuto, mensagens que chegam a um servidor por segundo acidentes por dia, defeitos por m2, etc.. 37 Distribuição de Poisson Pressupostos Os números de ocorrências em quaisquer intervalos são independentes. A probabilidade de duas ou mais ocorrências simultâneas é zero. O número médio de ocorrências () é constante em todo o intervalo considerado. 38 Distrib. de Poisson: uma justificativa X = núm. de ocorrências em [t, t+1] t t+1 n intervalos de amplitude 1/n, com n p = probab. de ocorrência em cada intervalo n x n x P( X x) p (1 p) x P( X x) n p0 np >0 x t t e x! (x =0, 1, 2, ...) 39 Distribuição de Poisson Equação As probabilidades de uma distribuição de Poisson são dadas por: e-t . tx P(X=x) = t - x! número médio de ocorrências no intervalo (tempo ou espaço) considerado. 40 Valor Esperado e Variância O valor esperado (média) e a variância de uma distribuição de Poisson são iguais a. E(X) = t Var(X) = t 41 Exemplo 2 Em um processo produtivo têxtil, o número médio de defeitos por m2 de tecido é 0,4, variando segundo uma distribuição de Poisson. Qual é a probabilidade de que, em 1 m2 de tecido fabricado: a) não haja defeito? 42 Exemplo 2 - item a = 0,4 t =1 t = 0,4 e-0,4 . x P(X=x) = x! e-0,4 . 0 P(X=0) = 0! = 0,6703 ou 67,03% 43 Exemplo 2 Em um processo produtivo têxtil, o número médio de defeitos por m2 de tecido é 0,4, variando segundo uma distribuição de Poisson. Qual é a probabilidade de que, em 1 m2 de tecido fabricado: a) não haja defeito? b) haja no máximo 1 defeito? 44 Exemplo 2 - item b e-0,4 . x P(X=x) = x! P( X 1) e-0,4 . 1 P(X=1) = 1! = 0,2681 ou 26,81% P(X=0) + P(X=1) = 0,6703 + 0,2681 = 0,9384 ou 93,84% 45