PROBABILIDADES E ESTATÍSTICA Ao conjunto de todos os resultados possíveis, de uma experiência aleatória, chamamos espaço amostral e representamos por S. Define-se acontecimento como sendo um subconjunto do espaço amostral. A= “sair 6” – {6} B= “sair fica par” – {2,4,6} C=”sair ficar impar” – {1,3,5} Aos acontecimentos constituídos por um único resultado chamam-se acontecimentos elementares. O espaço amostral e os acontecimentos nele contidos podem ser representados por diagramas de Venn. Dado o paralelismo entre acontecimentos e subconjuntos, podemos a partir das operações sobre conjuntos obter novos acontecimentos. - A união dos acontecimentos A e B, representa-se A ∪ B e é o acontecimento que se realiza se e só se A ou B se realizam. A intersecção dos acontecimentos, representa-se A ∩ B e é o acontecimento que se realiza se só A e B se realizam mutuamente. O acontecimento complementar de A, representa-se por A e é acontecimento constituído por todos os resultados de S, que não estão em S. A∪B B∩C=∅ A = {1,2,3,4,5} A∩Β Resultados adicionais sobre acontecimentos A = A (lei do complementar) (A∪B) ∩C = (A∩C) ∪ (B∩C) (A∩B) ∪C = (A∪C) ∩ (B∪C) lei distributiva (A∪B)∩C cara cara cara coroa coroa cara A∪B = A ∩ B coroa coroa Leis de De Morgan A∩B = A ∪ B A∩B=B∩A Lei comutativa A∪B=B∪A Os espaços amostrais também podem ser representados por diagramas de árvore. Ex: lançamento de 2 moedas S = {cara coroa, coroa coroa, cara cara, coroa cara} Dois acontecimentos A e B são mutuamente exclusivos ou disjuntos que não podem ocorrer conjuntamente então A∩B=∅. Noção de probabilidade – um espaço amostral é disjunto se e só se consiste num conjunto finito (ou infinitamente numerável) de resultados situados no intervalo [0,1] (0 e 100%). Definição subjectiva – a probabilidade de um resultado é interpretado pelo “grau de acreditar” que o resultado vai ocorrer. Definição clássica ou De Laplace – sempre que o espaço amostral é constituído por N resultados (acontecimentos elementares), todos eles igualmente possíveis, então a probabilidade de cada resultado ou 1 acontecimento elementar é N . Para um espaço amostral discreto, a probabilidade de um acontecimento A, representa-se por P(A) como sendo a soma das probabilidades de resultados que compõem A. P(A)= Nº de casos favoráveis Nº de casos possíveis P(A)= 1 6 P(B)= 3 1 = 6 2 A definição frequencista é baseada na repetição da experiência aleatória. A probabilidade de um acontecimento A é definida, como sendo o limite da sua frequência relativa, com que se verificou A em n provas ou repetições. P(A) = nA lim n n − > +∞ onde nA , representa o número de vezes que se verificou A em n provas. Axiomas de Probabilidade (Kolmogorov) A probabilidade é um número que é atribuído a cada elemento duma colecção de acontecimentos de uma experiência aleatória que satisfaz as seguintes propriedades. Se S é um espaço amostral e A é qualquer acontecimento de uma experiência aleatória. (i) (ii) (iii) P(s)=1 0<= P(A) <=1 Para um acontecimento A e B com A∩B = ∅, P(A∪B)=P(A)+P(B) Os axiomas implicam os seguintes resultados: i) P(∅)=0 P( A )=1-P Se A ⊆ B então P(A)<=P(B) ii) iii) P(A∪ A )=P(A)+P( A )=1 P(B)=P(A)+P(B∩ A ) >0 Regra de adição Se A e B forem dois acontecimentos quaisquer então: P(A∪B)=P(A)+P(B)-P(A∩B) A∪B = A∪(B∩ A ) B=(A∩B) ∪(B∩ A ) P(A∪B) = P(A)+P(B∩ A ) P(B)=P(A∩B)+P ( B ∩ A) Se A, B e C forem três acontecimentos quasiquer acontecimentos então: P(A∪B∪C)=P(A)+P(B)+P(C)-P(A∩B)-P(B∩C)+P(A∩B∩C) P(A∪B∪C)=P((A∪B) ∪C)=P(A∪B)+P(C)-P((A∪B) ∩C) = P(A)+P(B)P(A∩B)+P(C)-P((A∩C) ∪(B∩C)) =P(A)+P(B)+P(C)-P(A∩B)-P(A∩C)-P(B∩C)+P(A∩B∩C) Uma colecção de acontecimentos ξ 1, ξ 2,..., ξ k, são mutuamente exclusivos se para todos os pares: Ei ∩ Ej = ∅ ∧ 1<= i≠j <= k Para uma colecção de acontecimentos mutuamente exclusivos, Suponha que A, B e C são acontecimentos tais que: P(A)=P(B)=P(C) = ¼ P(A∩B)=P(C∩B)=0 P(A∩C)= 1/8 P(A∪B∪C)=? 3 1 6 1 5 − = − = 4 8 8 8 8 Se A, B e C são acontecimentos mutuamente exclusivos, será possível P(A)=0,3 , P(B)=0,4 e P(C)=0,5 ? Justifique. Não. Porque se são mutuamente exclusivos então P(A∪B∪C)=P(A)+P(B)+P(C) = 0,3+0,4+0,5 > 1 ⇒ Não é possível que estes acontecimentos tenham estes valores de probabilidade. PROBABILIDADE CONDICIONADA A probabilidade condicional do acontecimento B, dado que (ou sabendo que) ou sabendo que o acontecimento A se realizou, representa-se por P(B|A) e é dado por: P(B|A) = P(A ∩ B) P(A) com P(A) > 0 “B dado A” Molécula 2 Não Sim Total Molécula 1 Sim 24 12 36 Não 212 18 230 Total 236 30 266 Escolhendo uma amostra ao acaso, determine a probabilidade da molécula 1 estar presente, sabendo que a molécula 2 está igualmente presente. P(A ∩ B) P(B|A) = = P(A) 12 260 36 260 = 12 = 0,(3) 36 P(B) = 30 = 0,113 260 REGRAS DE MULTIPLICAÇÃO A partir da definição de Probabilidade Condicional podemos obter uma expressão geral para a probabilidade de intersecção de dois acontecimentos. P(A ∩ B) = P(A|B) ⋅ P(B) = P(B|A) ⋅ P(A) P(A | B ) = P(A ∩ B) P(B) P(B|A) = P(B ∩ A) P(A) A fórmula é simétrica! A generalização da equação anterior é dado por: P(E1 ∩ E 2 ∩ K ∩ En ) = P(E1 )P(E 2 | E1 )P(E 3 | E1 ∩ E 2 ) K P(En | E1 ∩ E2 ∩ Exerc. 50 defeituosas 800 boas Seleccionou-se duas peças aleatoriamente sem reposição. Qual a probabilidade das duas peças serem defeituosas? lote P(A ∩ B) = P(A) ⋅ P(B|A) = 50 49 ⋅ = 0,003 850 849 K ∩ E n− 1) REGRA DE PROBABILIDADE TOTAL Para quaisquer acontecimentos A e B B = (A ∩ B) ∪ (A ∪ B) P(B) = P(B ∩ A) + P(B ∩ A) = P(B|A) ⋅ P(A) + P(B|A) ⋅ P(A) Aplicando esta fórmula ao exercício anterior obtém-se: 49 50 50 860 ⋅ + ⋅ = 0,059 849 850 849 850 Para múltiplos acontecimentos Uma colecção de acontecimentos E 1,E2,...,E n são exaustivos se E 1 ∪ E2 ∪... ∪ En = S B = ( B ∩ E1) ∪ ( B ∩ E2) ∪ ( B ∩ E3 ) ∪ ( B ∩ E4) então: P(B) = P( B ∩ E1) + P( B ∩ E2) + P( B ∩ E3 ) + P( B ∩ E4) =P(B|E 1)⋅P(E 1) + P(B|E 2)⋅P(E 2) + P(B|E 3)⋅P(E 3) + P(B|E 4)⋅P(E 4) Se E1,E2,...,En são n acontecimentos mutuamente exclusivos e exaustivos então P(B) = P( B ∩ E1) + P( B ∩ E2) + ... + P( B ∩ En ) = P(B|E 1)⋅P(E 1) + P(B|E 2)⋅P(E 2) + ... + P(B|E n)⋅P(E n) ACONTECIMENTOS INDEPENDENTES Dois acontecimentos são independentes se qualquer uma das seguintes afirmações equivalentes é verdadeira: i) ii) iii) P(A|B) = P(A) P(B|A) = P(B) P(A ∩ B) = P(A)⋅P(B) P(B) ≠ P(B|A) se forem Os acontecimentos E 1,E2,...,E n são independentes se para qualquer conjunto Ei1,Ei2,...,E in P(E i1 ∩ Ei2 ∩ ... ∩ Ein) = P(E i1)⋅P(Ei2)⋅...⋅P(Ein) Exercício: Sendo P(A)>0 e P(B)>0 será possível A e B serem mutuamente e exclusivos ? Resolução: 1) Se A e B são mutuamente exclusivos ⇒ P(A ∩ B) = 0 2) Se A e B são independentes ⇒ P(A ∩ B) = P(A)⋅P(B) 0 >0 Não podem ser as duas coisas ao mesmo tempo. TEOREMA DE BAYES Da definição de Probabilidade Condicional temos que: P(A∩B) = P(A|B)P(B) = P(B∩A)= P(B|A)P(A) A partir do segundo e último termo podemos escrever: P(A|B)= P(B|A)P(A) P(B) com P(B)> 0. Se P(B) no denominador for escrito usando a regra da probabilidade total, obtemos o teorema de Bayes: P(A|B)= P(B|A)P(A) P(B|A)P(A)+P(B|A)P(A) Generalização do teorema de Bayes Se E1,E2,E3 são k acontecimentos mutuamente exclusivos e exaustivos∗ , então dado qualquer acontecimento B, tem-se que: P(E1 | B ) = P(B|E1 )P(E1 ) P(B|E1 )P(E1 )+P(B|E2 )P(E2 ) + K +P(B|Ek )P(Ek ) Ex. 24 ∗ A – O funcionário da loja A 50 BC- 75 100 « « « « « B « C a sua união é todo o espaço amostral 50 50 = = 0,(2) 50 + 75 + 100 225 P(B)=0,(3) P( C ) = 1-0,(2)-0,(3)=0,(4) P(A) = M – Funcionário é mulher sendo: P(M|A)=0,5 P(M|B)=0,6 P(M|C)=0,7 P(C)P(M|C) P(A)P(M|A) + P(B)P(M|B) + P(C)P(M|C) 0,45 ⋅ 0,7 = = 0,51 0,22 ⋅ 0,5 + 0,33 ⋅ 0,6 + 0,45 ⋅ 0,7 P(C|M) = VARIÁVEIS ALEATÓRIAS E DISTRIBUIÇÕES DISCRETAS S= { cara, coroa } Uma variável aleatória (v.a.) é uma função que atribui um número real a cada resultado do espaço amostral de uma experiência aleatória. eα= lançamento de duas moedas S = { cara cara, cara coroa, coroa cara, coroa coroa } X = v.a. que representa o nº de vezes que saiu cara. X (cara cara) = 2 X (cara coroa) = 1 X (coroa cara) = 1 X (coroa coroa) = 0 Uma v.a. diz-se discreta se só assume um número finito ou infinito numerável de valores discretos. Exemplos: • • • nº de peças defeituosas num lote nº de acidentes no cruzamento de Gambelas por dia nº de chamadas telefónicas numa central por semana Uma v.a. diz-se contínua se assume todos os valores dum intervalo (finito ou infinito) de números reais. ex: temperaturas, peso, tempo entre chamadas telefónicas sucessivas A distribuição de probabilidade de um v.a. X é a descrição das probabilidades associadas com os valores possíveis de X. Seja X uma v.a. discreta com valores possíveis U1,U2,...,Un. A distribuição de X é caracterizada pela função massa de probabilidade (fmp) que associa uma probabilidade a cada valores que a v.a. assume. f(xi) = P(X= xi) V.A. discretas Atendendo à definição de probabilidade: 1) f(xi)≥0 n 2) ∑ f(x) = 1 i i =1 ex.: f(2)=P(X=2)=P(coroa coroa)=1/4 f(1)=P(X=1)=P(cara coroa, coroa cara)=1/2 f(0)=P(X=0)=P(coroa coroa)=1/4 x f(xi) 0 ¼ 1 ½ diagrama de barras 2 ¼ Função de distribuição Um processo alternativo de descrever as probabilidades associadas a uma v.a. X é utilizando a função distribuição. Seja X uma v.a. discreta com valores possíveis x1,x2,...,xn. A função distribuição ∑ f ( xi ) da v.a. X representa-se por F(x)=P(X≤x)= xi ≤ x F(x) satisfaz as seguintes propriedades: 1) lim F(x) = 0 x→ − ∞ lim F(x) = 1 2) x → + ∞ 3) Se x1≤x2, então F(x1) ≤ F(x2) – não decrescente 4) F(x) é contínua e discreta Dada a função distribuição da v.a. discreta X, podemos obter a respectiva função massa de probabilidade (f.m.p.). f(x)=F(x)-F(x -) Para qualquer função de distribuição F(x), dados dois números reais x1 e x2 com x1<x2, tem-se P(x1≤X≤x2)=F(x2)-F(x1) P(X<x)=P(X≤x)-P(X=x) =F(x)-(F(x)- F(x -)) = F(x -) x2 x1 x P(X>x)=1-P(X≤x)=1-F(x) P(X≥x)=1-P(X<x)=1- F(x -) P(x1<X<x2)=P(x1<X≤x2)-P(X=x2) =F(x2)-F(x1)-(F(x2)- F(x2 -)) =F(x2-)- F(x1-) P(x1≤X≤x2)=P(x1≤X<x2)+P(X=x1) = F(x2-) - F(x1-)+F(x1)- F(x1-) = F(x2 -)- F(x1-) x f(xi) 0 ¼ 1 ½ 2 ¼ 0 se x<0 ¼ se 0≤x<1 ¾ se 1≤x<2 1 se x≤2 F(0)=P(X≤0)=f(0)= ¼ F(1)=P(X≤1)=f(0)+f(1)= ¼ + ½ = ¾ F(2)=P(X ≤2)=f(0)+f(1)+f(2)= ¼ + ½ + ¼ =1 F(1,5)=P(X≤1,5) = ¾ f(1,5)=0 P(0≤X≤1)=F(1)-F(0 -)= ¾ f(0)+f(1)= ¾ P(0≤X≤1) =F(1)-F(0 -) = ¾ F(x) 1 2 3 4 F(x)= FUNÇÕES DE UMA VARIÁVEL ALEATÓRIA DISCRETA Se X é uma v.a. e h uma aplicação de ¡ em ¡, então y=h(X) é uma v.a. de distribuição de Y=h(x) é determinada pela transformação h e pela distribuição de X. Seja X uma v.a. discreta com valores possíveis x1,x2,...,xn e função massa de probabilidade (f.m.p.) f(x). Então a f.m.p. de y é dada por: g(y) = P(Y = y) = P(h(x) = y) ∑ = P({x : h(x) = y}) = f(x) x:h(x) = y x f(xi) x g(x) -2 -1 0 1 2 1 5 1 4 1 6 1 10 17 60 0 0 0 6 24 0 6 24 37 60 1 10 17 60 y=h(x)=x3+3x2+2x g(y)= ? 1 1 1 37 g(0)=f(-2)=f(-1)+f(0)= + + = 5 9 6 60 g(6) = f(1) = 1 10 g(24) = f(2) = 17 60 VALOR ESPERADO E VARIÂNCIA DE UMA V.A. DISCRETA A média ou valor esperado de uma v.a. discreta X, representa-se por E[X] ou µe E[X]= µ = ∑ xf(x) x De um modo geral, seja h(x) uma função real de X: E[h(X)] = ∑ h(x)f(x) x Com h(x)=(X-E[X])2 obtém-se obtém-se a variância de X e representa-se por U[X] ou σ2 e σ 2 2 = U[X] = E[(x-E[x]) ] { =µ =∑ [(x-µ ) f(x)] = ∑ [(x 2 − 2xµ + µ 2 )f(x)] 2 x = ∑x 2 ∑x 2 x = x f(x) − 2µ ∑ xf(x) + µ 2 ∑ f(x) x x f(x) − 2µ 2 + µ 2 = x = ∑x 2 f(x) − µ 2 x E[X2 ] − E[X] 2 A raíz quadrada da variância chamamos desvio-padrão e representamos σ = U[x] 1 2 1 1 +1 ⋅ + 2 = 1 4 2 4 1 1 1 1 U[x] = (0 2 ⋅ + 1 2⋅ + 2 2⋅ ) − 12 = 4 2 4 2 µ = E[x] = 0 ⋅ Se X é uma v.a. e a, b e c constante então: 1) 2) 3) 4) E[c] = c E[x-µ]=0 E[cX]=cE[X] E[h(X)+h’(X)] = E[h(X)]+E[h’(X)] Demonstrações das propriedades anteriores: 1) E[c] = ∑ cf(x) = c∑ f(x) = c x 2) x E[x- µ ]= ∑ | x − µ |f(x) = x 3) x x E[cX]= ∑ cxf(x) = c∑ xf(x) = cE[X] x 4) ∑ xf(x) − µ ∑ f(x) = µ − µ = 0 x E[h(X)+h′ (X)] = ′ ∑ [h(x)+h′ (x)]f(x)= ∑ h(x)f(x)+∑ h(x)f(x) x x = 5) E[h(X)] + E[h'(X)] E[aX + b] = E[aX] + E[b] = aE[x] + b { { { (4) (3) (1) x 6) V[aX+b] = E[((aX+b)-E[aX+b])2] = E[aX+b – aE[X]-b] = E[(aX-aE[X])2] = E[a 2(X-E[X])2]=a2E[(X-E[X])2]=a2V[X]