probabilidades e estatística

Propaganda
PROBABILIDADES E ESTATÍSTICA
Ao conjunto de todos os resultados possíveis, de uma experiência aleatória,
chamamos espaço amostral e representamos por S. Define-se acontecimento
como sendo um subconjunto do espaço amostral.
A= “sair 6” – {6}
B= “sair fica par” – {2,4,6}
C=”sair ficar impar” – {1,3,5}
Aos acontecimentos constituídos por um único resultado chamam-se
acontecimentos elementares.
O espaço amostral e os acontecimentos nele contidos podem ser
representados por diagramas de Venn.
Dado o paralelismo entre acontecimentos e subconjuntos, podemos a partir das
operações sobre conjuntos obter novos acontecimentos.
-
A união dos acontecimentos A e B, representa-se A ∪ B e é o
acontecimento que se realiza se e só se A ou B se realizam.
A intersecção dos acontecimentos, representa-se A ∩ B e é o
acontecimento que se realiza se só A e B se realizam mutuamente.
O acontecimento complementar de A, representa-se por A e é
acontecimento constituído por todos os resultados de S, que não estão
em S.
A∪B B∩C=∅
A = {1,2,3,4,5}
A∩Β
Resultados adicionais sobre acontecimentos
A = A (lei do complementar)
(A∪B) ∩C = (A∩C) ∪ (B∩C)
(A∩B) ∪C = (A∪C) ∩ (B∪C)
lei distributiva
(A∪B)∩C
cara cara
cara coroa
coroa cara
A∪B = A ∩ B
coroa
coroa
Leis de De Morgan
A∩B = A ∪ B
A∩B=B∩A
Lei comutativa
A∪B=B∪A
Os espaços amostrais também podem ser representados por diagramas de
árvore.
Ex: lançamento de 2 moedas
S = {cara coroa, coroa coroa, cara cara, coroa cara}
Dois acontecimentos A e B são mutuamente exclusivos ou disjuntos que não
podem ocorrer conjuntamente então A∩B=∅.
Noção de probabilidade – um espaço amostral é disjunto se e só se consiste
num conjunto finito (ou infinitamente numerável) de resultados situados no
intervalo [0,1] (0 e 100%).
Definição subjectiva – a probabilidade de um resultado é interpretado pelo
“grau de acreditar” que o resultado vai ocorrer.
Definição clássica ou De Laplace – sempre que o espaço amostral é
constituído por N resultados (acontecimentos elementares), todos eles
igualmente possíveis, então a probabilidade de cada resultado ou
1
acontecimento elementar é N .
Para um espaço amostral discreto, a probabilidade de um acontecimento A,
representa-se por P(A) como sendo a soma das probabilidades de resultados
que compõem A.
P(A)=
Nº de casos favoráveis
Nº de casos possíveis
P(A)=
1
6
P(B)=
3 1
=
6 2
A definição frequencista é baseada na repetição da experiência aleatória. A
probabilidade de um acontecimento A é definida, como sendo o limite da sua
frequência relativa, com que se verificou A em n provas ou repetições.
P(A) =
nA
lim n
n − > +∞
onde nA , representa o número de vezes que se verificou A em n provas.
Axiomas de Probabilidade (Kolmogorov)
A probabilidade é um número que é atribuído a cada elemento duma colecção
de acontecimentos de uma experiência aleatória que satisfaz as seguintes
propriedades. Se S é um espaço amostral e A é qualquer acontecimento de
uma experiência aleatória.
(i)
(ii)
(iii)
P(s)=1
0<= P(A) <=1
Para um acontecimento A e B com A∩B = ∅, P(A∪B)=P(A)+P(B)
Os axiomas implicam os seguintes resultados:
i)
P(∅)=0
P( A )=1-P
Se A ⊆ B então P(A)<=P(B)
ii)
iii)
P(A∪ A )=P(A)+P( A )=1
P(B)=P(A)+P(B∩ A )
>0
Regra de adição
Se A e B forem dois acontecimentos quaisquer então:
P(A∪B)=P(A)+P(B)-P(A∩B)
A∪B = A∪(B∩ A )
B=(A∩B)
∪(B∩ A )
P(A∪B)
= P(A)+P(B∩ A )
P(B)=P(A∩B)+P ( B ∩ A)
Se A, B e C forem três acontecimentos quasiquer acontecimentos então:
P(A∪B∪C)=P(A)+P(B)+P(C)-P(A∩B)-P(B∩C)+P(A∩B∩C)
P(A∪B∪C)=P((A∪B) ∪C)=P(A∪B)+P(C)-P((A∪B) ∩C) = P(A)+P(B)P(A∩B)+P(C)-P((A∩C) ∪(B∩C))
=P(A)+P(B)+P(C)-P(A∩B)-P(A∩C)-P(B∩C)+P(A∩B∩C)
Uma colecção de acontecimentos ξ 1, ξ 2,..., ξ k, são mutuamente exclusivos se
para todos os pares:
Ei ∩ Ej = ∅ ∧ 1<= i≠j <= k
Para uma colecção de acontecimentos mutuamente exclusivos,
Suponha que A, B e C são acontecimentos tais que:
P(A)=P(B)=P(C) = ¼
P(A∩B)=P(C∩B)=0
P(A∩C)= 1/8
P(A∪B∪C)=?
3 1 6 1 5
−
=
−
=
4 8 8 8 8
Se A, B e C são acontecimentos mutuamente exclusivos, será possível
P(A)=0,3 , P(B)=0,4 e P(C)=0,5 ? Justifique.
Não. Porque se são mutuamente exclusivos então P(A∪B∪C)=P(A)+P(B)+P(C)
= 0,3+0,4+0,5 > 1 ⇒ Não é possível que estes acontecimentos tenham estes
valores de probabilidade.
PROBABILIDADE CONDICIONADA
A probabilidade condicional do acontecimento B, dado que (ou sabendo que)
ou sabendo que o acontecimento A se realizou, representa-se por P(B|A) e é
dado por:
P(B|A) =
P(A ∩ B)
P(A) com P(A) > 0
“B dado A”
Molécula 2
Não
Sim
Total
Molécula 1
Sim
24
12
36
Não
212
18
230
Total
236
30
266
Escolhendo uma amostra ao acaso, determine a probabilidade da molécula 1
estar presente, sabendo que a molécula 2 está igualmente presente.
P(A ∩ B)
P(B|A) =
=
P(A)
12
260
36
260
=
12
= 0,(3)
36
P(B) =
30
= 0,113
260
REGRAS DE MULTIPLICAÇÃO
A partir da definição de Probabilidade Condicional podemos obter uma
expressão geral para a probabilidade de intersecção de dois acontecimentos.
P(A ∩ B) = P(A|B) ⋅ P(B) = P(B|A) ⋅ P(A)
P(A | B ) =
P(A ∩ B)
P(B)
P(B|A) =
P(B ∩ A)
P(A)
A fórmula é
simétrica!
A generalização da equação anterior é dado por:
P(E1 ∩ E 2 ∩
K
∩
En ) = P(E1 )P(E 2 | E1 )P(E 3 | E1 ∩ E 2 ) K P(En | E1 ∩ E2 ∩
Exerc.
50 defeituosas
800 boas
Seleccionou-se duas peças aleatoriamente sem reposição. Qual a
probabilidade das duas peças serem defeituosas?
lote
P(A ∩ B) = P(A) ⋅ P(B|A) =
50 49
⋅
= 0,003
850 849
K
∩
E n− 1)
REGRA DE PROBABILIDADE TOTAL
Para quaisquer acontecimentos A e B
B = (A ∩ B) ∪ (A ∪ B)
P(B) = P(B ∩ A) + P(B ∩ A)
=
P(B|A) ⋅ P(A) + P(B|A) ⋅ P(A)
Aplicando esta fórmula ao exercício anterior obtém-se:
49 50
50 860
⋅
+
⋅
= 0,059
849 850 849 850
Para múltiplos acontecimentos
Uma colecção de acontecimentos E 1,E2,...,E n são exaustivos se E 1 ∪ E2 ∪... ∪
En = S
B = ( B ∩ E1) ∪ ( B ∩ E2) ∪ ( B ∩ E3 ) ∪ ( B ∩
E4)
então:
P(B) = P( B ∩ E1) + P( B ∩ E2) + P( B ∩ E3 ) + P( B ∩ E4)
=P(B|E 1)⋅P(E 1) + P(B|E 2)⋅P(E 2) + P(B|E 3)⋅P(E 3) + P(B|E 4)⋅P(E 4)
Se E1,E2,...,En são n acontecimentos mutuamente exclusivos e exaustivos
então
P(B) = P( B ∩ E1) + P( B ∩ E2) + ... + P( B ∩ En )
= P(B|E 1)⋅P(E 1) + P(B|E 2)⋅P(E 2) + ... + P(B|E n)⋅P(E n)
ACONTECIMENTOS INDEPENDENTES
Dois acontecimentos são independentes se qualquer uma das seguintes
afirmações equivalentes é verdadeira:
i)
ii)
iii)
P(A|B) = P(A)
P(B|A) = P(B)
P(A ∩ B) = P(A)⋅P(B)
P(B) ≠ P(B|A) se forem
Os acontecimentos E 1,E2,...,E n são independentes se para qualquer conjunto
Ei1,Ei2,...,E in
P(E i1 ∩ Ei2 ∩ ... ∩ Ein) = P(E i1)⋅P(Ei2)⋅...⋅P(Ein)
Exercício:
Sendo P(A)>0 e P(B)>0 será possível A e B serem mutuamente e exclusivos ?
Resolução:
1) Se A e B são mutuamente exclusivos ⇒ P(A ∩ B) = 0
2) Se A e B são independentes ⇒ P(A ∩ B) = P(A)⋅P(B)
0
>0
Não podem ser as duas coisas ao mesmo tempo.
TEOREMA DE BAYES
Da definição de Probabilidade Condicional temos que:
P(A∩B) = P(A|B)P(B) = P(B∩A)= P(B|A)P(A)
A partir do segundo e último termo podemos escrever:
P(A|B)=
P(B|A)P(A)
P(B)
com P(B)> 0.
Se P(B) no denominador for escrito usando a regra da probabilidade total,
obtemos o teorema de Bayes:
P(A|B)=
P(B|A)P(A)
P(B|A)P(A)+P(B|A)P(A)
Generalização do teorema de Bayes
Se E1,E2,E3 são k acontecimentos mutuamente exclusivos e exaustivos∗ , então
dado qualquer acontecimento B, tem-se que:
P(E1 | B ) =
P(B|E1 )P(E1 )
P(B|E1 )P(E1 )+P(B|E2 )P(E2 ) + K +P(B|Ek )P(Ek )
Ex. 24
∗
A – O funcionário da loja A
50
BC-
75
100
«
«
«
«
« B
« C
a sua união é todo o espaço amostral
50
50
=
= 0,(2)
50 + 75 + 100 225
P(B)=0,(3)
P( C ) = 1-0,(2)-0,(3)=0,(4)
P(A) =
M – Funcionário é mulher sendo:
P(M|A)=0,5 P(M|B)=0,6
P(M|C)=0,7
P(C)P(M|C)
P(A)P(M|A) + P(B)P(M|B) + P(C)P(M|C)
0,45 ⋅ 0,7
=
= 0,51
0,22 ⋅ 0,5 + 0,33 ⋅ 0,6 + 0,45 ⋅ 0,7
P(C|M) =
VARIÁVEIS ALEATÓRIAS E DISTRIBUIÇÕES DISCRETAS
S= { cara, coroa }
Uma variável aleatória (v.a.) é uma função que atribui um número real a cada
resultado do espaço amostral de uma experiência aleatória.
eα= lançamento de duas moedas
S = { cara cara, cara coroa, coroa cara, coroa coroa }
X = v.a. que representa o nº de vezes que saiu cara.
X (cara cara) = 2
X (cara coroa) = 1
X (coroa cara) = 1
X (coroa coroa) = 0
Uma v.a. diz-se discreta se só assume um número finito ou infinito numerável
de valores discretos.
Exemplos:
•
•
•
nº de peças defeituosas num lote
nº de acidentes no cruzamento de Gambelas por dia
nº de chamadas telefónicas numa central por semana
Uma v.a. diz-se contínua se assume todos os valores dum intervalo (finito ou
infinito) de números reais.
ex: temperaturas, peso, tempo entre chamadas telefónicas sucessivas
A distribuição de probabilidade de um v.a. X é a descrição das
probabilidades associadas com os valores possíveis de X.
Seja X uma v.a. discreta com valores possíveis U1,U2,...,Un. A distribuição de X
é caracterizada pela função massa de probabilidade (fmp) que associa uma
probabilidade a cada valores que a v.a. assume.
f(xi) = P(X= xi)
V.A. discretas
Atendendo à definição de probabilidade:
1) f(xi)≥0
n
2)
∑ f(x) = 1
i
i =1
ex.:
f(2)=P(X=2)=P(coroa coroa)=1/4
f(1)=P(X=1)=P(cara coroa, coroa cara)=1/2
f(0)=P(X=0)=P(coroa coroa)=1/4
x
f(xi)
0
¼
1
½
diagrama de barras
2
¼
Função de distribuição
Um processo alternativo de descrever as probabilidades associadas a uma v.a.
X é utilizando a função distribuição.
Seja X uma v.a. discreta com valores possíveis x1,x2,...,xn. A função distribuição
∑ f ( xi )
da v.a. X representa-se por F(x)=P(X≤x)= xi ≤ x
F(x) satisfaz as seguintes propriedades:
1)
lim F(x) = 0
x→ − ∞
lim F(x) = 1
2) x → + ∞
3) Se x1≤x2, então F(x1) ≤ F(x2) – não decrescente
4) F(x) é contínua e discreta
Dada a função distribuição da v.a. discreta X, podemos obter a respectiva
função massa de probabilidade (f.m.p.).
f(x)=F(x)-F(x -)
Para qualquer função de distribuição F(x), dados dois números reais x1 e x2
com x1<x2, tem-se
P(x1≤X≤x2)=F(x2)-F(x1)
P(X<x)=P(X≤x)-P(X=x)
=F(x)-(F(x)- F(x -)) = F(x -)
x2
x1
x
P(X>x)=1-P(X≤x)=1-F(x)
P(X≥x)=1-P(X<x)=1- F(x -)
P(x1<X<x2)=P(x1<X≤x2)-P(X=x2)
=F(x2)-F(x1)-(F(x2)- F(x2 -)) =F(x2-)- F(x1-)
P(x1≤X≤x2)=P(x1≤X<x2)+P(X=x1)
= F(x2-) - F(x1-)+F(x1)- F(x1-)
= F(x2 -)- F(x1-)
x
f(xi)
0
¼
1
½
2
¼
0
se
x<0
¼
se
0≤x<1
¾
se
1≤x<2
1
se
x≤2
F(0)=P(X≤0)=f(0)= ¼
F(1)=P(X≤1)=f(0)+f(1)= ¼ + ½ = ¾
F(2)=P(X ≤2)=f(0)+f(1)+f(2)= ¼ + ½ + ¼ =1
F(1,5)=P(X≤1,5) = ¾
f(1,5)=0
P(0≤X≤1)=F(1)-F(0 -)= ¾
f(0)+f(1)= ¾
P(0≤X≤1)
=F(1)-F(0 -) = ¾
F(x)
1
2
3
4
F(x)=
FUNÇÕES DE UMA VARIÁVEL ALEATÓRIA DISCRETA
Se X é uma v.a. e h uma aplicação de ¡ em ¡, então y=h(X) é uma v.a. de
distribuição de Y=h(x) é determinada pela transformação h e pela distribuição
de X.
Seja X uma v.a. discreta com valores possíveis x1,x2,...,xn e função massa de
probabilidade (f.m.p.) f(x). Então a f.m.p. de y é dada por:
g(y) = P(Y = y) = P(h(x) = y)
∑
= P({x : h(x) = y}) =
f(x)
x:h(x) = y
x
f(xi)
x
g(x)
-2
-1
0
1
2
1
5
1
4
1
6
1
10
17
60
0
0
0
6
24
0
6
24
37
60
1
10
17
60
y=h(x)=x3+3x2+2x
g(y)= ?
1 1 1 37
g(0)=f(-2)=f(-1)+f(0)= + + =
5 9 6 60
g(6) = f(1) =
1
10
g(24) = f(2) =
17
60
VALOR ESPERADO E VARIÂNCIA DE UMA V.A. DISCRETA
A média ou valor esperado de uma v.a. discreta X, representa-se por E[X] ou
µe
E[X]= µ =
∑ xf(x)
x
De um modo geral, seja h(x) uma função real de X:
E[h(X)] =
∑ h(x)f(x)
x
Com h(x)=(X-E[X])2 obtém-se obtém-se a variância de X e representa-se por
U[X] ou σ2 e
σ
2
2
= U[X] = E[(x-E[x])
]
{
=µ
=∑ [(x-µ ) f(x)] =
∑ [(x 2 − 2xµ + µ 2 )f(x)]
2
x
=
∑x
2
∑x
2
x
=
x
f(x) − 2µ ∑ xf(x) + µ 2 ∑ f(x)
x
x
f(x) − 2µ 2 + µ 2 =
x
=
∑x
2
f(x) − µ 2
x
E[X2 ] − E[X] 2
A raíz quadrada da variância chamamos desvio-padrão e representamos
σ = U[x]
1 2 1
1
+1 ⋅ + 2 = 1
4
2
4
1
1
1
1
U[x] = (0 2 ⋅ + 1 2⋅ + 2 2⋅ ) − 12 =
4
2
4
2
µ =
E[x] = 0 ⋅
Se X é uma v.a. e a, b e c constante então:
1)
2)
3)
4)
E[c] = c
E[x-µ]=0
E[cX]=cE[X]
E[h(X)+h’(X)] = E[h(X)]+E[h’(X)]
Demonstrações das propriedades anteriores:
1)
E[c] =
∑ cf(x) = c∑ f(x) = c
x
2)
x
E[x- µ ]= ∑ | x − µ |f(x) =
x
3)
x
x
E[cX]= ∑ cxf(x) = c∑ xf(x) = cE[X]
x
4)
∑ xf(x) − µ ∑ f(x) = µ − µ = 0
x
E[h(X)+h′ (X)] =
′
∑ [h(x)+h′ (x)]f(x)= ∑ h(x)f(x)+∑ h(x)f(x)
x
x
=
5)
E[h(X)] + E[h'(X)]
E[aX + b] = E[aX]
+ E[b] = aE[x] + b
{
{
{
(4)
(3)
(1)
x
6)
V[aX+b] = E[((aX+b)-E[aX+b])2] = E[aX+b – aE[X]-b] = E[(aX-aE[X])2]
= E[a 2(X-E[X])2]=a2E[(X-E[X])2]=a2V[X]
Download