E Entende endo o T Teorema a de Bay yes

Propaganda
Entende
E
endo o Teorema
T
a de Bayyes
Vamos
V
ver e
este assuntto por meio de um exem
mplo:
A cidade de
e Diabetelân
ndia tem 10.000 habita
antes, sendo
o 4.400 velh
hos, 3.300 jjovens, 2.300 criançass. Os
dados
d
mosttram que nesta
n
cidad
de está havvendo uma
a desertifica
ação urbanna em virtu
ude da falta
a de
empregos.
e
Foi
F realizad
da uma pessquisa pela Secretaria
a de Saúde
e onde se constatou
c
uuma grande
e incidência
a de
diabetes
d
na população
o. A pesquis
sa revelou que 132 ve
elhos são portadores
p
dda doença,, 33 jovenss são
portadores
p
e 46 criança
as são porta
adoras. Asssim:
Diaabetelând
dia
e vermelh
hos
Os valores em
d
sãoo os habitantes das
cattegorias que não são
s
porrtadores de diabetes.
Portadores Haabitantes de Diabete
132
V
Velhos
4.400
33
3.300
J
Jovens
46
Crianças
C
2.300
211
10.000
T
TOTAL
Muitas
M
veze
es esta tabe
ela vem dada em porce
entagens. Assim:
A
Observve que os velhos
v
E po
ortadores dde diabetes
s: P(velhos 
portad ores de diiabetes) representam 1,32% da população da
2 ou 1,32%
%).
Portadores de cidade Diabetelândia (132  10.000 = 0,0132
Portant
idade
a
pro
to,
nesta
c
obabilidade
e
(ou
chanc
ce)
de
cheg
gar
D
Diabete na ao hos pital um ve
elho E porta
ador de diaabetes é 1,3
32%! É pou
uco
população
prováve
el aos méd
dicos do hospital atendder um velh
ho E portad
dor
ao
de
dia
abetes
entr
re
os
paci
entes
em
geral
que
e
chegam
2%
1,32
hospita
al.
0,33
3%
0,46
6%
2,11
1%
Diiabetelân
ndia
Haabitantes
Velhos
V
J
Jovens
C
Crianças
T
TOTAL
44,00%
33,00%
23,00%
100,00%
Porém,
P
quando chega ao hospital um velho (um pedaç
ço da popullação), a chhance dele ser diabético é
dividindo-sse 132 porr 4.400 (13
encontrada
e
32  4.400 = 0,03 ou
u 3%). A cchance aumentou po
orque
re
estringimoss o atendimento apena
as aos velho
os.
Matematicam
M
mente escrrevemos estta probabili dade COND
DICIONAL (ser portadoor de diabe
etes E velho
o) da
seguinte
s
ma
aneira: P(X|V). Aqui X significa
s
se r diabético e V significa
a ser velho . Dizemos, a probabilid
dade
P de ser dia
abético dado
o que seja velho.
v
Note
N
que alé
ém de ser velho,
v
tem que
q ser dia
abético (coittado!). Isto mostra quee colocamos
s uma cond
dição
entre
e
os velhos. Lemb
bre-se que nesta cida de existem
m muitos ve
elhos que nnão são dia
abéticos. Esstes,
como
c
mostra
a a figura acima
a
totaliz
zam 4.400 – 132 = 4.26
68 velhos sem a doençça.
Como
C
vimoss esta proba
abilidade fo
oi calculada tomando to
odos os velhos E diabééticos (132)) que estão no
conjunto
c
inte
erseção [Ve
elho  Diab
béticos] e di vidido pela quantidade
e de velhos da cidade (4.400). Então,
|
∩
132
4.4
400
0,03
3%.
Lembrem-se
L
e que, os eventos
e
serr velho e se
er diabético
o são INDE
EPENDENT
TES. Isto significa que
e ser
velho
v
não precisa ser diabético
d
e ser diabéticco não prec
cisa ser velho ou, em outras pala
avras, nem todo
velho
v
é diab
bético e nem
m todo diabé
ético é velh
ho.
A expressão
o acima pod
deria ser ca
alculada de outra mane
eira:
2
Entendendo o Teorema de Bayes
|
∩
∩
∩
1,32%
44%
0,03
3%.
Repetindo isto para as outras categorias podemos montar a seguinte tabela:
Diabetelândia
Habitantes
Velhos
Jovens
Crianças
TOTAL
44,00%
33,00%
23,00%
100,00%
Portadores de Diabetes na categoria P(X|Ai)
3,00%
1,00%
2,00%
2,11%
Cabe aqui a pergunta:
Qual a probabilidade de um velho ser diabético?
Resposta: 3%. Esta é a chance de aparecer em qualquer lugar da cidade um velho que é diabético.
Não precisa ter medo deles!!!! A chance é pequena e a doença não infecto-contagiosa!
Esta pergunta requer que encontremos P(X|V), certo?
Outra pergunta: Qual a probabilidade de um diabético ser velho?
É a mesma coisa que antes? 3%?
Posto de outra forma, chega ao hospital um diabético, qual a chance dele ser velho?
Agora queremos a probabilidade condicional P(V|X), ou seja, o contrário de antes. Imporemos agora
uma CONDIÇÃO entre todos os diabéticos – eles devem ser velhos. Observando a figura anterior,
temos que dividir nº de velhos diabéticos pelo total de diabéticos
|
∩
∩
∩
1,32%
2,11%
0,6256
62,56%.
Se atentarmos para os diabéticos da cidade, a chance dele ser velho é 62,56%. É, nesta cidade, entre
os diabéticos temos muitos velhos (ver figura acima).
Médicos, ao chegar um paciente
diabético, é muito grande (62,56%)
dele ser velho.
Diabetelândia
Habitantes
Velhos
Jovens
Crianças
TOTAL
44,00%
33,00%
23,00%
100,00%
Portadores de A Categoria dos Diabetes na categoria Portadores de P(X|Ai)
Diabetes P(Ai|X)
3,00%
62,56%
1,00%
15,64%
2,00%
21,80%
2,11%
100,00%
Fica bem claro que:
I.
II.
III.
P(X | Ai) ≠ P(Ai | X)
P(X  Ai) = P(A i X)
Pela definição de probabilidade condicional
|
∩
Bertolo
Entendendo o Teorema de Bayes
Temos que: P(X  Ai) = P(X|Ai) P(Ai).
Dessa forma podemos fazer:
∩
|
3
∩
∩
∩
⋯
∩
Ou, usando a definição de probabilidade condicional:
|
∩
P X|A P A
P X|A P A
P X|A P A
⋯
P X|A P A
∑
∩
P X|A P A
Este resultado recebe o nome de Teorema de Bayes.
USANDO TABELA
De acordo com o desenvolvimento anterior poderemos realizar os cálculos por meio de uma tabela.
Assim
Espaço Amostral
Participação da Partição do Partição no Espaço Espaço Amostral Amostral Ai
P(Ai)
P(X|Ai) conhecido
P(X  Ai) = P(X|Ai).P(Ai)
P(Ai|X)
A1
P(A1)
P(X|A1)
P(A1) * P(X|A1)
[P(A1) * P(X|A1)]/SOMA
A2
P(A2)
P(X|A2)
P(A2) * P(X|A2)
[P(A2) * P(X|A2)]/SOMA
A3
...
...
...
An
TOTAL
P(A3)
P(X|A3)
P(A3) * P(X|A3)
[P(A3) * P(X|A3)]/SOMA
P(An)
100,00%
P(X|An)
P(An) * P(X|An)
SOMA
[P(An) * P(X|An)]/SOMA
USANDO O EXCEL
Já que podemos fazer uma tabela, podemos também realizar tudo no Excel.
Abra uma pasta de trabalho e introduza os títulos conforme a figura abaixo:
Bertolo
4
Ente
endendo o Teorema
T
de
e Bayes
Faça
F
100 pa
artições do espaço amostral (acho
o que fica o suficiente, não?). Com
m isso precisamos
selecionar
s
o intervalo A2:A101
A
e colocar
c
os tíítulos Ai.
Para
P
criarmo
os uma plan
nilha com re
ecursos ava
ançados do
o Excel, vam
mos definir uum nome ao intervalo de
células
c
onde
e existirem valores, deixando o re
esto das células em bra
anco, evitanndo assim colunas
c
com
m
ZEROS
Z
dessnecessários, pois não faremos cá
álculos naquelas linhas
s.
Para
P
se nom
mear um intervalo de células no E
Excel, procedemos sele
ecionando o intervalo de
d células
G2:G101,
G
de
epois na gu
uia Formata
ar, no grupo
o Nomes De
efinidos, esc
colhemos D
Definir Nome
e. Aparecerrá a
ja
anela:
Na
N caixa No
ome: ProbIn
nterseção
Na
N
ccaixa
e
a:
intrroduza
a
Refere-se
=DESLOC(P
=
PLAN1!$G$
$2;0;0;CONT.NÚM(Pla
an1!$G$2:$G
G$101;1)). Dê OK.
seguinte
fórm
mula:
Selecione
S
o intervalo G2:G101 e escolha a cor bran
nca para a fonte. Issoo para não poluir a no
ossa
disto para evitarmos as
planilha
p
com
m dados e precisamos
p
a referencias circularees do Excel ao introdu
uzir a
fu
unção SOM
MA na célula
a D101..
Vamos
V
ente
ender o que fizemos. Primeiro, porr que usar a função DE
ESLOC?
Bertolo
o
Entendendo o Teorema de Bayes
5
Esta função embutida do Excel retorna uma referência a um intervalo que possui um número específico
de linhas e colunas com base em um referência especificada (no nosso caso se houver número e a
existência ou não de números é identificado com a função CONT.NÚM que falaremos abaixo). A sintaxe
da função DESLOC é: =DESLOC(ref;Lins;cols;altura;largura). Os argumentos em negrito são
obrigatórios e os outros são opcionais.
A função CONT.NÚM calcula o nº de células em um intervalo que contém números. Sua sintaxe é:
CONT.NÚM(valor1;valor2;....). Novamente os argumentos em negrito são obrigatórios. Aqui usamos
valor2 = 1, para não retornar zero quando não encontrar número e com isso causando um erro de
altura na função DESLOC.
Dessa forma a função DESLOC nomeará o intervalo na coluna G que tiver números e com isso não
serão introduzidos zeros quando a célula estiver em branco na coluna D que apresenta a fórmula
SOMA(DADOS) na célula D101.
Voltemos à célula D2 e introduzimos a fórmula: =SE(B2=””;””;B2*C2) e na célula E2, introduzimos:
=SE(D2=””;””;D2/$D$102).
A planilha ficou pronta. Agora é só salvar e guardar com carinho para quando precisar.
DIAGRAMA DE ÁRVORE
O diagrama de árvore ajuda a montar o problema e fazer as contas.
Voltemos à cidade Diabetelândia e vemos que lembremos que a população foi dividida em 3 categorias
de habitantes (velhos, jovens e crianças). Algumas das pessoas de cada categoria eram portadoras de
diabetes.
Então, estabelecendo que X é portador e
Bertolo
não é portador, temos
6
Entendendo o Teorema de Bayes
0,0132
0,0211
X 0,44 x 0,03 = 0,0132 ou 1,32%
0,6256
62,56%
0,1564
15,64%
3%
V
97%
44%
X 0,33 x 0,01 = 0,0033 ou 0,33%
0,0033
0,0211
1%
33%
J
99%
23%
X 0,23 x 0,02 = 0,0046 ou 0,46%
2%
0,0046
0,0211
0,2180
21,80%
______________
C
0,0211 ou 2,11%
98%
EXERCÍCIOS RESOLVIDOS
1. Uma urna A contém 3 fichas vermelhas e 2 azuis, e uma urna B contém 2 vermelhas e 8 azuis. Jogase uma moeda “honesta”. Se a moeda der cara, extrai-se uma ficha da urna A; se der coroa, extraise uma ficha da urna B. Uma ficha vermelha é extraída.
Qual a probabilidade de ter saído cara no lançamento da moeda?
Solução
A
B
3V
2V
2A
8A
Queremos encontrar a probabilidade de sair cara
dado a bola ser vermelha, isto é P(Ca|V)
P(A) = P(Ca) = (1/2)
P(V|A) = (3/5) = 60% = P(V|Ca)
P(B) = P(Co) = (1/2)
P(V|B) = (2/10)= 40% = P(V|Co)
Pelo Teorema de Bayes, temos
|
∩
P X|A P A
P X|A P A
P X|A P A
⋯
P X|A P A
∑
∩
P X|A P A
Bertolo
endo o Teorrema de Ba
ayes
Entende
|
∩
∩
3 20
10
0 8
P V|A P A
P V|A P A
P V|B
V P B
60
0
80
3
4
0,75
5
3 1
5 2
3 1 2 1
5 2 10 2
3
10
3
0
10
7
2
20
6
3
10
20
2
75%
Temos, p
portanto, 75% de probabilid
dade de qu
ue a bola vermelha seja extr
raída da urna
u
A por te
er obtido cara no lançamento
l
o da moeda
a.
Na plani
ilha Excel
l, preench
ha apenas a área az
zul:
Faça o e
exercício usando a árvore.
2.
2 A caixa A tem 9 carttas numerad
das de 1 a 9
9. A caixa B tem 5 carttas numeraddas de 1 a 5. Uma caixa é
escolhida ao acaso e uma carta é retirada. Se
e o número é par , qual a probabiliddade de que a carta sortteada
tenha vind
do de A?
Solução
A
1234
5678
9
B
1234
5
Queremos
s encontr
rar a prob
babilidad
de da car
rta vir
da urna A dado que
q
o seu número é par, is
sto é
P(A|par) .
P(A) = (
(1/2)
) = (4/9)=
= 44,44%
P(par|A)
P(B) = (
(1/2)
P(par|B)
) = (2/5)=
= 40%
Pelo Teo
orema de Bayes,
B
tem
mos
|
|
∩
P X|A P A
∩
4
18
P X|A P A
P X|A P A
40 36
4
180
∩
de
40
7
76
10
19
proba
abilidade
0,5263
de
Na plani
ilha Excel
l, preench
ha apenas a área az
zul:
Bertolo
P X|A P A
P par|A P A
P par|A P A
P par|B P B
4 180
76
18
1
Temos, portanto,
, 52,63%
extraída
a da urna A.
⋯
∑
∩
P X|A P A
4 1
9 2
4 1 2 1
9 2 5 2
4
18
4
18
2
10
5
52,63%
que a
carta
de
núme
ero
par
s
seja
8
Ente
endendo o Teorema
T
de
e Bayes
3.
3 Num colégio, 4% doss homens e 1% das mu
ulheres têm mais de 1,75 m de altu ra. 60% dos
s estudantess são
mulheres. Um estuda
ante é escollhido ao aca
aso e tem mais
m
de 1,75
5 m. Qual a probabilida
ade de que seja
homem?
Solução
er mais de
e 1,75 m d
de altura.
.
A = evento te
P(M) = 6
60%
P
P(A|M)
= 1%
1
P(H) = 4
40%
P
P(A|H)
= 4%
4
Quer
remos P(H|
|A)
Pelo Teo
orema de Bayes,
B
tem
mos
∩
|
∩
|
P X|A P A
∩
0,016
6
0,022
2
8
11
P X|A P A
P X|A P A
⋯
P A |H P H
P A|H P H
P A|M P M
0,7273
P X|A P A
∑
0,04 0,440
0,0
04 0,40 0,,01 0,60
∩
P X|A P A
0,016
006
0,016 0,0
72 ,73%
Temos, p
portanto, 72,73% de
d probabi
ilidade de
e que o es
studante c
com mais de 1,75 m de
escolhido ao acaso
altura e
o seja ho
omem. Embo
ora o colégio tenh
ha mais mulher
m
do que
homem, h
há mais ho
omens com altura su
uperior a 1,75 m do
o que mulh
heres.
Na plani
ilha Excel
l, preench
ha apenas a área az
zul:
4.
4 Uma caixxa tem 3 mo
oedas: uma não viciada
a, outra com
m 2 caras e uma terceeira viciada, de modo que a
probabilidade de ocorrrer cara nes
sta moeda é 1/5. Uma moeda
m
é selecionada aoo acaso na caixa. Saiu cara.
obabilidade de
d que a 3ª moeda
m
tenha
a sido a selec
cionada?
Qual a pro
Solução
A = primeira moeda,
m
B = segunda moeda,
C = terceira moeda
Bertolo
o
Entende
endo o Teorrema de Ba
ayes
P(A) = 1
1/3
P
P(Ca|A)
= 50% ou 1/
/2
P(B) = 1
1/3
P
P(Ca|B)
= 100% ou 1
P(C) = 1
1/3
P
P(Ca|C)
= 20% ou 1/
/5
9
Querem
mos P(C|Ca
a)
Pelo Teo
orema de Bayes,
B
tem
mos
∩
|
∩
|
P X|A P A
P X|A P A
P X|A P A
∩
P Ca|A P A
0,20 1/3
1
1
1
1
0,,20
3
3
3
0,5
50
⋯
P X|A P A
∑
P Ca|C
C
P C
P Ca|B
C
P B
P Ca|C P C
0,20
0,20
2
0,5
50 1 0,2
20 1,70 17
∩
P X|A P A
0,117
76
11,76%
%
Temos, p
portanto, 11,76% de
d probabi
ilidade de
e que a face cara seja apre
esentada pela
p
3ª moeda
a quando esta
e
for escolhida
e
ao acaso.
.
Na plani
ilha Excel
l, preench
ha apenas a área az
zul:
5.
5 A probabilidade de um
m indivíduo de classe A comprar um
m carro de 3/4,
3 da B é dde 1/5 e da C é de 1/20
0. As
probabilidades se os indivíduos co
omprarem um
m carro da marca
m
x são 1/10, 3/5 e 33/10, dado qu
ue sejam de A, B
e C, respectivamente. Certa loja vendeu um carro da ma
arca x. Qual a probabili dade de que
e i indivíduo
o que
comprou sseja da classse B?
Solução
A = classe A,
,
B = classe B,
C = classe C
P(A) = 3
3/4
P
P(car|A)
= 1/10
P(B) = 1
1/5
P
P(car|B)
= 3/5
P(C) = 1
1/20
P
P(car|C)
= 3/10
Qu
ueremos P(
(B|car)
Pelo Teo
orema de Bayes,
B
tem
mos
∩
|
|
Bertolo
∩
P X|A P A
P X|A P A
P X|A P A
∩
⋯
P X|A P A
∑
∩
P X|A P A
P car|B P B
P car|B P B
P car|A P A
3 1
3
5
5
25
3
3
3
1 3 3 1 3 1
40 25 200
10 4 5 5 10 20
0,5714 57,14%
P car|C P C
3
3 200
2
25
15 24 3 25 42
200
4
7
10
Ente
endendo o Teorema
T
de
e Bayes
Temos, portanto, 57,14% de proba
abilidade de que o carro
indivídu
uo da clas
sse B.
foi comp
prado por
r um
Na plani
ilha Excel
l, preench
ha apenas a área az
zul:
6.
6 Um certo programa pode
p
ser usado com um
ma entre duas sub-rotinas A e B, ddependendo do problem
ma. A
experiência tem mosttrado que a sub-rotina A é usada 40
0% das veze
es e B é usaada 60% da
as vezes. Se
eAé
usada, exxiste 75% de
e chance de que o progrrama chegue a um resu
ultado dentroo do limite de tempo. Se
eBé
usada, a cchance é de
e 50%. Se o programa fo
oi realizado dentro
d
do lim
mite de tempoo. Se B é us
sada, a chan
nce é
de 50%. S
Se o programa foi realiz
zado dentro do limite de
e tempo, qua
al a probabillidade de qu
ue a sub-rotina A
tenha sido
o a escolhida
a?
Solução
40%
P(A) = 4
P
P(resultad
do|A) = 75
5%
P(B) = 6
60%
P
P(resultad
do|B) = 50
0%
Quere
emos P(A|r
resultado).
Pelo Teo
orema de Bayes,
B
tem
mos
|
∩
P X|A P A
P X|A P A
P X|A P A
∩
|
0,75 0,40
0,75
5 0,40 0,5
50 0,60
∩
0,30
0
0,30 0,30
⋯
P X|A P A
∑
∩
P X|A P A
P resuultado|A P A
P ressultado|A P A
P resultado|B P B
0,30 1
0,5000 50,00%
0,60 2
Temos, p
portanto, 50,00% de
e probabi lidade de
e que o re
esultado f
foi atingi
ido dentro
o do
limite u
usando a sub-rotina
s
a A.
Na plani
ilha Excel
l, preench
ha apenas a área az
zul:
Bertolo
o
Entendendo o Teorema de Bayes
11
7. A urna X contém 2 bolas azuis, 2 brancas e 1 cinza, e a urna Y contém 2 bolas azuis, 1 branca e 1 cinza.
Retira-se uma bola de cada urna. Calcule a probabilidade de saírem 2 bolas brancas sabendo-se que são
bolas de mesma cor?
Solução
X
Y
2 A
2
A
2 B
1
B
1 C
1
C
Após retirar uma bola de cada urna queremos
saber P(B  B|mesma cor).
A cor da bola que sai da segunda urna não é influenciada pela cor da bola que saiu
da primeira urna, isto é os eventos são independentes.
P(mesma cor) = P(BB) + P(AA) + P(C  C)= P(B).P(B) + P(A).P(A) +
P(C).P(C) = (2/5)(1/4) + (2/5)(2/4) + (1/5)(1/4) = (2/20)+(4/20)+(1/20) =
(7/20) = 0,35 ou 35%
Agora
P BB|mesmacor
Bertolo
∩
12
Entendendo o Teorema de Bayes
,
X 0,44 x 0,03 = 0,0132 ou 1,32%
,
0,6256
62,56%
0,1564
15,64%
3%
V
97%
44%
X 0,33 x 0,01 = 0,0033 ou 0,33%
,
,
1%
33%
J
99%
23%
Bertolo
Entendendo o Teorema de Bayes
X 0,23 x 0,02 = 0,0046 ou 0,46%
2%
C
______________
0,0211 ou 2,11%
98%
Jovens
Velhos
3.300 =
4.400 =
4.268 +
132
132
33
3.267 + 33
46
Crianças 2.300 = 2.254 + 46
Bertolo
,
,
0,2180
13
21,80%
Download