Entende E endo o Teorema T a de Bayyes Vamos V ver e este assuntto por meio de um exem mplo: A cidade de e Diabetelân ndia tem 10.000 habita antes, sendo o 4.400 velh hos, 3.300 jjovens, 2.300 criançass. Os dados d mosttram que nesta n cidad de está havvendo uma a desertifica ação urbanna em virtu ude da falta a de empregos. e Foi F realizad da uma pessquisa pela Secretaria a de Saúde e onde se constatou c uuma grande e incidência a de diabetes d na população o. A pesquis sa revelou que 132 ve elhos são portadores p dda doença,, 33 jovenss são portadores p e 46 criança as são porta adoras. Asssim: Diaabetelând dia e vermelh hos Os valores em d sãoo os habitantes das cattegorias que não são s porrtadores de diabetes. Portadores Haabitantes de Diabete 132 V Velhos 4.400 33 3.300 J Jovens 46 Crianças C 2.300 211 10.000 T TOTAL Muitas M veze es esta tabe ela vem dada em porce entagens. Assim: A Observve que os velhos v E po ortadores dde diabetes s: P(velhos portad ores de diiabetes) representam 1,32% da população da 2 ou 1,32% %). Portadores de cidade Diabetelândia (132 10.000 = 0,0132 Portant idade a pro to, nesta c obabilidade e (ou chanc ce) de cheg gar D Diabete na ao hos pital um ve elho E porta ador de diaabetes é 1,3 32%! É pou uco população prováve el aos méd dicos do hospital atendder um velh ho E portad dor ao de dia abetes entr re os paci entes em geral que e chegam 2% 1,32 hospita al. 0,33 3% 0,46 6% 2,11 1% Diiabetelân ndia Haabitantes Velhos V J Jovens C Crianças T TOTAL 44,00% 33,00% 23,00% 100,00% Porém, P quando chega ao hospital um velho (um pedaç ço da popullação), a chhance dele ser diabético é dividindo-sse 132 porr 4.400 (13 encontrada e 32 4.400 = 0,03 ou u 3%). A cchance aumentou po orque re estringimoss o atendimento apena as aos velho os. Matematicam M mente escrrevemos estta probabili dade COND DICIONAL (ser portadoor de diabe etes E velho o) da seguinte s ma aneira: P(X|V). Aqui X significa s se r diabético e V significa a ser velho . Dizemos, a probabilid dade P de ser dia abético dado o que seja velho. v Note N que alé ém de ser velho, v tem que q ser dia abético (coittado!). Isto mostra quee colocamos s uma cond dição entre e os velhos. Lemb bre-se que nesta cida de existem m muitos ve elhos que nnão são dia abéticos. Esstes, como c mostra a a figura acima a totaliz zam 4.400 – 132 = 4.26 68 velhos sem a doençça. Como C vimoss esta proba abilidade fo oi calculada tomando to odos os velhos E diabééticos (132)) que estão no conjunto c inte erseção [Ve elho Diab béticos] e di vidido pela quantidade e de velhos da cidade (4.400). Então, | ∩ 132 4.4 400 0,03 3%. Lembrem-se L e que, os eventos e serr velho e se er diabético o são INDE EPENDENT TES. Isto significa que e ser velho v não precisa ser diabético d e ser diabéticco não prec cisa ser velho ou, em outras pala avras, nem todo velho v é diab bético e nem m todo diabé ético é velh ho. A expressão o acima pod deria ser ca alculada de outra mane eira: 2 Entendendo o Teorema de Bayes | ∩ ∩ ∩ 1,32% 44% 0,03 3%. Repetindo isto para as outras categorias podemos montar a seguinte tabela: Diabetelândia Habitantes Velhos Jovens Crianças TOTAL 44,00% 33,00% 23,00% 100,00% Portadores de Diabetes na categoria P(X|Ai) 3,00% 1,00% 2,00% 2,11% Cabe aqui a pergunta: Qual a probabilidade de um velho ser diabético? Resposta: 3%. Esta é a chance de aparecer em qualquer lugar da cidade um velho que é diabético. Não precisa ter medo deles!!!! A chance é pequena e a doença não infecto-contagiosa! Esta pergunta requer que encontremos P(X|V), certo? Outra pergunta: Qual a probabilidade de um diabético ser velho? É a mesma coisa que antes? 3%? Posto de outra forma, chega ao hospital um diabético, qual a chance dele ser velho? Agora queremos a probabilidade condicional P(V|X), ou seja, o contrário de antes. Imporemos agora uma CONDIÇÃO entre todos os diabéticos – eles devem ser velhos. Observando a figura anterior, temos que dividir nº de velhos diabéticos pelo total de diabéticos | ∩ ∩ ∩ 1,32% 2,11% 0,6256 62,56%. Se atentarmos para os diabéticos da cidade, a chance dele ser velho é 62,56%. É, nesta cidade, entre os diabéticos temos muitos velhos (ver figura acima). Médicos, ao chegar um paciente diabético, é muito grande (62,56%) dele ser velho. Diabetelândia Habitantes Velhos Jovens Crianças TOTAL 44,00% 33,00% 23,00% 100,00% Portadores de A Categoria dos Diabetes na categoria Portadores de P(X|Ai) Diabetes P(Ai|X) 3,00% 62,56% 1,00% 15,64% 2,00% 21,80% 2,11% 100,00% Fica bem claro que: I. II. III. P(X | Ai) ≠ P(Ai | X) P(X Ai) = P(A i X) Pela definição de probabilidade condicional | ∩ Bertolo Entendendo o Teorema de Bayes Temos que: P(X Ai) = P(X|Ai) P(Ai). Dessa forma podemos fazer: ∩ | 3 ∩ ∩ ∩ ⋯ ∩ Ou, usando a definição de probabilidade condicional: | ∩ P X|A P A P X|A P A P X|A P A ⋯ P X|A P A ∑ ∩ P X|A P A Este resultado recebe o nome de Teorema de Bayes. USANDO TABELA De acordo com o desenvolvimento anterior poderemos realizar os cálculos por meio de uma tabela. Assim Espaço Amostral Participação da Partição do Partição no Espaço Espaço Amostral Amostral Ai P(Ai) P(X|Ai) conhecido P(X Ai) = P(X|Ai).P(Ai) P(Ai|X) A1 P(A1) P(X|A1) P(A1) * P(X|A1) [P(A1) * P(X|A1)]/SOMA A2 P(A2) P(X|A2) P(A2) * P(X|A2) [P(A2) * P(X|A2)]/SOMA A3 ... ... ... An TOTAL P(A3) P(X|A3) P(A3) * P(X|A3) [P(A3) * P(X|A3)]/SOMA P(An) 100,00% P(X|An) P(An) * P(X|An) SOMA [P(An) * P(X|An)]/SOMA USANDO O EXCEL Já que podemos fazer uma tabela, podemos também realizar tudo no Excel. Abra uma pasta de trabalho e introduza os títulos conforme a figura abaixo: Bertolo 4 Ente endendo o Teorema T de e Bayes Faça F 100 pa artições do espaço amostral (acho o que fica o suficiente, não?). Com m isso precisamos selecionar s o intervalo A2:A101 A e colocar c os tíítulos Ai. Para P criarmo os uma plan nilha com re ecursos ava ançados do o Excel, vam mos definir uum nome ao intervalo de células c onde e existirem valores, deixando o re esto das células em bra anco, evitanndo assim colunas c com m ZEROS Z dessnecessários, pois não faremos cá álculos naquelas linhas s. Para P se nom mear um intervalo de células no E Excel, procedemos sele ecionando o intervalo de d células G2:G101, G de epois na gu uia Formata ar, no grupo o Nomes De efinidos, esc colhemos D Definir Nome e. Aparecerrá a ja anela: Na N caixa No ome: ProbIn nterseção Na N ccaixa e a: intrroduza a Refere-se =DESLOC(P = PLAN1!$G$ $2;0;0;CONT.NÚM(Pla an1!$G$2:$G G$101;1)). Dê OK. seguinte fórm mula: Selecione S o intervalo G2:G101 e escolha a cor bran nca para a fonte. Issoo para não poluir a no ossa disto para evitarmos as planilha p com m dados e precisamos p a referencias circularees do Excel ao introdu uzir a fu unção SOM MA na célula a D101.. Vamos V ente ender o que fizemos. Primeiro, porr que usar a função DE ESLOC? Bertolo o Entendendo o Teorema de Bayes 5 Esta função embutida do Excel retorna uma referência a um intervalo que possui um número específico de linhas e colunas com base em um referência especificada (no nosso caso se houver número e a existência ou não de números é identificado com a função CONT.NÚM que falaremos abaixo). A sintaxe da função DESLOC é: =DESLOC(ref;Lins;cols;altura;largura). Os argumentos em negrito são obrigatórios e os outros são opcionais. A função CONT.NÚM calcula o nº de células em um intervalo que contém números. Sua sintaxe é: CONT.NÚM(valor1;valor2;....). Novamente os argumentos em negrito são obrigatórios. Aqui usamos valor2 = 1, para não retornar zero quando não encontrar número e com isso causando um erro de altura na função DESLOC. Dessa forma a função DESLOC nomeará o intervalo na coluna G que tiver números e com isso não serão introduzidos zeros quando a célula estiver em branco na coluna D que apresenta a fórmula SOMA(DADOS) na célula D101. Voltemos à célula D2 e introduzimos a fórmula: =SE(B2=””;””;B2*C2) e na célula E2, introduzimos: =SE(D2=””;””;D2/$D$102). A planilha ficou pronta. Agora é só salvar e guardar com carinho para quando precisar. DIAGRAMA DE ÁRVORE O diagrama de árvore ajuda a montar o problema e fazer as contas. Voltemos à cidade Diabetelândia e vemos que lembremos que a população foi dividida em 3 categorias de habitantes (velhos, jovens e crianças). Algumas das pessoas de cada categoria eram portadoras de diabetes. Então, estabelecendo que X é portador e Bertolo não é portador, temos 6 Entendendo o Teorema de Bayes 0,0132 0,0211 X 0,44 x 0,03 = 0,0132 ou 1,32% 0,6256 62,56% 0,1564 15,64% 3% V 97% 44% X 0,33 x 0,01 = 0,0033 ou 0,33% 0,0033 0,0211 1% 33% J 99% 23% X 0,23 x 0,02 = 0,0046 ou 0,46% 2% 0,0046 0,0211 0,2180 21,80% ______________ C 0,0211 ou 2,11% 98% EXERCÍCIOS RESOLVIDOS 1. Uma urna A contém 3 fichas vermelhas e 2 azuis, e uma urna B contém 2 vermelhas e 8 azuis. Jogase uma moeda “honesta”. Se a moeda der cara, extrai-se uma ficha da urna A; se der coroa, extraise uma ficha da urna B. Uma ficha vermelha é extraída. Qual a probabilidade de ter saído cara no lançamento da moeda? Solução A B 3V 2V 2A 8A Queremos encontrar a probabilidade de sair cara dado a bola ser vermelha, isto é P(Ca|V) P(A) = P(Ca) = (1/2) P(V|A) = (3/5) = 60% = P(V|Ca) P(B) = P(Co) = (1/2) P(V|B) = (2/10)= 40% = P(V|Co) Pelo Teorema de Bayes, temos | ∩ P X|A P A P X|A P A P X|A P A ⋯ P X|A P A ∑ ∩ P X|A P A Bertolo endo o Teorrema de Ba ayes Entende | ∩ ∩ 3 20 10 0 8 P V|A P A P V|A P A P V|B V P B 60 0 80 3 4 0,75 5 3 1 5 2 3 1 2 1 5 2 10 2 3 10 3 0 10 7 2 20 6 3 10 20 2 75% Temos, p portanto, 75% de probabilid dade de qu ue a bola vermelha seja extr raída da urna u A por te er obtido cara no lançamento l o da moeda a. Na plani ilha Excel l, preench ha apenas a área az zul: Faça o e exercício usando a árvore. 2. 2 A caixa A tem 9 carttas numerad das de 1 a 9 9. A caixa B tem 5 carttas numeraddas de 1 a 5. Uma caixa é escolhida ao acaso e uma carta é retirada. Se e o número é par , qual a probabiliddade de que a carta sortteada tenha vind do de A? Solução A 1234 5678 9 B 1234 5 Queremos s encontr rar a prob babilidad de da car rta vir da urna A dado que q o seu número é par, is sto é P(A|par) . P(A) = ( (1/2) ) = (4/9)= = 44,44% P(par|A) P(B) = ( (1/2) P(par|B) ) = (2/5)= = 40% Pelo Teo orema de Bayes, B tem mos | | ∩ P X|A P A ∩ 4 18 P X|A P A P X|A P A 40 36 4 180 ∩ de 40 7 76 10 19 proba abilidade 0,5263 de Na plani ilha Excel l, preench ha apenas a área az zul: Bertolo P X|A P A P par|A P A P par|A P A P par|B P B 4 180 76 18 1 Temos, portanto, , 52,63% extraída a da urna A. ⋯ ∑ ∩ P X|A P A 4 1 9 2 4 1 2 1 9 2 5 2 4 18 4 18 2 10 5 52,63% que a carta de núme ero par s seja 8 Ente endendo o Teorema T de e Bayes 3. 3 Num colégio, 4% doss homens e 1% das mu ulheres têm mais de 1,75 m de altu ra. 60% dos s estudantess são mulheres. Um estuda ante é escollhido ao aca aso e tem mais m de 1,75 5 m. Qual a probabilida ade de que seja homem? Solução er mais de e 1,75 m d de altura. . A = evento te P(M) = 6 60% P P(A|M) = 1% 1 P(H) = 4 40% P P(A|H) = 4% 4 Quer remos P(H| |A) Pelo Teo orema de Bayes, B tem mos ∩ | ∩ | P X|A P A ∩ 0,016 6 0,022 2 8 11 P X|A P A P X|A P A ⋯ P A |H P H P A|H P H P A|M P M 0,7273 P X|A P A ∑ 0,04 0,440 0,0 04 0,40 0,,01 0,60 ∩ P X|A P A 0,016 006 0,016 0,0 72 ,73% Temos, p portanto, 72,73% de d probabi ilidade de e que o es studante c com mais de 1,75 m de escolhido ao acaso altura e o seja ho omem. Embo ora o colégio tenh ha mais mulher m do que homem, h há mais ho omens com altura su uperior a 1,75 m do o que mulh heres. Na plani ilha Excel l, preench ha apenas a área az zul: 4. 4 Uma caixxa tem 3 mo oedas: uma não viciada a, outra com m 2 caras e uma terceeira viciada, de modo que a probabilidade de ocorrrer cara nes sta moeda é 1/5. Uma moeda m é selecionada aoo acaso na caixa. Saiu cara. obabilidade de d que a 3ª moeda m tenha a sido a selec cionada? Qual a pro Solução A = primeira moeda, m B = segunda moeda, C = terceira moeda Bertolo o Entende endo o Teorrema de Ba ayes P(A) = 1 1/3 P P(Ca|A) = 50% ou 1/ /2 P(B) = 1 1/3 P P(Ca|B) = 100% ou 1 P(C) = 1 1/3 P P(Ca|C) = 20% ou 1/ /5 9 Querem mos P(C|Ca a) Pelo Teo orema de Bayes, B tem mos ∩ | ∩ | P X|A P A P X|A P A P X|A P A ∩ P Ca|A P A 0,20 1/3 1 1 1 1 0,,20 3 3 3 0,5 50 ⋯ P X|A P A ∑ P Ca|C C P C P Ca|B C P B P Ca|C P C 0,20 0,20 2 0,5 50 1 0,2 20 1,70 17 ∩ P X|A P A 0,117 76 11,76% % Temos, p portanto, 11,76% de d probabi ilidade de e que a face cara seja apre esentada pela p 3ª moeda a quando esta e for escolhida e ao acaso. . Na plani ilha Excel l, preench ha apenas a área az zul: 5. 5 A probabilidade de um m indivíduo de classe A comprar um m carro de 3/4, 3 da B é dde 1/5 e da C é de 1/20 0. As probabilidades se os indivíduos co omprarem um m carro da marca m x são 1/10, 3/5 e 33/10, dado qu ue sejam de A, B e C, respectivamente. Certa loja vendeu um carro da ma arca x. Qual a probabili dade de que e i indivíduo o que comprou sseja da classse B? Solução A = classe A, , B = classe B, C = classe C P(A) = 3 3/4 P P(car|A) = 1/10 P(B) = 1 1/5 P P(car|B) = 3/5 P(C) = 1 1/20 P P(car|C) = 3/10 Qu ueremos P( (B|car) Pelo Teo orema de Bayes, B tem mos ∩ | | Bertolo ∩ P X|A P A P X|A P A P X|A P A ∩ ⋯ P X|A P A ∑ ∩ P X|A P A P car|B P B P car|B P B P car|A P A 3 1 3 5 5 25 3 3 3 1 3 3 1 3 1 40 25 200 10 4 5 5 10 20 0,5714 57,14% P car|C P C 3 3 200 2 25 15 24 3 25 42 200 4 7 10 Ente endendo o Teorema T de e Bayes Temos, portanto, 57,14% de proba abilidade de que o carro indivídu uo da clas sse B. foi comp prado por r um Na plani ilha Excel l, preench ha apenas a área az zul: 6. 6 Um certo programa pode p ser usado com um ma entre duas sub-rotinas A e B, ddependendo do problem ma. A experiência tem mosttrado que a sub-rotina A é usada 40 0% das veze es e B é usaada 60% da as vezes. Se eAé usada, exxiste 75% de e chance de que o progrrama chegue a um resu ultado dentroo do limite de tempo. Se eBé usada, a cchance é de e 50%. Se o programa fo oi realizado dentro d do lim mite de tempoo. Se B é us sada, a chan nce é de 50%. S Se o programa foi realiz zado dentro do limite de e tempo, qua al a probabillidade de qu ue a sub-rotina A tenha sido o a escolhida a? Solução 40% P(A) = 4 P P(resultad do|A) = 75 5% P(B) = 6 60% P P(resultad do|B) = 50 0% Quere emos P(A|r resultado). Pelo Teo orema de Bayes, B tem mos | ∩ P X|A P A P X|A P A P X|A P A ∩ | 0,75 0,40 0,75 5 0,40 0,5 50 0,60 ∩ 0,30 0 0,30 0,30 ⋯ P X|A P A ∑ ∩ P X|A P A P resuultado|A P A P ressultado|A P A P resultado|B P B 0,30 1 0,5000 50,00% 0,60 2 Temos, p portanto, 50,00% de e probabi lidade de e que o re esultado f foi atingi ido dentro o do limite u usando a sub-rotina s a A. Na plani ilha Excel l, preench ha apenas a área az zul: Bertolo o Entendendo o Teorema de Bayes 11 7. A urna X contém 2 bolas azuis, 2 brancas e 1 cinza, e a urna Y contém 2 bolas azuis, 1 branca e 1 cinza. Retira-se uma bola de cada urna. Calcule a probabilidade de saírem 2 bolas brancas sabendo-se que são bolas de mesma cor? Solução X Y 2 A 2 A 2 B 1 B 1 C 1 C Após retirar uma bola de cada urna queremos saber P(B B|mesma cor). A cor da bola que sai da segunda urna não é influenciada pela cor da bola que saiu da primeira urna, isto é os eventos são independentes. P(mesma cor) = P(BB) + P(AA) + P(C C)= P(B).P(B) + P(A).P(A) + P(C).P(C) = (2/5)(1/4) + (2/5)(2/4) + (1/5)(1/4) = (2/20)+(4/20)+(1/20) = (7/20) = 0,35 ou 35% Agora P BB|mesmacor Bertolo ∩ 12 Entendendo o Teorema de Bayes , X 0,44 x 0,03 = 0,0132 ou 1,32% , 0,6256 62,56% 0,1564 15,64% 3% V 97% 44% X 0,33 x 0,01 = 0,0033 ou 0,33% , , 1% 33% J 99% 23% Bertolo Entendendo o Teorema de Bayes X 0,23 x 0,02 = 0,0046 ou 0,46% 2% C ______________ 0,0211 ou 2,11% 98% Jovens Velhos 3.300 = 4.400 = 4.268 + 132 132 33 3.267 + 33 46 Crianças 2.300 = 2.254 + 46 Bertolo , , 0,2180 13 21,80%