Capítulo 3 Probabilidade Condicional – Independência Estatística – Valor Esperado Recapitulando... Já fizemos 3 definições básicas: 1) Experimento aleatório Um experimento é dito aleatório se ele pode produzir saídas diferentes, embora seja executado da mesma forma. Recapitulando... Já fizemos 3 definições básicas: 2) Espaço amostral O conjunto de todos os resultados possíveis de um experimento aleatório. Recapitulando... Já fizemos 3 definições básicas: 3) Evento Qualquer subconjunto do espaço amostral. Dado um experimento aleatório... com um conjunto amostral... consideramos um evento em particular. Considere o exemplo de um atleta que corre diariamente e sofreu ruptura no tendão de Aquiles. O atleta passou por uma cirurgia… e está em um processo de fisioterapia para se recuperar. Em quantos meses ele poderá voltar a correr? Suponha que o fisioterapeuta queira liberá-lo em 5 meses. Qual será o experimento aleatório? Exp: atleta que sofreu cirurgia para reparar tendão, voltar a correr após 5 meses de fisioterapia. Qual o espaço amostral? Ω = {apresenta novamente a lesão; não apresenta novamente a lesão}. Qual o evento que interessa ao fisioterapeuta? A = {não apresenta novamente a lesão}. Como podemos saber a chance do evento que interessa ocorrer? Probabilidade! O fisioterapeuta vai recorrer aos casos anteriores… e verificar com que freqüência A ocorreu. Ex: Se em 30 casos, 21 atletas puderam correr a partir da 5ª semana: 21 P( A) 0,7 30 Há 70% de chances do evento A ocorrer e o atleta não apresentar a lesão… Já que 0,7 = 70%. Não devemos dizer que a probabilidade é 70%! Em geral diz-se que a probabilidade é 0,7 ou que há 70% de chance. Aprendemos também: Probabilidade Conjunta (interseção de dois eventos): P(AB) Aprendemos também: Probabilidade da União de dois eventos: P(A U B) = P(A) + P(B) – P(AB) Probabilidade Condicional Um tema central em probabilidade é a possibilidade de atualizar as probabilidades quando certos eventos são observados. Probabilidade Condicional de A dado B, é a probabilidade do ‘evento A’ atualizada depois de sabermos que o evento B ocorreu. A probabilidade condicional é definida como a proporção, dentro de B (que já sabemos que ocorreu), na qual ‘A’ também ocorre. Probabilidade Condicional: Proporção de AB dentro de B! P( AB ) P( A | B) P( B) Probabilidade condicional não é definida para P(B) = 0. Um exemplo: Tratamento contra depressão (150 pacientes) Resposta Imipramina Lithium Combinação Placebo Total Recaiu 18 13 22 24 77 Não recaiu 22 25 16 10 73 Total 40 38 38 34 150 Sejam: A o evento de que o paciente recaiu, B o de que foi tratado com placebo C o de que foi tratado com Lithium P(B) = 34/150 P(AB)=24/150 e P(A|B) = 24/34 = 0.706 Da mesma forma, poderíamos calcular P(A|C) P(A|C) = 13/38 =0.342 Note que se conhecemos P(AB) e P(B) poderíamos ter calculado P(A | B) sem voltar a consultar a tabela, através da expressão que havíamos mostrado a pouco: P( AB ) P( A | B) P( B) usando P(B) = 34/150 P(AB)=24/150, chegaríamos a: P(A | B) = 24/34 É possivel calcular ‘probabilidade conjunta’ a partir da definição de probabilidade condicional: P(AB) = P(B) P(A|B) ou P(AB) = P(A) P(B|A) e no caso de n eventos, A1, A2, A3, ... , An: P(A1 A2 A3 ... An) = P(A1) P(A2 / A1) P(A3 / A1 A2) ... P(An / A1 A2 ... An-1). Estas formulas são as vezes chamadas de regra da multiplicação. Uma Aplicação de Probabilidade Condicional Suponha que faremos um teste: O paciente tem ou não uma determinada doença? O paciente pode ser liberado da fisioterapia? O tratamento usado foi o adequado? Em cada resultado podemos ter dois tipos de resposta: positivo e negativo. Uma Aplicação de Probabilidade Condicional Quando o teste der resultado positivo: O paciente pode ter a doença... Verdadeiro positivo – VP. O paciente pode ter não a doença... Falso positivo – FP. Uma Aplicação de Probabilidade Condicional Quando o teste der resultado negativo: O paciente pode não ter a doença... Verdadeiro negativo – VN. O paciente pode ter a doença... Falso negativo– FN. Uma Aplicação de Probabilidade Condicional Podemos resumir isto em uma tabela: DOENÇA RESULTADO PRESENTE AUSENTE POSITIVO Verdadeiro Positivo Falso Positivo NEGATIVO Falso Negativo Verdadeiro Negativo Uma Aplicação de Probabilidade Condicional Qual a probabilidade do paciente testar positivo, dado que ele tem a doença? DOENÇA RESULTADO PRESENTE AUSENTE POSITIVO Verdadeiro Positivo Falso Positivo NEGATIVO Falso Negativo Verdadeiro Negativo P(testar positivo | tem a doença ) P(testar positivo tem a doença ) P(tem a doença ) VP /(VP FN FP VN ) VP (VP FN FP VN ) VP (VP FN ) /(VP FN FP VN ) (VP FN FP VN ) (VP FN ) VP FN Este valor é chamado de sensibilidade Uma Aplicação de Probabilidade Condicional Qual a probabilidade do paciente testar negativo, dado que ele não tem a doença? DOENÇA RESULTADO PRESENTE AUSENTE POSITIVO Verdadeiro Positivo Falso Positivo NEGATIVO Falso Negativo Verdadeiro Negativo P(testar negativo | não tem a doença ) P(testar negativo não tem a doença ) P(não tem a doença ) VN /(VP FN FP VN ) VN (VP FN FP VN ) VN (VN FP ) /(VP FN FP VN ) (VP FN FP VN ) (VN FP ) VN FP Este valor é chamado de especificidade Uma Aplicação de Probabilidade Condicional O que é um bom teste? Possui alto valor para sensibilidade. Possui alto valor para especificidade. Em outras palavras, identifica os que têm a doença e os que não têm. Uma Aplicação de Probabilidade Condicional Ja vimos que testes podem ser avaliados através de sensibilidade e especificidade… Ainda podemos aplicar probabilidade condicional para obtermos outras informações sobre o desempenho do teste. Uma Aplicação de Probabilidade Condicional Suponha que um teste foi realizado e o resultado tenha sido positivo. Qual a probabilidade do paciente estar mesmo doente, dado que o teste deu resultado positivo? Qual a probabilidade do paciente estar mesmo doente, dado que o teste deu resultado positivo? DOENÇA RESULTADO PRESENTE AUSENTE POSITIVO Verdadeiro Positivo Falso Positivo NEGATIVO Falso Negativo Verdadeiro Negativo P(estar doente | testou positivo) P(estar doente testou positivo) P(testou positivo) VP /(VP FN FP VN ) VP (VP FN FP VN ) VP (VP FP ) /(VP FN FP VN ) (VP FN FP VN ) (VP FP ) VP FP Este valor é chamado de Valor Preditivo Positivo (VPP) Suponha agora que o teste foi realizado e o resultado tenha sido negativo. Qual a probabilidade do paciente não estar doente, dado que o teste deu resultado negativo? Qual a probabilidade do paciente não estar doente, dado que o teste deu resultado negativo? DOENÇA RESULTADO PRESENTE AUSENTE POSITIVO Verdadeiro Positivo Falso Positivo NEGATIVO Falso Negativo Verdadeiro Negativo P(não estar doente | testou negativo) P(não estar doente testou negativo) P(testou negativo) VN /(VP FN FP VN ) VN (VP FN FP VN ) VN ( FN VN ) /(VP FN FP VN ) (VP FN FP VN ) ( FN VN ) FN VN Este valor é chamado de Valor Preditivo Negativo (VPP) Observe que, com sensibilidade e especificidade, estávamos considerando se o paciente tinha ou não a doença… Aqui estamos considerando o fato do teste ter dado positivo ou negativo. Eventos Independentes Vamos voltar ao caso do atleta…. Suponha que a temperatura esteja esteja 30º. Isso influencia na probabilidade de ocorrência do evento A? A = {não apresenta novamente a lesão}. B = {temperatura está 30º} Qual é P(A | B)? Eventos Independentes Tínhamos visto que P(A) = 0,7. Você acha que, ao saber que o evento B ocorreu, isto é, que a temperatura no momento da corrida é de 30º… a probabilidade do evento A muda? Claro que não! P(A | B) = P(A) = 0,7. Eventos Independentes Dizemos que os eventos A e B são independentes se o conhecimento de que B ocorreu não interfere a probabilidade de A, ou seja, P(A | B) = P(A) Assim, se A e B são independentes: P( AB ) P( A | B) P( B) e P( A | B) P( A) Logo, P( AB ) P( A), ou seja P( AB ) P( A) P( B) P( B) Eventos Independentes Portanto, os eventos A e B são independentes se P(AB) = P(A)P(B) P( AB ) P( A) P( B) P( A | B) P( A) P( B) P( B) Eventos Independentes Vamos supor agora um caso diferente…. diagnóstico de infarto. Os quadros possíveis são: A = {IAM com supra}. B = {IAM sem supra} Será que esses eventos são independentes? Eventos Independentes Já sabemos que, P(AB) é a probabilidade de um paciente apresentar, ao mesmo tempo, IAM com e sem supra… mas isso é impossível! Logo P(AB) = 0. Eventos Independentes É razoável supormos que, se o paciente está passando mal… a probabilidade dele ter um infarto é diferente de zero. Então P(A) 0 e P(B) 0, o que implica que P(A)P(B) 0. Logo P(AB) P(A)P(B) e os eventos não são independentes. Eventos Independentes Graficamente: Se IAM com supra ocorre: Se IAM sem supra ocorre: Estes eventos são chamados de mutuamente exclusivos. Dois eventos mutuamente exclusivos NUNCA serão independentes. Um exclui o outro…há uma relação entre eles. Exemplos: 1) Mostre que, em um lançamento de um dado justo, encontrar um 4 na face superior e encontrar um número ímpar não são eventos independentes. A = {encontrar um 4 na face superior}. B = {encontrar um número ímpar na face superior}. P(A) = 1/6 P(B) = 3/6 P(AB) = 0 P(A)P(B) = 3/36 Como P(AB) P(A)P(B), A e B não são independentes. Exemplos: 2) Uma urna contém 2 bolas verdes, 2 bolas vermelhas, um cubo vermelho e um cubo verde. Uma pessoa retira um item aleatoriamente. Verifique se os eventos “retirar um item verde” e “retirar um cubo” são independentes. A = {retirar um item verde}. B = {retirar um cubo}. P(A) = 3/6 P(B) = 2/6 P(AB) = 1/6 P(A)P(B) = 6/36 Como 1/6= 6/36, temos que P(AB) = P(A)P(B) e A e B são independentes. Exemplos: 3)Em uma sala de aula com 60 meninas e 40 meninos, 24 meninas e 16 meninos usam óculos. Haveria alguma relação entre o déficit visual e o gênero? É preciso verificar se déficit visual e gênero são independentes. A = {usar óculos}. 1. P(A | B) = P(A); B = {menino}. 2. P(B | A) = P (B); 3. P(AB) = P(A)P(B). Exemplos: Para os meninos P(usar oculos menino) 16 / 100 P(usar oculos | menino) P(menino) 40 / 100 16 100 16 . 0,4 100 40 40 24 16 40 P(usar oculos ) 0,4 60 40 100 Logo, P(usar óculos | menino) = P(usar óculos). Exemplos: Para os meninos P(menino usa oculos ) 16 / 100 P(menino | usa oculos ) P(usa oculos ) 40 / 100 16 100 16 . 0,4 100 40 40 40 P(menino) 0,4 100 Logo, P(menino | usa óculos) = P(menino). Exemplos: Para os meninos P(menino usar oculos ) 16 0,16 100 40 P(menino) 0,4 100 24 16 40 P(usar oculos ) 0,4 60 40 100 0,4.0,4 0,16 Logo, P(menino usa óculos) = P(menino)P(usar óculos). Exemplos: Para os meninas P(usar oculos menina ) 24 / 100 P(usar oculos | menina ) P(menina ) 60 / 100 24 100 24 . 0,4 100 60 60 24 16 40 P(usar oculos ) 0,4 60 40 100 Logo, P(usar óculos | menina) = P(usar óculos). Exemplos: Para os meninas P(menina usa oculos ) 24 / 100 P(menina | usa oculos ) P(usa oculos ) 40 / 100 24 100 24 . 0,6 100 40 40 60 P(menina ) 0,6 100 Logo, P(menina | usa óculos) = P(menina). Exemplos: Para os meninas P(menina usar oculos ) 24 0,24 100 60 P(menina ) 0,6 100 24 16 40 P(usar oculos ) 0,4 60 40 100 0,6.0,4 0,24 Logo, P(menina usa óculos) = P(menina)P(usar óculos). Gênero e déficit visual parecem independer um do outro, pelo menos nesta pequena amostra. Filosoficamente, na ciência não é tão importante descobrir a independência entre fenômenos. Mais importante é descobrir a dependência entre fenômenos que antes não imaginávamos serem relacionados. Valor Esperado Seja um experimento aleatório com um espaço amostral associado. Suponha que sabemos calcular a probabilidade de cada elemento do espaço amostral. Ex: Em uma jogada de um dado justo, a face de cima pode ser 1, 2, 3, 4, 5 ou 6. P(1) = P(2) = P(3) = P(4) = P(5) = P(6) = 1/6 Valor Esperado Já aprendemos que, em geral, escolhemos a média como representante dos dados. No caso de um dado justo, como todos os resultados possíveis possuem a mesma probabilidade, podemos calcular a média aritmética: (1 + 2 + 3 + 4 + 5 + 6)/6 = 21/6 = 3,5 Observe que a média, neste caso, não pertence ao espaço amostral. Valor Esperado Existem situações onde as probabilidades dos eventos são diferentes. Exemplo: Em um grupo de 100 pacientes diagnosticados com um determinado estadiamento observou-se os seguintes tempos de sobrevida em meses a partir do diagnostico: Número Meses de de sobrevida pacientes 10 3 20 6 50 12 15 36 5 48 100 Valor Esperado Exemplo: Em um grupo de 100 pacientes diagnosticados com um determinado estadiamento observou-se os seguintes tempos de sobrevida em meses apartir do diagnostico: Número Meses de de sobrevida pacientes Probabilidade 10 3 0.10 20 6 0.20 50 12 0.50 15 36 0.15 5 48 0.05 soma 1 100 Valor Esperado Pergunta: quantos meses de sobrevida você acredita que um paciente tenha? Podemos calcular o tempo médio...mas como as probabilidades diferem, temos que calcular uma média ponderada pelas probabilidades. Valor Esperado (0.10 x 3) + (0.20 x 6) + (0.50 x 12) + (0.15 x 36) + (0.05 x 48) = 15,2 meses. Número Meses de de sobrevida pacientes Probabilidade 10 3 0.10 20 6 0.20 50 12 0.50 15 36 0.15 5 48 0.05 soma 1 100 Valor Esperado A essa média ponderada pelas probabilidades, damos o nome de valor esperado. Formalmente… n E ( X ) xi P( xi ) x1P( x1 ) x2 P( x2 ) ... xn P( xn ) i 1 Exemplo: Um concorrente em um programa de TV tem 4 caixas fechadas com prêmios, 1 está vazia, 2 tem R$ 5000,00 e 1 tem R$ 20000,00. Ele deverá escolher e abrir um destas caixas. Por quanto o concorrente deveria aceitar uma oferta da produção para vender sua caixa? E(X) = 0.25 x 0,00 + 0.50 x 5000,00 + 0.25 x 20000,00 = R$ 7500,00