PROBABILIDADE October 16, 2013 Bioestatística Parte I October 16, 2013 1 / 78 PROBABILIDADE 1 2 Probabilidade Introdução Operações com Eventos Definição Clássica de Probabilidade Definição axiomática de probabilidade Exercícios Espaço amostral não enumerável Usando o EXCEL Probabilidade condicional Partição de um espaço amostral Teorema se Bayes Testes Diagósticos Qualidade de testes diagnósticos Sensibilidade e Especificidade Exemplo 1 Exemplo 2 Valor da predições Exemplo Bioestatística 3 Parte I October 16, 2013 2 / 78 Vimos anteriormente como caracterizar uma massa de dados, como o objetivo de organizar e resumir informações. Agora, apresentamos a teoria matemática que dá base teórica para o desenvolvimento de técnicas estatísticas utilizadas nas tomadas de decisões. Bioestatística Parte I October 16, 2013 3 / 78 Fenômeno aleatório (ou experimento aleatório) É a situação ou acontecimento cujos resultados não podem ser previstos com certeza. Exemplo: as condições climáticas para o próximo domingo não podem ser estabelecidas com total acerto. (Modelos podem ser estabelecidos para quantificar as incertezas das diversas ocorrências nessas situações). Bioestatística Parte I October 16, 2013 4 / 78 Espaço Amostral É o conjunto de todos os resultados possíveis, de um experimento aleatório. Ele será representado pela letra grega Ω (ômega). Quanto ao número de elementos pode ser: Finito: Número limitado de elementos. Exemplo: S = 1, 2, 3, 4, 5, 6 Infinito: Número ilimitado de elementos: a) Enumerável: Quando os possíveis resultados puderem ser postos em concordância biunívoca com o conjunto dos números naturais (caso das variáveis aleatórias discretas). Exemplo: N b) Não Enumerável: Quando os possíveis resultados não puderem ser postos em concordância biunívoca com o conjunto dos números naturais (caso das variáveis aleatórias contínuas). R Bioestatística Parte I October 16, 2013 5 / 78 Evento Os subconjuntos de Ω são denominados eventos e podem ser representados pelas letras maiúsculas A, B, · · · . O conjunto vazio será representado por Φ, como já é tradicional. Podem-se ter operações entre eventos da mesma forma que com conjuntos, como é mostrado a seguir. Bioestatística Parte I October 16, 2013 6 / 78 União A união de dois conjuntos A e B, denotada por A U B, representa a ocorrência de pelo menos um dos eventos, A ou B. É o evento que ocorrerá se, e somente se, A ou B ou ambos ocorrerem. Bioestatística Parte I October 16, 2013 7 / 78 Interseção A interseção do evento A com o evento B, denotada por ocorrência simultânea de A e B. Bioestatística Parte I T éa October 16, 2013 8 / 78 Dois eventos são disjuntos ou mutuamente exclusivos quando não tem elementos em comum. Isto é, A ∩ B = Φ Bioestatística Parte I October 16, 2013 9 / 78 Dizemos que A e B são complementares se sua união é o espaço amostral e sua interseção é vazia. O complementar de A será dado por Ac e temos que: A ∪ Ac = Ω e A ∩ Ac = Φ. Algumas vezes, encontramos A no lugar de Ac . Bioestatística Parte I October 16, 2013 10 / 78 Exemplo Lançam-se duas moedas. Sejam os eventos: A: saída de faces iguais. B: saída de cara na primeira moeda. Determinar os eventos: a) A ∪ B b) A ∩ B c) Ac d) B c e) (A ∪ B)c f) (A ∩ B) Bioestatística Parte I October 16, 2013 11 / 78 Definição Clássica de Probabilidade Dado um experimento aleatório, sendo Ω seu espaço amostral, vamos admitir que todos os elementos de Ω tenham a mesma chance de acontecer, ou seja, Ω é um conjunto equiprovável. Definimos a probabilidade de um evento A (A ⊂ Ω) ao número real P (A) tal que: P (A) = Bioestatística n(A) número de resultados favoráveis a A = número de resultados possíveis n(Ω) Parte I October 16, 2013 12 / 78 Exemplo Considerndo o lançamento de um dado, pede-se: a) A probabilidade do evento A (obter um número par na face superior). b) A probabilidade do evento B (obter um número menor ou igual a 6 na face superior). c) A probabilidade do evento C (obter um número 4 na face superior). d) A probabilidade do evento D (obter um número maior que 6 na face superior). Bioestatística Parte I October 16, 2013 13 / 78 Definição axiomática de probabilidade Uma função P (·) é denominada probabilidade se satisfaz as condições: (i) 0 ≤ P (A) ≤ 1,∀A ⊂ Ω (ii) P (Ω) = 1 (iii) P ( Sn j=1 Aj ) = Pn j=1 P (Aj ), com os Aj disjuntos, ou seja, P (A1 ∪ A2 ) = P (A1 ) + P (A2 ) Bioestatística Parte I October 16, 2013 14 / 78 Essas propriedades são conhecidas como axiomas de Kolmogorov. Os axiomas, muitas vezes, se inspiram em resultados experimentais e que, assim, definem a probabilidade de forma que possa ser confirmada experimentalmente. A partir daí, pode-se mostrar que valem as seguintes relações: Bioestatística Parte I October 16, 2013 15 / 78 1) Se A e B são dois eventos quaisquer, então, P (A ∪ B) = P (A) + P (B) − P (A ∩ B) 2) Para o evento complementar vale a seguinte relação: P (Ac ) = 1 − P (A) 3) Se A ⊂ B,entao,P (A) ≤ P (B) 4) P (A ∪ B) = P (A ∩ B) = 1 − P (A ∩ B) 5) P (A ∩ B) = P (A ∪ B) = 1 − P (A ∪ B) Bioestatística Parte I October 16, 2013 16 / 78 Exercícios Exercício 1 Sejam A e B dois eventos em um dado espaço amostral, tais que P (A) = 0, 2; P (B) = p; P (A ∪ B) = 0, 5; P (A ∩ B) = 0, 1. Determine o valor de p. Exercício 2 Retira-se uma carta de um baralho completo de 52 cartas. Qual a probabilidade de sair um rei ou uma carta de espadas? Bioestatística Parte I October 16, 2013 17 / 78 Exercícios Exercício 3 O seguinte grupo de pessoas está numa sala: 5 rapazes com mais de 21 anos, 4 rapazes com menos de 21 anos, 6 moças com mais de 21 anos e 3 moças com menos de 21 anos. Uma pessoa é escolhida ao acaso entre as 18. Os seguintes eventos são definidos: a pessoa tem mais de 21 anos a pessoa tem menos de 21 anos a pessoa é um rapaz a pessoa é uma moça Calcule P (B ∪ D) e P (A ∩ C) Bioestatística Parte I October 16, 2013 18 / 78 Nem sempre é possível enumerar o espaço amostral. Nesses casos, devemos usar a análise combinatória como processo de contagem. Vejamos alguns exemplos: Bioestatística Parte I October 16, 2013 19 / 78 Exemplo 1 Em um congresso científico existem 15 matemáticos e 12 estatísticos. Qual a probabilidade de se formar uma comissão com 5 membros, na qual figurem 3 matemáticos e 2 estatísticos? Resolução: A: comissão de 3 matemáticos e 2 estatísticos. 27 n(Ω) = 5 15 3 12 2 15 3 12 2 n(A) = P (A) = Bioestatística Parte I 27 5 October 16, 2013 20 / 78 Exemplo 2 Qual a probabilidade de, num baralho com 52 cartas, ao se retirarem 4 cartas, ao acaso, sem reposição, se obter uma quadra? Resolução: A: saída de uma quadra. 52 n(Ω) = 4 n(A) = 13 P (A) = Bioestatística Parte I 13 52 4 October 16, 2013 21 / 78 Exemplo 3 Calcular a probabilidade de se obter exatamente 3 caras e 2 oroas em 5 lances de uma moeda? Resolução: A: saída de 3 caras e 2 coroas. n(Ω) = 32 n(A) = 5 3 P (A) = Bioestatística Parte I = 10 10 32 October 16, 2013 22 / 78 Exemplo 4 Uma urna contem as letras A,A,A,R,R,S. Retira-se letra por letra.Qual a probabilidade de sair a palavra ARARAS? Resolução: A: saída da palavras araras. n(Ω) = (P R)63,2,1 = 6! 3!2!1! n(A) = 1 P (A) = 1 60 Observação (P R)nn1 ,n2 ,···nn = n! n1 !n2 !n3 ! com n1 + n2 + · · · + nn = n Bioestatística Parte I October 16, 2013 23 / 78 Usando o EXCEL A planilha Excel dispõe de ferramenta específica para o cálculo de combinações. Esta ferramenta pertence à categoria das funções da Matemática e Trigonometria. Para adicioná-la proceda da seguinte forma : Posicione o cursor na célula A1 e digite r = Posicione o cursor na célula A2 e digite p = Posicione o cursor na célula A3 e digite Cr,p = Posicione o cursor na célula B1 e digite, por exemplo, 5 Posicione o cursor na célula B2 e digite, por exemplo, 2 Posicione o cursor na célula B3 e acione o auxiliar de função fx e escolha a categoria Matemática e Trigonometria e clique em OK Bioestatística Parte I October 16, 2013 24 / 78 Bioestatística Parte I October 16, 2013 25 / 78 Bioestatística Parte I October 16, 2013 26 / 78 Bioestatística Parte I October 16, 2013 27 / 78 Bioestatística Parte I October 16, 2013 28 / 78 Bioestatística Parte I October 16, 2013 29 / 78 Para permutações sem repetição, existe uma função no Excel. Bioestatística Parte I October 16, 2013 30 / 78 Para permutações com repetição, podemos escrever a seguinte expressão. Bioestatística Parte I October 16, 2013 31 / 78 Probabilidade condicional Dados dois eventos A e B, a probabilidade condicional de A dado que B ocorreu é representada por P (A|B): P (A|B) = P (A ∩ B) P (B) Caso P (B) = 0, P (A|B) pode ser definido arbitrariamente. Nesse curso, usaremos P (A|B) = P (A). Bioestatística Parte I October 16, 2013 32 / 78 Independência de eventos Dizemos que A e B são independentes se: P (A ∩ B) = P (A)P (B) ou equivalentemente, P (A|B) = P (A), P (B) > 0 Esta última relação evidencia o significado de independência. O conhecimento de que B ocorreu não influencia na probabilidade de que A ocorra. Bioestatística Parte I October 16, 2013 33 / 78 Exemplo Há apenas dois modos, mutuamente exclusivos, de Genésio ir para Genebra participar de um congresso: ou de navio ou de avião. A probabilidade de Genésio ir de navio é de 40% e de ir de avião é de 60%. Se ele for de navio, a probabilidade de chegar ao congresso com dois dias de atraso é de 8,5%. Se ele for de avião a probabilidade de chegar ao congresso com dois dias de atraso é de 1%. Bioestatística Parte I October 16, 2013 34 / 78 Árvore de Probabilidades Foi dito quais são as probabilidades de o Genésio viajar de navio e de avião. Daí, já podemos iniciar o desenho da árvore de probabilidades! Teremos: Bioestatística Parte I October 16, 2013 35 / 78 Árvore de Probabilidades Quer tenha o Genésio viajado de navio, quer tenha viajado de avião, ele poderá chegar com atraso ao congresso. E se pode chegar com atraso, nós já somos capazes de deduzir que, contrariamente, ele pode também chegar em tempo, ou seja, sem atraso. Bioestatística Parte I October 16, 2013 36 / 78 Quantos caminhos de probabilidade nós temos nessa árvore de probabilidades? Temos quatro caminhos: 1o ) viajar de navio e chegar atrasado; 2o ) viajar de navio e chegar em tempo; 3o ) viajar de avião e chegar atrasado; 4o ) viajar de avião e chegar em tempo. Daí, analisemos esta árvore e esses caminhos para responder possíveis perguntas. Bioestatística Parte I October 16, 2013 37 / 78 a) Qual a probabilidade de Genésio ir de navio e de chegar atrasado? Daí, multiplicando-se as probabilidades individuais desse caminho, teremos: (0,40)x(0,085)= 0,034 = 3,4% Resposta! Na linguagem da probabilidade, diremos: P(navio e atrasado)=0,034 b) Qual a probabilidade de Genésio ir de avião e chegar atrasado? Multiplicando-se as probabilidades individuais desse caminho, teremos: (0,60)x(0,01)= 0,006 = 0,6% Resposta! Na linguagem da probabilidade, diremos: P(avião e atrasado)=0,006 Bioestatística Parte I October 16, 2013 38 / 78 Árvore de Probabilidades c) Qual a probabilidade de Genésio chegar atrasado? A pergunta aqui foi diferente! Só falou no evento “atraso”, sem estabelecer o meio de transporte! Bioestatística Parte I October 16, 2013 39 / 78 Árvore de Probabilidades Como são dois os caminhos que nos conduzem ao resultado procurado, teremos portanto que somar essas duas probabilidades resultantes de ambos. Teremos, pois, que: 3, 4% + 0, 6% = 4% Resposta! Na linguagem da probabilidade, diremos: P(atrasado)=0,04 Bioestatística Parte I October 16, 2013 40 / 78 Árvore de Probabilidades d) Qual a probabilidade de Genésio chegar em tempo? Aqui também não foi estabelecido qual seria o meio de transporte que levaria Genésio a não se atrasar! No item anterior, encontramos que a probabilidade de Genésio chegar atrasado (independente do transporte utilizado) foi de 4%. P(atrasado) + P(em tempo) = 100% 4% + P(em tempo) = 100% P(em tempo)= 100% − 4% P(em tempo) = 96% Resposta! Na linguagem da probabilidade, diremos: P(em tempo)=0,96. Bioestatística Parte I October 16, 2013 41 / 78 Há apenas dois modos, mutuamente excludentes, de Genésio ir para Genebra participar de um congresso: ou de navio ou de avião. A probabilidade de Genésio ir de navio é de 40% e de ir de avião é de 60%. Se ele for de navio, a probabilidade de chegar ao congresso com dois dias de atraso é de 8,5%. Se ele for de avião a probabilidade de chegar ao congresso com dois dias de atraso é de 1%. Sabe-se que Genésio chegou com dois dias de atraso para participar do congresso em Genebra. Qual a probabilidade de ele ter ido de avião? Bioestatística Parte I October 16, 2013 42 / 78 Probabilidade Condicional! Para responder a essa pergunta, teremos que aplicar a seguinte expressão: P (A|B) = P (A ∩ B) P (B) → P(avião dado atrasado) = P(avião e atrasado) / P(atrasado) Já concluímos anteriormente que: P(avião e atrasado)=0,006. Vimos ainda que P(atrasado)=0,04. → P(avião dado atraso) = P(avião e atraso) / P(atraso) → P(avião dado atraso) = 0, 006/0, 04 = 0, 15 = 15% Resposta! Bioestatística Parte I October 16, 2013 43 / 78 Exemplo A probabilidade de um gato estar vivo daqui a 5 anos é 3/5. A probabilidade de um cão estar vivo daqui a 5 anos é 4/5. Considerando os eventos independentes: Qual a probabilidade, ao mesmo tempo, de o cão estar vivo e de o gato estar vivo daqui a 5 anos? Qual a probabilidade de somente o cão estar vivo daqui a 5 anos? Bioestatística Parte I October 16, 2013 44 / 78 Os eventos C1 , C2 , · · · , Ck formam uma partição do espaço amostral se eles nao tem interseção entre si e sua uniao é igual ao espaço amostral. Isto é: Ci ∩ Cj = Φ para i 6= j e ∪ki=1 Ci = Ω. A figura a seguir apresenta um exemplo de partição de 6 eventos. Bioestatística Parte I October 16, 2013 45 / 78 Seja A um evento qualquer em Ω. Então, pela figura a seguir temos: Bioestatística Parte I October 16, 2013 46 / 78 Teorema da Probabilidade Total O evento A, neste caso, será dado entao, por: A = (A ∩ C1 ) ∪ (A ∩ C2 ) ∪ (A ∩ C3 ) Sendo assim, a probabilidade de A, P (A), é dada por P P (A) = ki=1 P (Ci ∩ A) Mas, P (Ci ∩ A) = P (Ci )P (A|Ci ) , i = 1, 2, · · · , k. Logo, P (A) = Pk i=1 P (Ci )(P (A|Ci ) O qual denominamos Teorema da Probabilidade Total. Bioestatística Parte I October 16, 2013 47 / 78 Teorema se Bayes Suponha que os eventos C1 , C2 , · · · , Ck formem uma partição do espaço amostral Ω tal que P (Cj ) ≥ 0, j = 1, 2, · · · , k. Seja A qualquer evento tal queP (A) ≥ 0. Entao, para qualquer i = 1, 2, · · · , k temos: P (Ci )P (A|Ci ) P (Cj |A) = Pk i=1 P (Ci )P (A|Ci ) Bioestatística Parte I October 16, 2013 48 / 78 Exemplo Em certo colégio 5% dos homens e 2% das mulheres têm mais do que 1,80m de altura. Por outro lado, 60% dos estudantes são homens. Se um estudante é selecionado ao acaso e tem mais de 1,80m de altura, qual a probabilidade de que o estudante seja mulher? Bioestatística Parte I October 16, 2013 49 / 78 Exercício 1 Em um cinema três filmes A, B e C foram responsáveis por toda a clientela da última semana, sendo 20% dos clientes assistiram ao filme A, 30% ao filme B e 50% assistiu ao filme C. Uma pesquisa, realizada após cada apresentação dos filmes, mostrou que 20% dos clientes que assistiram ao filme A estavam insatisfeitos, e a proporção de insatisfeitos com os filmes B e C era foi de 5% e 2%, respectivamente. Suponhamos que nenhum cliente assistiu a mais de um filme naquela semana. Um cliente insatisfeito fez uma reclamação via urna sem se lembrar de especificar a sala onde viu o filme. Pergunta-se: Qual é a probabilidade deste cliente ter assistido ao filme A? Bioestatística Parte I October 16, 2013 50 / 78 Exercício 2 Em um baralho com 52 cartas, qual a probabilidade de obter uma carta de espadas ou uma carta de paus? E a probabilidade de obter uma carta de paus ou uma carta de número 8? E por último, qual é a probabilidade de uma carta selecionada deste baralho não ser de espadas ou de paus? Exercício 3 Qual é a probabilidade de se ter obtido um número par no lançamento de um dado uma vez que se sabe que o resultado de tal lançamento gerou um número menor que 4? Bioestatística Parte I October 16, 2013 51 / 78 Testes Diagósticos Uma das experiências mais rotineiras da prática médica é a solicitação de um teste diagnóstico. Os objetivos são vários, incluindo a triagem de pacientes, o diagnóstico de doenças e o acompanhamento ou prognóstico da evolução de um paciente. Para chegar ao diagnóstico, o médico considera várias possibilidades, com níveis de certeza que variam de acordo com as informações disponíveis. Bioestatística Parte I October 16, 2013 52 / 78 Aqui o objetivo será mostrar, usando a linguagem de Probabilidade, como se mede o nível de incerteza da ocorrência de um evento, por exemplo, a presença deuma doença após a observação de um teste positivo. Considerando o teste positivo quando indicar a presença da doença e negativo quando indicar a ausência. Bioestatística Parte I October 16, 2013 53 / 78 Não existe teste perfeito. Aquele que com certeza absoluta determina a presença ou ausência da doença. Assim, o objetivo principal é estudar os índices nos quais o conceito de qualidade de um teste diagnóstico é, geralmente, desmembrado. Frequentemente, um único teste não é suficiente, portanto, devemos combinar dois ou mais testes. O ideal seria que, para cada patologia, fossem determinados os testes a serem incluídos no processo diagnóstico e a melhor forma e combiná-los. Bioestatística Parte I October 16, 2013 54 / 78 Dados genéricos de um teste clínico Na etapa da pesquisa para a determinação do grau de confiabilidade de um teste diagnóstico, o pesquisador utiliza-o primeiramente em dois grupos muito específico de pessoas: um de portadoras da doença perfeitamente caracterizada e outro sem a doença em questão. O diagnóstico nessa etapa deve ser feito por um meio diferente do teste em estudo, o chamado padrão ouro. Os resultados desta etapa da pesquisa podem ser resumidos na forma da Tabela a seguir. Bioestatística Parte I October 16, 2013 55 / 78 Esquema padrão de síntese dos dados para verificação da qualidade de um teste clínico Doença Teste Positivo Negativo Total Presente a b n1 = a + b Ausente c d n2 = c + d Total a+c b+d n = n1 + n2 Bioestatística Parte I October 16, 2013 56 / 78 Qualidade de testes diagnósticos O bom uso de um teste diagnóstico requer, além de considerações clínicas, o conhecimento de medidas que caracterizam a sua qualidade intrínseca: a sensibilidade, a especificiddae e os parâmetros que refletem a sua capacidade de produzir decisões corretas: valor da predição negativa e valor da predição positiva. Usando os resultados da Teoria das Probabilidades apresentados anteriormente, vamos nos ocupar desses quatro indices nos quais é usualmente decomposta a ideia de qualidade de um teste diagnóstico. Bioestatística Parte I October 16, 2013 57 / 78 Para definir os índices que descrevem o grau de confiabilidade de um teste, precisamos trabalhar com os seguintes eventos: T+ corresponde a teste positivo. T− corresponde a teste negativo. D+ corresponde a indivíduo portador da doença. D− corresponde a teste indivíduo não portador da doença. Bioestatística Parte I October 16, 2013 58 / 78 Na análise da qualidade de testes diagnósticos, interessa conhecer duas probabilidades condicionais que, pela sua importância, recebem nomes especiais: sensibilidade e especificidade. Bioestatística Parte I October 16, 2013 59 / 78 Sensibilidade A sensibilidade, denotada por s, é definida como: s = P (T+ |D+ ) ou seja, a probabilidade de o teste ser positivo sabendo-se que o paciente que está sendo examinado é doente. Bioestatística Parte I October 16, 2013 60 / 78 Especificidade A especificidade, denotada por e, é definida como: e = P (T− |D− ) ou seja, a probabilidade de o teste ser pnegativo sabendo-se que o paciente que está sendo examinado não é portador da doença. Bioestatística Parte I October 16, 2013 61 / 78 Os nomes são descritivos: especificidade mede a capacidade de reação do teste em um paciente doente, enquanto a especificidade, a não reação do teste em pacientes não portadores da doença, isto é, o teste é específico para doenças em questão. A análise da definição desses dois índices (s e e) mostra que, subjacentemente a esses conceitos, estamos assumindo a existência de um padrão ouro, ou seja, um teste diagnóstico que sempre produz resultados corretos. Além disso, assumimos que os pacientes são classificados apenas como doentes e não doentes, não se admitindo estágios intermediários. Bioestatística Parte I October 16, 2013 62 / 78 Usando a notação da tabela anterior e a definição e probabilidade condicional, os índices s e e são estimdos por: Bioestatística s= a a = n1 a+b e= d d = n2 c+d Parte I October 16, 2013 63 / 78 Exemplo 1 Diagnóstico de doença coronariana Wiener et. al. (1979) compararam os resultados do teste ergométrico de tolerância a exercícios entre indivíduos com e sem doença coronariana. O teste foi considerado positivo quando se observou mais de 1mm de depressão ou elevação do segmento ST, por no mínimo 0, 08s, em comparação com o resultados obtidos com o paciente em repouso. O diagnóstico definitivo foi feito através de angiografia. A tabela a seguir sintetiza os resultados encontrados. Bioestatística Parte I October 16, 2013 64 / 78 Resultados da aplicação do teste ergomético de tolerância a exercícios em 1465 pessoas Doença coronariana Teste ergométrico Positivo Negativo Total Presente (D+ ) 815 208 1023 Ausente (D− ) 115 327 442 Total 930 535 1465 A sensibilidade e a especificidade são estimadas por: s= 815 = 0, 797 1023 e= 327 = 0, 740 442 O teste ergométrico tem uma sensibilidade de 79,7%, ligeiramente suprior à sua especificidade (74%) Bioestatística Parte I October 16, 2013 65 / 78 Exemplo 2 Metástase de Carcinoma Hepático Lind e Singer (1986) estudaram a qualidade da tomografia computadorizada para o diagnóstico de metástase de carcinoma de fígado, obtendo os resultados sintetizados na tabela a seguir. Um total de 150 pacientes foram submtidos a dois exames: a tomografia computadorizada e a laparotomia. Este último é tomado como padrão do outro, isto é, classifica o paciente sem erro. Bioestatística Parte I October 16, 2013 66 / 78 Resultados da tomografia computadorizada em 67 pacientes com metástase e 83 sem metástase do carcinoma hepático Metástase do carcinoma hepático Tomografia computadorizada Positiva (T+ ) Negativa (T− ) Total Presente (D+ ) 52 15 67 Ausente (D− ) 9 74 83 Total 61 89 150 A sensibilidade e a especificidade são estimadas por: s= 52 = 0, 776 67 e= 74 = 0, 892 83 Diferentemente do exemplo anterior, a especificidade (89, 2%) é maior di que a sensibilidade (77, 6%). Bioestatística Parte I October 16, 2013 67 / 78 Valor da predições A sensibilidade e a especificidade, embora sendo índices ilustrativos e bons sintetizadores das qualidades gerais de um teste,têm uma séria limitação: não ajudam a decisão da equipe médica que, recebendo um paciente com resultado positivo do teste, precisa avaliar se o paciente está ou não doente. Não se pode depender apenas da sensibilidade e da especificidade, pois estes índices sõ provenientes de uma situação em que há certeza total sobre o diagnóstico, o que não acontece no consultório médico. Daí a necessidade de dois outros índices que refletem melhor a realidade prática. Bioestatística Parte I October 16, 2013 68 / 78 Valor da predições Neste momento, interessa mais conhecer os seguintes índices denominados valor de predição positiva (VPP) e o valor da predição negativa (VPN), definidos respectivamente por: V P P = P (D+ |T+ ) V P N = P (D− |T− ) Em palavras, VPP é aprobabilidade do paciente estar realmente doente quando o resultado do teste é positivo e VPN, a probabilidade do paciente não estar doente quando o resultado do teste é negativo. Estes valores são probabilidades condicionais, tal que o evento condicionante é o resultado do teste, aquele que na prática acontece primeiro. Bioestatística Parte I October 16, 2013 69 / 78 Probabilidades necessárias para o cálcul odos índices VPP e VPN A maneira mais fácil de se calcular o VPP e o VPN é através da Tabela a seguir, sugerida por Vecchio(1996). Seja p = P (D+ ) a prevalência da doença na população de interesse, isto é, a proporção de pessoas doentes, ou a probabilidade de doença pré-teste. População Proporção Doente p ps p(1 − s) Sadio 1−p (1 − p)(1 − e) (1 − p)e Total 1 ps + (1 − p)(1 − e) p(1 − s) + (1 − p)e Bioestatística Proporção com resultado Positivo Negativo Parte I October 16, 2013 70 / 78 O valor da predição positiva é obtido dividindo-se a frequencia dos "verdadeiros" positivos, aqueles oriundos de pacientes doentes, pelo total de positivos. Obtem-se a seguinte expressão: V PP = ps ps + (1 − p)(1 − e) De forma análoga, considerando-se "verdadeiros" negativos obtemos o valor da predição ngativa: V PN = (1 − p)e p(1 − s) + (1 − p)e Ambas as expressões dependem do conhecimento de p, uma estimativa da prevalência da doença na população de interesse. Estas são probabilidades de resultados corretos de diagnóstico. Bioestatística Parte I October 16, 2013 71 / 78 Exemplo 3 Metástase de Carcinoma Hepático - continuação Para uma população cuja prevalência de Metástase de Carcinoma de fígado é de 2%, os valores de predição da tomografia computadorizada são: V PP = 0, 02x0, 78 = 0, 13 0, 02x0, 78 + (1 − 0, 02)(1 − 0, 89) V PN = (1 − 0, 02)x0, 89 = 0, 99 (1 − 0, 02)x0, 89 + 0, 02(1 − 0, 78) Bioestatística Parte I October 16, 2013 72 / 78 Portanto, o valor da predição positiva é baixo enquanto que o valor da predição negativa é bastante alto. Se o resultado da tomografia computadorizada é negativo, a chance de não haver metástase é de 99%. Se, antes de qualquer informação, o paciente tinha uma chance de 2% de apresentar a doença, após o resultado do teste negativo esta chance é de apenas 1%. Bioestatística Parte I October 16, 2013 73 / 78 Exercício Pesquisadores que tratam de doenças hepáticas em uma clínica especializada sugeriram um novo teste para detectar câncer no fígado. Os resultados do experimento, para uma amostra de 2225 pacientes atendidos nessa clínica foram: Câncer hepático Teste Positivo Negativo Total Presente 90 17 107 Ausente 39 2079 2118 Total 129 2096 2225 Pelo modo como os dados foram obtidos, a prevalência de câncer hepático, nesta clínica, pode ser calculada usando os dados da tabela. Bioestatística Parte I October 16, 2013 74 / 78 Exercício a) Calcule a sensibilidade e a especificidade do teste. b) Calcule a probabilidade de um paciente, atendido nessa clínica e que não tem câncer no fígado, tenha um resultado positivo no teste. c) Calcule o valor da prediçã opositiva e o valor da predição negativa. d) Os pesuisadores que desenvolveram o teste sugeriram seu uso como um meio simples para os clínicos em geral decidirem se devem ou não encaminhar o paciente para uma clínica especializada. Critique esta recomendação. Bioestatística Parte I October 16, 2013 75 / 78 As probabilidades P F P = P (D− |T+ ) = 1 − P (D+ |T+ ) = 1 − V P P P F N = P (D+ |T− ) = 1 − P (D− |T− ) = 1 − V P N referem-se, respectivamente ao falso-positivo e falso-negativo, isto é,decisões incorretas baseadas no teste diagnóstico. Bioestatística Parte I October 16, 2013 76 / 78 Por exemplo, as probabilidades de falso-positivo e falso-negativosão muito frequentemente usadas para as quantidades 1 − s e 1 − e, quando deveriam ser reservadas para 1 − V P P e 1 − V P N . Por isso, na medida do possível, evitaremos usar tais termos. Bioestatística Parte I October 16, 2013 77 / 78 Infelizmente, não há na literaturapadronização relativa a nomes dos índices de um teste diagnóstico. Por exemplo, Bioestatística Parte I October 16, 2013 78 / 78 MAGALHÃES, M. N. ; LIMA,A. C. P. Noções de Probabilidade e Estatística. Edusp.2004. MORETTIN, L.G. Estatística Básica - Probabilidade e Inferência. (Volume ùnico)Editora Pearson. 2010. SOARES, J. F. SIQUEIRA, A. L. Introdução À Estatística Médica. Coopmed. 2002. Bioestatística Parte I October 16, 2013 78 / 78