UNIVERSIDADE ESTADUAL DE GOIÁS Unidade Universitária de Ciências Exatas e Tecnológicas Curso de Licenciatura em Matemática Probabilidade nas Ciências da Saúde Rafaela Fernandes da Silva Santos ANÁPOLIS 2014 Rafaela Fernandes da Silva Santos Probabilidade nas Ciências da Saúde Trabalho de Curso apresentado a Coordenação Adjunta de TC, como parte dos requisitos para obtenção do título de Graduado no Curso de Licenciatura em Matemática da Universidade Estadual de Goiás sob a orientação do Professor Msc. Cleber Giugioli Carrasco. ANÁPOLIS 2014 DEDICATÓRIA Dedico este trabalho aos meus pais, familiares, amigos e professores que sempre me apoiaram. AGRADECIMENTOS Agradeço primeiramente a Deus, por ter me abençoado nessa caminhada e me proteger a cada dia. Agradeço aos meus pais, Sérgio e Lúcia por estarem ao meu lado e me apoiando em todos os momentos da minha graduação. A minha irmã, Caroline, que sempre serviu de inspiração para eu não desistir dos meus sonhos. E aos meus familiares e amigos. Ao professor Cleber, por ter tido a paciência e dedicação, e por ter me mostrado um lado diferente da Probabilidade, despertando em mim interesse na área. Agradeço ao Henrique, Deus o colocou em meu caminho e por ter sido paciente e me apoiado nessa reta final da universidade. Agradeço também a todos os professores que tive o privilégio de conviver todos esses anos. E aos meus colegas que já se formaram, em especial, a Lorrany, ao Edson e o Rafael, que foram muito importantes nessa minha vida acadêmica. LISTA DE TABELAS TABELA 4.1: Esquema para verificação de teste diagnóstico......................................................23 TABELA 4.2: Resultado do teste em paralelo...............................................................................28 TABELA 4.3: Resultado do teste em série....................................................................................30 TABELA 5.1: Exame do fator reumatoide.....................................................................................32 TABELA 5.2: Valores do teste ELISA..........................................................................................33 TABELA 5.3: Combinação em paralelo e em série dos testes de ultrassom e tomografia............35 LISTA DE FIGURAS FIGURA 2.1: Exemplo de eventos mutuamente exclusivos..........................................................13 FIGURA 2.2: Ilustração da probabilidade condicional do evento A dado o evento B..................16 FIGURA 3.1: Partição do espaço amostral para três eventos..........................................................18 FIGURA 3.2: Representação do evento B no espaço amostral S..................................................19 RESUMO Neste trabalho será apresentada uma avaliação dos testes diagnósticos aplicados na área da saúde. No primeiro momento uma introdução sobre probabilidade com enfoco nas definições, regra da adição e independência de eventos. Como segunda parte, será apresentado o teorema de Bayes. Posteriormente, a avaliação do teste diagnóstico, destacando as medidas, os valores preditivos e as combinações em paralelo e em série. Por último, utilizando o conhecimento adquirido previamente, serão apresentados exemplos de aplicações da metodologia adotada. Palavras chave: Probabilidade, Teorema de Bayes, Teste diagnóstico. SUMÁRIO INTRODUÇÃO ............................................................................................................................. 10 2. PROBABILIDADE ................................................................................................................... 12 2.1. Experimentos Aleatórios e Determinísticos ....................................................................... 12 2.2. Espaço Amostral e Evento.................................................................................................. 12 2.2.1. Eventos Mutuamente Exclusivos .................................................................................. 13 2.3. Probabilidades .................................................................................................................... 13 2.3.1. Probabilidade Clássica ................................................................................................ 13 2.3.2. Probabilidade Frequentista.......................................................................................... 14 2.3.3. Probabilidade Axiomática ............................................................................................ 14 2.3.4. Probabilidade Subjetiva ............................................................................................... 15 2.4. Regra da Adição de Probabilidades .................................................................................... 15 2.5. Probabilidade Condicional ................................................................................................. 16 2.6. Independência de Eventos .................................................................................................. 16 3. TEOREMA DE BAYES ........................................................................................................... 18 3.1. Partição do Espaço Amostral .............................................................................................. 18 3.2. Regra da Probabilidade Total ............................................................................................. 19 3.3. Teorema de Bayes .............................................................................................................. 21 4. AVALIAÇÃO TESTE DIAGNÓSTICO .................................................................................. 23 4.1. Medidas do Teste Diagnóstico ........................................................................................... 23 4.2. Sensibilidade e Especificidade ........................................................................................... 25 4.3. Valores Preditivos .............................................................................................................. 25 4.4. Decisões Incorretas ............................................................................................................. 27 4.5. Combinação de Testes Diagnósticos .................................................................................. 28 4.5.1. Combinação em Paralelo ............................................................................................. 28 4.5.2. Combinação em Série ................................................................................................... 30 5. EXEMPLOS DE APLICAÇÃO ................................................................................................ 32 5.1. Teste de Reumatismo ......................................................................................................... 32 5.2. Teste de HIV....................................................................................................................... 33 5.3. Diagnóstico de Câncer Pancreático .................................................................................... 34 CONCLUSÃO ............................................................................................................................... 36 BIBLIOGRAFIA............................................................................................................................36 INTRODUÇÃO Um paciente faz exames para descobrir se possui certa doença, e o médico, baseado no resultado, diz que sim. Qual é a probabilidade dos testes estarem certos e do paciente estar realmente doente? Testes diagnósticos são utilizados para avaliar patologias com um bom grau de precisão, utilizando apenas alguns exames (VIEIRA, 2004). Esses testes apenas são precisos, porque eles exigem, além de análises clínicas, a compreensão de medidas que definem a sua qualidade própria (SOARES, SIQUEIRA, 2002). É muito importante estudar e entender as aplicações da probabilidade relacionada às ciências da saúde, em particular, neste trabalho as probabilidades associadas à avaliação da qualidade de testes diagnósticos e suas combinações, e também quais são os passos para que eles sejam realizados. Não existe teste perfeito, aquele que com certeza absoluta determina a presença ou ausência da doença. [...] Frequentemente, um único teste não é o suficiente, e portanto devemos combinar dois ou mais testes. O ideal seria que, para cada patologia, fossem determinados os testes a serem incluídos no processo diagnóstico e a melhor forma de combiná-los (SOARES, SIQUEIRA, 2002). O teste diagnóstico é considerado válido somente quando seus valores atingem determinado valor, por causa disso ele é capaz de identificar a doença. Ele só é realmente adotado na população quando feito em uma amostra com indivíduos doentes e sadios. Neste trabalho, serão apresentados e estudados a sensibilidade do teste, que é a probabilidade do teste ser positivo dado que a pessoa está doente, e a especificidade do teste, sendo a probabilidade do teste ser negativo dado que o paciente não está doente. Será visto também o valor preditivo positivo, que é a probabilidade do paciente estar realmente doente quando o resultado do teste é positivo, e o valor preditivo negativo, sendo esse a probabilidade do paciente não estar doente dado que o exame deu negativo. Duas decisões incorretas também serão apresentadas, o falso positivo, que é a probabilidade do teste dar positivo quando a pessoa não está doente, e o falso negativo, que é a probabilidade do teste dar negativo quando a pessoa está doente. Dois tipos de combinação de testes diagnósticos serão estudados, a combinação em paralelo, sendo utilizado em casos de emergência, quando é considerada a presença da doença se 11 pelo menos um dos testes forem positivos, e a combinação em série, sendo mais utilizada quando é necessário mais tempo para o diagnóstico do paciente. Este trabalho está dividido em cinco capítulos. No segundo capítulo será apresentada uma revisão sobre probabilidade, com experimentos aleatórios e determinísticos, espaço amostral, eventos e as definições de probabilidade juntamente com a regra da adição, probabilidade condicional e independência de eventos. O terceiro capítulo traz uma demonstração do teorema de Bayes, a partição do espaço amostral e a regra da probabilidade total. No quarto capítulo é apresentada a avaliação do teste diagnóstico com as frequências, sensibilidade e especificidade, os valores preditivos e as combinações dos testes em paralelo e em série. No último capítulo será utilizada a metodologia aplicada a exemplos numéricos. 2. PROBABILIDADE Neste capítulo são apresentadas as definições de experimentos aleatórios e determinísticos e espaço amostral. São introduzidas também as definições de probabilidade clássica, frequentista, axiomática e subjetiva. Além disso, serão apresentados os conceitos de regra da adição, probabilidade condicional, regra do produto e independência de eventos. 2.1. Experimentos Aleatórios e Determinísticos Experimentos aleatórios são experimentos que ao serem repetidos nas mesmas condições iniciais não produzem os mesmos resultados, enquanto os experimentos determinísticos, levam ao mesmo resultado (DANTAS, 2008). Como exemplo de experimento aleatório pode ser considerado o resultado do teste do etilômetro (ou bafômetro), dependendo do que o paciente ingeriu o teste pode dar alterado ou normal, e já para o experimento determinístico, temos o exemplo clássico de que se aquecermos a água, sob pressão normal, a 100ºC ela entrará em ebulição. 2.2. Espaço Amostral e Evento Espaço amostral denotado por S é o conjunto de todos os resultados possíveis de um experimento aleatório (MEYER, 1983), enquanto evento é qualquer subconjunto de resultados do experimento aleatório. Para cada experimento realizado ocorrerá apenas um único evento. Como exemplo, considere o seguinte experimento: Um teste é aplicado a três pacientes, onde o resultado classifica o paciente como tendo a doença (D) ou não (Dc), assim o espaço amostral é dado por, S = {( D 1 , D 2 , D 3 ), ( D 1 , D 2 , D 3c ), ( D 1 , D 2c , D 3 ), ( D 1c , D 2 , D 3 ), ( D 1 , D 2c , D 3c ), ( D 1c , D 2 , D 3c ), ( D 1c , D 2c , D 3 ), ( D 1c , D 2c , D 3c )} . Um evento associado a esse espaço amostral, poderia ser, por exemplo: O evento A: “somente dois pacientes são classificados como doentes pelo teste”, assim o evento A é dado por: A = {(D1, D2 , D3c ),(D1, D2c , D3 ),(D1c , D2 , D3 )}. 13 2.2.1. Eventos Mutuamente Exclusivos Dois eventos A e B são mutuamente exclusivos quando a ocorrência de um exclui a ocorrência do outro, por exemplo, o teste para confirmar a ocorrência de uma doença só tem dois possíveis resultados, positivo ou negativo. A ocorrência de um desses eventos elimina a ocorrência do outro, isto é, A I B = φ . A Figura 2.1 ilustra um evento mutuamente exclusivo: FIGURA 2.1: Exemplo de Eventos Mutuamente Exclusivos. 2.3. Probabilidades Nessa seção serão apresentados quatro definições de probabilidade: clássica, frequentista, subjetiva e axiomática. 2.3.1. Probabilidade Clássica Seja S um espaço amostral com n eventos simples equiprováveis e A um evento simples de S composto de m eventos simples. A probabilidade de ocorrer o evento A, é definida por (DANTAS, 2008): P( A) = m n (2.1) A não ocorrência do evento A determinada por Ac poder ser calculada subtraindo m de n, e dividindo por n, assim tem-se: 14 P ( Ac ) = n−m n (2.2) c É fácil verificar que P( A ) =1− P( A) , pois: P( Ac ) = n−m n m m = − = 1 − = 1 − P( A) n n n n (2.3) c c Assim, tem-se que P( A ) =1− P( A) e P(A ) + P(A) =1 pois: P ( A c ) + P ( A) = m n−m m+n−m n + = = =1 n n n n (2.4) 2.3.2. Probabilidade Frequentista Ao repetir n vezes um experimento aleatório, anota-se quantas vezes o evento A associado a esse experimento acontece. Seja n(A) a quantidade de vezes que ocorre o evento A nas n repetições, então a probabilidade do evento A ocorrer é dada por (DANTAS, 2008): P ( A) = n ( A) n (2.5) 2.3.3. Probabilidade Axiomática Dado um evento qualquer do espaço amostral S, a probabilidade será definida numa classe de eventos que satisfaz certas propriedades a seguir (DANTAS, 2008): a) 0 ≤ P(A) ≤ 1; b) P(S) = 1; c) P( φ ) = 0; 15 d) P(Ac) = 1 - P(A); e) P(AUAc) = P(S); n f) P( U Ai ) = n ∑P( A ) , com os Ai´s mutuamente exclusivos. i i=1 i −1 2.3.4. Probabilidade Subjetiva A probabilidade subjetiva conta com a experiência de vida do indivíduo que trabalha com o assunto quando analisa as características do experimento estudado. Desse modo, a probabilidade poderá ser diferente em cada caso, para cada pessoa, em decorrência das distintas opiniões ou conhecimento que cada uma tem sobre a ocorrência do evento (DANTAS, 2008). Como exemplo, tome um estudo de caso em que o médico usando a sua experiência profissional, avalia a probabilidade de um indivíduo estar com determinada doença. Um outro médico entretanto, também devido a sua experiência, poderia avaliar para mais ou para menos essa probabilidade. 2.4. Regra da Adição de Probabilidades A Regra da adição é usada para calcular a probabilidade da união de eventos. Seja A e B quaisquer eventos de S, então temos (MAGALHÃES, LIMA, 2008): P ( A U B ) = P ( A) + P ( B ) − P ( A I B ) (2.6) Observe que, se A e B forem eventos mutuamente exclusivos, temos: P ( A U B ) = P ( A) + P ( B ) pois A I B = φ e P (φ ) = 0 . (2.7) 16 2.5. Probabilidade Condicional Dados dois eventos A e B, a probabilidade de A ocorrer dado que B ocorreu, pode ser observada no Diagrama de Venn, da Figura 2.2 onde, se o evento B ocorrer, o evento A ocorre somente se ocorrer a intersecção entre eles, ou seja, se ocorrer A∩B. Assim temos que: P(A | B) = P( A I B) , desde que P ( B ) > 0 . P(B) (2.8) FIGURA 2.2: Ilustração da probabilidade condicional do evento A dado o evento B. Isolando-se a P ( A I B ) em (2.8), tem-se um resultado consequência da probabilidade condicional, conhecida como regra do produto de probabilidades, dada por: P( A I B) = P( A | B) ⋅ P(B) (2.9) 2.6. Independência de Eventos Um evento A é independente do evento B, se a probabilidade de A ocorrer não é influenciada pelo fato de B ter ocorrido ou não, ou seja (MAGALHÃES, LIMA, 2008): P ( A | B ) = P ( A) (2.10) 17 ou ainda, substituindo (2.10) em (2.9), temos: P ( A I B ) = P ( A) ⋅ P ( B ) (2.11) 3. TEOREMA DE BAYES Neste capítulo são apresentados os conceitos de partição do espaço amostral, regra da probabilidade total e o teorema de Bayes. 3.1. Partição do Espaço Amostral Os eventos A1, A2 , A3,K, An formam uma partição do espaço amostral, se eles forem mutuamente exclusivos e se sua união for igual ao espaço amostral. Isto é (MAGALHÃES, LIMA, 2013): n Ai I Aj = φ para todo i ≠ j e UA i = S para i = 1, 2,..., n. (3.1) i =1 A Figura 3.1 ilustra um exemplo de uma partição com 3 eventos, onde, A1 U A2 U A3 = S e A1 I A2 I A3 = φ . FIGURA 3.1: Partição do espaço amostral para três eventos. 19 3.2. Regra da Probabilidade Total Para introduzir a regra da probabilidade total, será considerado a princípio um caso particular para três eventos A1, A2, A3 que formam uma partição de S. Considere também, B como um evento qualquer de S. Assim pode-se escrever B = ( B I A1 ) U ( B I A2 ) U ( B I A3 ) conforme mostra a Figura 3.2. FIGURA 3.2: Representação do evento B no espaço amostral S. Logo a probabilidade do evento B ocorrer pode ser dada por: P( B) = P(( B I A1 ) U ( B I A2 ) U ( B I A3 )) (3.2) Como os eventos B I A1 , B I A 2 e B I A 3 são mutuamente exclusivos, tem-se que, P( B) = P( B I A1 ) + P( B I A2 ) + P( B I A3 ) (3.3) Dessa forma, pela regra do produto (2.9) tem-se: P( B) = P( B | A1 ) ⋅ P( A1 ) + P( B | A2 ) ⋅ P( A2 ) + P( B | A3 ) ⋅ P( A3 ) (3.4) Como caso geral da regra da probabilidade total, considere A1, A2, A3, ..., An, eventos da partição do espaço amostral S e seja B um evento qualquer de S, temos (MORETTIN, 2012): 20 n P( B) = ∑ P( B | Ai ) ⋅ P( Ai ) (3.5) i =1 Demonstração: Os eventos ( B I Ai ) e ( B I A j ) , para i ≠ j, i = 1, 2, ..., n e j = 1, 2, ..., n, são mutuamente exclusivos, pois: (B I Ai ) I (B I Aj ) = B I ( Ai I Aj ) = B Iφ = φ (3.6) Observe em (3.6) que Ai I Aj = φ , pois os eventos Ai’s, formam uma partição do espaço amostral S. O evento B pode ser escrito como: B = ( B I A1 ) U ( B I A2 ) U ( B I A3 ) U ... U ( B I An ) (3.7) assim, P( B) = P( B I A1 ) + P( B I A2 ) + P( B I A3 ) + K + P( B I An ) (3.8) Usando a regra do produto (2.9), temos: P( B) = P( B | A1 ) ⋅ P( A1 ) + P( B | A2 ) ⋅ P( A2 ) + K + P( B | An ) ⋅ P( An ) (3.9) portanto, n P(B) = ∑ P( B | Ai ) ⋅ P( Ai ) i =1 (3.10) 21 3.3. Teorema de Bayes Seja A1, A2 ,...,An uma partição do espaço amostral S e B um evento qualquer do espaço amostral S, e seja conhecidas P(Ai) e P(B|Ai) para i = 1, 2, ..., n, então a probabilidade de ocorrer um dos eventos Ai dado que ocorreu o evento B é dada por (DANTAS, 2008): P( Ai | B) = P( B | Ai ) P( Ai ) P(B | A1 ) ⋅ P( A1 ) + P( B | A2 ) ⋅ P( A2 ) + K + P( B | An ) ⋅ P( An ) (3.11) ou P( Ai | B) = P( B | Ai ) ⋅ P( Ai ) n (3.12) ∑ P( B | Ai ) ⋅ P( Ai ) i =1 Demonstração: Pela probabilidade condicional (2.8) tem-se, que: P ( Ai | B ) = P ( Ai I B ) P(B) (3.13) Sabe-se que P( Ai I B) = P( B I Ai ) e que pela regra do produto (2.9) tem-se que P( B I Ai ) pode ser reescrito como: P( B I Ai ) = P( B | Ai ) ⋅ P( Ai ) (3.14) com isso, pela regra da probabilidade total (3.9) tem-se: P( B) = P( B | A1 ) ⋅ P( A1 ) + P( B | A2 ) ⋅ P( A2 ) + K + P( B | An ) ⋅ P( An ) (3.15) 22 Portanto utilizando (3.14) e (3.15) respectivamente, no numerador e denominador de (3.13), tem-se que: P( Ai | B) = P( B | Ai ) ⋅ P( Ai ) P(B | A1 ) ⋅ P( A1 ) + P(B | A2 ) ⋅ P( A2 ) + L + P(B | An ) ⋅ P( An ) (3.16) ou ainda, P( Ai | B) = P( B | Ai ) ⋅ P( Ai ) n ∑ P( B | A ) ⋅ P( A ) i i =1 i (3.17) 4. AVALIAÇÃO TESTE DIAGNÓSTICO Quando existe certa anomalia ou doença na população, as ciências da saúde utilizam recursos precisos para fazer o diagnóstico de certas doenças. O uso correto de testes diagnósticos constitui em uma parte fundamental da área da saúde, portanto a qualidade dos testes diagnósticos é vital (VIEIRA, 2010). O importante é descobrir se o teste realmente responde quem está doente e quem não está, com certa precisão. 4.1. Medidas do Teste Diagnóstico Quando feito o teste diagnóstico, a frequência de verdadeiro positivo (a) indica que o número de doentes nos quais foram feitos os testes deu positivo e eles realmente estão doentes, já a frequência de verdadeiro negativo (d) é o número de indivíduos sem a doença e que o teste deu negativo (VIEIRA, 2010). Frequência de falso positivo (b) é a quantidade de pessoas sem a doença no qual ao ser aplicado o teste o mesmo falhou, ou seja, o teste detectou a presença da doença, e frequência de falso negativo (c) indica o número de pessoas doentes em que o teste foi feito e o mesmo não detectou a doença (VIEIRA, 2003). A Tabela 4.1 esquematiza as frequências para uma melhor compreensão. TABELA 4.1: Esquema para verificação de teste diagnóstico. Doença Teste Total Positivo Negativo Presente a c a+c Ausente b d b+d Total a+b c+d a+b+c+d 24 Denotando o teste positivo por T + e negativo por T − , quem é portador da doença por D+ e não portador por D− , pode-se definir a seguir algumas probabilidades com o auxílio da Tabela 4.1. A probabilidade do teste dar positivo (T+) é calculada dividindo o total de testes positivos pelo total de testes aplicados, isto é: P(T+ ) = a+b (a + b + c + d ) (4.1) Analogamente, a probabilidade do teste ser negativo (T-) é calculada dividindo o total de testes negativos pelo total de testes aplicados, isto é: P(T− ) = c+d (a + b + c + d ) (4.2) Agora, a probabilidade do indivíduo ser portador da doença (D+) é dada pela divisão do total da presença da doença pelo total de indivíduos (ou testes aplicados), ou seja: P( D+ ) = a+c (a + b + c + d ) (4.3) E a probabilidade do indivíduo não ser o portador da doença (D-) é definida pela divisão do total da ausência da doença pelo total de indivíduos, dada por: P( D− ) = b+d (a + b + c + d ) (4.4) 25 4.2. Sensibilidade e Especificidade O uso correto de um teste diagnóstico necessita, além de considerações clínicas, o conhecimento de medidas que caracterizam a sua veracidade. A sensibilidade e a especificidade são usadas para produzir decisões clínicas precisas (SOARES, SIQUEIRA, 2002). Sensibilidade é a probabilidade de diagnósticos verdadeiros positivos (resultados positivos corretos), no total de pessoas com a doença, ou seja, a probabilidade condicional do teste ser positivo dado que o indivíduo apresenta a doença (VIEIRA, 2010), isto é: s = P(T+ | D+ ) = a a+c (4.5) Especificidade é a probabilidade de diagnósticos verdadeiros negativos (resultados negativos corretos), no total de pessoas sem a doença, ou seja a probabilidade condicional do teste ser negativo dado que o indivíduo não está doente (VIEIRA, 2010), ou seja: e = P (T− | D− ) = d b+d (4.6) Tanto a sensibilidade quanto a especificidade medem a qualidade do teste. 4.3. Valores Preditivos O importante em testes diagnósticos é a obtenção das medidas de desempenho do teste. Para calcular esses valores é necessário ter um certo cuidado, pois uma terceira medida, a prevalência da doença, denotada também por p = P( D+ ) , é utilizada e pode ser definida como a proporção de indivíduos portadores da doença na população, que está sendo investigada (MARTINEZ, LOUZADA-NETO, 2000). Nesta seção utiliza-se P( D+ ) como sendo a prevalência da doença na população e não somente de uma amostra (grupo de pacientes) como no cálculo da sensibilidade e especificidade. 26 O valor preditivo positivo (VPP) é a probabilidade do paciente estar doente dado que o teste tem resultado positivo (SOARES, SIQUEIRA, 2002), isto é: VPP = P( D+ | T+ ) (4.7) Não se pode utilizar a Tabela 4.1 para calcular o VPP, pois agora p = P( D+ ) se trata da prevalência da população e a tabela se trata de uma amostra. Assim, o VPP pode ser calculado através do teorema de Bayes, da seguinte maneira: VPP = P( D+ | T+ ) = P(T+ | D+ ) P( D+ ) P(T+ | D+ ) P( D+ ) + P(T+ | D− ) P( D− ) (4.8) Note que P(T+ | D+ ) = s , P( D+ ) é a prevalência da doença na população (p), P (T + | D − ) é o complementar da especificidade, logo é igual a 1 − e e P( D− ) é o complementar da prevalência, ou seja, 1 − p . Dessa forma substituindo as probabilidades pelos seus respectivos valores em (4.8), tem-se que: VPP = s⋅ p s ⋅ p + (1 − e) ⋅ (1 − p) (4.9) Define-se valor preditivo negativo (VPN) como sendo a probabilidade do paciente não está doente dado que o resultado do teste é negativo (MARTINEZ, LOUZADA-NETO, 2000), ou seja: VPN = P ( D − | T − ) (4.10) Analogamente, através do teorema de Bayes, o valor preditivo negativo (VPN), pode ser escrito da seguinte forma, isto é: 27 VPN = P( D− | T− ) = P(T− | D− ) P( D− ) P(T− | D− ) P( D− ) + P(T− | D+ ) P( D+ ) (4.11) Neste caso, note que P (T − | D − ) = e e P (T − | D + ) é o complementar da sensibilidade, ou seja, 1 − s . Dessa forma substituindo as probabilidades pelos seus respectivos valores em (4.11), tem-se que: VPN = e ⋅ (1 − p) e ⋅ (1 − p) + (1 − s) ⋅ p (4.12) 4.4. Decisões incorretas São denominadas decisões incorretas, as probabilidades dos testes serem falsos positivos (PFP) e falsos negativos (PFN) (SOARES, SIQUEIRA, 2002). A probabilidade de ocorrer falso positivo é definida como sendo a probabilidade da pessoa não estar doente dado que o teste deu positivo, e o falso negativo é a probabilidade da pessoa estar doente dado que o teste deu negativo. Dessa forma, a probabilidade de ocorrer falso positivo é dada por: PFP = P ( D − | T+ ) (4.13) Observe que P ( D − | T + ) é o complementar do valor preditivo positivo (VPP), isto é, P ( D − | T + ) = 1 − P ( D + | T + ) = 1 − VPP , logo tem-se que: PFP = 1 − VPP (4.14) A probabilidade do teste ser falso negativo é representada por: PFN = P ( D + | T− ) (4.15) 28 Note que P ( D + | T− ) é complementar do valor preditivo negativo (VPN), ou seja, P ( D + | T − ) = 1 − P ( D − | T − ) = 1 − VPN , logo tem-se que, (4.16) PFN = 1 − VPN 4.5. Combinação de Testes Diagnósticos Quando é necessário usar dois ou mais testes para chegar a um diagnóstico, é preciso saber como são obtidos os índices de qualidade do teste múltiplo, sendo esse composto por dois ou mais testes individuais. E, a maneira mais simples de se fazer um teste múltiplo a partir do resultado de dois testes, são as combinações em série e paralelo. A combinação em paralelo é mais utilizada em casos de emergências, já a em série é aplicada em triagens, quando não é necessário um atendimento rápido (SOARES, SIQUEIRA, 2002). 4.5.1. Combinação em Paralelo Considerando somente dois testes (T1 e T2), a combinação de testes em paralelo é dita positiva se pelo menos um dos testes for positivo. A Tabela 4.2 apresenta os possíveis resultados para a combinação de dois testes em paralelo. TABELA 4.2: Resultado do teste em paralelo. Teste 1 Teste 2 Teste em Paralelo Negativo Negativo Negativo Negativo Positivo Positivo Positivo Negativo Positivo Positivo Positivo Positivo A sensibilidade do teste em paralelo sp é dado por (SOARES, SIQUEIRA, 2002): 29 s p = P(T+ | D+ ) = P (T1+ U T2+ | D+ ) (4.17) Assim, pela regra da adição (2.6), tem-se s p = P(T1+ U T2+ | D+ ) = P(T1+ | D+ ) + P(T2+ | D+ ) − P(T1+ I T2+ | D+ ) (4.18) Com isso, pela independência de eventos (2.11), tem-se P(T1+ I T2+ | D+ ) = P(T1+ | D+ ) ⋅ P(T2+ | D+ ) (4.19) s p = P (T1+ | D+ ) + P (T2+ | D+ ) − P (T1+ | D+ ) ⋅ P (T2+ | D+ ) (4.20) então, Definido s1 = P(T1+ | D+ ) como sendo a sensibilidade do teste T1 e s2 = P(T21+ | D+ ) , a sensibilidade do teste T2, a sensibilidade do teste em paralelo é dada por: s p = s1 + s2 − s1 ⋅ s2 (4.21) A especificidade do teste em paralelo ep é dada por (SOARES, SIQUEIRA, 2002): e p = P(T− | D− ) = P(T1− I T2− | D− ) (4.22) pela independência de eventos (2.11), tem-se e p = P (T1− | D− ) ⋅ P (T2− | D− ) (4.22) assim, definindo e1 = P(T1− | D− ) como sendo a especificidade do teste T1 e e2 = P(T2− | D− ) é a especificidade do teste T2, portanto, a especificidade do teste em paralelo é dada por: 30 (4.23) e p = e1 ⋅ e2 4.5.2. Combinação em Série O teste em série é considerado positivo se ambos os testes forem positivos. Considerado apenas dois testes, o segundo teste somente será aplicado apenas se o primeiro for positivo. A Tabela 4.3 apresenta os resultados da aplicação de um teste em série. TABELA 4.3: Resultado do teste em série. Teste 1 Teste 2 Teste em Série Negativo Desnecessário Negativo Positivo Negativo Negativo Positivo Positivo Positivo A sensibilidade do teste em série é dada por (SOARES, SIQUEIRA, 2002): ss = P(T+ | D+ ) = P(T1+ I T2+ | D+ ) (4.24) Assim, utilizando a independência de eventos (2.11), tem-se ss = P(T1+ | D+ ) ⋅ P(T2+ | D+ ) (4.25) portanto, como s1 = P(T1+ | D+ ) e s2 = P(T2+ | D+ ) , a sensibilidade do teste em série, é dada por: ss = s1 ⋅ s2 (4.26) A especificidade do teste em série eS é dada por (SOARES, SIQUEIRA, 2002): es = P(T− | D− ) = P(T1− U T2− | D− ) (4.27) 31 ou seja, pela regra da adição (2.6), tem-se es = P(T1− U T2− | D− ) = P(T1− | D− ) + P(T2− | D− ) − P(T1− I T2− | D− ) (4.28) pela independência de eventos (2.11), tem-se que, P(T1− I T2− | D− ) = P(T1− | D− ) ⋅ P(T2− | D− ) portanto, como e1 = P (T1− | D − ) e e 2 = P (T2 − | D − ) , a expressão para especificidade do teste em série é dada por: eS = e1 + e2 − e1 ⋅ e2 (4.29) 5. EXEMPLOS DE APLICAÇÃO Neste capítulo serão apresentados exemplos de aplicações dos testes diagnósticos, um em que são calculados a sensibilidade, a especificidade e os valores preditivos, e outra em que os testes em paralelo e em série são utilizados. 5.1. Teste de reumatismo Pesquisadores estudam um caso de reumatismo em 176 pacientes com artrite reumatoide e 274 sem a doença (VIEIRA, 2010). Os valores apresentados na Tabela 5.1 apresentam os dados do teste. Doença Presente TABELA 5.1: Exame do fator reumatoide. Teste Positivo Negativo 120 56 Total 176 Ausente 24 250 274 Total 144 306 450 FONTE: MEDEIROS, MMC, FERRAZ, MB, 1998. Estudos sobre diagnósticos. Rev Bras Reumatol. 1998. A sensibilidade e a especificidade, usando os dados da Tabela 5.1, poder ser calculadas respectivamente por (4.5) e (4.6), logo tem-se: s = P (T+ | D+ ) = 120 = 0,682 176 e e = P (T − | D − ) = 250 = 0 ,912 274 (5.1) Portanto, para o teste de reumatismo tem-se uma sensibilidade de 68,2% e uma especificidade de 91,2%, ou seja, se o paciente realmente tiver a doença (reumatismo), o teste detecta com uma probabilidade de 68,2% e se o paciente não tiver a doença, a probabilidade do teste dar negativo, ou seja, acertar é 91,2%. 33 5.2. Teste de HIV Existem várias tecnologias para a detecção do vírus HIV, mas no Brasil a mais usada foi o teste ELISA. Em 1995 esta técnica foi aplicada em vários laboratórios americanos, e entre eles o ABBOTT, que relatou em seus primeiros testes, uma sensibilidade de 95% e uma especificidade de 99,8% (SOARES, SIQUEIRA, 2002). A Tabela 5.2 mostra os valores para o VPP, VPN, PFP e PFN. TABELA 5.2: Valores do teste ELISA. VPP(%) VPN(%) PFP(%) 0,47 100,00 99,53 Prevalência 1/100.000 PFN(%) 0,00 1/10.000 4,54 100,00 95,46 0,00 1/1.000 32,21 99,99 67,79 0,01 1/500 48,77 99,99 51,23 0,01 1/200 70,47 99,99 29,53 0,01 1/100 82,75 99,99 17,25 0,01 1/50 90,65 99,99 9,35 0,01 Considerando a prevalência de HIV como sendo de um caso a cada 1.000 indivíduos ( p = 0 ,001 ) , pode-se calcular os valores preditivos e as probabilidades de falso positivo e negativo, utilizando respectivamente (4.9), (4.12), (4.14) e (4.16), assim tem-se: VPP = s⋅ p 0,95⋅ 0,001 = = s ⋅ p + (1 − e) ⋅ (1 − p) 0,95⋅ 0,001+ (1 − 0,998) ⋅ (1 − 0,001) (5.2) = 0,00095 0,00095 = = 0,3221 0,00095+ 0,002⋅ 0,999 0,002948 34 VPN = e ⋅ (1 − p) 0,998⋅ (1 − 0,001) = = e ⋅ (1 − p) + (1 − s) ⋅ p 0,998⋅ (1 − 0,001) + (1 − 0,95) ⋅ 0,001 (5.3) = 0,998⋅ 0,999 0,997002 0,997002 = = = 0,9999 0,998⋅ 0,999 + 0,05⋅ 0,001 0,997002+ 0,00001 0,997003 PFP = 1 − VPP = 1 − 0,3221 = 0,6779 (5.4) PFN = 1 − VPN = 1 − 0 ,9999 = 0,0001 (5.5) Dessa forma, tem-se que a probabilidade de se cometer um falso positivo é considerável, pois a probabilidade do indivíduo não ter HIV dado que o teste foi positivo é de 67,79%. Entretanto, a probabilidade de cometer um falso negativo é muito baixa, somente 0,01%. Observe na Tabela 5.2 que a medida que a prevalência de HIV na população aumenta, o VPP também aumenta, e como a PFP é o complementar do VPP, então ela diminui. No entanto, o VPN continua alto, mesmo para prevalência alta de HIV. O mesmo ocorre para a PFN. Por isso, que em geral, quando um paciente faz um teste de HIV e o resultado é positivo, o médico pede para que ele repita o teste (exame), enquanto, que se o resultado for negativo não é pedido para ele refazer o teste. 5.3. Diagnóstico de Câncer Pancreático Um paciente sente várias dores nas costas e no abdômen e tem uma perda de peso significante, os médicos levantam a hipótese de que seja câncer do pâncreas. Para verificar a presença da doença, os testes de ultrassom e tomografia computadorizadas são solicitados. A Tabela 5.3 mostra os dados sobre a sensibilidade e a especificidade dos testes, sendo usados em paralelo e em série (SOARES, SIQUEIRA, 2002). 35 TABELA 5.3: Combinação em paralelo e série dos testes de ultrassom e tomografia. Teste Sensibilidade (%) Especificidade (%) A: Ultrassom 75 65 B: Tomografia 85 85 P: A ou B positivo 96 55 S: A e B positivo 64 95 Os testes P e S são respectivamente os testes em paralelo e em série. Tomando ambos os testes A e B como independentes e usando as equações da sensibilidade (4.20) e da especificidade (4.23) do teste em paralelo e a sensibilidade (4.26) e especificidade (4.29) do teste em série, temse: s p = s A + s B − s A ⋅ s B = 0,75 + 0,85 − 0,75 ⋅ 0,85 = 0,96 (5.6) e p = e A ⋅ eB = 0,65 ⋅ 0,85 = 0,55 (5.7) ss = s A ⋅ sB = 0,75 ⋅ 0,85 = 0,64 (5.8) es = eA + eB − eA ⋅ eB = 0,65 + 0,85 − 0,65 ⋅ 0,85 = 0,95 (5.9) O teste em paralelo teve maior sensibilidade do que o teste em série, entretanto, a especificidade do teste em série foi maior do que a do paralelo. O uso de teste em paralelo ou em série, vai depender da urgência do diagnóstico. Em geral, em casos de emergência utiliza-se a combinação em paralelo, pois a mesma é mais sensível. Quando não necessita muita rapidez no diagnóstico, utiliza-se a combinação em série, pois essa tem uma especificidade maior. CONCLUSÃO Profissionais das ciências da saúde precisam passar por uma série de estudos antes de estarem aptos a elaborar e realizar os testes diagnósticos, que são fundamentais para os pacientes e tem que ser precisos e bem feitos. Com este trabalho, pode-se observar que esses testes são bastante complexos e por causa disso é necessário um conhecimento prévio à respeito de probabilidade, em particular, sobre o teorema de Bayes. Por isso, foram mostrados como se calcula os tipos de probabilidade e outras regras necessárias para a resolução dos testes. Com a aplicação da combinação dos testes em paralelo e em série, pode-se observar que o teste em paralelo é mais sensível que o teste em série, ou seja, a probabilidade do teste ser positivo dado que o paciente está doente é maior. Entretanto, o teste em série tem maior especificidade que o teste em paralelo, ou seja, a probabilidade do teste ser negativo dado que a pessoa não está doente é mais alta. Dessa forma, com a realização deste trabalho, pode-se concluir que, dependendo da urgência do tratamento, a combinação de testes em paralelo é o mais indicado, pois, basta apenas um dos testes ser positivo para considerar o resultado do teste em paralelo positivo e começar o tratamento do indivíduo imediatamente. No entanto, os testes em série são indicados, em geral, quando não se tem tanta urgência no diagnóstico do indivíduo, sendo utilizados em triagens e consultórios médicos. BIBLIOGRAFIA DANTAS, C. A. B. Probabilidade: Um Curso Introdutório. Editora USP. 3ª Edição Revista. 2008. MAGALHÃES, M. N; LIMA, A. C. P. Noções de Probabilidade e Estatística. 6ª Edição. Revisada. São Paulo: Editora USP, 2008. MARTINEZ, E. Z; LOUZADA NETO. F. Metodologia Estatística para Testes Diagnósticos e Laboratoriais com Respostas Dicotomizadas. Revista de Matemática Estatística, São Paulo, 18: 83101, 2000. MEYER, P. L. Probabilidade: Aplicações à Estatística. Editora LTC. 2ª Edição, 1983. MORETTIN, L. G. Estatística Básica: Probabilidade e Inferência. Editora Pearson, São Paulo. 1ª Edição, 2ª Reimpressão. 2012. SOARES, J. F; SIQUEIRA, A. L. Introdução à Estatística Médica. Cooperativa Editora e de Cultura Médica Ltda. 1ª Edição. Minas Gerais. 2002. VIEIRA, G. M. Segredos da Estatística em Pesquisa Científica. Gráfica e Editora Vieira. 1ª Edição. 2004. VIEIRA, S. Bioestatística – Tópicos Avançados. Editora Elsevier. 1ª Edição. 7ª Reimpressão, Revista e Atualizada. 2003. VIEIRA, S. Bioestatística – Tópicos Avançados. Editora Elsevier. 3ª Edição. 2010.