notas de aula - ICEB-UFOP

Propaganda
PROBABILIDADE
October 16, 2013
Bioestatística
Parte I
October 16, 2013
1 / 78
PROBABILIDADE
1
2
Probabilidade
Introdução
Operações com Eventos
Definição Clássica de Probabilidade
Definição axiomática de probabilidade
Exercícios
Espaço amostral não enumerável
Usando o EXCEL
Probabilidade condicional
Partição de um espaço amostral
Teorema se Bayes
Testes Diagósticos
Qualidade de testes diagnósticos
Sensibilidade e Especificidade
Exemplo 1
Exemplo 2
Valor da predições
Exemplo
Bioestatística 3
Parte I
October 16, 2013
2 / 78
Vimos anteriormente como caracterizar uma massa de dados, como o
objetivo de organizar e resumir informações.
Agora, apresentamos a teoria matemática que dá base teórica para o
desenvolvimento de técnicas estatísticas utilizadas nas tomadas de
decisões.
Bioestatística
Parte I
October 16, 2013
3 / 78
Fenômeno aleatório (ou experimento aleatório)
É a situação ou acontecimento cujos resultados não podem ser
previstos com certeza.
Exemplo: as condições climáticas para o próximo domingo não podem
ser estabelecidas com total acerto.
(Modelos podem ser estabelecidos para quantificar as incertezas das
diversas ocorrências nessas situações).
Bioestatística
Parte I
October 16, 2013
4 / 78
Espaço Amostral
É o conjunto de todos os resultados possíveis, de um experimento
aleatório.
Ele será representado pela letra grega Ω (ômega).
Quanto ao número de elementos pode ser:
Finito: Número limitado de elementos. Exemplo: S = 1, 2, 3, 4, 5, 6
Infinito: Número ilimitado de elementos:
a) Enumerável: Quando os possíveis resultados puderem ser
postos em concordância biunívoca com o conjunto dos números
naturais (caso das variáveis aleatórias discretas). Exemplo: N
b) Não Enumerável: Quando os possíveis resultados não
puderem ser postos em concordância biunívoca com o conjunto
dos números naturais (caso das variáveis aleatórias contínuas). R
Bioestatística
Parte I
October 16, 2013
5 / 78
Evento
Os subconjuntos de Ω são denominados eventos e podem ser
representados pelas letras maiúsculas A, B, · · · .
O conjunto vazio será representado por Φ, como já é tradicional.
Podem-se ter operações entre eventos da mesma forma que com
conjuntos, como é mostrado a seguir.
Bioestatística
Parte I
October 16, 2013
6 / 78
União
A união de dois conjuntos A e B, denotada por A U B, representa a
ocorrência de pelo menos um dos eventos, A ou B. É o evento que
ocorrerá se, e somente se, A ou B ou ambos ocorrerem.
Bioestatística
Parte I
October 16, 2013
7 / 78
Interseção
A interseção do evento A com o evento B, denotada por
ocorrência simultânea de A e B.
Bioestatística
Parte I
T
éa
October 16, 2013
8 / 78
Dois eventos são disjuntos ou mutuamente exclusivos quando não
tem elementos em comum.
Isto é, A ∩ B = Φ
Bioestatística
Parte I
October 16, 2013
9 / 78
Dizemos que A e B são complementares se sua união é o espaço
amostral e sua interseção é vazia.
O complementar de A será dado por Ac e temos que:
A ∪ Ac = Ω e A ∩ Ac = Φ.
Algumas vezes, encontramos A no lugar de Ac .
Bioestatística
Parte I
October 16, 2013
10 / 78
Exemplo
Lançam-se duas moedas. Sejam os eventos:
A: saída de faces iguais.
B: saída de cara na primeira moeda.
Determinar os eventos:
a) A ∪ B
b) A ∩ B
c) Ac
d) B c
e) (A ∪ B)c
f) (A ∩ B)
Bioestatística
Parte I
October 16, 2013
11 / 78
Definição Clássica de Probabilidade
Dado um experimento aleatório, sendo Ω seu espaço amostral, vamos
admitir que todos os elementos de Ω tenham a mesma chance de
acontecer, ou seja, Ω é um conjunto equiprovável.
Definimos a probabilidade de um evento A (A ⊂ Ω) ao número real
P (A) tal que:
P (A) =
Bioestatística
n(A)
número de resultados favoráveis a A
=
número de resultados possíveis
n(Ω)
Parte I
October 16, 2013
12 / 78
Exemplo
Considerndo o lançamento de um dado, pede-se:
a) A probabilidade do evento A (obter um número par na face
superior).
b) A probabilidade do evento B (obter um número menor ou igual a 6
na face superior).
c) A probabilidade do evento C (obter um número 4 na face superior).
d) A probabilidade do evento D (obter um número maior que 6 na face
superior).
Bioestatística
Parte I
October 16, 2013
13 / 78
Definição axiomática de probabilidade
Uma função P (·) é denominada probabilidade se satisfaz as
condições:
(i) 0 ≤ P (A) ≤ 1,∀A ⊂ Ω
(ii) P (Ω) = 1
(iii) P (
Sn
j=1 Aj )
=
Pn
j=1 P (Aj ),
com os Aj disjuntos, ou seja,
P (A1 ∪ A2 ) = P (A1 ) + P (A2 )
Bioestatística
Parte I
October 16, 2013
14 / 78
Essas propriedades são conhecidas como axiomas de Kolmogorov.
Os axiomas, muitas vezes, se inspiram em resultados experimentais e
que, assim, definem a probabilidade de forma que possa ser
confirmada experimentalmente.
A partir daí, pode-se mostrar que valem as seguintes relações:
Bioestatística
Parte I
October 16, 2013
15 / 78
1) Se A e B são dois eventos quaisquer, então,
P (A ∪ B) = P (A) + P (B) − P (A ∩ B)
2) Para o evento complementar vale a seguinte relação:
P (Ac ) = 1 − P (A)
3) Se A ⊂ B,entao,P (A) ≤ P (B)
4) P (A ∪ B) = P (A ∩ B) = 1 − P (A ∩ B)
5) P (A ∩ B) = P (A ∪ B) = 1 − P (A ∪ B)
Bioestatística
Parte I
October 16, 2013
16 / 78
Exercícios
Exercício 1
Sejam A e B dois eventos em um dado espaço amostral, tais que
P (A) = 0, 2; P (B) = p; P (A ∪ B) = 0, 5; P (A ∩ B) = 0, 1.
Determine o valor de p.
Exercício 2
Retira-se uma carta de um baralho completo de 52 cartas. Qual a
probabilidade de sair um rei ou uma carta de espadas?
Bioestatística
Parte I
October 16, 2013
17 / 78
Exercícios
Exercício 3
O seguinte grupo de pessoas está numa sala: 5 rapazes com mais de
21 anos, 4 rapazes com menos de 21 anos, 6 moças com mais de 21
anos e 3 moças com menos de 21 anos. Uma pessoa é escolhida ao
acaso entre as 18. Os seguintes eventos são definidos:
a pessoa tem mais de 21 anos
a pessoa tem menos de 21 anos
a pessoa é um rapaz
a pessoa é uma moça
Calcule P (B ∪ D) e P (A ∩ C)
Bioestatística
Parte I
October 16, 2013
18 / 78
Nem sempre é possível enumerar o espaço amostral.
Nesses casos, devemos usar a análise combinatória como processo
de contagem.
Vejamos alguns exemplos:
Bioestatística
Parte I
October 16, 2013
19 / 78
Exemplo 1
Em um congresso científico existem 15 matemáticos e 12 estatísticos.
Qual a probabilidade de se formar uma comissão com 5 membros, na
qual figurem 3 matemáticos e 2 estatísticos?
Resolução: A: comissão de 3 matemáticos e 2 estatísticos.
27
n(Ω) =
5
15
3
12
2
15
3
12
2
n(A) =
P (A) =
Bioestatística
Parte I
27
5
October 16, 2013
20 / 78
Exemplo 2
Qual a probabilidade de, num baralho com 52 cartas, ao se retirarem 4
cartas, ao acaso, sem reposição, se obter uma quadra?
Resolução: A: saída de uma quadra.
52
n(Ω) =
4
n(A) = 13
P (A) = Bioestatística
Parte I
13
52
4
October 16, 2013
21 / 78
Exemplo 3
Calcular a probabilidade de se obter exatamente 3 caras e 2 oroas em
5 lances de uma moeda?
Resolução: A: saída de 3 caras e 2 coroas.
n(Ω) = 32
n(A) =
5
3
P (A) =
Bioestatística
Parte I
= 10
10
32
October 16, 2013
22 / 78
Exemplo 4
Uma urna contem as letras A,A,A,R,R,S. Retira-se letra por letra.Qual
a probabilidade de sair a palavra ARARAS?
Resolução: A: saída da palavras araras.
n(Ω) = (P R)63,2,1 =
6!
3!2!1!
n(A) = 1
P (A) =
1
60
Observação
(P R)nn1 ,n2 ,···nn =
n!
n1 !n2 !n3 !
com n1 + n2 + · · · + nn = n
Bioestatística
Parte I
October 16, 2013
23 / 78
Usando o EXCEL
A planilha Excel dispõe de ferramenta específica para o cálculo de
combinações.
Esta ferramenta pertence à categoria das funções da Matemática e
Trigonometria.
Para adicioná-la proceda da seguinte forma :
Posicione o cursor na célula A1 e digite r =
Posicione o cursor na célula A2 e digite p =
Posicione o cursor na célula A3 e digite Cr,p =
Posicione o cursor na célula B1 e digite, por exemplo, 5
Posicione o cursor na célula B2 e digite, por exemplo, 2
Posicione o cursor na célula B3 e acione o auxiliar de função fx e
escolha a categoria Matemática e Trigonometria e clique em OK
Bioestatística
Parte I
October 16, 2013
24 / 78
Bioestatística
Parte I
October 16, 2013
25 / 78
Bioestatística
Parte I
October 16, 2013
26 / 78
Bioestatística
Parte I
October 16, 2013
27 / 78
Bioestatística
Parte I
October 16, 2013
28 / 78
Bioestatística
Parte I
October 16, 2013
29 / 78
Para permutações sem repetição, existe uma função no Excel.
Bioestatística
Parte I
October 16, 2013
30 / 78
Para permutações com repetição, podemos escrever a seguinte
expressão.
Bioestatística
Parte I
October 16, 2013
31 / 78
Probabilidade condicional
Dados dois eventos A e B, a probabilidade condicional de A dado que
B ocorreu é representada por P (A|B):
P (A|B) =
P (A ∩ B)
P (B)
Caso P (B) = 0, P (A|B) pode ser definido arbitrariamente. Nesse
curso, usaremos P (A|B) = P (A).
Bioestatística
Parte I
October 16, 2013
32 / 78
Independência de eventos
Dizemos que A e B são independentes se:
P (A ∩ B) = P (A)P (B)
ou equivalentemente,
P (A|B) = P (A), P (B) > 0
Esta última relação evidencia o significado de independência. O
conhecimento de que B ocorreu não influencia na probabilidade de
que A ocorra.
Bioestatística
Parte I
October 16, 2013
33 / 78
Exemplo
Há apenas dois modos, mutuamente exclusivos, de Genésio ir para
Genebra participar de um congresso: ou de navio ou de avião.
A probabilidade de Genésio ir de navio é de 40% e de ir de avião é de
60%.
Se ele for de navio, a probabilidade de chegar ao congresso com dois
dias de atraso é de 8,5%.
Se ele for de avião a probabilidade de chegar ao congresso com dois
dias de atraso é de 1%.
Bioestatística
Parte I
October 16, 2013
34 / 78
Árvore de Probabilidades
Foi dito quais são as probabilidades de o Genésio viajar de navio e de
avião. Daí, já podemos iniciar o desenho da árvore de probabilidades!
Teremos:
Bioestatística
Parte I
October 16, 2013
35 / 78
Árvore de Probabilidades
Quer tenha o Genésio viajado de navio, quer tenha viajado de avião,
ele poderá chegar com atraso ao congresso. E se pode chegar com
atraso, nós já somos capazes de deduzir que, contrariamente, ele
pode também chegar em tempo, ou seja, sem atraso.
Bioestatística
Parte I
October 16, 2013
36 / 78
Quantos caminhos de probabilidade nós temos nessa árvore de
probabilidades?
Temos quatro caminhos:
1o ) viajar de navio e chegar atrasado;
2o ) viajar de navio e chegar em tempo;
3o ) viajar de avião e chegar atrasado;
4o ) viajar de avião e chegar em tempo.
Daí, analisemos esta árvore e esses caminhos para responder
possíveis perguntas.
Bioestatística
Parte I
October 16, 2013
37 / 78
a) Qual a probabilidade de Genésio ir de navio e de chegar atrasado?
Daí, multiplicando-se as probabilidades individuais desse caminho,
teremos:
(0,40)x(0,085)= 0,034 = 3,4% Resposta!
Na linguagem da probabilidade, diremos: P(navio e atrasado)=0,034
b) Qual a probabilidade de Genésio ir de avião e chegar atrasado?
Multiplicando-se as probabilidades individuais desse caminho,
teremos:
(0,60)x(0,01)= 0,006 = 0,6% Resposta!
Na linguagem da probabilidade, diremos: P(avião e atrasado)=0,006
Bioestatística
Parte I
October 16, 2013
38 / 78
Árvore de Probabilidades
c) Qual a probabilidade de Genésio chegar atrasado?
A pergunta aqui foi diferente! Só falou no evento “atraso”, sem
estabelecer o meio de transporte!
Bioestatística
Parte I
October 16, 2013
39 / 78
Árvore de Probabilidades
Como são dois os caminhos que nos conduzem ao resultado
procurado, teremos portanto que somar essas duas probabilidades
resultantes de ambos.
Teremos, pois, que:
3, 4% + 0, 6% = 4% Resposta! Na linguagem da probabilidade,
diremos: P(atrasado)=0,04
Bioestatística
Parte I
October 16, 2013
40 / 78
Árvore de Probabilidades
d) Qual a probabilidade de Genésio chegar em tempo?
Aqui também não foi estabelecido qual seria o meio de transporte que
levaria Genésio a não se atrasar!
No item anterior, encontramos que a probabilidade de Genésio chegar
atrasado (independente do transporte utilizado) foi de 4%.
P(atrasado) + P(em tempo) = 100%
4% + P(em tempo) = 100%
P(em tempo)= 100% − 4%
P(em tempo) = 96% Resposta!
Na linguagem da probabilidade, diremos: P(em tempo)=0,96.
Bioestatística
Parte I
October 16, 2013
41 / 78
Há apenas dois modos, mutuamente excludentes, de Genésio ir para
Genebra participar de um congresso: ou de navio ou de avião.
A probabilidade de Genésio ir de navio é de 40% e de ir de avião é de
60%.
Se ele for de navio, a probabilidade de chegar ao congresso com dois
dias de atraso é de 8,5%.
Se ele for de avião a probabilidade de chegar ao congresso com dois
dias de atraso é de 1%.
Sabe-se que Genésio chegou com dois dias de atraso para participar
do congresso em Genebra.
Qual a probabilidade de ele ter ido de avião?
Bioestatística
Parte I
October 16, 2013
42 / 78
Probabilidade Condicional!
Para responder a essa pergunta, teremos que aplicar a seguinte
expressão:
P (A|B) =
P (A ∩ B)
P (B)
→ P(avião dado atrasado) = P(avião e atrasado) / P(atrasado)
Já concluímos anteriormente que: P(avião e atrasado)=0,006.
Vimos ainda que P(atrasado)=0,04.
→ P(avião dado atraso) = P(avião e atraso) / P(atraso)
→ P(avião dado atraso) = 0, 006/0, 04 = 0, 15 = 15% Resposta!
Bioestatística
Parte I
October 16, 2013
43 / 78
Exemplo
A probabilidade de um gato estar vivo daqui a 5 anos é 3/5. A
probabilidade de um cão estar vivo daqui a 5 anos é 4/5.
Considerando os eventos independentes:
Qual a probabilidade, ao mesmo tempo, de o cão estar vivo e de
o gato estar vivo daqui a 5 anos?
Qual a probabilidade de somente o cão estar vivo daqui a 5 anos?
Bioestatística
Parte I
October 16, 2013
44 / 78
Os eventos C1 , C2 , · · · , Ck formam uma partição do espaço amostral
se eles nao tem interseção entre si e sua uniao é igual ao espaço
amostral.
Isto é: Ci ∩ Cj = Φ para i 6= j e ∪ki=1 Ci = Ω.
A figura a seguir apresenta um exemplo de partição de 6 eventos.
Bioestatística
Parte I
October 16, 2013
45 / 78
Seja A um evento qualquer em Ω. Então, pela figura a seguir temos:
Bioestatística
Parte I
October 16, 2013
46 / 78
Teorema da Probabilidade Total
O evento A, neste caso, será dado entao, por:
A = (A ∩ C1 ) ∪ (A ∩ C2 ) ∪ (A ∩ C3 )
Sendo assim, a probabilidade de A, P (A), é dada por
P
P (A) = ki=1 P (Ci ∩ A)
Mas, P (Ci ∩ A) = P (Ci )P (A|Ci ) , i = 1, 2, · · · , k.
Logo,
P (A) =
Pk
i=1 P (Ci )(P (A|Ci )
O qual denominamos Teorema da Probabilidade Total.
Bioestatística
Parte I
October 16, 2013
47 / 78
Teorema se Bayes
Suponha que os eventos C1 , C2 , · · · , Ck formem uma partição do
espaço amostral Ω tal que P (Cj ) ≥ 0, j = 1, 2, · · · , k.
Seja A qualquer evento tal queP (A) ≥ 0. Entao, para qualquer
i = 1, 2, · · · , k temos:
P (Ci )P (A|Ci )
P (Cj |A) = Pk
i=1 P (Ci )P (A|Ci )
Bioestatística
Parte I
October 16, 2013
48 / 78
Exemplo
Em certo colégio 5% dos homens e 2% das mulheres têm mais do
que 1,80m de altura. Por outro lado, 60% dos estudantes são homens.
Se um estudante é selecionado ao acaso e tem mais de 1,80m de
altura, qual a probabilidade de que o estudante seja mulher?
Bioestatística
Parte I
October 16, 2013
49 / 78
Exercício 1
Em um cinema três filmes A, B e C foram responsáveis por toda a
clientela da última semana, sendo 20% dos clientes assistiram ao filme
A, 30% ao filme B e 50% assistiu ao filme C. Uma pesquisa, realizada
após cada apresentação dos filmes, mostrou que 20% dos clientes
que assistiram ao filme A estavam insatisfeitos, e a proporção de
insatisfeitos com os filmes B e C era foi de 5% e 2%, respectivamente.
Suponhamos que nenhum cliente assistiu a mais de um filme naquela
semana. Um cliente insatisfeito fez uma reclamação via urna sem se
lembrar de especificar a sala onde viu o filme. Pergunta-se: Qual é a
probabilidade deste cliente ter assistido ao filme A?
Bioestatística
Parte I
October 16, 2013
50 / 78
Exercício 2
Em um baralho com 52 cartas, qual a probabilidade de obter uma
carta de espadas ou uma carta de paus? E a probabilidade de obter
uma carta de paus ou uma carta de número 8? E por último, qual é a
probabilidade de uma carta selecionada deste baralho não ser de
espadas ou de paus?
Exercício 3
Qual é a probabilidade de se ter obtido um número par no lançamento
de um dado uma vez que se sabe que o resultado de tal lançamento
gerou um número menor que 4?
Bioestatística
Parte I
October 16, 2013
51 / 78
Testes Diagósticos
Uma das experiências mais rotineiras da prática médica é a
solicitação de um teste diagnóstico.
Os objetivos são vários, incluindo a triagem de pacientes, o
diagnóstico de doenças e o acompanhamento ou prognóstico da
evolução de um paciente.
Para chegar ao diagnóstico, o médico considera várias possibilidades,
com níveis de certeza que variam de acordo com as informações
disponíveis.
Bioestatística
Parte I
October 16, 2013
52 / 78
Aqui o objetivo será mostrar, usando a linguagem de Probabilidade,
como se mede o nível de incerteza da ocorrência de um evento, por
exemplo, a presença deuma doença após a observação de um teste
positivo.
Considerando o teste positivo quando indicar a presença da doença e
negativo quando indicar a ausência.
Bioestatística
Parte I
October 16, 2013
53 / 78
Não existe teste perfeito. Aquele que com certeza absoluta determina
a presença ou ausência da doença.
Assim, o objetivo principal é estudar os índices nos quais o conceito
de qualidade de um teste diagnóstico é, geralmente, desmembrado.
Frequentemente, um único teste não é suficiente, portanto, devemos
combinar dois ou mais testes.
O ideal seria que, para cada patologia, fossem determinados os testes
a serem incluídos no processo diagnóstico e a melhor forma e
combiná-los.
Bioestatística
Parte I
October 16, 2013
54 / 78
Dados genéricos de um teste clínico
Na etapa da pesquisa para a determinação do grau de confiabilidade
de um teste diagnóstico, o pesquisador utiliza-o primeiramente em
dois grupos muito específico de pessoas: um de portadoras da doença
perfeitamente caracterizada e outro sem a doença em questão.
O diagnóstico nessa etapa deve ser feito por um meio diferente do
teste em estudo, o chamado padrão ouro.
Os resultados desta etapa da pesquisa podem ser resumidos na
forma da Tabela a seguir.
Bioestatística
Parte I
October 16, 2013
55 / 78
Esquema padrão de síntese dos dados para
verificação da qualidade de um teste clínico
Doença
Teste
Positivo Negativo
Total
Presente
a
b
n1 = a + b
Ausente
c
d
n2 = c + d
Total
a+c
b+d
n = n1 + n2
Bioestatística
Parte I
October 16, 2013
56 / 78
Qualidade de testes diagnósticos
O bom uso de um teste diagnóstico requer, além de considerações
clínicas, o conhecimento de medidas que caracterizam a sua
qualidade intrínseca: a sensibilidade, a especificiddae e os
parâmetros que refletem a sua capacidade de produzir decisões
corretas: valor da predição negativa e valor da predição positiva.
Usando os resultados da Teoria das Probabilidades apresentados
anteriormente, vamos nos ocupar desses quatro indices nos quais é
usualmente decomposta a ideia de qualidade de um teste diagnóstico.
Bioestatística
Parte I
October 16, 2013
57 / 78
Para definir os índices que descrevem o grau de confiabilidade de um
teste, precisamos trabalhar com os seguintes eventos:
T+ corresponde a teste positivo.
T− corresponde a teste negativo.
D+ corresponde a indivíduo portador da doença.
D− corresponde a teste indivíduo não portador da doença.
Bioestatística
Parte I
October 16, 2013
58 / 78
Na análise da qualidade de testes diagnósticos, interessa conhecer
duas probabilidades condicionais que, pela sua importância, recebem
nomes especiais: sensibilidade e especificidade.
Bioestatística
Parte I
October 16, 2013
59 / 78
Sensibilidade
A sensibilidade, denotada por s, é definida como:
s = P (T+ |D+ )
ou seja, a probabilidade de o teste ser positivo sabendo-se que o
paciente que está sendo examinado é doente.
Bioestatística
Parte I
October 16, 2013
60 / 78
Especificidade
A especificidade, denotada por e, é definida como:
e = P (T− |D− )
ou seja, a probabilidade de o teste ser pnegativo sabendo-se que o
paciente que está sendo examinado não é portador da doença.
Bioestatística
Parte I
October 16, 2013
61 / 78
Os nomes são descritivos: especificidade mede a capacidade de
reação do teste em um paciente doente, enquanto a especificidade, a
não reação do teste em pacientes não portadores da doença, isto é, o
teste é específico para doenças em questão.
A análise da definição desses dois índices (s e e) mostra que,
subjacentemente a esses conceitos, estamos assumindo a existência
de um padrão ouro, ou seja, um teste diagnóstico que sempre produz
resultados corretos.
Além disso, assumimos que os pacientes são classificados apenas
como doentes e não doentes, não se admitindo estágios
intermediários.
Bioestatística
Parte I
October 16, 2013
62 / 78
Usando a notação da tabela anterior e a definição e probabilidade
condicional, os índices s e e são estimdos por:
Bioestatística
s=
a
a
=
n1
a+b
e=
d
d
=
n2
c+d
Parte I
October 16, 2013
63 / 78
Exemplo 1
Diagnóstico de doença coronariana
Wiener et. al. (1979) compararam os resultados do teste ergométrico
de tolerância a exercícios entre indivíduos com e sem doença
coronariana.
O teste foi considerado positivo quando se observou mais de 1mm de
depressão ou elevação do segmento ST, por no mínimo 0, 08s, em
comparação com o resultados obtidos com o paciente em repouso.
O diagnóstico definitivo foi feito através de angiografia.
A tabela a seguir sintetiza os resultados encontrados.
Bioestatística
Parte I
October 16, 2013
64 / 78
Resultados da aplicação do teste ergomético de
tolerância a exercícios em 1465 pessoas
Doença coronariana
Teste ergométrico
Positivo Negativo
Total
Presente (D+ )
815
208
1023
Ausente (D− )
115
327
442
Total
930
535
1465
A sensibilidade e a especificidade são estimadas por:
s=
815
= 0, 797
1023
e=
327
= 0, 740
442
O teste ergométrico tem uma sensibilidade de 79,7%, ligeiramente
suprior à sua especificidade (74%)
Bioestatística
Parte I
October 16, 2013
65 / 78
Exemplo 2
Metástase de Carcinoma Hepático
Lind e Singer (1986) estudaram a qualidade da tomografia
computadorizada para o diagnóstico de metástase de carcinoma de
fígado, obtendo os resultados sintetizados na tabela a seguir.
Um total de 150 pacientes foram submtidos a dois exames: a
tomografia computadorizada e a laparotomia. Este último é tomado
como padrão do outro, isto é, classifica o paciente sem erro.
Bioestatística
Parte I
October 16, 2013
66 / 78
Resultados da tomografia computadorizada em 67
pacientes com metástase e 83 sem metástase do
carcinoma hepático
Metástase do carcinoma hepático
Tomografia computadorizada
Positiva (T+ ) Negativa (T− )
Total
Presente (D+ )
52
15
67
Ausente (D− )
9
74
83
Total
61
89
150
A sensibilidade e a especificidade são estimadas por:
s=
52
= 0, 776
67
e=
74
= 0, 892
83
Diferentemente do exemplo anterior, a especificidade (89, 2%) é maior
di que a sensibilidade (77, 6%).
Bioestatística
Parte I
October 16, 2013
67 / 78
Valor da predições
A sensibilidade e a especificidade, embora sendo índices ilustrativos e
bons sintetizadores das qualidades gerais de um teste,têm uma séria
limitação: não ajudam a decisão da equipe médica que, recebendo
um paciente com resultado positivo do teste, precisa avaliar se o
paciente está ou não doente.
Não se pode depender apenas da sensibilidade e da especificidade,
pois estes índices sõ provenientes de uma situação em que há certeza
total sobre o diagnóstico, o que não acontece no consultório médico.
Daí a necessidade de dois outros índices que refletem melhor a
realidade prática.
Bioestatística
Parte I
October 16, 2013
68 / 78
Valor da predições
Neste momento, interessa mais conhecer os seguintes índices
denominados valor de predição positiva (VPP) e o valor da predição
negativa (VPN), definidos respectivamente por:
V P P = P (D+ |T+ )
V P N = P (D− |T− )
Em palavras, VPP é aprobabilidade do paciente estar realmente
doente quando o resultado do teste é positivo e VPN, a probabilidade
do paciente não estar doente quando o resultado do teste é negativo.
Estes valores são probabilidades condicionais, tal que o evento
condicionante é o resultado do teste, aquele que na prática acontece
primeiro.
Bioestatística
Parte I
October 16, 2013
69 / 78
Probabilidades necessárias para o cálcul odos índices
VPP e VPN
A maneira mais fácil de se calcular o VPP e o VPN é através da
Tabela a seguir, sugerida por Vecchio(1996).
Seja p = P (D+ ) a prevalência da doença na população de interesse,
isto é, a proporção de pessoas doentes, ou a probabilidade de doença
pré-teste.
População
Proporção
Doente
p
ps
p(1 − s)
Sadio
1−p
(1 − p)(1 − e)
(1 − p)e
Total
1
ps + (1 − p)(1 − e)
p(1 − s) + (1 − p)e
Bioestatística
Proporção com resultado
Positivo
Negativo
Parte I
October 16, 2013
70 / 78
O valor da predição positiva é obtido dividindo-se a frequencia dos
"verdadeiros" positivos, aqueles oriundos de pacientes doentes, pelo
total de positivos. Obtem-se a seguinte expressão:
V PP =
ps
ps + (1 − p)(1 − e)
De forma análoga, considerando-se "verdadeiros" negativos obtemos
o valor da predição ngativa:
V PN =
(1 − p)e
p(1 − s) + (1 − p)e
Ambas as expressões dependem do conhecimento de p, uma
estimativa da prevalência da doença na população de interesse.
Estas são probabilidades de resultados corretos de diagnóstico.
Bioestatística
Parte I
October 16, 2013
71 / 78
Exemplo 3
Metástase de Carcinoma Hepático - continuação
Para uma população cuja prevalência de Metástase de Carcinoma de
fígado é de 2%, os valores de predição da tomografia
computadorizada são:
V PP =
0, 02x0, 78
= 0, 13
0, 02x0, 78 + (1 − 0, 02)(1 − 0, 89)
V PN =
(1 − 0, 02)x0, 89
= 0, 99
(1 − 0, 02)x0, 89 + 0, 02(1 − 0, 78)
Bioestatística
Parte I
October 16, 2013
72 / 78
Portanto, o valor da predição positiva é baixo enquanto que o valor da
predição negativa é bastante alto.
Se o resultado da tomografia computadorizada é negativo, a chance
de não haver metástase é de 99%.
Se, antes de qualquer informação, o paciente tinha uma chance de
2% de apresentar a doença, após o resultado do teste negativo esta
chance é de apenas 1%.
Bioestatística
Parte I
October 16, 2013
73 / 78
Exercício
Pesquisadores que tratam de doenças hepáticas em uma clínica
especializada sugeriram um novo teste para detectar câncer no
fígado. Os resultados do experimento, para uma amostra de 2225
pacientes atendidos nessa clínica foram:
Câncer hepático
Teste
Positivo Negativo
Total
Presente
90
17
107
Ausente
39
2079
2118
Total
129
2096
2225
Pelo modo como os dados foram obtidos, a prevalência de câncer
hepático, nesta clínica, pode ser calculada usando os dados da tabela.
Bioestatística
Parte I
October 16, 2013
74 / 78
Exercício
a) Calcule a sensibilidade e a especificidade do teste.
b) Calcule a probabilidade de um paciente, atendido nessa clínica
e que não tem câncer no fígado, tenha um resultado positivo no
teste.
c) Calcule o valor da prediçã opositiva e o valor da predição
negativa.
d) Os pesuisadores que desenvolveram o teste sugeriram seu
uso como um meio simples para os clínicos em geral decidirem
se devem ou não encaminhar o paciente para uma clínica
especializada. Critique esta recomendação.
Bioestatística
Parte I
October 16, 2013
75 / 78
As probabilidades
P F P = P (D− |T+ ) = 1 − P (D+ |T+ ) = 1 − V P P
P F N = P (D+ |T− ) = 1 − P (D− |T− ) = 1 − V P N
referem-se, respectivamente ao falso-positivo e falso-negativo, isto
é,decisões incorretas baseadas no teste diagnóstico.
Bioestatística
Parte I
October 16, 2013
76 / 78
Por exemplo, as probabilidades de falso-positivo e falso-negativosão
muito frequentemente usadas para as quantidades 1 − s e 1 − e,
quando deveriam ser reservadas para 1 − V P P e 1 − V P N .
Por isso, na medida do possível, evitaremos usar tais termos.
Bioestatística
Parte I
October 16, 2013
77 / 78
Infelizmente, não há na literaturapadronização relativa a nomes dos
índices de um teste diagnóstico.
Por exemplo,
Bioestatística
Parte I
October 16, 2013
78 / 78
MAGALHÃES, M. N. ; LIMA,A. C. P. Noções de Probabilidade e
Estatística. Edusp.2004.
MORETTIN, L.G. Estatística Básica - Probabilidade e Inferência.
(Volume ùnico)Editora Pearson. 2010.
SOARES, J. F. SIQUEIRA, A. L. Introdução À Estatística Médica.
Coopmed. 2002.
Bioestatística
Parte I
October 16, 2013
78 / 78
Download