Probabilidades

Propaganda
Costa, S.C.
1
Universidade Estadual de Londrina
Departamento de Estatı́stica
Probabilidades
Silvano Cesar da Costa
Londrina - Paraná
Costa, S.C.
Noções sobre a teoria das probabilidades
Conceitos probabilı́sticos são necessários para se estudar fenômenos aleatórios,
isto é, situações em que os resultados possı́veis são conhecidos, mas não se
pode saber a priori qual deles ocorrerá.
Conceitos básicos em probabilidade
# Experimento aleatório
É um processo de coleta de dados relativo a um fenômeno que acusa variabilidade em seus resultados. Os resultados não serão previsı́veis, serão diferentes
mesmo que as condições iniciais sejam sempre as mesmas.
2
Costa, S.C.
Exemplos:
a) lançar uma moeda honesta e observar a face voltada para cima;
b) lançar três moedas honestas e observar as faces voltadas para cima;
c) efetuar a medida do nı́vel de ácido úrico de um paciente durante um mês;
d) anotar o resultado de uma inseminação artificial;
e) colocar 20 ovos em uma incubadora e observar, após um certo perı́odo de
tempo, o número de ovos eclodidos;
f) anotar o número de espécies de aves que são capturadas numa rede-neblina
armada no sub-bosque de uma floresta nativa.
Quando se tem um experimento aleatório, não se pode prever com certeza o
resultado. Pode-se, no entanto, descrever todos os possı́veis resultados deste
experimento.
3
Costa, S.C.
# Espaço Amostral
Ao conjunto de todos os resultados possı́veis de um experimento aleatório
chamamos de espaço amostral. É representado por S ou Ω.
Exemplos:
a) o lançamento de uma moeda e a verificação da face voltada para cima:
b) lançar três moedas justas e observar as faces voltadas para cima:
c) anotar o resultado de uma inseminação artificial;
d) colocar 20 ovos em uma incubadora e observar, após um certo perı́odo de
tempo, o número de ovos eclodidos;
e) anotar o número de espécies de aves que são capturadas numa rede-neblina
armada no sub-bosque de uma floresta nativa:
4
Costa, S.C.
5
# Evento
É qualquer subconjunto do espaço amostral.
Os eventos são geralmente representados por letras maiúsculas, como A, B,
C, . . ..
Dentre os eventos a considerar, deve-se incluir o próprio espaço amostral
(evento certo) e o conjunto vazio (evento impossı́vel).
Exemplo: Um experimento foi conduzido com a finalidade de se conhecer
a eficiência de um tratamento na cura de certa doença. Para tanto, três
doentes foram tratados com a referida droga. O espaço amostral S é dado
por:
S = {CCC; CCC; CCC; CC C; C CC; CCC; CCC, C C C}
em que: C = cura e C = não cura.
Considere os seguintes eventos:
A = {Obter duas curas}
B = {Obter quatro curas}
=⇒
=⇒
A = {CCC; CCC CCC; }
B = ϕ.
O evento B é denominado evento impossı́vel.
Costa, S.C.
Exercı́cios
Defina um espaço amostral para cada um dos seguintes experimentos
aleatórios:
I Observar o sexo da próxima pessoa a entrar na sala;
I Uma moeda é lançada duas vezes e observam-se as faces obtidas;
I Uma urna contém 10 bolas azuis e 10 vermelhas com dimensões rigorosamente iguais. Três bolas são selecionadas ao acaso com reposição e as
cores anotadas.
I Um casal pretende ter filhos até ter uma menina ou no máximo quatro
filhos;
I Lance um dado até que a face 3 ocorra pela primeira vez.
6
Costa, S.C.
Conceito de Probabilidade
Conceito Clássico ou a priori
a) a probabilidade é definida com base em dados do experimento aleatório;
b) a probabilidade é obtida antes de o experimento ser realizado e, daı́, o
nome a priori ;
O conceito clássico surgiu no século XVII a partir dos jogos de azar e define
a probabilidade de o evento A ocorrer como sendo:
Número de resultados favoráveis a A
P (A) =
Número de resultados possı́veis
7
Costa, S.C.
Exemplo: No lançamento de um dado honesto, qual é a probabilidade de o
resultado ser um número:
a) Ímpar?
b) Menor que 3?
c) Primo?
Exemplo: Ao retirar uma carta de um baralho com 52 cartas, qual a probabilidade de ser:
a) um rei?
b) uma figura?
c) um número primo?
8
Costa, S.C.
Em todos os exemplos, deve-se definir:
E: Experimento aleatório;
S: Espaço amostral;
A: Evento;
P: Probabilidade do evento
É importante notar que a definição clássica exige que os resultados tenham
todos a mesma chance. Se os resultados não têm a mesma chance, deve-se
apelar para a estimativa pela frequência relativa.
9
Costa, S.C.
Mas como calcular as probabilidades a priori nas seguintes situações:
a) Uma pessoa que fuma um pacote de cigarros por dia desenvolver câncer;
b) Ocorrer uma geada no próximo inverno;
c) Furto de um veı́culo Honda Civic 2014;
d) Acidente automobilı́stico em Londrina, nos finais de semana, no perı́odo
entre 0h e 4h da manhã;
e) A vacinação contra certa doença reduzir a mortalidade.
f) Uma pessoa do curso de Medicina Veterinária da UEL, ter estatura entre
1, 70 m e 1, 75 m?
10
Costa, S.C.
Conceito Frequentista ou a posteriori
Na maioria das situações práticas, os elementos do espaço amostral não são
igualmente prováveis e, deste modo, a probabilidade dos eventos deve ser
calculada utilizando-se da noção de frequência relativa.
As caracterı́sticas da teoria frequentista são:
a) a probabilidade dos eventos é definida com base em registros da ocorrência
dos eventos;
b) os “experimentos aleatórios” passam a ser ensaios conduzidos repetidamente em condições relativamente uniformes, daı́ o nome de
probabilidade a posteriori ;
c) a probabilidade de um evento é definida como a frequência relativa de
ocorrência do evento numa série de ensaios ou simulações, daı́ o nome
“frequentista”.
11
Costa, S.C.
Realize (ou observe) um experimento um grande número de vezes e conte
quantas vezes o evento A ocorre. Então P (A) é estimada como segue:
Número de ocorrências de A
P (A) =
Número de repetições
Ao calcular probabilidades pelo método da frequência relativa, obtém-se uma
aproximação em lugar de um valor exato.
À medida que o número de observações aumenta, as aproximações tendem a
ficar cada vez mais próximas da probabilidade efetiva.
Exemplos:
1) Verifique o exemplo sobre Planejamento Familiar da apostila.
2) Dos 4.560 atendimentos realizados pelo Hospital Veterinário da UEL em
2009, 125 resultaram em óbito. Qual a probabilidade de um animal atendido no HV vir a óbito? Considere o evento A como sendo o óbito do
animal.
12
Costa, S.C.
13
3) A probabilidade de um aluno, aleatoriamente selecionado, do curso de
Medicina Veterinária, da UEL, ter entre 1, 70 m e 1, 75 m é dado por:
Tabela 1: Estaturas dos alunos do
Tabela 2: Estaturas dos alunos do
curso de Medicina Veterinária, da UEL, em 2015.
curso de Medicina Veterinária, da UEL, de 2010 a
2016.
Estaturas
fi
fr
1,50 ⊢ 1,55
2
0,025
Estaturas
fi
fr
1,55 ⊢ 1,60
8
0,100
1,45 ⊢ 1,50
1
0,0022
1,60 ⊢ 1,65
14
0,175
1,50 ⊢ 1,55
17
0,0370
1,65 ⊢ 1,70
18
0,225
1,55 ⊢ 1,60
54
0,1174
1,70 ⊢ 1,75
18
0,225
1,60 ⊢ 1,65
84
0,1826
1,75 ⊢ 1,80
13
0,162
1,65 ⊢ 1,70
84
0,1826
1,80 ⊢ 1,85
4
0,050
1,70 ⊢ 1,75
98
0,2130
1,85 ⊢ 1,90
3
0,038
1,75 ⊢ 1,80
55
0,1196
1,80 ⊢ 1,85
40
0,0870
1,85 ⊢ 1,90
21
0,0456
1,90 ⊢ 1,95
6
0,0130
Costa, S.C.
4) Em uma prova caı́ram dois problemas. Sabe-se que 132 alunos acertaram
o primeiro, 86 erraram o segundo, 120 acertaram os dois e 54 acertaram
apenas um problema. Qual a probabilidade de que um aluno, escolhido
ao acaso:
a) não tenha acertado nenhum problema?
b) tenha acertado apenas o segundo problema?
5) O número de animais, por porte e sexo, atendidos no Hospital Universitário é:
Sexo
Fêmeas
Machos
Porte do animal
Pequeno Médio Grande
248
102
40
192
82
32
Sorteando-se ao acaso uma dessas fichas de atendimento, qual a probabilidade de:
a) uma ficha de animal de grande porte ter sido sorteada?
b) uma ficha de animal macho de pequeno porte ter sido sorteada?
14
Costa, S.C.
Propriedades da Probabilidade
As probabilidades sempre se referem a ocorrência de eventos e, independentemente do conceito utilizado, clássico ou frequentista, o modelo de probabilidade terá sempre uma coerência interna que resulta dos axiomas de
probabilidade:
0 ≤ P (A) ≤ 1
P (S) = 1
P (ϕ) = 0
Obs.: Se Ā for o evento complementar de A, então P (Ā) = 1 − P (A).
15
Costa, S.C.
Diagramas de Venn
Operações com Eventos
Em muitos problemas de probabilidade interessam-nos eventos que podem ser
expressos em termos de dois ou mais eventos, formando uniões, interseções e
complementos. Os espaços amostrais e os eventos, especialmente as relações
entre os eventos, costumam ser ilustrados por diagramas de Venn, que
auxiliam na “visualização” dos conceitos básicos de probabilidade.
16
Costa, S.C.
União de Eventos:
O evento união de A e B equivale à ocorrência de A, ou de B, ou ambos.
Contém os elementos do espaço amostral que estão em pelo menos um dos
dois conjuntos.
∪
Diz-se “ocorre A ou B”.
Notação: A B
17
Costa, S.C.
Interseção de Eventos:
A interseção de dois eventos A e B, é o evento que consiste de todos os elementos contidos simultaneamente em A e em B. Contém todos os pontos
comuns a A e B.
∩
Diz-se “ocorre A e B”.
Notação: A B
18
Costa, S.C.
Eventos Disjuntos:
Dois eventos A e B, dizem-se disjuntos ou mutuamente exclusivos, quando a
ocorrência de um deles impossibilita a ocorrência do outro. Os dois eventos
não têm elementos
em comum.
∩
Notação: A B = ϕ
19
Costa, S.C.
Sub-Conjuntos:
Diz-se: “B é sub-conjunto de A” ou “B implica em A”.
Notação:
{ ∪
B A=A
B⊂A⇒
∩
B A=B
20
Costa, S.C.
Complemento:
É o evento que consiste de todos os elementos do espaço amostral que não
estão contidos em A, ou seja, é a negação de A.
Notação: Ac ou Ā.
{
∪
c
A
A=S
Ac ⇒
∩
Ac A = ϕ
21
Costa, S.C.
Regras de Cálculo de Probabilidades
Utilizando os diagramas de Venn torna-se mais fácil compreender algumas
regras que surgem naturalmente no cálculo de probabilidades.
Regra 1: Probabilidade da união de eventos
P (A ∪ B) = P (A) + P (B) − P (A ∩ B)
Se A e B forem mutuamente exclusivos (disjuntos), têm-se P (A ∩ B) = 0, e
o teorema fica sendo:
P (A ∪ B) = P (A) + P (B)
22
Costa, S.C.
23
Exemplo: Considere o experimento “lançamento de um dado” e os seguintes
eventos:
A = sair o número 3;
B = sair número par, e
C = sair número ı́mpar.
Determinar: P (A);
P (B);
P (C);
P (A ∪ B);
P (A ∪ C) e P (Ac ).
Regra 1B: Probabilidade da união de eventos disjuntos
Se A e B são disjuntos ⇒ A ∩ B = ϕ
⇒
P (A ∩ B) = 0.
Portanto, a probabilidade da união de eventos disjuntos fica:
P (A ∪ B) = P (A) + P (B)
Costa, S.C.
Regra 2: Probabilidade da união de uma sequência de eventos
disjuntos
Se A1 , A2 , A3 , . . . , formam uma sequência de eventos disjuntos, então:
(∞ )
∞
∑
∪
Ai =
P (Ai ).
P
i=1
i=1
Exemplo: No lançamento de duas moedas temos: A1 = “pelo menos uma
cara”, A2 = “duas coroas”. Qual a probabilidade de duas coroas ou pelo
menos uma cara?
24
Costa, S.C.
Regra 3: Probabilidade do complemento
Do diagrama de Venn, têm-se que
A ∪ Ac = S ⇒ P (A ∪ Ac ) = P (S).
Mas, sabe-se que: P (S) = 1, e que A ∪ Ac = ϕ sendo P (ϕ) = 0, logo:
P (A ∪ Ac ) = P (S)
P (A) + P (Ac ) = 1
P (Ac ) = 1 − P (A).
Exemplo: Um dado é lançado 10 vezes, qual a probabilidade de A = “pelo
menos um 6”?
25
Costa, S.C.
Probabilidade Condicional
Algumas vezes a chance de um particular evento acontecer depende do resultado de algum outro evento. Por exemplo, a chance de um paciente com
alguma doença sobreviver o próximo ano depende, naturalmente, de ter sobrevivido no presente perı́odo.
A probabilidade do evento A, quando se sabe que o evento B ocorreu, é chamada probabilidade condicional de A dado B, denota-se por P (A|B).
Pode ser determinada dividindo-se a probabilidade de ocorrência de ambos
os eventos A e B pela probabilidade do evento B, como se mostra a seguir:
P (A ∩ B)
P (A|B) =
P (B)
ou, ainda,
P (B|A) =
P (A ∩ B)
,
P (A)
26
Costa, S.C.
27
Na probabilidade condicional, a ocorrência de um evento altera a probabilidade de ocorrência de outro evento.
Exemplo: Um grupo de pessoas foi classificado quanto a peso e pressão
arterial de acordo com as proporções mostradas na Tabela 3.
Tabela 3: Distribuição de pacientes segundo peso e pressão arterial.
Pressão arterial
Elevada
Normal
Total
Excesso
0,10
0,15
0,25
Peso
Normal
0,08
0,45
0,53
Deficiente
0,02
0,20
0,22
Total
0,20
0,80
1,00
Considerando-se que a pessoa escolhida tem excesso de peso, qual a probabilidade de ter também pressão elevada?
Dado que a pessoa escolhida tem peso deficiente, qual a probabilidade de ter
pressão normal?
Costa, S.C.
28
Probabilidade Condicional no Diagrama de Venn
Nota-se, através do diagrama de Venn, que a probabilidade condicional é
apenas uma redução do espaço amostral, ao evento que já ocorreu.
Se o evento A ocorreu, o resultado
está em A, ou seja,
P (B|A) =
P (A ∩ B)
P (A).
Se o evento B ocorreu, o resultado
está em B, ou seja,
P (A|B) =
P (A ∩ B)
P (B).
Costa, S.C.
Exemplo: Um número é sorteado ao acaso entre os inteiros 1, 2, . . . , 15. Se
o número sorteado for ı́mpar, qual a probabilidade de que seja o número 9?
29
Costa, S.C.
Aplicação da Probabilidade Condicional
O bom uso de um teste diagnóstico requer, além de considerações clı́nicas, o
conhecimento de medidas que caracterizam a sua qualidade:
a) a sensibilidade;
b) a especificidade;
A sensibilidade, denotada por s, é definida como:
s = P (T+ |D+ ),
A especificidade, denotada por e, é definida como:
e = P (T− |D− ),
30
Costa, S.C.
31
Tabela 4: Esquema padrão de sı́ntese dos dados para verificação da qualidade
de um teste clı́nico.
Teste (T)
Doença (D)
+
−
Total
Positivo (T )
Negativo (T )
Presente (D+ )
a
b
a+b
Ausente (D− )
c
d
c+d
Total
a+c
b+d
n
Para definir os ı́ndices que descrevem o grau de confiabilidade de um teste,
precisamos trabalhar com os seguintes eventos:
# T+ corresponde a teste positivo;
# T− corresponde a teste negativo;
# D+ corresponde a indivı́duo portador da doença;
# D− corresponde a indivı́duo não portador da doença.
Costa, S.C.
32
Usando a notação da Tabela 4 e a definição de probabilidade condicional,
têm que a sensibilidade e a especificidade são dadas, respectivamente, por:
Sensibilidade
s=
a
a+b
Especificidade
e=
d
c+d
Costa, S.C.
33
Exemplo: Linder & Singera estudaram a qualidade da tomografia computadorizada para o diagnóstico de metástase de carcinoma de fı́gado, e os
resultados resumidos na Tabela 5.
Tabela 5: Resultados da tomografia computadorizada em 67 pacientes com
metástase e 83 sem metástase do carcinoma hepático.
Metástase de
Tomografia computadorizada
Total
carcinoma hepático
Positiva (T+ )
Negativa (T− )
Presente (D+ )
52
15
67
Ausente (D− )
9
74
83
Total
61
89
150
a Diagnosing
liver metastases: a Bayesian analysis. Journal of Clinical Oncology,
v.3, p.379-88, 1986
Costa, S.C.
34
A sensibilidade e a especificidade da tomografia computadorizada são estimadas por:
Sensibilidade
Especifidade
a
s=
a+b
d
e=
c+d
52
s=
= 0, 776
67
74
e=
= 0, 892
83
Ainda, (1 − e) é definido como a probabilidade de se obter um falso positivo.
Já (1 − s) é a probabilidade de se obter um falso negativo.
Costa, S.C.
Valor das Predições
A sensibilidade e a especificidade não ajudam a decisão da equipe médica
que, recebendo um paciente com resultado positivo do teste, precisa
avaliar se o paciente está ou não doente.
Não se pode depender apenas da sensibilidade e a especificidade, pois
estes ı́ndices são provenientes de uma situação em que há certeza total
sobre o diagnóstico, o que não acontece no consultório médico.
Neste momento, interessa mais conhecer os seguintes ı́ndices denominados valor da predição positiva (VPP) e valor da predição negativa (VPN), definidos
respectivamente por:
35
Costa, S.C.
Valor da predição positiva (VPP) é a probabilidade do paciente estar realmente doente quando o resultado do teste é positivo.
V P P = P (D+ |T+ )
Valor da predição negativa (VPN) é a probabilidade do paciente não estar
doente quando o resultado do teste é negativo.
V P N = P (D− |T− )
Estes valores são probabilidade condicionantes, tal que o evento condicionante é o resultado do teste, aquele que na prática acontece primeiro.
36
Costa, S.C.
37
A maneira mais fácil de se calcular o VPP e VPN é através da Tabela 6, sugerida por Vecchio. Seja p a prevalência da doença na população de interesse,
isto é, a proporção de pessoas doentes.
Tabela 6: Probabilidades necessárias para o cálculo dos ı́ndices VPP e VPN.
Proporção com resultado
População
Proporção
Positivo
Negativo
Doente
p
ps
p(1-s)
Sadia
1-p
(1 - p) (1 - e)
(1 - p)e
Total
1
ps + (1 - p)(1 - e)
p (1 - s) + (1 – p)e
Costa, S.C.
Assim, o valor da predição positiva é:
V P P = P (D+ |T+ ) =
ps
.
ps + (1 − p)(1 − e)
O valor da predição negativa é dado por:
(1 − p)e
V P N = P (D− |T− ) =
.
p(1 − s) + (1–p)e
38
Costa, S.C.
Para o exemplo da Tabela 5, considere que a prevalência de metástase de
carcinoma de fı́gado é de 2%, os valores de predição da tomografia computadorizada são:
V PP
V PP
ps
0, 02 × 0, 776
=
ps + (1 − p)(1 − e)
0, 02 × 0, 776 + (1 − 0, 02)(1 − 0, 8916)
= 0, 1275.
=
e
V PN
V PN
(1 − p)e
(1 − 0, 02) × 0, 892
=
=
p(1 − s) + (1–p)e
0, 02 × (1 − 0, 776) + (1 − 0, 02) × 0, 8916)
= 0, 9949.
Portanto, o valor de predição positiva é baixo enquanto que o valor de
predição negativa é bastante alto. Se o resultado da tomografia computadorizada é negativo, a chance de não haver metástase é de 99,5%.
39
Costa, S.C.
Probabilidade da Intersecção de Dois Eventos
A probabilidade condicional permite-nos calcular diretamente a probabilidade da intersecção de dois eventos. Assim,
P (A ∩ B)
P (B)
⇒
P (A ∩ B) = P (B) P (A|B)
P (A ∩ B)
P (B|A) =
P (A)
⇒
P (A ∩ B) = P (A) P (B|A)
P (A|B) =
ou, ainda.
Exemplo: Em um laboratório de diagnóstico por imagem compareceram
nove pacientes naturais do local e três naturais de outros estados. Se dois
dos pacientes são selecionados aleatoriamente para um exame de angiografia,
qual é a probabilidade de serem ambos naturais de outro estado? Considere
A o evento “o primeiro paciente é natural de outro estado” e B o evento “o
segundo paciente é natural de outro estado.”
40
Costa, S.C.
Independência de Eventos
Dois eventos são considerados independentes quando a ocorrência de um deles
não depende da ocorrência do outro, isto é, P (A|B) = P (A) e P (B|A) =
P (B). Logo, o teorema do produto para dois eventos independentes é dado
por:
P (A ∩ B) = P (A) · P (B)
Exemplo 1: Efeitos colaterais com o uso de certa droga ocorrem em 10% de
todos os pacientes que a tomam. Dois pacientes de um médico estão tomando
a droga.
a) Qual é a probabilidade de que ambos os pacientes apresentem os efeitos
colaterais?
b) Qual é a probabilidade de que pelo menos um apresente os efeitos colaterais ?
41
Costa, S.C.
Exemplo 2: Suponha que a probabilidade de uma pessoa ser do tipo sanguı́neo
O é 45%, ser A é 42% e ser B é 10%. Suponha ainda que a probabilidade de
Rh+ é de 90% e que o fator independe do tipo sanguı́neo. Nestas condições,
qual a probabilidade de uma pessoa tomada ao acaso da população ser:
a) O e Rh+ ?
b) AB e Rh− ?
42
Costa, S.C.
Livro: Noções de Probabilidade e Estatı́stica
Autores: Marcos Nascimento Magalhães e Antonio Carlos Pedroso de Lima
Pág. 55 –
Exemplo: Uma famı́lia viaja ao litoral para passar um fim de semana. A
probabilidade de congestionamento na estrada é de 0,6. Havendo congestionamento, a probabilidade dos seus dois filhos brigarem no carro é de 0,8 e,
sem congestionamento, a briga pode aparecer com probabilidade 0,4. Quando
há briga, com ou sem congestionamento, a probabilidade do pai perder a
paciência com os filhos é de 0,7. É claro que havendo congestionamento o
pai pode perder a paciência com os filhos mesmo sem brigas o que aconteceria
com probabilidade 0,5. Quando não há nem congestionamento, nem briga, o
pai dirige tranquilo e não perde a paciência. Determina a probabilidade de:
a) não ter havido congestionamento se o pai não perdeu a paciência com seus
filhos;
b) ter havido briga, dado que perdeu a paciência.
43
Download