Costa, S.C. 1 Universidade Estadual de Londrina Departamento de Estatı́stica Probabilidades Silvano Cesar da Costa Londrina - Paraná Costa, S.C. Noções sobre a teoria das probabilidades Conceitos probabilı́sticos são necessários para se estudar fenômenos aleatórios, isto é, situações em que os resultados possı́veis são conhecidos, mas não se pode saber a priori qual deles ocorrerá. Conceitos básicos em probabilidade # Experimento aleatório É um processo de coleta de dados relativo a um fenômeno que acusa variabilidade em seus resultados. Os resultados não serão previsı́veis, serão diferentes mesmo que as condições iniciais sejam sempre as mesmas. 2 Costa, S.C. Exemplos: a) lançar uma moeda honesta e observar a face voltada para cima; b) lançar três moedas honestas e observar as faces voltadas para cima; c) efetuar a medida do nı́vel de ácido úrico de um paciente durante um mês; d) anotar o resultado de uma inseminação artificial; e) colocar 20 ovos em uma incubadora e observar, após um certo perı́odo de tempo, o número de ovos eclodidos; f) anotar o número de espécies de aves que são capturadas numa rede-neblina armada no sub-bosque de uma floresta nativa. Quando se tem um experimento aleatório, não se pode prever com certeza o resultado. Pode-se, no entanto, descrever todos os possı́veis resultados deste experimento. 3 Costa, S.C. # Espaço Amostral Ao conjunto de todos os resultados possı́veis de um experimento aleatório chamamos de espaço amostral. É representado por S ou Ω. Exemplos: a) o lançamento de uma moeda e a verificação da face voltada para cima: b) lançar três moedas justas e observar as faces voltadas para cima: c) anotar o resultado de uma inseminação artificial; d) colocar 20 ovos em uma incubadora e observar, após um certo perı́odo de tempo, o número de ovos eclodidos; e) anotar o número de espécies de aves que são capturadas numa rede-neblina armada no sub-bosque de uma floresta nativa: 4 Costa, S.C. 5 # Evento É qualquer subconjunto do espaço amostral. Os eventos são geralmente representados por letras maiúsculas, como A, B, C, . . .. Dentre os eventos a considerar, deve-se incluir o próprio espaço amostral (evento certo) e o conjunto vazio (evento impossı́vel). Exemplo: Um experimento foi conduzido com a finalidade de se conhecer a eficiência de um tratamento na cura de certa doença. Para tanto, três doentes foram tratados com a referida droga. O espaço amostral S é dado por: S = {CCC; CCC; CCC; CC C; C CC; CCC; CCC, C C C} em que: C = cura e C = não cura. Considere os seguintes eventos: A = {Obter duas curas} B = {Obter quatro curas} =⇒ =⇒ A = {CCC; CCC CCC; } B = ϕ. O evento B é denominado evento impossı́vel. Costa, S.C. Exercı́cios Defina um espaço amostral para cada um dos seguintes experimentos aleatórios: I Observar o sexo da próxima pessoa a entrar na sala; I Uma moeda é lançada duas vezes e observam-se as faces obtidas; I Uma urna contém 10 bolas azuis e 10 vermelhas com dimensões rigorosamente iguais. Três bolas são selecionadas ao acaso com reposição e as cores anotadas. I Um casal pretende ter filhos até ter uma menina ou no máximo quatro filhos; I Lance um dado até que a face 3 ocorra pela primeira vez. 6 Costa, S.C. Conceito de Probabilidade Conceito Clássico ou a priori a) a probabilidade é definida com base em dados do experimento aleatório; b) a probabilidade é obtida antes de o experimento ser realizado e, daı́, o nome a priori ; O conceito clássico surgiu no século XVII a partir dos jogos de azar e define a probabilidade de o evento A ocorrer como sendo: Número de resultados favoráveis a A P (A) = Número de resultados possı́veis 7 Costa, S.C. Exemplo: No lançamento de um dado honesto, qual é a probabilidade de o resultado ser um número: a) Ímpar? b) Menor que 3? c) Primo? Exemplo: Ao retirar uma carta de um baralho com 52 cartas, qual a probabilidade de ser: a) um rei? b) uma figura? c) um número primo? 8 Costa, S.C. Em todos os exemplos, deve-se definir: E: Experimento aleatório; S: Espaço amostral; A: Evento; P: Probabilidade do evento É importante notar que a definição clássica exige que os resultados tenham todos a mesma chance. Se os resultados não têm a mesma chance, deve-se apelar para a estimativa pela frequência relativa. 9 Costa, S.C. Mas como calcular as probabilidades a priori nas seguintes situações: a) Uma pessoa que fuma um pacote de cigarros por dia desenvolver câncer; b) Ocorrer uma geada no próximo inverno; c) Furto de um veı́culo Honda Civic 2014; d) Acidente automobilı́stico em Londrina, nos finais de semana, no perı́odo entre 0h e 4h da manhã; e) A vacinação contra certa doença reduzir a mortalidade. f) Uma pessoa do curso de Medicina Veterinária da UEL, ter estatura entre 1, 70 m e 1, 75 m? 10 Costa, S.C. Conceito Frequentista ou a posteriori Na maioria das situações práticas, os elementos do espaço amostral não são igualmente prováveis e, deste modo, a probabilidade dos eventos deve ser calculada utilizando-se da noção de frequência relativa. As caracterı́sticas da teoria frequentista são: a) a probabilidade dos eventos é definida com base em registros da ocorrência dos eventos; b) os “experimentos aleatórios” passam a ser ensaios conduzidos repetidamente em condições relativamente uniformes, daı́ o nome de probabilidade a posteriori ; c) a probabilidade de um evento é definida como a frequência relativa de ocorrência do evento numa série de ensaios ou simulações, daı́ o nome “frequentista”. 11 Costa, S.C. Realize (ou observe) um experimento um grande número de vezes e conte quantas vezes o evento A ocorre. Então P (A) é estimada como segue: Número de ocorrências de A P (A) = Número de repetições Ao calcular probabilidades pelo método da frequência relativa, obtém-se uma aproximação em lugar de um valor exato. À medida que o número de observações aumenta, as aproximações tendem a ficar cada vez mais próximas da probabilidade efetiva. Exemplos: 1) Verifique o exemplo sobre Planejamento Familiar da apostila. 2) Dos 4.560 atendimentos realizados pelo Hospital Veterinário da UEL em 2009, 125 resultaram em óbito. Qual a probabilidade de um animal atendido no HV vir a óbito? Considere o evento A como sendo o óbito do animal. 12 Costa, S.C. 13 3) A probabilidade de um aluno, aleatoriamente selecionado, do curso de Medicina Veterinária, da UEL, ter entre 1, 70 m e 1, 75 m é dado por: Tabela 1: Estaturas dos alunos do Tabela 2: Estaturas dos alunos do curso de Medicina Veterinária, da UEL, em 2015. curso de Medicina Veterinária, da UEL, de 2010 a 2016. Estaturas fi fr 1,50 ⊢ 1,55 2 0,025 Estaturas fi fr 1,55 ⊢ 1,60 8 0,100 1,45 ⊢ 1,50 1 0,0022 1,60 ⊢ 1,65 14 0,175 1,50 ⊢ 1,55 17 0,0370 1,65 ⊢ 1,70 18 0,225 1,55 ⊢ 1,60 54 0,1174 1,70 ⊢ 1,75 18 0,225 1,60 ⊢ 1,65 84 0,1826 1,75 ⊢ 1,80 13 0,162 1,65 ⊢ 1,70 84 0,1826 1,80 ⊢ 1,85 4 0,050 1,70 ⊢ 1,75 98 0,2130 1,85 ⊢ 1,90 3 0,038 1,75 ⊢ 1,80 55 0,1196 1,80 ⊢ 1,85 40 0,0870 1,85 ⊢ 1,90 21 0,0456 1,90 ⊢ 1,95 6 0,0130 Costa, S.C. 4) Em uma prova caı́ram dois problemas. Sabe-se que 132 alunos acertaram o primeiro, 86 erraram o segundo, 120 acertaram os dois e 54 acertaram apenas um problema. Qual a probabilidade de que um aluno, escolhido ao acaso: a) não tenha acertado nenhum problema? b) tenha acertado apenas o segundo problema? 5) O número de animais, por porte e sexo, atendidos no Hospital Universitário é: Sexo Fêmeas Machos Porte do animal Pequeno Médio Grande 248 102 40 192 82 32 Sorteando-se ao acaso uma dessas fichas de atendimento, qual a probabilidade de: a) uma ficha de animal de grande porte ter sido sorteada? b) uma ficha de animal macho de pequeno porte ter sido sorteada? 14 Costa, S.C. Propriedades da Probabilidade As probabilidades sempre se referem a ocorrência de eventos e, independentemente do conceito utilizado, clássico ou frequentista, o modelo de probabilidade terá sempre uma coerência interna que resulta dos axiomas de probabilidade: 0 ≤ P (A) ≤ 1 P (S) = 1 P (ϕ) = 0 Obs.: Se Ā for o evento complementar de A, então P (Ā) = 1 − P (A). 15 Costa, S.C. Diagramas de Venn Operações com Eventos Em muitos problemas de probabilidade interessam-nos eventos que podem ser expressos em termos de dois ou mais eventos, formando uniões, interseções e complementos. Os espaços amostrais e os eventos, especialmente as relações entre os eventos, costumam ser ilustrados por diagramas de Venn, que auxiliam na “visualização” dos conceitos básicos de probabilidade. 16 Costa, S.C. União de Eventos: O evento união de A e B equivale à ocorrência de A, ou de B, ou ambos. Contém os elementos do espaço amostral que estão em pelo menos um dos dois conjuntos. ∪ Diz-se “ocorre A ou B”. Notação: A B 17 Costa, S.C. Interseção de Eventos: A interseção de dois eventos A e B, é o evento que consiste de todos os elementos contidos simultaneamente em A e em B. Contém todos os pontos comuns a A e B. ∩ Diz-se “ocorre A e B”. Notação: A B 18 Costa, S.C. Eventos Disjuntos: Dois eventos A e B, dizem-se disjuntos ou mutuamente exclusivos, quando a ocorrência de um deles impossibilita a ocorrência do outro. Os dois eventos não têm elementos em comum. ∩ Notação: A B = ϕ 19 Costa, S.C. Sub-Conjuntos: Diz-se: “B é sub-conjunto de A” ou “B implica em A”. Notação: { ∪ B A=A B⊂A⇒ ∩ B A=B 20 Costa, S.C. Complemento: É o evento que consiste de todos os elementos do espaço amostral que não estão contidos em A, ou seja, é a negação de A. Notação: Ac ou Ā. { ∪ c A A=S Ac ⇒ ∩ Ac A = ϕ 21 Costa, S.C. Regras de Cálculo de Probabilidades Utilizando os diagramas de Venn torna-se mais fácil compreender algumas regras que surgem naturalmente no cálculo de probabilidades. Regra 1: Probabilidade da união de eventos P (A ∪ B) = P (A) + P (B) − P (A ∩ B) Se A e B forem mutuamente exclusivos (disjuntos), têm-se P (A ∩ B) = 0, e o teorema fica sendo: P (A ∪ B) = P (A) + P (B) 22 Costa, S.C. 23 Exemplo: Considere o experimento “lançamento de um dado” e os seguintes eventos: A = sair o número 3; B = sair número par, e C = sair número ı́mpar. Determinar: P (A); P (B); P (C); P (A ∪ B); P (A ∪ C) e P (Ac ). Regra 1B: Probabilidade da união de eventos disjuntos Se A e B são disjuntos ⇒ A ∩ B = ϕ ⇒ P (A ∩ B) = 0. Portanto, a probabilidade da união de eventos disjuntos fica: P (A ∪ B) = P (A) + P (B) Costa, S.C. Regra 2: Probabilidade da união de uma sequência de eventos disjuntos Se A1 , A2 , A3 , . . . , formam uma sequência de eventos disjuntos, então: (∞ ) ∞ ∑ ∪ Ai = P (Ai ). P i=1 i=1 Exemplo: No lançamento de duas moedas temos: A1 = “pelo menos uma cara”, A2 = “duas coroas”. Qual a probabilidade de duas coroas ou pelo menos uma cara? 24 Costa, S.C. Regra 3: Probabilidade do complemento Do diagrama de Venn, têm-se que A ∪ Ac = S ⇒ P (A ∪ Ac ) = P (S). Mas, sabe-se que: P (S) = 1, e que A ∪ Ac = ϕ sendo P (ϕ) = 0, logo: P (A ∪ Ac ) = P (S) P (A) + P (Ac ) = 1 P (Ac ) = 1 − P (A). Exemplo: Um dado é lançado 10 vezes, qual a probabilidade de A = “pelo menos um 6”? 25 Costa, S.C. Probabilidade Condicional Algumas vezes a chance de um particular evento acontecer depende do resultado de algum outro evento. Por exemplo, a chance de um paciente com alguma doença sobreviver o próximo ano depende, naturalmente, de ter sobrevivido no presente perı́odo. A probabilidade do evento A, quando se sabe que o evento B ocorreu, é chamada probabilidade condicional de A dado B, denota-se por P (A|B). Pode ser determinada dividindo-se a probabilidade de ocorrência de ambos os eventos A e B pela probabilidade do evento B, como se mostra a seguir: P (A ∩ B) P (A|B) = P (B) ou, ainda, P (B|A) = P (A ∩ B) , P (A) 26 Costa, S.C. 27 Na probabilidade condicional, a ocorrência de um evento altera a probabilidade de ocorrência de outro evento. Exemplo: Um grupo de pessoas foi classificado quanto a peso e pressão arterial de acordo com as proporções mostradas na Tabela 3. Tabela 3: Distribuição de pacientes segundo peso e pressão arterial. Pressão arterial Elevada Normal Total Excesso 0,10 0,15 0,25 Peso Normal 0,08 0,45 0,53 Deficiente 0,02 0,20 0,22 Total 0,20 0,80 1,00 Considerando-se que a pessoa escolhida tem excesso de peso, qual a probabilidade de ter também pressão elevada? Dado que a pessoa escolhida tem peso deficiente, qual a probabilidade de ter pressão normal? Costa, S.C. 28 Probabilidade Condicional no Diagrama de Venn Nota-se, através do diagrama de Venn, que a probabilidade condicional é apenas uma redução do espaço amostral, ao evento que já ocorreu. Se o evento A ocorreu, o resultado está em A, ou seja, P (B|A) = P (A ∩ B) P (A). Se o evento B ocorreu, o resultado está em B, ou seja, P (A|B) = P (A ∩ B) P (B). Costa, S.C. Exemplo: Um número é sorteado ao acaso entre os inteiros 1, 2, . . . , 15. Se o número sorteado for ı́mpar, qual a probabilidade de que seja o número 9? 29 Costa, S.C. Aplicação da Probabilidade Condicional O bom uso de um teste diagnóstico requer, além de considerações clı́nicas, o conhecimento de medidas que caracterizam a sua qualidade: a) a sensibilidade; b) a especificidade; A sensibilidade, denotada por s, é definida como: s = P (T+ |D+ ), A especificidade, denotada por e, é definida como: e = P (T− |D− ), 30 Costa, S.C. 31 Tabela 4: Esquema padrão de sı́ntese dos dados para verificação da qualidade de um teste clı́nico. Teste (T) Doença (D) + − Total Positivo (T ) Negativo (T ) Presente (D+ ) a b a+b Ausente (D− ) c d c+d Total a+c b+d n Para definir os ı́ndices que descrevem o grau de confiabilidade de um teste, precisamos trabalhar com os seguintes eventos: # T+ corresponde a teste positivo; # T− corresponde a teste negativo; # D+ corresponde a indivı́duo portador da doença; # D− corresponde a indivı́duo não portador da doença. Costa, S.C. 32 Usando a notação da Tabela 4 e a definição de probabilidade condicional, têm que a sensibilidade e a especificidade são dadas, respectivamente, por: Sensibilidade s= a a+b Especificidade e= d c+d Costa, S.C. 33 Exemplo: Linder & Singera estudaram a qualidade da tomografia computadorizada para o diagnóstico de metástase de carcinoma de fı́gado, e os resultados resumidos na Tabela 5. Tabela 5: Resultados da tomografia computadorizada em 67 pacientes com metástase e 83 sem metástase do carcinoma hepático. Metástase de Tomografia computadorizada Total carcinoma hepático Positiva (T+ ) Negativa (T− ) Presente (D+ ) 52 15 67 Ausente (D− ) 9 74 83 Total 61 89 150 a Diagnosing liver metastases: a Bayesian analysis. Journal of Clinical Oncology, v.3, p.379-88, 1986 Costa, S.C. 34 A sensibilidade e a especificidade da tomografia computadorizada são estimadas por: Sensibilidade Especifidade a s= a+b d e= c+d 52 s= = 0, 776 67 74 e= = 0, 892 83 Ainda, (1 − e) é definido como a probabilidade de se obter um falso positivo. Já (1 − s) é a probabilidade de se obter um falso negativo. Costa, S.C. Valor das Predições A sensibilidade e a especificidade não ajudam a decisão da equipe médica que, recebendo um paciente com resultado positivo do teste, precisa avaliar se o paciente está ou não doente. Não se pode depender apenas da sensibilidade e a especificidade, pois estes ı́ndices são provenientes de uma situação em que há certeza total sobre o diagnóstico, o que não acontece no consultório médico. Neste momento, interessa mais conhecer os seguintes ı́ndices denominados valor da predição positiva (VPP) e valor da predição negativa (VPN), definidos respectivamente por: 35 Costa, S.C. Valor da predição positiva (VPP) é a probabilidade do paciente estar realmente doente quando o resultado do teste é positivo. V P P = P (D+ |T+ ) Valor da predição negativa (VPN) é a probabilidade do paciente não estar doente quando o resultado do teste é negativo. V P N = P (D− |T− ) Estes valores são probabilidade condicionantes, tal que o evento condicionante é o resultado do teste, aquele que na prática acontece primeiro. 36 Costa, S.C. 37 A maneira mais fácil de se calcular o VPP e VPN é através da Tabela 6, sugerida por Vecchio. Seja p a prevalência da doença na população de interesse, isto é, a proporção de pessoas doentes. Tabela 6: Probabilidades necessárias para o cálculo dos ı́ndices VPP e VPN. Proporção com resultado População Proporção Positivo Negativo Doente p ps p(1-s) Sadia 1-p (1 - p) (1 - e) (1 - p)e Total 1 ps + (1 - p)(1 - e) p (1 - s) + (1 – p)e Costa, S.C. Assim, o valor da predição positiva é: V P P = P (D+ |T+ ) = ps . ps + (1 − p)(1 − e) O valor da predição negativa é dado por: (1 − p)e V P N = P (D− |T− ) = . p(1 − s) + (1–p)e 38 Costa, S.C. Para o exemplo da Tabela 5, considere que a prevalência de metástase de carcinoma de fı́gado é de 2%, os valores de predição da tomografia computadorizada são: V PP V PP ps 0, 02 × 0, 776 = ps + (1 − p)(1 − e) 0, 02 × 0, 776 + (1 − 0, 02)(1 − 0, 8916) = 0, 1275. = e V PN V PN (1 − p)e (1 − 0, 02) × 0, 892 = = p(1 − s) + (1–p)e 0, 02 × (1 − 0, 776) + (1 − 0, 02) × 0, 8916) = 0, 9949. Portanto, o valor de predição positiva é baixo enquanto que o valor de predição negativa é bastante alto. Se o resultado da tomografia computadorizada é negativo, a chance de não haver metástase é de 99,5%. 39 Costa, S.C. Probabilidade da Intersecção de Dois Eventos A probabilidade condicional permite-nos calcular diretamente a probabilidade da intersecção de dois eventos. Assim, P (A ∩ B) P (B) ⇒ P (A ∩ B) = P (B) P (A|B) P (A ∩ B) P (B|A) = P (A) ⇒ P (A ∩ B) = P (A) P (B|A) P (A|B) = ou, ainda. Exemplo: Em um laboratório de diagnóstico por imagem compareceram nove pacientes naturais do local e três naturais de outros estados. Se dois dos pacientes são selecionados aleatoriamente para um exame de angiografia, qual é a probabilidade de serem ambos naturais de outro estado? Considere A o evento “o primeiro paciente é natural de outro estado” e B o evento “o segundo paciente é natural de outro estado.” 40 Costa, S.C. Independência de Eventos Dois eventos são considerados independentes quando a ocorrência de um deles não depende da ocorrência do outro, isto é, P (A|B) = P (A) e P (B|A) = P (B). Logo, o teorema do produto para dois eventos independentes é dado por: P (A ∩ B) = P (A) · P (B) Exemplo 1: Efeitos colaterais com o uso de certa droga ocorrem em 10% de todos os pacientes que a tomam. Dois pacientes de um médico estão tomando a droga. a) Qual é a probabilidade de que ambos os pacientes apresentem os efeitos colaterais? b) Qual é a probabilidade de que pelo menos um apresente os efeitos colaterais ? 41 Costa, S.C. Exemplo 2: Suponha que a probabilidade de uma pessoa ser do tipo sanguı́neo O é 45%, ser A é 42% e ser B é 10%. Suponha ainda que a probabilidade de Rh+ é de 90% e que o fator independe do tipo sanguı́neo. Nestas condições, qual a probabilidade de uma pessoa tomada ao acaso da população ser: a) O e Rh+ ? b) AB e Rh− ? 42 Costa, S.C. Livro: Noções de Probabilidade e Estatı́stica Autores: Marcos Nascimento Magalhães e Antonio Carlos Pedroso de Lima Pág. 55 – Exemplo: Uma famı́lia viaja ao litoral para passar um fim de semana. A probabilidade de congestionamento na estrada é de 0,6. Havendo congestionamento, a probabilidade dos seus dois filhos brigarem no carro é de 0,8 e, sem congestionamento, a briga pode aparecer com probabilidade 0,4. Quando há briga, com ou sem congestionamento, a probabilidade do pai perder a paciência com os filhos é de 0,7. É claro que havendo congestionamento o pai pode perder a paciência com os filhos mesmo sem brigas o que aconteceria com probabilidade 0,5. Quando não há nem congestionamento, nem briga, o pai dirige tranquilo e não perde a paciência. Determina a probabilidade de: a) não ter havido congestionamento se o pai não perdeu a paciência com seus filhos; b) ter havido briga, dado que perdeu a paciência. 43