“Será que vai chover amanhã ?” Quantificando a incerteza Probabilidades – Aula 1 Nosso dia-a-dia está cheio de incertezas “Vai chover amanhã?” “Quanto tempo levarei de casa até a universidade?” “Em quanto tempo serei atendido se eu pegar a fila única?” “E se eu pegar as filas separadas?” Na área científico-investigativa, não é diferente …. “Se fizermos uma intervenção ‘X’, quantos casos da doença eliminaremos na área 1 ?” “Quantos bebês dos próximos 10 recém-nascidos precisarão de cuidados na UTI neo-natal ?” “Qual será o tamanho da ninhada de uma fêmea felina da raça siamesa?” “Se nascerem 6 gatinhos, quantos vão sobreviver?” Lidando com a incerteza Uma das maneiras de lidar com a incerteza acerca de um evento é expressá-la em números. Ou seja , quantificando a incerteza. Probabilidades: quantificando a incerteza Probabilidade é uma medida da incerteza acerca de um evento. Esta medida é um número que vai de 0 a 1. Quanto maior a probabilidade de evento, menor a incerteza acerca dele. “Segundo o centro de meteorologia, a probabilidade de chover amanhã é de 0.60 (ou 60%)” “A probabilidade de gastar mais de 20 minutos de casa até o trabalho é de 75%” “A probabilidade de esperar menos de 2 minutos na fila única é de 85%” “Na fila separada, esta probabilidade é de 40%” Conceitos básicos Experimento aleatório é aquele no qual os resultados possíveis são conhecidos antes da realização do experimento, mas só saberemos qual deles irá ocorrer quando ele for realizado. EXEMPLOS: Experimento aleatório 1: retirar uma carta de um baralho de 52 cartas e verificar sua cor. Resultados possíveis: {vermelha, preta} Experimento aleatório 2: jogar um dado e observar a face de cima. Resultados possíveis: {1,2,3,4,5,6} Experimento aleatório 3: sortear uma mulher na cidade e verificar quantos filhos ela tem. Resultados possíveis: {0,1,2,3,4....} Conceitos básicos Espaço Amostral (E) é o conjunto de resultados possíveis para um experimento aleatório. EXEMPLOS: Para o experimento aleatório 1: retirar uma carta de um baralho de 52 cartas e verificar sua cor. Espaço amostral E1 = {vermelha, preta} Para o experimento aleatório 2: jogar um dado e observar a face de cima. Espaço amostral E2 ={1,2,3,4,5,6} Para o experimento aleatório 3: sortear uma mulher na cidade e verificar quantos filhos ela tem. Espaço amostral E3 ={0,1,2,3,4....} Conceitos básicos Evento é qualquer subconjunto do espaço amostral de um experimento aleatório é chamado EXEMPLOS: do espaço amostral E1, A = {preta} do espaço amostral E2, B = {2,4,6} A é um Evento Simples (somente um elemento do espaço amostral) Evento Complementar ( A ): o complementar de um evento A é formado pelos elementos do espaço amostral que não fazem parte do evento. Exemplo: se o espaço amostral é E2 = {1,2,3,4,5,6} e B = {2,4,6}, B = {1,3,5} Conceitos básicos Evento vazio ( ∅) é evento que não contém nenhum elemento do espaço amostral. Exemplo: no experimento aleatório 1, o evento B: “carta verde” é um evento vazio, B = ∅ . Evento União ( A ∪ B ): o evento “A união B” é formado pelos elementos que estão em A ou em B. Conceitos básicos Evento Interseção ( A ∩ B ): o evento “A interseção B” é formado pelos elementos que estão em A e em B. Exemplo : Sejam os eventos A “sair um número par na jogada de um dado”, A = { 2, 4, 6} e B “sair um número menor do que 4 na jogada de um dado”, B = {1, 2, 3} . O evento união é formado por (A ∪ B) = {1, 2, 3, 4, 6} e O evento interseção é formado por (A ∩ B) = { 2 }. Conceitos básicos Eventos Mutuamente Exclusivos: dois eventos A e B são mutuamente exclusivos quando A ∩ B=∅ B A E Exemplo : Seja o experimento aleatório “retirar uma carta de um baralho de 52 cartas” A : “sair uma carta vermelha”, A = {vermelha} e B : “sair uma carta de espadas”, B = {espadas} . O evento interseção (A ∩ B)=∅ Definição Clássica para Probabilidade Quando TODOS os elementos do espaço amostral têm a mesma probabilidade de ocorrerem, a definição clássica da probabilidade de um evento A ocorrer é dada por P( A ) = número de elementos do evento A total de elementos do espaço amostral Exemplo: seja o experimento aleatório “jogar um dado e observar a face de cima”. Se o dado for honesto, todas as seis faces têm a mesma probabilidade de saírem para cima. Assim, a probabilidade do evento F “o número é par”, F = {2,4,6}, é dada por P(F)=3/6=0.5. Experimento aleatório: retirar uma carta de um baralho de 52 cartas e verificar sua cor, naipe ou número E= {A♠ 2♠ 3♠ 4♠ 5♠ 6♠ 7♠ 8♠ 9♠ 10♠ J♠ Q♠ K♠ A♣ 2♣ 3♣ 4♣ 5♣ 6♣ 7♣ 8♣ 9♣ 10♣ J♣ Q♣ K♣ A♥ 2♥ 3♥ 4♥ 5♥ 6♥ 7♥ 8♥ 9♥ 10♥ J♥ Q♥ K♥ A♦ 2♦ 3♦ 4♦ 5♦ 6♦ 7♦ 8♦ 9♦ 10♦ J♦ Q♦ K♦} A = “carta preta” B= “carta com letra” P(A)=26/52 = 1/2 P(B) = 16/52 = 4/13 C = “carta de copas” P(C) = 13/52 = 1/4 D = “carta de ouros preta” P(D) = 0/52 = 0 Propriedades da Probabilidade 1. 0 ≤ P(A) ≤ 1 2. P(E) =1 3. P(A) = 1 - P(A) Probabilidade da União de Dois Eventos P(A ∪ B) = P(A) + P (B) - P (A ∩ B) Probabilidade Condicional A probabilidade de um evento A ocorrer, dado que o evento B ocorreu, é dada por: P( A ∩ B) P( A | B) = P( B) Exemplo: no experimento aleatório “jogar um dado e observar a face de cima”. Eventos: F = {2,4,6} e B={2}. 16 1 P( F ∩ B) P ({2}) = = P( B | F ) = = P( F ) P({2,4,6}) 3 6 3 Probabilidade Condicional Podemos enxergar a probabilidade condicional como uma redução do espaço amostral inicial. Exemplo: o experimento aleatório “jogar um dado e observar a face de cima”. Espaço amostral inicial E = {1,2,3,4,5,6} Se F = {2,4,6} ocorre, então o espaço amostral inicial E={1,2,3,4,5,6} é reduzido para E’={2,4,6} 1 P( B | F ) = 3 Independência de Eventos Se a ocorrência de B não altera a probabilidade de ocorrência de A, os eventos A e B são independentes. Ou seja, se P ( A | B ) = P ( A) os eventos A e B são independentes. Independência de Eventos Se A e B são independentes, isto significa que P ( A ∩ B ) = P( B ) × P( A) ind PP((AA∩ BB)) indind PP((PAA(|A |BB|))B==) == PP((PAA())A⇒ )⇒ PP((PAA( A ∩ BB))B ) P= P((P AA())A)PP ×((P BB())B ) P( B) Experimento aleatório: retirar uma carta de um baralho de 52 cartas e verificar sua cor, naipe ou número E= {A♠ 2♠ 3♠ 4♠ 5♠ 6♠ 7♠ 8♠ 9♠ 10♠ J♠ Q♠ K♠ A♣ 2♣ 3♣ 4♣ 5♣ 6♣ 7♣ 8♣ 9♣ 10♣ J♣ Q♣ K♣ A♥ 2♥ 3♥ 4♥ 5♥ 6♥ 7♥ 8♥ 9♥ 10♥ J♥ Q♥ K♥ A♦ 2♦ 3♦ 4♦ 5♦ 6♦ 7♦ 8♦ 9♦ 10♦ J♦ Q♦ K♦} A = “carta preta” B= “carta com letra” P(A)=26/52 = 1/2 P(B) = 16/52 = 4/13 A e B são eventos independentes ? P(B|A) = 8/26 = 4/13 = P(B). SIM Interseção A e B : P(AB) = 8/52 = 2/13 Experimento aleatório: jogar um dado e verificar qual é a face de cima E= { } A = “número 4” B= “número ímpar” P(A)=1/6 P(B) = 3/6 = 1/2 AB = “número ímpar igual a 4” P(AB) = 0/6 = 0 A e B são eventos independentes ? P(B|A) = P(AB)/P(A) = 0/(1/6) = 0 ≠ P(B). NÃO Definição Frequentista da Probabilidade Quando os elementos do espaço amostral NÃO têm a mesma probabilidade de ocorrerem, a definição clássica da probabilidade NÃO pode ser usada. A probabilidade de um evento deve ser estimada atráves da frequência da ocorrência do evento na repetição do experimento um grande número de vezes. Definição Frequentista da Probabilidade Exemplo: Qual é a probabilidade de que uma pessoa seja portadora da bactéria H. pylori ? Experimento aleatório : “selecionar uma pessoa do grupo de interesse e verificar um dos resultados possíveis: E = {portadora, não-portadora} P( portadora ) ≠ P (não − portadora ) A probabilidade de ser portadora deve ser estimada com a utilização de uma grande amostra de pessoas do grupo de interesse Definição Frequentista da Probabilidade Exemplo: Qual é a probabilidade de que uma pessoa seja portadora da bactéria H. pylori ? # de pessoas portadoras na amostra ˆ P ( portadora) = tamanho da amostra O valor de Pˆ ( portadora ) é uma estimativa de P( portadora ) Cálculo de Probabilidades em tabelas de classificação cruzada Grupo Sangüíneo Tromboembolismo Doente Sadia A 32 51 83 B 8 19 27 AB 6 5 11 O 9 70 79 Total 55 145 200 Total 55 P (doente) = = 0.275 200 P( sadia ) = 1 − P (doente) = 1 − 0.275 = 0.725 83 P ( A) = = 0.415 200 32 P ( A ∩ doente) = = 0.16 200 Cálculo de Probabilidades em tabelas de classificação cruzada Grupo Sangüíneo Tromboembolismo Doente Sadia A 32 51 83 B 8 19 27 AB 6 5 11 O 9 70 79 Total 55 145 200 32 P ( A ∩ doente) = = 0.16 200 Total 32 P (doente | A) = = 0.385 83 Os eventos “ser doente” e “pertencer ao grupo sanguíneo A” podem ser considerados independentes ? NÃO P (doente) = 0.275 P (doente | A) ≠ P (doente) Para pensar … Um exame rápido para detecção de leishmaniose em cães resulta em positivo para 90% dos animais doentes examinados. Dentre os animais sadios, o resultado é negativo para 80% dos animais testados. Acredita-se que 15% dos cães de uma determinada região da cidade sejam portadores da leishmaniose. Se um cão dessa região é testado e seu resultado é positivo, qual é a probabilidade de que ele esteja realmente doente? Para saber mais … Seções 1 e 2 da Apostila “Avaliação de Testes Diagnósticos” (Reis e Reis, 2002) Para praticar … Exercícios da Seção 3 do Caderno de Exercícios Referências Bibliográficas REIS, E. A. ; REIS, I. A. (2002) Avaliação de Testes Diagnósticos. Relatório Técnico do Departamento de Estatística da UFMG. Disponível em: http://www.est.ufmg.br