UFPA * CCB Laboratório de Informática Biometria Probabilidade (Leitura complementar ao capítulo 2) No século XVII os matemáticos franceses Pierre de Fermat (1601-1665) e Blaise Pascal (1623-1662) iniciaram estudos sobre a teoria dos jogos. O objetivo principal era prever um resultado e obter êxito em suas apostas. Mas, seja nos jogos ou em qualquer outro experimento aleatório é possível associar uma medida para a incerteza quanto à ocorrência, ou não, de algum evento. Essa medida é chamada de probabilidade. A probabilidade de um acontecimento ocorrer é definida como o quociente do número de eventos desejados pelo total de eventos possíveis (que constitui o espaço amostral). Probabilidade = número de eventos desejados / número de eventos possíveis Ocorrência de 1 evento Assim, a probabilidade de ocorrência de um evento é representada como um número real no intervalo que contém os limites 0 e 1, pois: - para eventos em que a ocorrência é garantida, dizemos que sua probabilidade é igual a 1 (um), ou seja, há certeza de ocorrência do acontecimento e, - para eventos que nunca ocorrerão a sua probabilidade é avaliada como 0 (zero), pois há impossibilidade da ocorrência impossibilidade da ocorrência P=0 possibilidade de ocorrência pode acontecer certeza de ocorrência P=1 Evidentemente, quanto mais próxima de 1 for a probabilidade de um evento, é mais provável que o evento ocorra. E ocorre o inverso quando se toma resultados com valor de probabilidade próximos a zero: eles tem ocorrência mais improvável. Entretanto, deve-se ressaltar que, quando se trata de um evento possível ele pode ocorrer com diferentes probabilidades ( por exemplo: 12%, 53% 94%, etc) podendo aceitar valores desde muito próximos à impossibilidade de ocorrência (por exemplo: 0.01%) até quase atingir a certeza de acontecimento (por exemplo: 99%). Já, se dois eventos forem ditos como igualmente prováveis, pode-se exprimir a probabilidade de cada evento como "1 em 2", ou, "50%", ou ainda "1/2". Exemplo 1 No lançamento de uma moeda não viciada, qual a probabilidade de cair coroa? número de eventos desejados = 1 (só há uma face coroa) número de eventos possíveis = 2 (há 2 faces na moeda). Portanto, P = 1/2 Nesse caso os eventos são chamados de eqüiprováveis. Caso idêntico a esse é o sexo de criança esperada após uma gravidez: P(menina) = 1/2 e P(menino) = 1/2. Exemplo 2 No lançamento de um dado não viciado, qual a probabilidade de cair face 4? número de eventos desejados = 1 (só há uma face 4) número de eventos possíveis = 6 (há 6 faces no dado). Portanto, P = 1/6 Exemplo 3 Supondo um casal, em que ambos são homozigotos dominantes para uma certa característica, qual a probabilidade de terem uma criança também homozigota AA? A resposta é P (AA) = 1 ou 100%. Ou seja, existe 100% de chance da criança ser AA. Entretanto, e se a pergunta para o mesmo casal, fosse: Qual a probabilidade da criança ser homozigota aa? A ocorrência do evento (aa) tem probabilidade igual a zero, P (aa) = 0, pois não há genes a na família. Ocorrência de 2 eventos 1. Probabilidade de ocorrência de um OU outro acontecimento Dois eventos são mutuamente exclusivos quando a ocorrência de um impede a ocorrência do outro e viceversa. A probabilidade de ocorrerem eventos mutuamente exclusivos é dada pela soma das probabilidades isoladas de ocorrência de cada um dos eventos. Exemplos a. Qual a probabilidade de cair face 3 ou face 6 em um único lançamento de dado? P(3) = 1/6 P(6) = 1/6 P(3 ou 6) = 1/6 + 1/6 = 2/6 = 1/3 b. Qual a probabilidade de se retirar uma dama de um baralho previamente embaralhado? P (dama copas) = 1/52, P (dama ouro) = 1/52, P (dama espadas) = 1/52 P, (dama paus) = 1/52 Portanto, P (dama) = 1/52 + 1/52 + 1/52 + 1/52 = 4/52 = 1/13 2. Probabilidade de ocorrência de um E outro acontecimento Dois eventos são independentes quando a ocorrência de um não influencia a probabilidade do outro ocorrer. A probabilidade de ocorrerem eventos independentes é dada pela multiplicação das probabilidades isoladas de ocorrência de cada um dos eventos. Condição 1: Os acontecimentos são iguais. Exemplo Qual a probabilidade de caírem 2 faces 3 no lançamento de 2 dados? P (3) = 1/6 Logo, P (3 e 3) = 1/6 X 1/6 = 1/36 Condição 2: Os acontecimentos são diferentes. Neste caso há que se considerar 2 tipos de situação: 2.1. A ordem de ocorrência dos acontecimentos é importante. Exemplo Qual a probabilidade de, em 2 lançamentos, cair face 1 no primeiro e face 2 no segundo? Quais são os eventos possíveis? EVENTOS POSSÍVEIS = ESPAÇO AMOSTRAL = ( S ) Espaço amostral é o conjunto que contém todos os resultados possíveis de um experimento aleatório. {1,1 1,2 1,3 1,4 1,5 1,6 2,1 2,2 2,3 2,4 2,5 2,6 3,1 3,2 3,3 3,4 3,5 3,6 4,1 4,2 4,3 4,4 4,5 4,6 5,1 5,2 5,3 5,4 5,5 5,6 6,1 6,2 6,3 6,4 6,5 6,6} Portanto: P (1) = 1/6 e P(2) = 1/6 P (1 no primeiro e 2 no segundo) = 1/6 x 1/6 = 1/36 2.2. A ordem de ocorrência dos acontecimentos não é importante Notar que no espaço amostral do exercício anterior (S), há a parcela ( 2,1 ), ou seja, caiu o número 2 no lançamento do primeiro dado e o 1 no outro. Isto não satisfazia a questão. Mas, se a pergunta fosse: Qual a probabilidade de, em 2 lances, caírem faces 1 e 2? P ( 1,2 ) = 1/36 P ( 2,1 ) = 1/36 Logo: P ( 1,2 ou 2,1) = 1/36 + 1/36 = 2/36 = 1/18 3. Probabilidade condicional Considerando o lançamento de um dado, qual a probabilidade de em 1 jogada resultar em um número ímpar e menor que 3? Menor que três: 1 e 2 e Ímpar = 1. Portanto, apenas o número 1 satisfaz ambas as condições. Assim, P = 1/6 Portanto, a probabilidade do resultado ser um número ímpar e menor que 3 é a interseção desses eventos: Menor que três: (1, 2) = 2/6 e Ímpar = (1, 3, 5) = 3/6. Assim, P = 1/6 Exemplos: a. De um baralho de 52 cartas (13 de ouro, 13 de espadas, 13 de copas e 13 de paus) qual é a probabilidade de, ao ser retirada uma carta, ser uma dama de copas? P = 1/52 b. De um baralho de 52 cartas (13 de ouro, 13 de espadas, 13 de copas e 13 de paus) qual é a probabilidade de, ao ser retirada uma carta, ser uma dama, sabendo-se que a carta retirada é de copas. Como há 4 tipos : P = 1/52 X 1/4 Como já se sabe que a carta é de copas, temos apenas 1 dama em um total de 13 cartas. A probabilidade é então: P(Q, copas) = 1/13. 4. Ocorrência de eventos repetidos Se trabalharmos com muitos eventos haverá um grande número de combinações possíveis (evidentemente, se não considerarmos a ordem de sua ocorrência). Exemplo: No lançamento de 4 moedas, qual a probabilidade de caírem 3 caras e 1 coroa? ESPAÇO AMOSTRAL ( S ): ca ca ca ca ca ca ca co* ca ca co ca* ca co ca ca* co ca ca ca* ca ca co co ca co ca co ca co co ca co ca co ca ca co co ca co co ca ca co ca ca co ca co co co co ca co co co co ca co co co co co Ou seja, há 16 combinações possíveis e, entre elas há 4 que satisfazem a pergunta. Quando se monta o espaço amostral fica claro que a probabilidade de ocorrência do 3 caras e 1 coroa no lançamento de 4 moedas é P = 4/16 = !/4 Entretanto, a construção do espaço amostral pode ser muito trabalhosa. Como calcularíamos essa probabilidade, com o uso de fórmulas? Há 2 modos: 1. Fórmula para Casos Complexos - Número de combinações Quantas combinações com 3 caras e 1 coroa são possíveis? Este número pode ser calculado pela seguinte fórmula: C = n! / ( x!.y! ). Como y = (n-x). Portanto: C = n! / [ x! . (n - x)! ] em que: n = número total de ocorrência dos eventos ! = fatorial x = número de ocorrência de um dos eventos (nesse exemplo = cara ) Lembrar que, como só há 2 eventos, x e y: y = (n-x) . Portanto, nesse exemplo: C = 4! / [3! x (4-3)!] = 4x3x2x1 / 3x2x1 x 1 = 24 / 6 = 4 Assim, há 4 combinações possíveis, que, como visto anteriormente, são: ca ca ca co - ca ca co ca - ca co ca ca - co ca ca ca. Levando-se em conta apenas o número de caras e de coroas os 16 tipos de resultados podem ser agrupados em cinco classes, ou seja, com 0, 1, 2, 3 ou 4 resultados coroa, respectivamente com 4, 3, 2, 1 ou 0 resultados cara. - Fórmula para casos complexos Para o cálculo de uma certa probabilidade, pode-se usar a seguinte fórmula P = C . px . (1-p) (n-x) em que: C = número de combinações p = Probabilidade de ocorrência do evento 1 (nesse exemplo = cara ) q = Probabilidade de ocorrência do evento 2 (nesse exemplo = coroa ) x = Número de vezes em que o evento 1 ocorre n - x = Número de vezes em que o evento 2 ocorre Voltando à questão: No lançamento de 4 moedas, qual a probabilidade de caírem 3 caras e 1 coroa? P(cara) = P(coroa) = 1/2 e Número de combinações = C = 4 P = 4 x (1/2)3 x (1/2)1 = 4 x 1/ 8 x 1/2= 4/16 = 1/4. Obteve-se, portanto, o mesmo valor visto no espaço amostral. 2. Binômio de Newton e Triângulo de Pascal Esses resultados também podem ser obtidos pelo desenvolvimento do , Para responder a mesma pergunta anterior (No lançamento de 4 moedas, qual a probabilidade de caírem 3 caras e 1 coroa?) o binômio será: (p + q )4 A expansão desse binômio gera uma equação em que pode-se usar o Triângulo de Pascal para calcular os coeficientes. Eles serão 1 : 4 : 6 : 4 : 1. E a equação será: (p + q)4 = 1 p4q0+ 4 p3q1 + 6 p2q2 + 4 p1q3 + 1 p0q4 1 p4 q0 4 coroas e 0 caras 4 p3q1 3 coroas e 1 cara 6 p2q2 2 coroas e 2 caras 4 p1q3 1 coroa e 3 caras 1 p0q4 0 coroas e 4 caras Lembrando que p = ocorrência do evento "cara" e de q (ou 1-p), entre os resultados possíveis, a fração que interessa é 4p3 q1 = 4 x 1/ 8 x 1/2= 4/16 = 1/4. Ou seja, novamente foi obtido o mesmo valor visto no espaço amostral e quando se utilizou a fórmula para casos complexos. É importante notar que em Genética, o triângulo é bastante útil em casos de herança quantitativa, determinada por vários pares de genes cumulativos. (Se desejar mais detalhes clicar aqui). Exemplo 2: Qual a probabilidade de um casal ter 5 filhos, sendo 3 homens e 2 mulheres? Resolução 1: Usando a fórmula para casos complexos: C = 5! / (3! x 2!) = 5x4x3x2x1 / 3x2x1 x 2x1 = 10 Portanto, há 10 modos de nascerem 3 homens e 2 mulheres em 5 gestações: hhhmm-hhmmh-hhmhm-hmmhh-hmhmh hmhhm-mmhhh-mhmhh-mhhhm-mhhmh Assim, P(h) = P(m) = 1/2 e C = 10 Aplicando a fórmula P = C . px . (1-p) (n-x) P(3h e 2m) = 10 x (1/2)3 x (1/2)2 = 10 x 1/ 8 x 1/4 = 10/32 = 5/16 Resolução 2: Utilizando o Binômio de Newton Nesse caso a equação é (p + q )5 A expansão do binômio gera uma equação em que pode-se usar o Triângulo de Pascal para calcular os coeficientes da equação. Os coeficientes encontrados são: 1 : 5 : 10 : 10 : 5 : 1 Portanto, a expansão do binômio gerará: (p + q)5 = 1 p5q0 + 5 p4q1 + 10 p3q2 + 10 p2q3 + 5 p1q4 + 1 p0q5 1 p5q0 5 homens e 0 mulheres 5 p4q1 4 homens e 1 mulher 10 p3q2 3 homens e 2 mulheres 10 p2q3 2 homens e 3 mulheres 5 p1q4 1 homem e 4 mulheres 1 p0q5 0 homens e 5 mulheres Assim, a fração que interessa é 10p3 q2 Portanto, P(3h e 2m) = 10 x (1/2)3 x (1/2)2 = 10 x 1/ 8 x 1/4 = 10/32 = 5/16 Média, Variância e Desvio padrão, se a distribuição for binomial Sendo conhecidos os parâmetros da (n e p): Média da população = µ µp = n.p usando o dado de um dos acontecimentos ou µq = n.q usando o dado do outro acontecimento Variância da população = σ2 Desvio padrão da população = σ σ2 = n.p.(1 - p) = n.p.q σ = raiz n.p.q Exemplo Qual é o número esperado de resultados cara e de resultados coroa em 1000 lances de moeda e seu desvio padrão? p (cara) = q (coroa) = 0,5 μp = n.p = 1000 x 0,5 = 500 caras são esperadas μq = n.q = 1000 x 0,5 = 500 coroas são esperadas σ = raiz (n.p.q) = raiz 1000 x 0,5 x 0,5 = 15,81 As últimas fórmulas caracterizam a distribuição binomial de probabilidades para a entidade estatística que está sendo estudada. É importante notar que para gerar uma distribuição binomial é necessário definir apenas 2 quantidades: n e p, que caracterizam a distribuição de forma exata e são chamadas de parâmetros da distribuição. Distribuição de Poisson A distribuição de Poisson pode ser considerada como um caso particular da distribuição binomial, na qual a probabilidade de ocorrência de um dado evento é muito pequena. Diferentemente da distribuição binomial, que é definida por 2 parâmetros (média e desvio-padrão), a distribuição de Poisson é definida por apenas um, a média, pois a variância é igual à média. Tomando-se u = µ, de acordo com a distribuição de Poisson, as probabilidades de amostras ou subamostras apresentarem 0, 1, 2, 3, 4 ou mais vezes o acontecimento cuja probabilidade de ocorrência é muito pequena, são dadas por: Número de ocorrências do evento: Probabilidade de ocorrência: 0 / 1eμ 1 / eμ μ0 1 / 1.eμ μ / eμ μ1 2 / 2.eμ 2 μ / 2.eμ μ2 3 2.3.eμ 3 μ / 2.3.eμ μ3 / 4 / 2.3.4.eμ 4 μ / 2.3.4.eμ μ4 Nessas expressões: . μ = é a esperança matemática, ou seja, a média esperada de ocorrência de algum acontecimento pouco provável em um conjunto de sub-amostras . o número irracional e tem valor igual a 2,71828182845904, sendo que seu logaritmo natural é, aproximadamente, 0,434295... Designando por n o número de subamostras analisadas, e simbolizando por u, os números esperados de amostras em que o acontecimento pouco provável ocorre 0, 1, 2, 3, 4 ou mais vezes são: Número de ocorrências do evento: Números esperados de amostras 0 n.μ0 / eμ n/eμ 1 n.μ1 / eμ n.μ/eμ 2 n.μ2 / 2.eμ n.μ2/2.eμ 3 n.μ3 / 2.3.eμ n.μ3/2.3.eμ 4 n.μ4 / 2.3.4.eμ n.μ4/2.3.4.eμ Quando se quer calcular uma sucessão de valores esperados na distribuição de Poisson, por exemplo: número de amostras com 0, 1, 2, etc, eventos, procede-se do seguinte modo: 1. Aceitar a média, (M), como o valor paramétrico μ da distribuição de Poisson, 2. Verifica-se qual é o número de amostras, o qual passa a ser aceito como n, 3. Aplica-se a fórmula para obtenção de amostras com zero eventos: n/eμ (Note que, usando logaritmos: n/eμ = log n - (μ. log e), onde log e = 0,434295) 4. O antilog do número obtido será o número esperado de amostras com 0 eventos. Continuando, aplica-se a fórmula para obtenção de amostras com um evento: n.μ / eμ, em que log e = 0,434295 Note que, usando logaritmos, n.u/eu = log u + log n - (u. log e) Repare que a parte sublinhada corresponde à primeira fórmula, portanto pode-se tomar o valor ali obtido e lhe acrescentar log u. Depois, toma-se o antilog do valor encontrado e tem-se o número esperado de amostras com 1 evento. Continuando, aplica-se a fórmula para obtenção de amostras com dois eventos: n.μ2 / 2.eu Note que, usando logaritmos, n.μ2 /2.eμ = 2 log μ + log n - (μ. log e + log 2), Repare que a parte sublinhada corresponde à segunda fórmula, portanto pode-se tomar o valor ali obtido e lhe acrescentar log u (já que são 2) e diminuir o logaritmo do número de vezes que se deseja o evento (nesse caso log 2) . Depois, toma-se o antilog do valor encontrado e tem-se o número esperado de amostras com 2 eventos. Continuando, aplica-se a fórmula para obtenção de amostras com três eventos: n.μ3/2.3.eμ Note que, usando logaritmos, n.u3 / 2.3.eμ = 3 log μ + log n - (μ. log e) + log 2 + log 3) Repare que a parte sublinhada corresponde à terceira fórmula, portanto pode-se tomar o valor ali obtido e lhe acrescentar log u (já que são 3) e diminuir o logaritmo do número de vezes que se deseja o evento (nesse caso log 3). Depois, toma-se o antilog do valor encontrado e tem-se o número esperado de amostras com 3 eventos. E continua-se com esse raciocínio até atingir o número de vezes desejado. Logaritmo e antilogaritmo Dados dois números reais positivos x > 0 e a > 1, chama-se de logaritmo de x na base a o expoente ao qual se deve elevar a base a para se obter o número x. Assim, a é chamado de base do logaritmo e x é o logaritmando ou antilogaritmo. Ou seja, um antilogaritmo é a base elevada à potência do número dado. Exemplo: Log 78 = 1,8921, Lembrar que a base 10 não precisa ser escrita. Seria: Log10 78 = 1,8921 Portanto, antilog 1,8921 = 78, pois 101,8921 = 78 O antilogaritmo consiste no inverso do cálculo do logaritmo de um número. Propriedades básicas dos logaritmos naturais 1. Ln (1) = 0 2. Ln (x.y) = Ln (x) + Ln (y) 3. Ln ( xk ) = k.Ln (x) 4. Ln (x/y) = Ln (x) - Ln (y) Última alteração: 14 mar 2008 Este "site", destinado prioritariamente aos alunos de Fátima Conti, pretende auxiliar quem esteja começando a se interessar por Bioestatística, computadores e programas, estando em permanente construção. Sugestões e comentários são bem vindos. Agradeço antecipadamente.