Noções de Probabilidade Joel M. Corrêa da Rosa 2011 A estatı́stica descritiva é ferramenta indispensável para extrair informação em um conjunto de dados. Entretanto, a tomada de decisões está fortemente vinculada ao uso da estatı́stica inferencial que, por sua vez, ampara-se no Cálculo de Probabilidades. As técnicas de Estatı́stica Inferencial podem ser classificadas em : técnicas de estimação e testes de hipóteses. Antes de investigar estas técnicas é indispensável conhecer conceitos básicos no Cálculo de Probabilidades. Este texto procura apresentar de forma breve e objetiva os conceitos básicos que integram as principais noções de probabilidades. Experimento Aleatório O experimento aleatório é aquele que quando realizado, mesmo de modo controlado, não há como predizer o seu resultado. Se o experimento não é aleatório, este é dito ser determinı́stico. Existe ainda uma terceira categoria de experimentos chamados de caóticos. A maioria dos experimentos cientı́ficos se encaixam na categoria dos experimentos aleatórios e são raros os exemplos de experimentos não-aleatórios(determinı́sticos). Espaço Amostral O espaço amostral é o conjunto de todos os possı́veis resulados de um experimento aleatório. Usualmente este conjunto é denotado por Ω. Como não é possı́vel determinar o resultado do experimento aleatório, estudá-lo por meio de probabilidades implica em primeiramente construir o seu espaço amostral. 1 Os espaços amostrais são de três tipos : Finitos Infinitos Enumeráveis Infinitos Não-Enumeráveis Alguns espaços amostrais vinculados a experimentos aleatórios são apresentados a seguir. Exemplo 1 Arremessa-se uma moeda honesta e observa-se a face voltada para cima. O espaço amostral neste caso é finito e obtido por Ω = {cara,coroa}. No próximo exemplo apresentamos um experimento aleatório cujo espaço amostral é infinito, porém enumerável. Exemplo 2 Um experimento aleatório é realizado por consecutivos arremessos de uma moeda honesta e registro do número de lançamentos até a obtenção da primeira cara. Os resultados possı́veis deste experimento são: Ω = {1, 2, 3, 4, . . .} Para completar os exemplos dos espaços amostrais e seus respectivos tipos, vamos verificar uma situação em que o espaço amostral é infinito e não-enumerável. Exemplo 3 Um experimento consiste em registrar o retorno percentual diário do investimento em uma carteira de ações.O espaço amostral é formado por um intervalo contı́nuo de valores que, por conveniência, assumiremos estar entre duas quantidades desconhecidas −M % e M %,ou seja, Ω = (−M, M ).Uma forma abstrata de caracterizar este espaço amostral é definı́-lo como:Ω = (−∞, ∞). Eventos Os eventos são subconjuntos do espaço amostral sobre os quais desejamos calcular probabilidades. Em geral, vamos nos referir aos eventos por letras maiúsculas do alfabeto: A, B, C, D, . . .. Dois eventos especiais são: ∅ e Ω. O primeiro é conjunto vazio e o segundo é o próprio espaço amostral. Veja os exemplos abaixo: 2 Experimento 1: Lançar uma moeda e observar a face superior Espaço amostral: S = {cara,coroa} Evento A = {cara} Evento B = {coroa} Experimento 2: Lançar um dado e observar a face superior Espaço amostral: S = {cara,coroa} Evento A = {números pares} = {2, 4, 6} Evento B = {números impares} = {1, 3, 5} Experimento 3: Observar o ı́ndice mensal de inflação Espaço amostral: S = (−200%, +200%) Evento A = {deflação} = (−200%, 0) Evento B = {inflação} = (0, 200%) Probabilidade Probabilidade é uma função que associa números reais no intervalo [0, 1] aos eventos de um experimento aleatório. Esta medida quantifica a chance da ocorrência de um evento de interesse. Vamos nos referir a esta medida por P (.), sendo P (A) a medida de probabilidade do evento A. A sua construção baseia-se nos 3 axiomas : 1. P (A) ≥ 0 2. P (Ω) = 1 3. P (A1 ∪ A2 ) = P (A1 ) + P (A2 )se A1 ∩ A2 = ∅ Probabilidade é o principal instrumento da Teoria de Inferência Estatı́stica que é utilizada para a tomada de decisões. Regra da Adição de Probabilidades A regra de adição de probabilidades determina o cálculo da probabilidade da união de eventos. Quando houver interseção esta probabilidade é calculada da seguinte forma: P (A ∪ B) = P (A) + P (B) − P (A ∩ B). 3 Quando a interseção é vazia, temos por consequência que P (A ∩ B) = 0 e os eventos A e B são ditos serem mutuamente exclusivos. Pode-se dizer que os eventos mutuamente exclusivos são aqueles que não podem ocorrer simultâneamente. A ocorrência de um deles determina a nãoocorrência do outro. Probabilidade Condicional Uma informação sobre o experimento aleatório pode alterar a configuração do espaço amostral e, consequentemente, o cálculo da probabilidade de um evento. Esta probabilidade, calculada com uma informação sobre a ocorrência de um evento, é chamada de probabilidade condicional. Exemplo 4 Um experimento consiste em lançar um dado honesto e equilibrado e observar o número de pontos na face superior. Uma pessoa lança o dado e informa que o resultado é um número ı́mpar de pontos. Qual a probabilidade de ter ocorrido 5 pontos na face superior? Veja que neste caso já existe o conhecimento da ocorrência do evento B = {Número Ímpar}. Isto modifica o espaço amostral, ou seja, o conjunto de possı́veis resultados do experimento está restrito a {1, 3, 5}. A probabilidade condicional é definida da seguinte maneira: P (A|B) = P (A ∩ B) P (B) para P (B) > 0 A probabilidade acima é lida como ”probabilidade de A dado a ocorrência de B”. Regra da Multiplicação de Probabilidades A regra da multiplicação de probabilidades descreve o cálculo de probabilidades para uma interseção de eventos. Esta regra é obtida simplesmente re-escrevendo a fórmula que possibilita o cálculo de probabilidades condicionais. P (A ∩ B) = P (A|B)P (B) Note que a igualdade abaixo também é verdadeira. 4 P (A ∩ B) = P (B|A)P (A) Quando os eventos são independentes, a probabilidade de interseção é simplesmente determinada pelo produto das probabilidades. P (A ∩ B) = P (A)P (B)se A e B são independentes. Uma outra forma de expressar independência entre eventos é colocá-la em termos da probabilidade condiconal. P (A|B) = P (A) se A e B são independentes Teorema da Probabilidade Total Seja A1 , A2 , . . . , An uma partição do espaço amostral Ω. Então, segundo o Teorema da Probabilidade Total: P (B) = n X P (B ∩ Ai ) i=1 Este resultado é útil para calcular a probabilidade de um evento quando conhecemos a probabilidade dele ocorrer conjuntamente com outro. De outro modo o resultado pode ser escrito como: P (B) = n X P (Ai )P (B|Ai ) i=1 Exemplo 5 Em uma agência bancária, 10% dos clientes são classificados como VIP, 30% dos clientes são preferenciais e 60% são correntistas. A inadimplência no grupo dos VIPs é igual a 10%, no grupo dos preferenciais é 20% e dentre os correntistas é de 30%. Qual a chance de, ao sortear um cliente, ele ser inadimplente. Considere os eventos: I : cliente inadimplente V P : cliente VIP P F : ciente Preferencial 5 CR : cliente Correntista pelo Teorema da Probabilidade Total P (I) = P (V P ).P (I|V P ) + P (P F )P (I|P F ) + P (CR)P (I|CR) = P (I) = 0, 1 × 0, 1 + 0, 3 × 0, 3 + 0, 6 × 0, 3 = 0, 28 Teorema de Bayes Como consequência da definição de probabilidade condicional e pelo Teorema da probabilidade total, surge uma importante resultado do cálculo de probabilidades que é o Teorema de Bayes. P (B|Ai )P (Ai ) P (Ai |B) = Pn j=1 P (Aj ).P (B|Aj ) Como um caso particular do Teorema de Bayes, sejam dois eventos A e B; P (A|B) = P (B|A)P (A) P (B) Na última expressão podemos ver que a razão entre as probabilidades condicionais é igual a razão entre as probabilidades incondicionais. Exemplo 6 Retira-se, consecutivamente, duas cartas de um baralho. Qual a probabilidade da primeira carta ser ás, sabendo que a segunda é ás ? Sejam os eventos: A1 : primeira carta é um ás A2 : segunda carta é um ás 4 A probabilidade da primeira carta ser ás é : . Pelo Teorema da Prob52 abilidade Total, podemos encontrar P (A2 ), da seguinte forma: P (A2 ) = P (A2 ∩ A1 ) + P (A2 ∩ A1 ) = P (A1 )P (A2 |A1 ) + P (A1 )P (A2 |A1 ) = 6 4 3 48 4 4 + = 52 51 52 51 52 Conhecendo as probabilidades calculadas acima, podemos encontrar P (A1 |A2 ), Utilizando o Teorema de Bayes, P (A1 |A2 ) = P (A2 |A1 )P (A1 ) = P (A2 ) 3 4 51 52 4 52 = 3 51 Exemplo 7 Considere uma doença que é prevalente em 5 % da população exposta. Um teste para o diagnóstico desta doença acerta 95% dos casos quando as pessoas realmente estão doentes. Esta probabilidade de acerto condicional ao conhecimento do estado do indivı́duo é chamada de sensibilidade. Por outro lado, o teste acerta 90% dos casos quando os indivı́duos não estão doentes e esta probabilidade é chamada de especificidade. Diante destes fatos, a realização de um teste diagnóstico é um experimento aleatório cujos os eventos de interesse são: D+ : pessoa doente D− : pessoa saudável T+ : teste positivo T− : negativo o espaço amostral neste caso é formado pelos elementos: Ω = {(D+ ∩ T+ ), (D− ∩ T− ), (D+ ∩ T− ), (D− ∩ T+ )} Embora não conheçamos de antemão as probabilidades dos eventos que forma o espaço amostral, podemos encontrá-las a partir das probabilidades descritas no enunciado. P (D+ ) = 0, 05 P (D− ) = 0, 95 P (T+ |D+ ) = 0, 95 P (T− |D− ) = 0, 90 7 Pela regra da multiplicação, P (D+ ∩ T+ ) = P (D+ )P (T+ |D+ ) = 0, 05 × 0, 95 = 0, 0475 P (D+ ∩ T− ) = P (D+ )P (T− |D+ ) = 0, 05 × 0, 05 = 0, 0025 P (D− ∩ T+ ) = P (D− )P (T+ |D− ) = 0, 95 × 0, 1 = 0, 095 P (D− ∩ T− ) = P (D− )P (T− |D− ) = 0, 95 × 0, 90 = 0, 855 Pelo Teorema da Probabilidade Total: P (T+ ) = P (D+ ∩ T+ ) + P (D+ ∩ T+ ) = 0, 0475 + 0, 095 = 0, 1425 P (T− ) = P (D+ ∩ T− ) + P (D− ∩ T− ) = 0, 0025 + 0, 8575 Pelo Teorema de Bayes, podemos achar P (D+ |T+ ) , que é chamado de valor preditivo positivo. P (D+ |T+ ) = P (T+ |D+ )P (D+ ) P (T+ ) pelo mesmo raciocı́nio podemos encontrar P (D− |T− ) que é o valor preditivo negativo. 8