MÓDULO 7 – PROBABILIDADE: ORIGEM, MÉTODOS E PRINCIPAIS TEOREMAS É preciso que façamos uma pequena recapitulação da definição de probabilidade antes de desenvolvermos este módulo, onde trataremos das origens e principais propriedades da probabilidade. A probabilidade é uma técnica estatística utilizada para expressar a chance de ocorrência de um determinado evento. A forma clássica de calcular a probabilidade é através da relação entre o número de casos favoráveis e o número de casos possíveis. Os casos favoráveis são aqueles resultados que se desejam acontecer; já os casos possíveis são todos os elementos que compõem o espaço amostral. Sendo assim, dado um determinado espaço amostral W , a probabilidade de um dado evento A, P ( A ) , será uma função definida em W , onde cada evento estará associado a um número real, a fim de satisfazer os axiomas abaixo: I )0 £ P £ 1 II ) P (W ) = 1 III) Se A e B forem eventos mutuamente exclusivos, P ( A È B ) = P ( A ) + P (B ) . ( A Ç B ) = f , então 7.1. Origens da Probabilidade Na realidade, existem três maneiras diferentes de se calcular ou estimar as probabilidades. São eles os métodos clássico, empírico e subjetivo, sendo que os métodos clássico e empírico são considerados métodos objetivos. 7.1.1. Métodos Objetivos 7.1.1.1. Método Clássico Quando estamos diante de experimentos que têm resultados igualmente prováveis, aplica­se o chamado método clássico. Neste caso, a probabilidade de ocorrer cada evento (resultado) é uma função do número de resultados possíveis. P evento = 1 númerodere sultadospo ssíveis Por exemplo, no experimento em que lançamos um dado, ocorrer qualquer das faces neste lançamento é igualmente provável. Então qual seria a probabilidade de ocorrer qualquer destas faces? P qualquerfa ce = P qualquerfa ce = 1 númerodefa ces 1 6 Ora, se aplicamos o método clássico a experimentos que envolvam dois ou mais resultados associados, com igual probabilidade de ocorrência destes resultados, teremos a definição clássica de probabilidade que demos no início deste módulo, onde a probabilidade será: P= resultados favoráveis resultados possíveis Por exemplo, a probabilidade de obter 4 ases num baralho de 52 cartas. Neste caso, teremos que identificar o número de resultados favoráveis, ou seja, aqueles resultados que desejamos que aconteçam. No caso, são 4 resultados favoráveis, dentro de quatro resultados possíveis, então teremos: P = 4 = 0 , 0769 = 7 , 6 % 52 Isto significa que se houver uma repetição significativa deste experimento, ou seja, de se retirar 4 ases de um baralho de 52 cartas, um evento como este, que tem probabilidade de 7,6% ocorrerá em 7,6% das vezes. Chance Existe uma maneira diferente de se exprimir as probabilidades, ao invés de se comparar o número de casos favoráveis ao número de casos possíveis, compara­ se o número de resultados favoráveis ao número de casos desfavoráveis. Isto pode ser expresso das duas formas abaixo: Chance = númerodere sultadosfa voráveis ou númerodere sultadosde sfavorávei s Chance = número de resultados favoráveis : número de resultados desfavoráveis Assim, por exemplo, numa sala de aula, temos de um total de 50 alunos, 22 homens e 28 mulheres. Qual seria, então, a probabilidade e a chance a favor de se selecionar, aleatoriamente desta sala, uma mulher? Probabilidade: e : Retirar pessoas de uma sala de aula W : 22 homens e 28 mulheres EventoA : Selecionar uma mulher P ( A ) = 28 28 = Þ P ( A ) = 0 , 56 = 56 % 22 + 28 50 A probabilidade de se retirar uma mulher é, portanto, de 56%. Chance: Evento A: selecionar uma mulher Chance = casosfavor áveis 28 14 = = ou 14:11 casosdesfa voráveis 22 11 As chances de se retirar uma mulher da sala são, portanto, de 14 para 11. 7.1.1.2. Método Empírico ou Freqüencial Quando tratamos de situações onde os resultados não são igualmente prováveis, podemos tentar estimar as probabilidades, obtendo alguns dados empíricos. Eu tenho portanto, uma estimativa das probabilidades baseada justamente nestes dados empíricos, que serão obtidos por meio de experimentos aleatórios ou através de dados históricos. É importante ressaltar que neste caso a probabilidade será uma estimativa do verdadeiro valor. Por exemplo, se tivermos um experimento em que lançamos um dado 100 vezes. Se destas 100 vezes, obtivermos a face 4 em 40 vezes, num próximo lançamento do dado seria razoável supor que a probabilidade estimada futura da 40 face 4 como sendo P (4 ) = = 40 % , se este experimento se der a condições 100 idênticas. Da mesma maneira, quando testo uma vacina em um grupo de 1000 pessoas, por exemplo, e a vacina apresenta sucesso em 700 delas, se eu repito o teste, devo esperar uma probabilidade estimada de sucesso futuro da vacina 700 7 P (s ) = = = 70 % , sob condições idênticas para a ocorrência deste resultado. 1000 10 Sendo assim, podemos calcular a estimativa da probabilidade de um evento futuro baseado no método empírico através da seguinte fórmula: P ( A ) = númerodeoc orrênciasd eA númerotota ldeobserva ções Se, por outro lado, ao invés de dispormos da possibilidade de obter os dados amostrais através da realização de um experimento, dispomos de dados históricos em uma distribuição de freqüência, ou na forma de dados publicados, ou como resultado de testes prévios, ou como informações que foram acumuladas em algum arquivo importante, podemos também calcular a probabilidade estimada pelo método freqüencial. Mas para isto é preciso que partamos da premissa que o passado é representativo do futuro. Por exemplo, suponhamos que uma distribuidora de chocolates acompanha suas vendas durante 90 dias. O objetivo desta distribuidora seria projetar as vendas para o futuro a fim de planejar seus estoques. Deste acompanhamento resultou a distribuição de freqüência abaixo: Número de Chocolates Vendidos, Em Kg, Em um Período de 90 Dias Quilos Vendidos Número de Dias 20 30 40 50 60 Total 10 20 20 30 10 90 Neste caso, também poderemos adotar o método empírico, procurando determinar qual o percentual de vezes que ocorreu tal evento. Por exemplo, em 20 dias, o distribuidor de chocolates vendeu 40 quilos de chocolate em 20 dias dos 90 dias totais de nossa observação. Então, neste caso, a estimativa de probabilidade 20 2 desta ocorrência é P (40 ) = = . A probabilidade é, portanto, a partir do método 90 9 empírico, uma proporção da ocorrência de um evento ou a freqüência relativa do evento. Assim, para as demais classes, as probabilidades serão dadas como segue na tabela abaixo da distribuição de freqüências, seguindo agora a seguinte fórmula: P ( A ) = f A , onde å f A P (A): Probabilidade de ocorrer o evento A; f A : freqüência absoluta do evento A; å f A : total de observações. Número de Chocolates Vendidos, Em Kg, Em um Período de 90 Dias Quilos Vendidos Número de Dias ( f A ) Probabilidade f A å f A 0 10 30 20 40 20 50 30 50 10 1 9 2 9 2 9 1 3 1 9 Total 90 Algumas observações são importantes de serem ressaltadas quando utilizamos o método empírico para calcular a probabilidade. I) II) III) Quando se calcula a probabilidade a partir do método empírico obtemos apenas uma estimativa do verdadeiro valor da probabilidade. Não temos dados suficientes para determinar o valor exato da probabilidade. O tamanho da amostra é fundamental para determinar a estimativa da probabilidade. Quanto maior o número de observações, e portanto, a amostra, melhor a estimativa da probabilidade. A probabilidade só é válida para um conjunto de condições idênticas àquelas geradoras dos dados amostrais. 7.1.2. MÉTODO SUBJETIVO Nos itens anteriores nos propusemos a calcular probabilidades que se originavam de fatos, fosse através do método clássico ou do método empírico. No entanto, ao longo do estudo da estatística surgiram diversas situações onde os eventos não eram nem passíveis de um estudo objetivo e muito menos eram igualmente prováveis. Neste caso, então, faz­se necessário atribuir­se subjetivamente uma probabilidade. Por exemplo: Você encontrará o amor da sua vida amanhã? Quando os operários do metrô farão nova greve? Uma mulher com câncer de mama se recuperará completamente? Nestes casos, mesmo que não seja possível efetuar o experimento, pode­se imaginar um grande número de situações idênticas e questionar­se qual será o percentual destas situações que produzirá o evento desejado. O método subjetivo é semelhante ao método empírico, a única diferença é que em geral os dados não podem ser coletados. A probabilidade subjetiva serve como um esforço não apenas para quantificar, mas para confirmar nossa crença a respeito de algo. A definição clássica de probabilidade subjetiva é a que segue: Probabilidade subjetiva é uma avaliação pessoal do grau de viabilidade de um evento. Existem, obviamente, algumas desvantagens importantes que este método apresenta: I) As estimativas subjetivas são em geral difíceis de defender quando postas em dúvida; As estimativas subjetivas podem ser tendenciosas. II) 7.2. Principais Teoremas de Probabilidade I) Digamos que temos um evento A qualquer, e um conjunto f que representa o conjunto vazio. Suponhamos ainda que A e f sejam disjuntos, então teremos: A Ç f = f P ( A È B ) = P ( A ) + P (f ) P ( A ) = P ( A ) + P (f ) Þ A È f = A Por tan to Þ P (f ) = 0 Sendo assim, temos que o primeiro teorema importante de probabilidade é o seguinte: SE f É O CONJUNTO VAZIO, ENTÃO P (f ) = 0 II) Sejam dois eventos A e A , onde A é complemento de A, onde o espaço amostral W pode ser escrito da seguinte forma W = AÈ A . Além disso, A e A são mutuamente exclusivos. Sendo assim, teremos: A Ç A = f Þ m ..exclusivos ( ) () P A È A = P ( A ) + P A () P (W ) = P ( A ) + P A Þ P (W ) = 1 () 1 = P ( A ) + P A () P A = 1 - P ( A ) () Se A é complemento de A, então P A = 1 - P ( A ) ( ) III) Se, por outro lado, tenho o seguinte conjunto B = A È A Ç B , onde A e A Ç B são mutuamente exclusivos, teremos então: ( ) P (B ) = P ( A ) + P A Ç B ( ) P A Ç B = P (B ) - P ( A ) P (B ) - P ( A ) ³ 0 P (B ) ³ P ( A ) IV) Teorema da Soma: se A e B são dois eventos quaisquer, então: P ( A È B ) = P ( A ) + P ( B ) - P ( A Ç B )