AULA DIA 19-06-06 PROF. HENRIQUE D. NEDER A DISTRIBUIÇAO BINOMIAL DE PROBABILIDADE Suponhamos que um experimento consista de tentativas repetidas, cada uma com dois possíveis resultados que podem ser vistos como sucesso ou fracasso. Uma aplicação obvia na área de ciências sociais aplicadas refere-se a um experimento que se refere a selecionar repetidas vezes um elemento de amostra de uma população que contenha apenas duas categorias, por exemplo, pessoas que votarão em um determinado candidato ou não. Consideremos que se a pessoa for votar no candidato teremos um resultado de sucesso e se não for votar teremos um resultado de fracasso. Outro exemplo seria um jogo de baralho em que extraímos repetidas vezes uma carta do conjunto de 52 cartas. Neste caso poderemos considerar como sucesso o resultado ser uma carta numérica e fracasso o resultado ser uma carta de figura. A um experimento definido desta forma damos o nome de processo Bernoulli. Podemos também definir uma variável aleatória que terá valor X = 1 se ocorrer sucesso e valor X = 0 se ocorrer fracasso. Desta forma também podemos chamar tal variável de variável aleatória Bernoulli. Cada tentativa do experimento é denominada tentativa Bernoulli. Podemos observar que tanto no exemplo do candidato como no exemplo das cartas se a pessoa selecionada da população de eleitores ou se a carta selecionada do baralho não for reposta a probabilidade de um sucesso para as repetidas tentativas muda. Suponhamos que a nossa população de eleitores tenha 1000 pessoas e dentro desta população 300 votarão no candidato e 700 não votarão. Na primeira tentativa do experimento (seleção da primeira pessoa) temos uma probabilidade de sucesso igual a 300 / 1000 = 0,3. Na segunda tentativa, se não for feita a reposição da primeira pessoa na população de origem, teremos uma probabilidade de sucesso igual a 299/999 caso tenha ocorrido sucesso na primeira tentativa e igual a 300/299 caso tenha ocorrido fracasso na primeira tentativa. Fica mais complicado de ver o que ocorrerá na terceira tentativa, pois o resultado irá depender do que ocorreu na primeira e na segunda tentativas. Neste caso não teremos tentativas Bernoulli porque a probabilidade de sucesso não se mantém constante no decorrer das tentativas seqüenciais. Iremos definir um processo Bernoulli da forma como segue. Estritamente falando, um processo Bernoulli dever ter as seguintes propriedades: 1) O experimento consiste de n tentativas repetidas. 2) Cada tentativa tem um resultado que pode ser classificado como um sucesso ou um fracasso. 3) A probabilidade de sucesso, denotada por p, permanece constante de tentativa para tentativa. 4) As tentativas repetidas são independentes. Considere um conjunto de tentativas Bernoulli onde três itens são selecionados aleatoriamente de um processo de fabricação. A seguir eles são inspecionados e classificados como defeituosos ou não defeituosos. Um item defeituoso é designado como um sucesso. O numero de sucesso é uma variável aleatória X com valores de 0 a 3. O espaço amostral destes experimento é definido por oito eventos: S = {NNN, NDN, NND, DNN, NDD, DND, DDN, DDD} Temos então a seguinte tabela de resultados para esta variável aleatória: Resultado X NNN 0 NDN 1 NND 1 DNN 1 NDD 2 DND 2 DDN 2 DDD 3 Como os itens são selecionados independentemente de um processo que digamos, produz 25 % de defeituosos, teremos, por exemplo: 3 1 3 9 0,14 . . 4 4 4 64 P(NDN) = P(N).P(D).P(N) = Se não houvesse independência estatistica entre as tentativas Bernoulli e se tivéssemos um lote de produção de 1000 pecas, teríamos o seguinte resultado: P( NDN ) P( N1 ).P( D2 / N1 ).P( N 3 / N1 D2 ) 750 250 749 0,14086 1000 999 998 Como pode ser visto, existe uma pequena diferença no valor da probabilidade quando calculamos considerando como tentativas Bernoulli (tentativas independentes e com probabilidade de sucesso constante) e quando consideramos que as tentativas não são independentes (neste ultimo caso não são tentativas Bernoulli). Vamos agora calcular o valor das probabilidades para cada valor da variável aleatória X (numero de sucessos). Para isto construímos a seguinte tabela de distribuição de probabilidades: x f(x) = P(X=x) 0 27/64 1 27/64 2 9/64 3 1/64 A variável aleatória X que é definida como o numero de sucessos é chamada de variável aleatória Binomial. A distribuição de probabilidade é chamada de distribuição binomial. Podemos generalizar este resultado com a seguinte definição: Distribuição binomial Uma tentativa Bernoulli pode resultar em um sucesso com probabilidade p e com fracasso com probabilidade q = 1- p. Então a distribuição de probabilidade de uma variável aleatória binomial X, o numero de sucessos em n tentativas independentes, é n b( x; n, p) p x q n x , x = 0,1,2,...,n. x