FACULDADE DE ALAGOAS Curso : ADMINISTRAÇÃO Disciplina: ESTATÍSTICA Professor: FERNANDO CHAGAS DISTRIBUIÇÕES DE PROBABILIDADE Existem diversos modelos que descrevem as Distribuições de Probabilidades, de acordo com as características de certos experimentos. Temos, como exemplos: Distribuição Normal Distribuição Geométrica Distribuição Binomial Distribuição Hipergeométrica Distribuição de Poisson Distribuição de Pascal Em nosso estudo, trataremos das três primeiras, onde a Distribuição Normal é a mais importante de todas estudadas e aplicadas na análise de experimentos estatísticos. PROBABILIDADE – DISTRIBUIÇÃO NORMAL A Distribuição NORMAL é a distribuição contínua de probabilidade mais importante na Estatística. Essa distribuição pode ser utilizada para modelar muitos conjuntos de medidas na natureza, na indústria, no comércio. Essa distribuição é também chamada de Distribuição Gaussiana, em função do seu desenvolvimento ter sido feita por um dos maiores matemáticos de todos os tempos: Carl Gauss. Propriedades da Distribuição Normal: a) A média, a Mediana e a Moda são iguais FACULDADE DE ALAGOAS b) A curva normal tem formato de sino e é simétrica em torno da média c) A curva normal aproxima-se mais do eixo-x à medida que se afasta da média em ambos os lados, mas nunca toca o eixo. Se X for uma variável aleatória contínua e tiver uma distribuição normal com média e desvio padrão , pode-se fazer o gráfico de uma curva normal usando a equação f( x ) 1 2 (x ) e2 2 2 em que x Mas, vamos resolver nossos problemas utilizando-se da Tabela da Distribuição Normal Padrão. Quando temos uma variável aleatória com distribuição normal, o principal interesse é encontrar a probabilidade de essa variável assumir um valor em determinado intervalo. Exemplo 1: Seja X a variável aleatória que representa os diâmetros dos parafusos produzidos por uma máquina. Supondo que a média dos diâmetros seja de 2 cm e o desvio padrão seja de 0,04 cm, qual seria a probabilidade de ter um parafuso com diâmetro entre 2,0 e 2,05 cm? Para solucionar a questão, utilizaremos a Tabela da Distribuição Normal Padrão (em função de z) anexa, cuja aplicação é feita após a descoberta dos valores do intervalo de z, conforme a seguinte equação: z = (x-m)/s m = média s = desvio padrão (2X2 ,05 ) Queremos calcular P Temos: Média(m)= 2,0 Desvio Padrão (s)= 0,04 Intervalo(x): entre 2,0 e 2,05 Calculando os valores do intervalo para z (substituindo os valores de x pelos dados do intervalo): Para x = 2,00 z = (2,0 – 2,0)/0,04 = 0 Para x = 2,05 z = (2,05 – 2,0)/0,04 = 1,25 Consultando a tabela, procuramos os valores correspondentes para 0 e 1,25, que são 0,0000 e 0,3944 Assim, de 0 a 1,25 temos: 0,3944 – 0,0000 = 0,3944 que corresponde a 39,44% Portanto, a probabilidade de se encontrar um parafuso com diâmetro entre 2 cm e 2,05 cm é de 39,44%. Exemplo 2: Considerando a mesma variável do exemplo 1 anterior, com média de 2,0 cm e desvio padrão de 0,04 cm, qual a probabilidade de se encontrar um parafuso com diâmetro entre 1,9 cm e 2,1 cm? Temos: Média(m)= 2,0 Desvio Padrão (s)= 0,04 Calculando os valores do intervalo para z: Intervalo(x): entre 1,9 e 2,1 FACULDADE DE ALAGOAS Para x = 1,9 z = (1,9 – 2,0)/0,04 = -2,5 Para x = 2,1 z = (2,1 – 2,0)/0,04 = 2,5 Como a curva é simétrica, temos que a probabilidade para o intervalo de –2,5 até 0 é a mesma que de 0 até 2,5. Assim, temos: 0,4938 + 0,4938 = 0,9876 que corresponde a 98,76%. Exemplo 3: Qual a probabilidade de se encontrar um parafuso com diâmetro entre 1,96 cm e 2,04 cm, considerando a mesma média e desvio padrão dos exemplos anteriores? Temos: Média(m)= 2,0 Desvio Padrão (s)= 0,04 Intervalo(x): entre 1,96 e 2,04 Calculando os valores do intervalo para z: Para x = 1,96 z = (1,96 – 2,0)/0,04 = -1,0 Para x = 2,04 z = (2,04 – 2,0)/0,04 = 1,0 Como a curva é simétrica, temos que a probabilidade para o intervalo de -1,0 até 0 é a mesma que de 0 até 1,0. Assim, temos a união dos intervalos: 0,3413 + 0,3413= 0,6826 que corresponde a 68,26%. Observação: Os valores do intervalo desse último exemplo, correspondem à Média – Desvio Padrão e Média + Desvio Padrão, isto é, m – s e m + s. Concluímos, pois, que numa distribuição normal, somando e subtraindo o Desvio Padrão da Média, encontramos um intervalo que tem 68,26% da distribuição. Exemplo 4: Os salários mensais dos operários de uma indústria são distribuídos normalmente, em torno da média de R$ 500,00. Sabendo-se que o Desvio Padrão é de R$ 40,00, qual a probabilidade de um operário ter um salário mensal situado entre R$ 490,00 e R$ 520,00? Temos: Média(m)= 500,00 Desvio Padrão (s)= 40,00 Intervalo(x): entre 490,00 e 520,00 Calculando os valores do intervalo para z: Para x = 490 z = (490-500)/40 = - 0,25 Para x = 520 z = (520-500)/40 = 0,50 FACULDADE DE ALAGOAS Teremos, então, a união do intervalo entre –0,25 até 0 e 0 até e 0,50. Consultando a Tabela, encontramos: 0,0987 + 0,1915 = 0,2902 Logo, a probabilidade de um operário ter salário mensal entre R$ 490,00 e R$ 520,00 é de 29,02%. PROBLEMA PROPOSTO: Um teste padronizado de escolaridade tem distribuição normal com média 100 e desvio padrão 10. Qual a probabilidade de um indivíduo submetido ao teste ter nota: a) Maior que 120 ? b) Entre 85 e 115 ? EXEMPLOS DE COMO USAR A TABELA DE DISTRIBUIÇÃO NORMAL PADRONIZADA EXEMPLO 1: Se após o cálculo dos valores do intervalo encontramos 0 e 1,25, vamos localizar os números correspondentes: Para 0 = 0,0000 Para 1,25 Na linha vertical do z localizamos 1,2 ; a partir do 1,2 seguimos em linha horizontal até encontrar o valor que corresponde ao 5 (que está na linha horizontal do z), que é 3944. Logo, o número procurado é 0,3944. Como o 0,0000 corresponde ao centro da curva, o valor 0,3944 (positivo) está à sua direita. O resultado final seria a subtração entre esses dois valores: 0,3944 – 0,0000 = 0,3944 EXEMPLO 2: Se após o cálculo dos valores do intervalo encontramos -1,0 e 1,5, vamos localizar os números correspondentes: Para -1,0 é o mesmo que se procurássemos para +1,0, pois a curva é simétrica. Assim, para -1,0 teríamos 0,3413. Para 1,5 temos 0,4332. Como uma parte do intervalo está à esquerda da média (0,3413) e a outra à direita (0,4332), o intervalo total corresponde à soma: 0,3413 + 0,4332 = 0,7745. EXEMPLO 3: Se quisermos saber qual a probabilidade para um valor de z maior que 2 faremos: O intervalo à esquerda da média corresponde à meta da curva, logo a uma probabilidade de 0,5. Calculamos, então, de 0 até 2, que é 0,4772. Assim, o intervalo total do lado esquerdo até chegar no 2 (positivo) é de 0,5 + 0,4772 = 0,9772. Para chegar em 1 falta 0,0228, que é o que procurávamos. FACULDADE DE ALAGOAS DISTRIBUIÇÃO GEOMÉTRICA Muitas vezes temos eventos repetidos até que se obtenha um sucesso. Por exemplo: nos serviços de telemarketing, uma telefonista liga várias vezes para os clientes, até conseguir concretizar a 1ª venda do dia. A Distribuição Geométrica é uma distribuição discreta de probabilidade de uma variável aleatória x que satisfaz às seguintes condições: Uma tentativa é repetida até que o sucesso ocorra As tentativas repetidas são independentes umas das outras A probabilidade de sucesso p é a mesma em cada tentativa. (x)p.( q)x1 A probabilidade de que o primeiro sucesso ocorrerá na tentativa x é : P onde p é a probabilidade de sucesso e q a probabilidade de fracasso. Assim, p+q = 1. Exemplos: 01- Por experiência, numa determinada empresa sabe-se que a probabilidade de que se conseguir uma venda em qualquer chamada telefônica é de 23%. Qual a probabilidade de que sua primeira venda em um dado dia ocorra na quarta chamada telefônica? Temos: Assim p = 0,23 q = 0,77 x=4 4 1 P ( 4 ) 0 , 23 .( 0 , 77 ) 0 , 105003 Que é 10,5003% 02- Na mesma empresa do problema anterior, qual a probabilidade de que sua primeira venda em um dado dia ocorra na quinta chamada telefônica? Temos: Assim p = 0,23 q = 0,77 x=5 5 1 P ( 5 ) 0 , 23 .( 0 , 77 ) 0 , 080852 Que é 8,0852% 03- Ainda na mesma empresa, qual a probabilidade de que em um dado dia sua primeira venda ocorra na quarta ou na quinta chamada telefônica? Nesse caso, basta somarmos as probabilidades da quarta com a da quinta: 0,105003 + 0,080852 = 0,185855 Que é 18,5855% FACULDADE DE ALAGOAS DISTRIBUIÇÃO BINOMIAL Quando temos experimentos que satisfaçam as condições abaixo, a Distribuição de Probabilidade utilizada é a Distribuição BINOMIAL: O experimento deve ser repetido, nas mesmas condições, um número finito de vezes (n); As provas repetidas devem ser independentes, isto é, o resultado de uma não deve interferir os resultados das sucessivas; Em cada prova deve aparecer um dos possíveis resultados: sucesso ou fracasso (insucesso); No decorrer do experimento, a probabilidade p do sucesso e a probabilidade q ( q = 1 – p) do fracasso manter-se-ão constantes. n k n k ( X k ) p. q A probabilidade para esse tipo de experimento é dada por P k onde, k é a quantidade de que o evento dado se realize n é o número de provas repetidas p é a probabilidade de sucesso q é a probabilidade de fracasso n! n é o coeficiente binomial de n sobre k, que é igual a k!.(nk)! k Exemplos: 1- Uma moeda é lançada 5 vezes seguidas sobre uma mesa. Qual a probabilidade de sair 3 caras? Vemos que o experimento atende as 4 condições da Distribuição Binomial: o experimento é repetido um número finito de vezes (no caso 5); cada lançamento é independente dos outros; em cada prova queremos saber qual o sucesso de se obter “cara”; a probabilidade de sucesso e fracasso são constantes a cada lançamento. Dados do problema: n = 5 k=3 p=½ q=½ 5 ! 1 1 5 . 4 . 3 ! 1 1 1 10 5 3 5 3 3 21 ( X 3 ) .( ) .( ) .( ) .( ) 10 . . 0 , 31 Assim, P 3 ! ( 5 3 )! 2 2 3 !. 2 ! 2 2 8 4 32 16 Logo, a probabilidade de que saiam 3 caras é de 31,25%. 2- Dois times (ASA BRANCA e ASA VERMELHA) jogam 6 vezes. Qual a probabilidade de ASA BRANCA vencer 4 jogos? Os resultados de cada jogo são Vitória, Empate ou Derrota. Assim, a probabilidade de vitória é de 1/3 e a de quaisquer outros resultados é de 2/3 (p = 1/3 e q= 2/3) FACULDADE DE ALAGOAS Dados do problema: n = 6 k = 4 p = 1/3 e q= 2/3 4 2 6 ! 1 2 6 . 5 . 4 ! 1 4 4 20 P ( X 4 ) . . . 15 . 0 , 082 4 !.( 6 4 )! 3 3 4 !. 2 ! 81 9 729 243 Assim, a probabilidade de ASA BRANCA vencer 4, dos 6 jogos, é de 8,23%.