CAP3: Distribuições Discretas e Contínuas Distribuições Discretas: Hipergeométrica, Binomial e Poisson Uma distribuição de probabilidade é um modelo matemático que relaciona o valor da variável com a probabilidade de ocorrência daquele valor na população. Exemplo 3.1 Os 125 diâmetro dos anéis de pistons (tabela 1.1) são uma amostra dos diâmetros que foi selecionada do processo de produção. A população neste exemplo é o conjunto de todos os anéis de pistons produzidos por este processo. Com o uso de métodos estatísticos poderemos analisar a amostra dos diâmetros e tirar conclusões sobre o processo que produz esses anéis. Os diâmetros dos anéis de pistons são chamados de variável aleatória, porque assume diferentes valores na população de acordo com algum mecanismo aleatório. A distribuição de probabilidade dos diâmetros dos anéis descreve a probabilidade de ocorrência de qualquer valor do diâmetro na população. Distribuição Discreta é quando a variável só pode assumir certos valores, tais como os inteiros 0, 1,2,... Exemplo 3.2 O número de pistons com diâmetro abaixo de determinado valor é uma variável discreta. Já o diâmetro do piston é uma variável contínua, pois pode assumir qualquer valor num intervalo de números reais. Notação: P(X=xi) = p(xi) significa a probabilidade da variável aleatória X assumir o valor xi. A probabilidade é um valor entre 0 e 1. No caso da distribuição de probabilidade, a soma das probabilidades sobre todos os valores possíveis da variável aleatória é igual a 1. Vamos estudar algumas distribuições discretas. OBS: Distribuição Hipergeométrica Considere uma população finita composta de N itens. Algum número, digamos D (D≤N), destes itens pertence a uma determinada classe de interesse. Uma amostra aleatória de n itens é retirada da população sem reposição e o número de itens na amostra que se situa na classe de interesse, x, é observado. Então x é uma variável aleatória hipergeométrica com distribuição de probabilidade como segue , x=0,1,2,...,min(n,D) A média e variância da distribuição são: e ) Exemplo 3.3 Um lote contém 100 itens, dos quais 5 não satisfazem os requisitos. Se 10 itens são selecionados aleatoriamente sem reposição, então a distribuição de probabilidade do número de itens defeituosos, x, é: A probabilidade de achar no máximo um item não-conforme é: X=número de itens não conforme No máximo um item não conforme: X≤1 Probabilidade: P(X = 0.9231433 = 0.923 Verifique que P(X>1) = 1-0.923 = 0.077, pois: Esta probabilidade é a soma de p(2)+p(3)+p(4)+p(5) A soma das probabilidades sobre todos os valores possíveis da variável aleatória é igual a 1 Os valores possíveis desta variável são 0,1,2,3,4,5 Logo p(0)+p(1)+ p(2)+p(3)+p(4)+p(5)=1 Note que dependendo da probabilidade a ser calculada temos mais de uma maneira de obtê-la. Veja: A probabilidade de achar no mínimo três itens não conforme é: X=número de itens não conforme No mínimo três itens não conformes: X≥3 Probabilidade: P(X = 0.006637913 = 0.007 Ou ainda 1 – [0.923+ ] = 1-[0.923 + 0.070] = 0.007 Atenção: antes de realizar os cálculos verifique a melhor maneira de obter o resultado. Lembre-se sempre que: A soma das probabilidades sobre todos os valores possíveis da variável aleatória é igual a 1. Distribuição Binomial Considere um processo consistindo de uma sequencia de n provas independentes. Por provas independentes queremos dizer que o resultado de cada prova não depende, de qualquer maneira, dos resultados das provas anteriores. Quando o resultado de cada prova é ou “sucesso” ou “fracasso”, as provas são chamadas provas de Bernoulli. Se a probabilidade de “sucesso” em qualquer prova, digamos p, é constante, então o número de “sucessos” x em n provas de Bernoulli independentes tem distribuição binomial com parâmetros n e p como segue: , x=0,1,2,...,n A média e variância da distribuição são: e Observe que na distribuição hipergeométrica a população é finita; já na distribuição binomial a população é considerada infinitamente grande. Exemplo 3.4 Um lote contém 1000 itens, dos quais 5 não satisfazem os requisitos. Se 10 itens são selecionados aleatoriamente sem reposição, então a distribuição de probabilidade do número de itens defeituosos, x, é: Hipergeométrica (população de 1000 itens): Binomial (se pensarmos que 1000 itens é um número consideravelmente grande!), a verificação dos 10 itens é o número de provas de Bernoulli e a probabilidade de encontrar “item não conforme” é 5/1000 = 0.005 A probabilidade de achar no máximo um item não-conforme é: X=número de itens não conforme No máximo um item não conforme: X≤1 Adotando a hipótese de população infinita, temos um modelo binomial P(X = 0.9511101 + 0.04779448= 0.9989046 = 0.999 Observe que tanto no modelo Binomial como no Hipergeométrico o objetivo é verificar número de itens não conformes numa amostra. A diferença está na hipótese do tamanho da população. As probabilidades de ambos os modelos se tornam muito próximas à medida que o tamanho da população tende a infinito. Distribuição de Poisson Muito usada no Controle de qualidade para modelar o número de defeitos por unidade de produto. Qualquer fenômeno aleatório que ocorrem em base unitária (unidade de área, unidade de volume, unidade de tempo, etc) é bem aproximado pela distribuição de Poisson. A distribuição de Poisson é: , x=0,1,... A média e variância da distribuição são: e Exemplo 3.5 Suponha que estejamos interessados em modelar o número de circuitos defeituosos por semicondutor. Sabe-se que em média cada semicondutor apresenta 4 circuitos defeituosos. Adotando um modelo de Poisson, temos λ=4 com A probabilidade de um semicondutor escolhido aleatoriamente conter no máximo dois circuitos defeituosos é: No máximo dois circuitos defeituosos: = = 0.2381033 = 0.238 Exercícios: 3.1 Uma montagem mecatrônica é submetida a um teste final. Suponha que os defeitos ocorram aleatoriamente nessas montagens de acordo com uma distribuição de Poisson com parâmetro λ = 0.02 a) Qual a probabilidade de uma montagem apresentar exatamente um defeito? b) Qual a probabilidade de uma montagem apresentar um ou mais defeitos? c)Suponha que você melhore o processo de modo que a taxa de ocorrência de defeitos seja reduzida pela metade, λ = 0.01. Qual o efeito desta medida sobre a probabilidade de uma montagem apresentar pelo menos um defeito? Respostas: a) 0.01960397(p(1)) b) 0.01980133 (1-p(0)) metade) c) 0.009950166 (a probabilidade fica reduzida pela 3.2 Um processo de produção opera a uma taxa de 2% de peças produzidas não conformes. A cada hora uma amostra de 50 unidades do produto é retirada, e o número de não conforme é contado. Se uma ou mais unidades fora das especificações são encontradas, o processo é interrompido e o técnico de controle de qualidade tem que encontrar a causa para a produção de não conformes. a) Estabeleça o modelo de probabilidade para o número de unidades não conforme. b) Avalie a probabilidade do técnico de controle de qualidade ter que interromper o processo devido à produção de não conformes. c) Avalie o número médio de interrupções para encontrar a causa da produção de não conformes num período de 10h de produção ininterruptas. Respostas: a)Modelo binomial com n=50 e p=0.02 b) c)10*0.6358 ; ou seja a cada 10 h em torno de 6 interrupções. 0.6358 3.3 Em um departamento de inspeção de recebimento, lotes de eixo de bomba são recebidos periodicamente. Os lotes contêm 100 unidades, e o seguinte plano de amostragem de aceitação é usado: Seleciona-se uma amostra de 10 unidades sem reposição. O lote é aceito se a amostra tiver, no máximo, um defeituoso. Suponha que cada lote contenha 5 defeituosos. a) Estabeleça o modelo de probabilidade para o número de defeituosos na amostra. b) Avalie a probabilidade de a amostra conter todos os itens defeituosos do lote. c) Avalie a probabilidade de o lote ser aceito. Respostas: a)Modelo Hipergeométrico com N=100 e n=10 e D=5 b) 0.9231 0.000003 c) 3.4 Considere que uma amostra de 100 unidades é retirada de um processo de produção a cada meia hora. A fração de peças não conformes produzidas é de 0.03. a) Estabeleça o modelo de probabilidade para o número de peças não conformes da amostra. b) Expresse a probabilidade de mais de três peças serem não conformes c) Expresse a probabilidade de no máximo três peças serem não conformes d) Expresse a probabilidade de menos de três peças serem não conformes e) Expresse a probabilidade de pelo menos três peças serem não conformes f) Obtenha os valores das probabilidades dos itens de b a e. Respostas: a)Modelo Binomial com n=100 e p=0.03 b) 0.3527508; 0.6472492; 0.4197751; 0.5802249 . c) d) 3.5 Considere um processo de Poisson com taxa de falha de 2/h. Expresse e avalie: a) A probabilidade de mais de duas falhas no processo b)A probabilidade de no máximo duas falhas no processo c) A probabilidade de menos de duas falhas no processo d) A probabilidade de pelo menos duas falhas no processo e) f) Respostas: a) =0.3233236 b) =0.6766764 c) =0.4060058 d) 3.6 Para uma distribuição de Poisson com parâmetro λ=4, identifique qual das alternativas representa a. b. c. d. Resposta: c 3.7 Para uma distribuição de Poisson com parâmetro λ=4, identifique qual das alternativas representa a. b. c. d. Resposta: d 3.8 Para uma distribuição de Poisson com parâmetro λ=4, identifique qual das alternativas representa a. b. c. d. Resposta: a 3.9 Para uma distribuição de Poisson com parâmetro λ=4, identifique qual das alternativas representa a. b. c. d. Resposta: c 3.10 Se 0.110674, avalie Resposta: 0.889326 . 0.5939942 Distribuições Contínuas:Distribuição Normal, Exponencial e Weibull Distribuição Normal Quando a variável sendo medida é expressa em uma escala contínua, sua distribuição de probabilidade é chamada distribuição contínua. Exemplo 4.1 Suponha que X seja uma variável aleatória representando o conteúdo real em kg de um pacote de café de 1kg. Assume-se que a distribuição de X seja Essa é uma distribuição contínua uma vez que o domínio de x é o intervalo [0.8; 1.1]. É chamada de distribuição uniforme e seu gráfico é representado por uma reta paralela ao eixo x: A probabilidade para variáveis contínuas assumirem valores num intervalo corresponde à área sobre a curva da função f(x) que é obtida pelo cálculo da integral definida no intervalo de valores que se deseja. Exemplo 4.2 Considerando a variável do exemplo 4.1, a probabilidade de um pacote de café conter menos de 1 kg é: = Interpretação: Assim, um processo de enchimento de pacotes de café com a distribuição de probabilidade descrita acima produzirá em torno de 67% dos pacotes com peso menor ou igual a 1kg. Neste capítulo veremos as seguintes distribuições contínuas: Normal, Exponencial e Weibull Distribuição Normal A média e variância da distribuição são: A notação usada para indicar que uma variável aleatória tem essa distribuição é: O gráfico desta distribuição é simétrico em forma de sino com eixo de simetria em x=μ. Gráfico4.1 Distribuição normal A probabilidade acumulada num ponto a qualquer é: Para a distribuição normal não há uma forma analítica de se obter esta integral, assim utilizamos uma tabela (veja tabela da distribuição normal acumulada) para obter as probabilidades desta distribuição. Para utilizar a tabela é necessária fazer uma mudança de variável: Exemplo 4.3 Considere X a força de tensão do papel usada na confecção de sacos para supermercados. Sabe-se que Um comprador dos sacos exige que eles tenham pelo menos 35 lb/in2. A probabilidade de que um saco confeccionado com este papel atenda tal especificação é: Para obter fazemos a mudança de variável: Assim, Graficamente isso representa a área hachurada: 0.2 0.0 0.1 f(x) 0.3 0.4 P(Z>-2.5) - Z~N(mi=0, sigma=1) -4 -2 0 2 4 x Gráfico 4.2: Área correspondente à probabilidade P(Z>-2.5) O valor da probabilidade é obtido consultando a tabela. Entretanto a tabela fornece valores de probabilidade acumulada, muitas vezes precisamos observar a simetria da curva para obtermos o valor adequado na tabela. Assim, observe sob a ótica da simetria que a área correspondente a Z>-2.5 é a mesma de Z<2.5. 0.2 0.0 0.1 f(x) 0.3 0.4 P(Z<2.5) - Z~N(mi=0, sigma=1) -4 -2 0 2 4 x Gráfico 4.3: Área correspondente à probabilidade P(Z<2.5) Logo, P(Z>-2.5) = P(Z<2.5) que é uma probabilidade acumulada no ponto 2.5. Consultando este valor (2.50) na tabela, obtemos: Logo, P(X>35) = 0.993790 ou 99,38% Exemplo 4.4 O diâmetro de uma haste de metal usada em uma unidade de disco é normalmente distribuída com média 0.2508 in e desvio padrão 0.0005 in. As especificações sobre a haste foram estabelecidas como . Deseja-se saber qual a fração das hastes produzidas que satisfazem as especificações. X = diâmetro da haste Probabilidade a ser calculada: Padronizando os valores: e Assim, que corresponde a probabilidade acumulada em 1.4 menos a probabilidade acumulada em -4.60 Graficamente: 0.2 0.0 0.1 f(x) 0.3 0.4 P(-4.6<Z<1.4) - Z~N(mi=0, sigma=1) -6 -4 -2 0 2 4 6 x Gráfico 4.4: Probabilidade entre dois valores Consultamos a tabela para os valores 1.4 e 4.6 (opa, temos um problema de sinal!) Para 1.4 obtemos 0.919243 e para 4.6 obtemos ...não tem na tabela, pegue o último valor que é 0.999998. Agora resolvemos a questão do sinal. Queremos a P(Z<-4.6) e na tabela obtivemos P(Z<4.6). Por simetria sabemos que P(Z>4.6) = P(Z<-4.6). Além disso temos que a área total é igual a 1. Logo P(Z<-4.6) = 1 – P(Z<4.6) = 1 – 0.999998 = 0.000002 Logo Interpretação: Podemos esperar que o aproveitamento do processo seja de aproximadamente 91.92%; isto é, cerca de 91.92% das hastes são produzidas de acordo com as especificações. Se a média do processo fosse modificada de 0.2508 para 0.2500, qual seria o percentual de aproveitamento do processo? Refaça os cálculos anteriores modificando μ para 0.2500. Se você entendeu tudo até agora, deverá obter . Assim, com a modificação no processo, o aproveitamento aumentaria para aproximadamente 99.73%. Exemplo 4.5 Algumas vezes, em vez de calcular a probabilidade associada a um determinado valor, é necessário fazer o oposto – achar um valor particular de uma variável aleatória que resulta em uma dada probabilidade. Suponha que . Queremos achar o valor de a, tal que P(X>a) = 0.05. De modo equivalente, podemos reescrever Agora, devemos procurar no interior da tabela o valor 0.95 (que corresponde a uma probabilidade acumulada; observe sempre este fato, por isso reescrevemos a informação inicial!) No interior da tabela encontramos 0.950529 que corresponde ao valor de z = 1,65 (1,60 +0.05) Também, encontramos 0.949497 que corresponde ao valor de z = 1,64. Como 0.95 fica entre estes dois valores, o valor de z procurado fica entre 1.64 e 1.65; nesta situação podemos assumir que o valor procurado é o ponto médio entre estes dois: 1.645 (faça assim sempre que encontrar situação semelhante!) O valor de a fica assim determinado: ou seja Exemplo 4.6: Certo tipo de lâmpada tem um resultado que é normalmente distribuído com média de 26900 lux e desvio padrão de 807 lux. Qual deve ser o limite inferior de especificação deste tipo de lâmpada para que não mais que 2.5% das produzidas fiquem abaixo deste limite? O que se deseja é determinar a, o limite inferior, tal que ou de modo equivalente . Consultando o valor 0.975 na tabela, obtemos: z=1.96 (1.90+0.06). Entretanto, devemos lembrar que o valor de a deve ser inferior ao valor da média 26900, logo o valor de z deve ser o simétrico de 1.96, ou seja, -1.96. Ao consultar a tabela em situações semelhantes, tenha sempre em mente se o valor que se deseja está acima ou abaixo da média, pois isso interfere no sinal de z devido à simetria da curva. Se tiver dúvida faça um esboço gráfico, marcando a área sob a curva: Gráfico 4.5: Ilustração dado a área determinar o valor de z O valor de a fica assim determinado: ou seja Portanto o limite inferior de especificação deve ser 25318.28 lux Exercícios Distribuição Normal: Treinando o uso da Tabela: obtenha as probabilidades que se pede: 1) 2) 3) 4) 5) 6) 7) 8) 9) 10) Obtenha a tal que sendo 11) A vida de determinado tipo de bateria de cela seca é distribuída normalmente com média de 600 dias e desvio padrão de 60 dias. Que fração dessas baterias espera-se que sobreviva acima de 680 dias? 12) A dureza de Rockwell de uma liga particular é distribuída normalmente com média de 70 e desvio padrão de 4. Se o intervalo aceitável para a dureza fosse (70 – c, 70 + c), para que valor de c teríamos 95% de todos os espécimes com dureza aceitável? 13) Um processo de fabricação de certo produto precisa de ajustes sempre que o pH do produto final ficar acima de 7.20 ou abaixo de 6.80. O pH da amostra é distribuído normalmente com média μ e desvio padrão 0.10. Qual a probabilidade de ajuste do processo quando a média do processo está muito ácido, ou seja, com μ=6.75? Respostas: 1) 0.977250 2) 0.995339 3) 1-0.977250 4) 1-0.995339 5) 1-0.977250 6) 1-0.996319 7) 0.978822-(1-0.922196) = 0.901018 8) 0.922196-(1-0.579260) = 0.501456 9) Equivale a = 0.598706 - (1-0.598706)= 0.197412 10) Z=-0.845 (atenção ao sinal, a deve ser inferior à média!). Logo a=2.324. 11) P(X>680) = P(Z>1.33) = 1 – 0.908241 = 0.091759 12) P(70-c<X<70+c) = 0.95 equivale a P(-c/4<Z<c/4)=0.95. Equivale ainda a P(X<70-c)=0.025. Este problema foi resolvido no exemplo 4.6. Assim c/4 = 1.96; logo c=7.84 13) P(6.8<X<7.2) = P(0.5<Z<4.5) = 0.999997 – (0.691462) = 0.308535 Distribuição Exponencial e Weibull A distribuição exponencial é definida por é uma constante. A média e a variância desta distribuição são: Veja o gráfico desta distribuição: Gráfico 4.6: Distribuição Exponencial com média 1/λ A distribuição exponencial é amplamente utilizada na área de engenharia de confiabilidade como modelo do tempo de falha de um componente ou sistema. Em tais aplicações o parâmetro λ é denominado taxa de falha do sistema e a média da distribuição 1/ λ é chamada tempo médio de falha. Exemplo 4.7: Suponha que um componente eletrônico em um sistema de radar de aeronave tenha vida útil descrita por uma distribuição exponencial com taxa de falha de 10-4/h, isto é, λ = 10-4. O tempo médio de falha para este componente é 1/ λ = 104 = 10.000h. A probabilidade de o componente falhar antes do seu tempo esperado de vida é: Este resultado vale independente do valor de . Note que a distribuição acumulada no ponto a para esta distribuição é: Exemplo 4.8 Suponha que um processo de fabricação de certo componente apresente distribuição exponencial para o tempo de falha, com taxa de falha de λ = 200-1 falhas por hora. Logo a vida média é de 200 horas. Por causa de uma clausula de garantia, o fabricante deve pagar uma multa de k dólares se um componente durar menos do que 400 horas. Qual a probabilidade do fabricante pagar a multa sobre um componente qualquer produzido? Deseja-se obter 0.864665 A distribuição de Weibull é definida por é o parâmetro de escala e A média desta distribuição é: é o parâmetro de forma. é chamada de função Gama. Se n é um inteiro positivo então: Veja o gráfico da distribuição de Weibull: Gráfico 4.7: Distribuição de Weibull, variando o parâmetro de forma. A distribuição de Weibull se reduz à exponencial quando β=1. Trata-se de um distribuição bastante flexível, pois pode assumir diversas formas com valores apropriados dos seus parâmetros. A distribuição acumulada da Weibull é: Exemplo 4.9 O tempo de falha de uma submontagem eletrônica usada em uma estação de trabalho RISK é satisfatoriamente modelado por uma distribuição de Weibull com β=0.5 e θ = 1000. Obtenha o tempo médio de falha de uma submontagem. O tempo médio de falha é dado por Qual a probabilidade da submontagem sobreviver mais de 4000h Espera-se que 13,53% das submontagens falharão após 4000 h de funcionamento. Exercícios Distribuição Exponencial e Weibull: 1- Sabe-se que o tempo de falha de certo transistor tem distribuição de Weibull com parâmetros β=1/3 e θ = 400. Ache a fração de transistor que sobrevive a 600 horas de uso. 2- Sabe-se que o tempo de falha de certo transistor tem distribuição de Weibull com parâmetros β=1/3 e θ = 400. Qual o tempo médio de falha do transistor. 3- Sabe-se que o tempo de falha de um pequeno sistema de computador tem distribuição de Weibull com parâmetros β=1/4 e θ = 200. Que fração dessas unidades de sistema sobreviverá a 1000 horas de uso. 4- Sabe-se que o tempo de falha de um pequeno sistema de computador tem distribuição de Weibull com parâmetros β=1/4 e θ = 200. Qual o tempo médio de falha de uma unidade do sistema. 5- Um fabricante de um monitor de televisão comercial garante o tubo de imagem por um ano (8760 h). Os monitores são usados em terminais de aeroportos para tabelas de voos, e estão ligados continuamente. A vida média dos tubos é de 20.000 h e o tempo de falha segue uma distribuição exponencial. Que proporção de tubos durará menos do que a garantia de 8760 h? 6- Estima-se que o tempo de falha de um tubo de televisão seja distribuído exponencialmente, com uma média de três anos. Uma companhia oferece seguro para esses tubos no primeiro ano de uso. Qual a porcentagem de apólices que terão que pagar? Repostas: 1- P(X>600) = 0.3183 23- P(X>1000) = =0.2242 45- P(X<8760) = 6- P(X<1) = 0.3547 0.2835 Após estes exercícios você deverá realizar o teste 3.