CAP3: Distribuições Discretas e Contínuas Distribuições Discretas

Propaganda
CAP3: Distribuições Discretas e Contínuas
Distribuições Discretas: Hipergeométrica, Binomial e Poisson
Uma distribuição de probabilidade é um modelo matemático que relaciona o valor da variável com a
probabilidade de ocorrência daquele valor na população.
Exemplo 3.1
Os 125 diâmetro dos anéis de pistons (tabela 1.1) são uma amostra dos diâmetros que foi selecionada do
processo de produção. A população neste exemplo é o conjunto de todos os anéis de pistons produzidos por
este processo.
Com o uso de métodos estatísticos poderemos analisar a amostra dos diâmetros e tirar conclusões sobre o
processo que produz esses anéis.
Os diâmetros dos anéis de pistons são chamados de variável aleatória, porque assume diferentes valores na
população de acordo com algum mecanismo aleatório.
A distribuição de probabilidade dos diâmetros dos anéis descreve a probabilidade de ocorrência de qualquer
valor do diâmetro na população.
Distribuição Discreta é quando a variável só pode assumir certos valores, tais como os inteiros 0, 1,2,...
Exemplo 3.2
O número de pistons com diâmetro abaixo de determinado valor é uma variável discreta.
Já o diâmetro do piston é uma variável contínua, pois pode assumir qualquer valor num intervalo de números
reais.
Notação:
P(X=xi) = p(xi) significa a probabilidade da variável aleatória X assumir o valor xi.
A probabilidade é um valor entre 0 e 1.
No caso da distribuição de probabilidade, a soma das probabilidades sobre todos os valores possíveis da
variável aleatória é igual a 1.
Vamos estudar algumas distribuições discretas.
OBS:
Distribuição Hipergeométrica
Considere uma população finita composta de N itens. Algum número, digamos D (D≤N), destes itens pertence a
uma determinada classe de interesse. Uma amostra aleatória de n itens é retirada da população sem reposição e
o número de itens na amostra que se situa na classe de interesse, x, é observado.
Então x é uma variável aleatória hipergeométrica com distribuição de probabilidade como segue
, x=0,1,2,...,min(n,D)
A média e variância da distribuição são:
e
)
Exemplo 3.3
Um lote contém 100 itens, dos quais 5 não satisfazem os requisitos. Se 10 itens são selecionados aleatoriamente
sem reposição, então a distribuição de probabilidade do número de itens defeituosos, x, é:
A probabilidade de achar no máximo um item não-conforme é:
X=número de itens não conforme
No máximo um item não conforme: X≤1
Probabilidade:
P(X
= 0.9231433 = 0.923




Verifique que P(X>1) = 1-0.923 = 0.077, pois:
Esta probabilidade é a soma de p(2)+p(3)+p(4)+p(5)
A soma das probabilidades sobre todos os valores possíveis da variável aleatória é igual a 1
Os valores possíveis desta variável são 0,1,2,3,4,5
Logo p(0)+p(1)+ p(2)+p(3)+p(4)+p(5)=1
Note que dependendo da probabilidade a ser calculada temos mais de uma maneira de obtê-la. Veja:
A probabilidade de achar no mínimo três itens não conforme é:
X=número de itens não conforme
No mínimo três itens não conformes: X≥3
Probabilidade:
P(X
= 0.006637913 = 0.007
Ou ainda
1 – [0.923+
] = 1-[0.923 + 0.070] = 0.007
Atenção: antes de realizar os cálculos verifique a melhor maneira de obter o resultado. Lembre-se sempre que: A
soma das probabilidades sobre todos os valores possíveis da variável aleatória é igual a 1.
Distribuição Binomial
Considere um processo consistindo de uma sequencia de n provas independentes. Por provas independentes
queremos dizer que o resultado de cada prova não depende, de qualquer maneira, dos resultados das provas
anteriores. Quando o resultado de cada prova é ou “sucesso” ou “fracasso”, as provas são chamadas provas de
Bernoulli. Se a probabilidade de “sucesso” em qualquer prova, digamos p, é constante, então o número de
“sucessos” x em n provas de Bernoulli independentes tem distribuição binomial com parâmetros n e p como
segue:
, x=0,1,2,...,n
A média e variância da distribuição são:
e
Observe que na distribuição hipergeométrica a população é finita; já na distribuição binomial a população é
considerada infinitamente grande.
Exemplo 3.4
Um lote contém 1000 itens, dos quais 5 não satisfazem os requisitos. Se 10 itens são selecionados
aleatoriamente sem reposição, então a distribuição de probabilidade do número de itens defeituosos, x, é:
Hipergeométrica (população de 1000 itens):
Binomial (se pensarmos que 1000 itens é um número consideravelmente grande!), a verificação dos 10 itens é o
número de provas de Bernoulli e a probabilidade de encontrar “item não conforme” é 5/1000 = 0.005
A probabilidade de achar no máximo um item não-conforme é:
X=número de itens não conforme
No máximo um item não conforme: X≤1
Adotando a hipótese de população infinita, temos um modelo binomial
P(X
=
0.9511101 + 0.04779448= 0.9989046 = 0.999
Observe que tanto no modelo Binomial como no Hipergeométrico o objetivo é verificar número de itens não
conformes numa amostra. A diferença está na hipótese do tamanho da população. As probabilidades de ambos
os modelos se tornam muito próximas à medida que o tamanho da população tende a infinito.
Distribuição de Poisson
Muito usada no Controle de qualidade para modelar o número de defeitos por unidade de produto.
Qualquer fenômeno aleatório que ocorrem em base unitária (unidade de área, unidade de volume, unidade de
tempo, etc) é bem aproximado pela distribuição de Poisson.
A distribuição de Poisson é:
, x=0,1,...
A média e variância da distribuição são:
e
Exemplo 3.5
Suponha que estejamos interessados em modelar o número de circuitos defeituosos por semicondutor. Sabe-se
que em média cada semicondutor apresenta 4 circuitos defeituosos. Adotando um modelo de Poisson, temos
λ=4 com
A probabilidade de um semicondutor escolhido aleatoriamente conter no máximo dois circuitos defeituosos é:
No máximo dois circuitos defeituosos:
=
= 0.2381033 = 0.238
Exercícios:
3.1 Uma montagem mecatrônica é submetida a um teste final. Suponha que os defeitos ocorram aleatoriamente
nessas montagens de acordo com uma distribuição de Poisson com parâmetro λ = 0.02
a) Qual a probabilidade de uma montagem apresentar exatamente um defeito?
b) Qual a probabilidade de uma montagem apresentar um ou mais defeitos?
c)Suponha que você melhore o processo de modo que a taxa de ocorrência de defeitos seja reduzida pela
metade, λ = 0.01. Qual o efeito desta medida sobre a probabilidade de uma montagem apresentar pelo menos
um defeito?
Respostas: a) 0.01960397(p(1)) b) 0.01980133 (1-p(0))
metade)
c) 0.009950166 (a probabilidade fica reduzida pela
3.2 Um processo de produção opera a uma taxa de 2% de peças produzidas não conformes. A cada hora uma
amostra de 50 unidades do produto é retirada, e o número de não conforme é contado. Se uma ou mais
unidades fora das especificações são encontradas, o processo é interrompido e o técnico de controle de
qualidade tem que encontrar a causa para a produção de não conformes.
a) Estabeleça o modelo de probabilidade para o número de unidades não conforme.
b) Avalie a probabilidade do técnico de controle de qualidade ter que interromper o processo devido à produção
de não conformes.
c) Avalie o número médio de interrupções para encontrar a causa da produção de não conformes num período
de 10h de produção ininterruptas.
Respostas: a)Modelo binomial com n=50 e p=0.02 b)
c)10*0.6358 ; ou seja a cada 10 h em torno de 6 interrupções.
0.6358
3.3 Em um departamento de inspeção de recebimento, lotes de eixo de bomba são recebidos periodicamente.
Os lotes contêm 100 unidades, e o seguinte plano de amostragem de aceitação é usado: Seleciona-se uma
amostra de 10 unidades sem reposição. O lote é aceito se a amostra tiver, no máximo, um defeituoso. Suponha
que cada lote contenha 5 defeituosos.
a) Estabeleça o modelo de probabilidade para o número de defeituosos na amostra.
b) Avalie a probabilidade de a amostra conter todos os itens defeituosos do lote.
c) Avalie a probabilidade de o lote ser aceito.
Respostas: a)Modelo Hipergeométrico com N=100 e n=10 e D=5 b)
0.9231
0.000003 c)
3.4 Considere que uma amostra de 100 unidades é retirada de um processo de produção a cada meia hora. A
fração de peças não conformes produzidas é de 0.03.
a) Estabeleça o modelo de probabilidade para o número de peças não conformes da amostra.
b) Expresse a probabilidade de mais de três peças serem não conformes
c) Expresse a probabilidade de no máximo três peças serem não conformes
d) Expresse a probabilidade de menos de três peças serem não conformes
e) Expresse a probabilidade de pelo menos três peças serem não conformes
f) Obtenha os valores das probabilidades dos itens de b a e.
Respostas: a)Modelo Binomial com n=100 e p=0.03 b)
0.3527508; 0.6472492; 0.4197751; 0.5802249
. c)
d)
3.5 Considere um processo de Poisson com taxa de falha de 2/h. Expresse e avalie:
a) A probabilidade de mais de duas falhas no processo
b)A probabilidade de no máximo duas falhas no processo
c) A probabilidade de menos de duas falhas no processo
d) A probabilidade de pelo menos duas falhas no processo
e)
f)
Respostas: a)
=0.3233236 b)
=0.6766764 c)
=0.4060058 d)
3.6 Para uma distribuição de Poisson com parâmetro λ=4, identifique qual das alternativas representa
a.
b.
c.
d.
Resposta: c
3.7 Para uma distribuição de Poisson com parâmetro λ=4, identifique qual das alternativas representa
a.
b.
c.
d.
Resposta: d
3.8 Para uma distribuição de Poisson com parâmetro λ=4, identifique qual das alternativas representa
a.
b.
c.
d.
Resposta: a
3.9 Para uma distribuição de Poisson com parâmetro λ=4, identifique qual das alternativas representa
a.
b.
c.
d.
Resposta: c
3.10 Se
0.110674, avalie
Resposta: 0.889326
.
0.5939942
Distribuições Contínuas:Distribuição Normal, Exponencial e Weibull
Distribuição Normal
Quando a variável sendo medida é expressa em uma escala contínua, sua distribuição de probabilidade é
chamada distribuição contínua.
Exemplo 4.1
Suponha que X seja uma variável aleatória representando o conteúdo real em kg de um pacote de café de 1kg.
Assume-se que a distribuição de X seja
Essa é uma distribuição contínua uma vez que o domínio de x é o intervalo [0.8; 1.1].
É chamada de distribuição uniforme e seu gráfico é representado por uma reta paralela ao eixo x:
A probabilidade para variáveis contínuas assumirem valores num intervalo corresponde à área sobre a curva da
função f(x) que é obtida pelo cálculo da integral definida no intervalo de valores que se deseja.
Exemplo 4.2
Considerando a variável do exemplo 4.1, a probabilidade de um pacote de café conter menos de 1 kg é:
=
Interpretação:
Assim, um processo de enchimento de pacotes de café com a distribuição de probabilidade descrita acima
produzirá em torno de 67% dos pacotes com peso menor ou igual a 1kg.
Neste capítulo veremos as seguintes distribuições contínuas: Normal, Exponencial e Weibull
Distribuição Normal
A média e variância da distribuição são:
A notação usada para indicar que uma variável aleatória tem essa distribuição é:
O gráfico desta distribuição é simétrico em forma de sino com eixo de simetria em x=μ.
Gráfico4.1 Distribuição normal
A probabilidade acumulada num ponto a qualquer é:
Para a distribuição normal não há uma forma analítica de se obter esta integral, assim utilizamos uma tabela
(veja tabela da distribuição normal acumulada) para obter as probabilidades desta distribuição.
Para utilizar a tabela é necessária fazer uma mudança de variável:
Exemplo 4.3
Considere X a força de tensão do papel usada na confecção de sacos para supermercados. Sabe-se que
Um comprador dos sacos exige que eles tenham pelo menos 35 lb/in2.
A probabilidade de que um saco confeccionado com este papel atenda tal especificação é:
Para obter
fazemos a mudança de variável:
Assim,
Graficamente isso representa a área hachurada:
0.2
0.0
0.1
f(x)
0.3
0.4
P(Z>-2.5) - Z~N(mi=0, sigma=1)
-4
-2
0
2
4
x
Gráfico 4.2: Área correspondente à probabilidade P(Z>-2.5)
O valor da probabilidade é obtido consultando a tabela. Entretanto a tabela fornece valores de probabilidade
acumulada, muitas vezes precisamos observar a simetria da curva para obtermos o valor adequado na tabela.
Assim, observe sob a ótica da simetria que a área correspondente a Z>-2.5 é a mesma de Z<2.5.
0.2
0.0
0.1
f(x)
0.3
0.4
P(Z<2.5) - Z~N(mi=0, sigma=1)
-4
-2
0
2
4
x
Gráfico 4.3: Área correspondente à probabilidade P(Z<2.5)
Logo, P(Z>-2.5) = P(Z<2.5) que é uma probabilidade acumulada no ponto 2.5. Consultando este valor (2.50) na
tabela, obtemos:
Logo, P(X>35) = 0.993790 ou 99,38%
Exemplo 4.4
O diâmetro de uma haste de metal usada em uma unidade de disco é normalmente distribuída com média
0.2508 in e desvio padrão 0.0005 in. As especificações sobre a haste foram estabelecidas como
. Deseja-se saber qual a fração das hastes produzidas que satisfazem as especificações.
X = diâmetro da haste
Probabilidade a ser calculada:
Padronizando os valores:
e
Assim,
que corresponde a probabilidade acumulada em 1.4
menos a probabilidade acumulada em -4.60
Graficamente:
0.2
0.0
0.1
f(x)
0.3
0.4
P(-4.6<Z<1.4) - Z~N(mi=0, sigma=1)
-6
-4
-2
0
2
4
6
x
Gráfico 4.4: Probabilidade entre dois valores
Consultamos a tabela para os valores 1.4 e 4.6 (opa, temos um problema de sinal!)
Para 1.4 obtemos 0.919243 e para 4.6 obtemos ...não tem na tabela, pegue o último valor que é 0.999998.
Agora resolvemos a questão do sinal.
Queremos a P(Z<-4.6) e na tabela obtivemos P(Z<4.6). Por simetria sabemos que P(Z>4.6) = P(Z<-4.6). Além disso
temos que a área total é igual a 1. Logo P(Z<-4.6) = 1 – P(Z<4.6) = 1 – 0.999998 = 0.000002
Logo
Interpretação:
Podemos esperar que o aproveitamento do processo seja de aproximadamente 91.92%; isto é, cerca de 91.92%
das hastes são produzidas de acordo com as especificações.
Se a média do processo fosse modificada de 0.2508 para 0.2500, qual seria o percentual de aproveitamento do
processo?
Refaça os cálculos anteriores modificando μ para 0.2500.
Se você entendeu tudo até agora, deverá obter
.
Assim, com a modificação no processo, o aproveitamento aumentaria para aproximadamente 99.73%.
Exemplo 4.5
Algumas vezes, em vez de calcular a probabilidade associada a um determinado valor, é necessário fazer o
oposto – achar um valor particular de uma variável aleatória que resulta em uma dada probabilidade.
Suponha que
. Queremos achar o valor de a, tal que P(X>a) = 0.05.
De modo equivalente, podemos reescrever
Agora, devemos procurar no interior da tabela o valor 0.95 (que corresponde a uma probabilidade acumulada;
observe sempre este fato, por isso reescrevemos a informação inicial!)
No interior da tabela encontramos 0.950529 que corresponde ao valor de z = 1,65 (1,60 +0.05)
Também, encontramos 0.949497 que corresponde ao valor de z = 1,64.
Como 0.95 fica entre estes dois valores, o valor de z procurado fica entre 1.64 e 1.65; nesta situação podemos
assumir que o valor procurado é o ponto médio entre estes dois: 1.645 (faça assim sempre que encontrar
situação semelhante!)
O valor de a fica assim determinado:
ou seja
Exemplo 4.6:
Certo tipo de lâmpada tem um resultado que é normalmente distribuído com média de 26900 lux e desvio
padrão de 807 lux. Qual deve ser o limite inferior de especificação deste tipo de lâmpada para que não mais que
2.5% das produzidas fiquem abaixo deste limite?
O que se deseja é determinar a, o limite inferior, tal que
ou de modo equivalente
.
Consultando o valor 0.975 na tabela, obtemos:
z=1.96 (1.90+0.06). Entretanto, devemos lembrar que o valor de a deve ser inferior ao valor da média 26900,
logo o valor de z deve ser o simétrico de 1.96, ou seja, -1.96. Ao consultar a tabela em situações semelhantes,
tenha sempre em mente se o valor que se deseja está acima ou abaixo da média, pois isso interfere no sinal de z
devido à simetria da curva. Se tiver dúvida faça um esboço gráfico, marcando a área sob a curva:
Gráfico 4.5: Ilustração dado a área determinar o valor de z
O valor de a fica assim determinado:
ou seja
Portanto o limite inferior de especificação deve ser 25318.28 lux
Exercícios Distribuição Normal:
Treinando o uso da Tabela: obtenha as probabilidades que se pede:
1)
2)
3)
4)
5)
6)
7)
8)
9)
10) Obtenha a tal que
sendo
11) A vida de determinado tipo de bateria de cela seca é distribuída normalmente com média de 600 dias e
desvio padrão de 60 dias. Que fração dessas baterias espera-se que sobreviva acima de 680 dias?
12) A dureza de Rockwell de uma liga particular é distribuída normalmente com média de 70 e desvio padrão de
4. Se o intervalo aceitável para a dureza fosse (70 – c, 70 + c), para que valor de c teríamos 95% de todos os
espécimes com dureza aceitável?
13) Um processo de fabricação de certo produto precisa de ajustes sempre que o pH do produto final ficar acima
de 7.20 ou abaixo de 6.80. O pH da amostra é distribuído normalmente com média μ e desvio padrão 0.10.
Qual a probabilidade de ajuste do processo quando a média do processo está muito ácido, ou seja, com
μ=6.75?
Respostas:
1) 0.977250
2) 0.995339
3) 1-0.977250
4) 1-0.995339
5) 1-0.977250
6) 1-0.996319
7) 0.978822-(1-0.922196) = 0.901018
8) 0.922196-(1-0.579260) = 0.501456
9) Equivale a
= 0.598706 - (1-0.598706)= 0.197412
10) Z=-0.845 (atenção ao sinal, a deve ser inferior à média!). Logo a=2.324.
11) P(X>680) = P(Z>1.33) = 1 – 0.908241 = 0.091759
12) P(70-c<X<70+c) = 0.95 equivale a P(-c/4<Z<c/4)=0.95. Equivale ainda a P(X<70-c)=0.025. Este problema foi
resolvido no exemplo 4.6. Assim c/4 = 1.96; logo c=7.84
13) P(6.8<X<7.2) = P(0.5<Z<4.5) = 0.999997 – (0.691462) = 0.308535
Distribuição Exponencial e Weibull
A distribuição exponencial é definida por
é uma constante.
A média e a variância desta distribuição são:
Veja o gráfico desta distribuição:
Gráfico 4.6: Distribuição Exponencial com média 1/λ
A distribuição exponencial é amplamente utilizada na área de engenharia de confiabilidade como modelo do
tempo de falha de um componente ou sistema. Em tais aplicações o parâmetro λ é denominado taxa de falha do
sistema e a média da distribuição 1/ λ é chamada tempo médio de falha.
Exemplo 4.7: Suponha que um componente eletrônico em um sistema de radar de aeronave tenha vida útil
descrita por uma distribuição exponencial com taxa de falha de 10-4/h, isto é, λ = 10-4. O tempo médio de falha
para este componente é 1/ λ = 104 = 10.000h.
A probabilidade de o componente falhar antes do seu tempo esperado de vida é:
Este resultado vale independente do valor de .
Note que a distribuição acumulada no ponto a para esta distribuição é:
Exemplo 4.8 Suponha que um processo de fabricação de certo componente apresente distribuição exponencial
para o tempo de falha, com taxa de falha de λ = 200-1 falhas por hora. Logo a vida média é de 200 horas. Por
causa de uma clausula de garantia, o fabricante deve pagar uma multa de k dólares se um componente durar
menos do que 400 horas. Qual a probabilidade do fabricante pagar a multa sobre um componente qualquer
produzido?
Deseja-se obter
0.864665
A distribuição de Weibull é definida por
é o parâmetro de escala e
A média desta distribuição é:
é o parâmetro de forma.
é chamada de função Gama. Se n é um inteiro positivo então:
Veja o gráfico da distribuição de Weibull:
Gráfico 4.7: Distribuição de Weibull, variando o parâmetro de forma.
A distribuição de Weibull se reduz à exponencial quando β=1. Trata-se de um distribuição bastante flexível, pois
pode assumir diversas formas com valores apropriados dos seus parâmetros.
A distribuição acumulada da Weibull é:
Exemplo 4.9 O tempo de falha de uma submontagem eletrônica usada em uma estação de trabalho RISK é
satisfatoriamente modelado por uma distribuição de Weibull com β=0.5 e θ = 1000. Obtenha o tempo médio de
falha de uma submontagem.
O tempo médio de falha é dado por
Qual a probabilidade da submontagem sobreviver mais de 4000h
Espera-se que 13,53% das submontagens falharão após 4000 h de funcionamento.
Exercícios Distribuição Exponencial e Weibull:
1- Sabe-se que o tempo de falha de certo transistor tem distribuição de Weibull com parâmetros β=1/3 e θ =
400. Ache a fração de transistor que sobrevive a 600 horas de uso.
2- Sabe-se que o tempo de falha de certo transistor tem distribuição de Weibull com parâmetros β=1/3 e θ =
400. Qual o tempo médio de falha do transistor.
3- Sabe-se que o tempo de falha de um pequeno sistema de computador tem distribuição de Weibull com
parâmetros β=1/4 e θ = 200. Que fração dessas unidades de sistema sobreviverá a 1000 horas de uso.
4- Sabe-se que o tempo de falha de um pequeno sistema de computador tem distribuição de Weibull com
parâmetros β=1/4 e θ = 200. Qual o tempo médio de falha de uma unidade do sistema.
5- Um fabricante de um monitor de televisão comercial garante o tubo de imagem por um ano (8760 h). Os
monitores são usados em terminais de aeroportos para tabelas de voos, e estão ligados continuamente. A
vida média dos tubos é de 20.000 h e o tempo de falha segue uma distribuição exponencial. Que proporção
de tubos durará menos do que a garantia de 8760 h?
6- Estima-se que o tempo de falha de um tubo de televisão seja distribuído exponencialmente, com uma média
de três anos. Uma companhia oferece seguro para esses tubos no primeiro ano de uso. Qual a porcentagem
de apólices que terão que pagar?
Repostas:
1- P(X>600) =
0.3183
23- P(X>1000) =
=0.2242
45- P(X<8760) =
6- P(X<1) =
0.3547
0.2835
Após estes exercícios você deverá realizar o teste 3.
Download