Variáveis Aleatórias e Modelos Probabilísticoss

Propaganda
Variáveis Aleatórias
Definição:
Uma variável aleatória v.a. é uma função que associa elementos do
espaço amostral a valores numéricos, ou seja, X :  → I , em que I  R.
Esquematicamente:
As variáveis aleatórias são classificadas em dois tipos:
VA discreta: é aquela para a qual o conjunto I é um conjunto finito ou
infinito enumerável
Exs.: I = {1, 2, 3, 4, 5, 6}, I = N = {0, 1, 2, 3, 4,.......∞}, etc.
VA contínua: é aquela para a qual o conjunto I é um conjunto infinito não
enumerável, ou seja, é uma v.a. que assume valores em intervalos de
números reais
Exs.: I = R = (−∞,∞), I = [0,1]  R , etc.
Notas: Para v.a.’s contínuas, a função que normalmente associa pontos
de  ao conjunto I  R, é a função identidade;
Para v.a.’s discretas, a função que normalmente associa pontos
de  ao conjunto I  R, é uma contagem ou soma.
Exemplo 1: Considere o nascimento de três bebês sendo o sexo da criança
observado, em que M = sexo masculino e F = sexo feminino. Desta forma,
para cada bebê teremos duas possibilidades, e, considerando os três
nascimentos, teremos um total de 23 = 8 combinações.
a) Quais são os resultados possíveis?
b) Como definir uma v.a. para esse caso?
c) Como associar probabilidade a essa v.a.?
a) Para os sexos dos três nascimentos teremos triplas do tipo (x, y, z)
em que x é o sexo do primeiro bebê, y do segundo e z do terceiro.
Portanto, o resultado (MMM) indica que os três nascimentos são do
sexo masculino.
O espcaço amostral para este caso será:
 =  MMM, MMF, MFM, FMM, MFF, FMF, FFM, FFF .
b) Temos pelo menos duas formas para definir uma variável aleatória
para esse caso:
(i) X1 = número de bebê do sexo feminino nos três nascimentos ou
(ii) X2 = número de bebê do sexo masculino nos três nascimentos.
Com X = número de bebê do sexo feminino nos três nascimentos
X(MMM) = 0
X(MMF) = X(MFM) = X(FMM) = 1
X(MFF) = X(FMF) = X(FFM) = 2
X(FFF) = 3
 Vamos simplificar a notação para os possíveis valores da v.a.:
X(MMM)
X=0
X(MMF) = X(MFM) = X(FMM)  X = 1
X(MFF) = X(FMF) = X(FFM)
X=2
X(FFF)
X=3
Assim pode-se escrever:
P(X = 3) = P(FFF) = 0,50,50,5 = 0.125
P(X = 2) = P(MFF  FMF  FFM) = 30.125 = 0,375
P(X = 1) = P(MMF  MFM  FMM) = 30.125 = 0,375
P(X = 0) = P(MMM) = 0,125
Normalmente representam-se os valores numa tabela com a
distribuição das probabilidades, chamada de função de probabilidade:
Tabela 1: Função de probabilidade da v.a. X = bebês do
sexo feminino nos três nascimentos.
Valores da v.a. X
Probabilidades
0
0,125
1
0,375
2
0,375
3
0,125
A função de probabilidade de uma v.a. discreta
Função de probabilidade de uma v.a. X, discreta, é uma função que
atribui probabilidade a cada de seus possíveis valores.
A função de distribuição de uma v.a. discreta
Função de distribuição ou função de distribuição acumulada de
uma v.a. X, discreta, é definida por
F ( x)   P( X  xi )   p( xi ) .
xi  x
xi  x
Notas:
i) F(x) é uma função do tipo “escada”, em que os pontos de
descontinuidade ocorrem em xi, i = 1, 2, . . .
ii) Dada a função de distribuição F(x), então,
p( xi )  F ( xi )  F ( xi 1) , i = 1, 2,...
Assim, a função que associa probabilidades aos possíveis valores de
uma v.a. discreta X, é chamada de função de probabilidade (fp) ou
função massa de probabilidade (fmp).
Seja X assumindo valores em { x1, x2 , x3 , }, então sua função de
probabilidade p(x) é definida por:
p( xi )  P[w   | X ( w)  xi ]  P( X  xi ) , i = 1, 2,...
Propriedades: a função de probabilidade p(x) satisfaz:
i) 0  p( xi )  1,  i  1, 2,;
ii)  p( xi )  1;
i
iii) p(x) é usualmente representada por:
p(x) = P(X = x),
x  Ix,
em que: Ix é o conjunto dos possíveis valores de X.
Tabela 2: No exemplo dos 3 nascimentos, temos Ix = { 0, 1, 2, 3 } e:
x
p(x)
 função que associa
probabilidades à v.a.
0
0,125
número de de bebês
1
0,375
do sexo feminino nos
2
0,375
três nascimentos.
3
0,125
Exemplo 2: Sabe-se que o percentual de pessoas com tipo sanguíneo O−
na população brasileira é de 9%. Considerando que chegam ao setor de
emergências de um hospital 10 pessoas necessitando de sangue, numa
determinada noite:
a) Defina uma variável aleatória para esse caso.
Qual é a probabilidade de que, dentre essas 10 pessoas:
b) exatamente um tenha sangue O− ?
c) pelo menos um tenha sangue O− ?
d) no máximo três tenham sangue O− ?
Escrevendo as probabilidades em termos da v.a.:
a) Seja a v.a. X = número de pessoas com tipo sanguíneo O− dentre as
n = 10 que chegaram à emergência.
Então, temos que I = { 0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 }, ou seja
p(x) = P(X = x), em que x  { 0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 }.
b) Probabilidade de que exatamente uma pessoa tenha sangue O− é:
p(1) = P(X = 1).
Se a proporção de pessoas com sangue O− é de 0,09, então, uma
pessoa tem probabilidades 0.09 de ter sangue O− e 0,91 de ter
qualquer outro tipo.
Sendo O− = sangue O negativo e n = outro tipo de sangue temos:
O−
n
n
n
n
n
n
n
n
n
O−/n
prob. 0,09 0,91 0,91 0,91 0,91 0,91 0,91 0,91 0,91 0,91
paciente 1
2
3
4
5
6
7
8
9
10
Assim, a probabilidade de que exatamente um paciente tenha sangue O−,
senda este o primeiro a é igual a: (0,09)(0,91)9
Como o paciente com sangue O− o primeiro ou o segundo ou o terceiro
. . . ou o décimo, então temos dez vezes essa probabilidade, i.e.:
10 
P(X = 1) = 10(0,09)(0,91)9 =   (0,09)1(0,91)9 = 0,3851,
1
c) Se tivermos pelo menos um dos pacientes com sangue O−, então
pode ser um paciente ou dois ou três . . . ou os dez.
Portanto, a probabilidade de que pelo menos um paciente tenha
sangue O− é dada por:
10
P(X  1) =  P( X  x)
x 1
= P(X = 1) + P(X = 2) + ...+ P(X = 10).
Mas, utilizando o evento complementar, podemos escrever essa
probabilidade como sendo um menos a probabilidade de que todos os
pacientes tenham outro tipo sanguíneo, ou seja:
P(X  1) = 1 – P(X = 0)
= 1 – (0,09)10 = 0,6106
d) A probabilidade de que, no máximo três pessoas tenham sangue O−
é escrita como:
P(X  3) = P(X = 0) + P(X = 1) + P(X = 2) + P(X = 3).
Em que:
10 
P(X = 0) =   (0,09)0 (0,91)10 = (0,91)10 = 0,3894
0
10 
P(X = 1) =   (0,09)1 (0,91)9 = 0,3851
1
10 
P(X = 2) =   (0,09)2 (0,91)8 = 0,1714
2
10 
P(X = 3) =   (0,09)3 (0,91)7 = 0,0452
3
Logo, P(X  3) = 0,9911.
Exemplo: O Tabagismo é um hábito que preocupa muito os profissionais
da área da saúde devido ao enorme número de doenças que pode
provocar. Dados de relatórios produzidos no mundo inteiro apontam que
os Russos estão entre os que mais fumam, com 36% de adultos fumantres
na população. No Japão esse percentual é de 25% enquanto que na
Alemanha, 20% de adultos são fumantes. A Verônica, por meio da
internet, contactou uma pessoa de cada um desses países e prente
hospedá-los em sua casa durante as Olimpíadas de 2016. Ela não fuma e
está preocupada, pois não deseja que sua casa fique com aquele “cheiro”
de cigarro e também acha “chato” questionar os três, pois já se
comprometeu com eles.
a) Considerando o hábito de fumar dos convidados da Verônica (um
Russo, um Japonês e um Alemão), quais são os resultados possíveis?
b) Como definir uma v.a. para esse caso?
c) Como associar probabilidade a essa v.a.?
Sejam os eventos: A = o alemão fuma;
J = o Japonês fuma e
R = o Russo fuma.
a) Espaço Amostral
 =  AJR, AcJR, AJcR, AJRc, AcJcR, AcJRc, AJcRc, AcJcRc 
b) Duas possibilidades para definir a variável aleatória:
(i) X1 = número de fumantes dentre os três viajantes ou
(ii) X2 = número de não fumantes dentre os três viajantes.
Vamos considerar X = número de fumantes dentre os tês viajantes
X(AJR) = 3
X(AcJR) = X(AJcR) = X(AJRc) = 2
X(AcJcR) = X(AcJRc) = X(AJcRc) = 1
X(AcJcRc) = 0
 Simplificando a notação para os possíveis valores da v.a., temos:
X(AJR)
X=3
X(AcJR) = X(AJcR) = X(AJRc)
X=2
X(AcJcR) = X(AcJRc) = X(AJcRc)  X = 1
X(AcJcRc)
X=0
Assim pode-se escrever:
P(X = 3) = P(AJR) = 0,360,250,20 = 0,018
P(X = 2) = P(AcJR  AJcR  AJRc) = 0,158
P(X = 1) = P(AcJcR  AcJRc  AJcRc) = 0,440
P(X = 0) = P(AcJcRc) = 0,384
Normalmente representam-se os valores numa tabela com a
distribuição das probabilidades, chamada de função de probabilidade:
Tabela: Função de probabilidade da v.a.
X = fumantes dentre os 3 viajantes.
Valores da v.a. X
Probabilidades
0
0,384
1
0,440
2
0,158
3
0,018
Modelos discretos de probabilidade
A) O modelo de Bernoulli:
O modelo de Bernoulli está associado à ensaios ou eventos
aleatórios, realizados de maneira independente, com somente dois
resultados possíveis:
 sim/não;
 ocorre/não ocorre;
 0 ou 1.
Nos ensaios deste tipo estamos interessados na ocorrência de
apenas um dos resultados ao qual chamaremos de sucesso sendo que, a
não ocorrência do evento de interesse vamos chamar de fracasso.
As probabilidades de ocorrência de sucesso e fracasso, são,
respectivamente
p = P(sucesso) e (1 – p) = P(fracasso) ,
0 ≤ p ≤ 1.
Devido à propriedade de independência, a probabilidade de sucesso
p permanece constante para todos os ensaios.
Ensaios com tais características são denominados ensaios de
Bernoulli.
Portanto, ensaios de Bernoulli são ensaios ensaios aleatórios
independentes com somente dois resultados possíveis, denotados por
sucesso e fracasso, cujas probabilidades permanecem constantes em
todas as suas realizações.
No Exemplo 2, ocorre sucesso quando o paciente que chega na
emergência tem sangue O− e fracasso quando o paciente tem um dos
outros tipos sanguíneos.
Para a construção do modelo de Bernoulli temos que a v.a. de
Bernoulli definida como uma variável que assume os valores 1, para
sucesso e 0, para fracasso, com probabilidades p e (1 − p),
respectivamente.
Seja X uma v.a. de Bernoulli, então, sua função de probabilidade
(fp) é definida por:
p ( x)  P( X  x)
1  p , se x  0;
p( x)  
se x  1.
 p,
Uma forma alternativa (e mais elegante) de apresentar a função de
probabilidade de Bernoulli é dada por:
P( X  x)  p x (1  p)1 x , x  0, 1.
A função de distribuição, ou função distribuição acumulada
(fda), por sua vez, é definida por:
F ( x)  P( X  x)
se x  0.
 0,

F ( x)  1  p , se 0  x  1;
 1,
se x  1.

Notação:
X  Bernoulli( p ).
Obs: p é parâmetro da distribuição de Bernoulli.
B) O modelo binomial
Considere, agora, a repetição de n ensaios cujos resultados podem
ser expressos como: sim/não; ocorre/não ocorre; 0 ou 1, tal que a
probabilidade de sucesso não se altera de um ensaio para outro, ou seja,
os ensaios são independentes.
Seja a v.a. X que conta o número de sucessos nos n ensaios
independentes, conforme descrito acima, então, X tem distribuição
binomial com parâmetros n e p, em que p = P(sucesso) e a sua
função de probabilidade é dada por:
n
P(X = x) =   px (1 – p)n – x,
 x
x = 0, 1, 2, ..., n.
O modelo binomial é caracterizado pela realização de n ensaios com
somente dois resultados possíveis (sucesso e fracasso), nos quais a
probabilidade de sucesso p é constante (ensaios de Bernoulli).
A v.a. binomial é, então, definida como sendo ”uma v.a. que conta
o número de sucessos num número fixo n de ensaios de Bernoulli”.
Notação:
X  binomial(n; p).
No exemplo dos pacientes com sangue O−, n = 10 e p = 0,09,
portanto, temos que:
X  binomial(10; 0,09)
x = 0, 1, 2, ..., 10,
e, sua f.p. é dada por:
10 
P(X = x) =   (0,09)x (0,91)10 – x,
x
x = 0, 1, 2, ..., 10.
A v.a. binomial como soma de Bernoulli’s
Considere, agora, uma sequência de n v.a. de Bernoulli indicando,
cada uma, o resultado de um ensaio. Desta forma, teremos uma
sequência de zeros e uns de tamanho n.
Sejam X1, X2, X3, . . . , Xn uma sequência de v.a.’s de Bernoulli.
Como já vimos, a v.a. binomial conta o número de sucessos nos n
ensaios, ou seja, conta o número de valores “1” na sequência de tamanho
n.
Uma forma prática de se contar o número de sucessos nos n ensaios
de Bernoulli é através da soma de X1, X2, X3, . . . , Xn, ou seja, definindo a
v.a. S como
n
S   Xi .
i 1
Então, S conta o número de sucessos nos n ensaios, tendo, assim,
uma distribuição binomial com parâmetros n e p, isto é,
S  binomial(n, p).
Exemplo 3: Considere a fabricação de pinos metálicos para montagens de
motores em que o índice de produtos com defeito é de 2,5%. Se um
inspetor seleciona um lote com 80 pinos para inspeção, qual a
probabilidade de que:
a) apenas um seja defeituoso?
b) nenhum seja defeituoso?
c) no máximo dois sejam defeituosos?
d) Qual é o número esperado de pinos defeituosos no lote?
Vamos definir a v.a. X = número de pinos defeituosos dentre os 80.
Como estamos interessados nos defeitos (sucesso  defeito), então:
p = P(defeito) = 0,025 e X  binomial(80; 0,025)
 80 
a) P(X = 1) =   (0,025)1(0,975)79 = 0,2706
1
 80 
b) P(X = 0) =   (0,025)0(0,975)80 = 0,1319
0
c) P(X  2) = P(X = 0) + P(X = 1) + P(X = 2) = 0,6767.
d) Espera-se: 800,025 = 2 peças defeituosas no lote, ou seja,
espera-se np peças com defeito.
Resultado: O número esperado de sucessos em n ensaios de Bernoulli,
tal que, P(sucesso) = p é dado por np.
Exemplo 4: Segundo pesquisa Lance!/IBOPE (ago/2010) 9,2% dos
Paulistas são torcedores do Santos. Se 21 pessoas do estado de São Paulo
são escolhidas ao acaso,
a) qual é a probabilidade de que pelo menos uma seja Santista?
b) qual é a probabilidade de que no máximo duas sejam Santistas?
c) qual o número esperado de Santistas entre as 21 pessoas?
Seja a v.a. X = número de torcedores do Santos na amostra.
X  binomial(21; 0,092)
a) P(X  1) = 1 – P(X = 0) = 1 – (0,908)21 = 0,8682
b) P(X  2) = P(X = 0) + P(X = 1) + P(X = 2) = 0,6962
c) Espera-se: 210,092 = 1,932  2 torcedores do Santos na amostra
C) O modelo geométrico
Considere, agora, uma sequência ilimitada de ensaios de Bernoulli e
seja a v.a. X que conta o número de ensaios realizados até a ocorrência
do primeiro sucesso.
Então X tem distribuição geométrica com parâmetro p e sua função
de probabilidade é dada por:
p(x) = p (1 – p) x − 1,
Notação:
x = 1, 2, 3, ...
(3)
X  geométrica(p).
A função de distribuição, ou função distribuição acumulada
(fda), do modelo geométrico é dado por:
F ( x)  P( X  x) 
 P( X  xi )
xi  x

x
 p(1  p) k 1
k 1
 p(1  p)0  p(1  p)1  p(1  p) 2    p(1  p) x1
Da soma dos infinitos termos da série geométrica, vamos escrever a
probabilidade acima como:
F ( x)  P( X  x)  1  P( X  x  1)
 1 


p(1  p) k 1
k  x 1
p(1  p) x 11
1 
1  (1  p)
p(1  p) x
1 
 1  (1  p) x
p
Logo, a f.d.a. para o modelo definido em (3) é dada por:
F ( x)  1  (1  p) x ,
x = 1, 2, 3, ...
Exemplo 5: Num processo de produção de placas eletrônicas, o índice de
defeitos é de 1%. Sabendo que as peças são produzidas
independentemente umas das outras, determine:
a) A probabilidade de que a primeira placa com defeito seja exatamente
a quinta a ser produzida?
b) Existe uma norma na empresa que diz que “se a primeira placa
defeituosa for produzida antes e que a 11ª placa tenha sido produzida,
então o processo deve ser ajustado”. Qual a probabilidade de que o
processo precise ser ajustado?
Neste Exemplo 5 temos que ocorre sucesso se um defeito é
observado, logo, o evento a quinta placa produzida é a primeira com
defeito pode ser representado pela sequencia FFFFS, em que S = sucesso
e F = fracasso.
Como as placas são produzidas de maneira independentes, e, como
P( S )  0,01 e P( F )  0,99 , temos a probabilidade:
P(FFFFS) = 0,990,990,990,990,01
P(FFFFS) = (0,99)40,01 = 0,00961
Definindo a v.a. X = número de placas produzidas até a ocorrência da
primeira com defeito, então X tem distribuição geométrica com
parâmetro p = 0,01, logo, sua f.p. é dada por:
p(x) = 0,01(0,99) x − 1,
x = 1, 2, 3, ...
Portanto, p(5) =P(X = 5) = 0,01(0,99) 5 − 1 = 0,00961
Para o item (b) temos que calcular:
P[ (1º. defeito é a 1ª. placa produzida) ou (1º. defeito é a 2ª. placa
produzida) ou . . . (1º. defeito é a 10ª. placa produzida) ] =
= P[ S  FS  FFS  FFFS  . . .  FFFFFFFFFS ]
= P[ S ] + P[ FS ] + P[ FFS ] + . . . + P[ FFFFFFFFFS ] = 0,0956179
Sequência
S
FS
FFS
FFFS
FFFFS
FFFFFS
FFFFFFS
FFFFFFFS
FFFFFFFFS
FFFFFFFFFS
v.a.
X=1
X=2
X=3
X=4
X=5
X=6
X=7
X=8
X=8
X = 10
probabilidade
0,01
0,010,99
0,01(0,99)2
0,01(0,99)3
0,01(0,99)4
0,01(0,99)5
0,01(0,99)6
0,01(0,99)7
0,01(0,99)8
0,01(0,99)9
valor
0,01
0,0099
0,009801
0,009703
0,009606
0,0095099
0,0094148
0,0093207
0,0092274
0,0091352
0,0956179
Utilizando a f.d.a.:
P( X  10)  F (10)  1  (0.99)10  0,0956179
O modelo geométrico pode, ainda, ser caracterizado pela v.a. Y que
conta o número de fracassos que precede o 1º. sucesso.
Neste caso temos a função de probabilidade dada por:
p(y) = p (1 – p) y,
y = 0, 1, 2, ...
Obs: a relação entre a v.a. X , definida anteriormente, e a v.a. Y é,
portanto, X = Y + 1.
D) O modelo de Poisson
Seja uma a v.a. X que conta o número de ocorrências de um evento
por unidade de tempo, sendo  a taxa de ocorrências, então, X tem
distribuição de Poisson com parâmetro  e sua função de probabilidade é
dada por:
x e 
p ( x) 
,
x!
Notação:
X  Poisson().
x = 0, 1, 2, ...
(4)
Exemplos:
 número de chamadas que chegam a uma central telefônica por
minuto;
 número de aviões que chegam para aterrissagem em um aeroporto,
por intervalos de meia hora;
 número de carros, por hora, que passam por uma cabine de pedágio;
 número de caixas de cerveja vendidas num bar, por semana; etc…
A distribuição de Poisson se aplica, ainda, a eventos que ocorrem por
unidades de medidas que não sejam o tempo, como por exemplo:
 na indústria calçadista controla-se a qualidade do couro que chega
para a produção pelo número de falhas por m2 e couro;
 no controle da qualidade da água é importante monitorar o número
de coliformes fecais por amostras de 100mL de água;
 na indústria tipográfica a qualidade na produção de livros é
quantificada pelo número de erros tipográficos, por páginas
publicadas;
 em estudos epidemiológicos espaciais registra-se a ocorrências de
casos de uma doença por unidade de área;
 no futebol, por exemplo, conta-se o número de gols por partida de
um campeonato;
 etc, etc, …
Exemplo 6: Um sistema que oferece um serviço via Web recebe acessos a
uma taxa de 1,4 por minuto. Determine a probabilidade de que o sistema:
a) receba 4 acessos num minuto?
b) receba no máximo 3 acessos num minuto?
c) receba pelo menos um acesso em 30 segundos?
d) receba 8 acessos em 5 minutos? (fazer em sala)
Seja a v.a. X = número de acessos/minuto no sistema.
X  Poisson(1,4)
(1,4) 4 e 1,4
0,9473

 0,0395
a) p(4)  P( X  4) 
4!
24
(1,4) x e 1,4
b) F (3)  P( X  3)  
x!
x 0
3
 e
1, 4
 1,4 e
1, 4
(1,4) 2 e 1,4
(1,4)3 e 1,4


2
6
 0,2466  0,3452  0,2417  0,1128  0,9463
c) Se o sistema recebe acessos a uma taxa de 1,4/min, então, em 30
segundos, a taxa será de 0,7 acessos.
Se Y = número de acessos em períodos de 30 segundos, então,
Y  Poisson(0,7)
Logo, devemos calcular:
P(Y  1)  1  P(Y  0)
 1  e 0,7  0,5034
Uma forma de apresentar a distribuição de Poisson é através da
função de probabilidade:
(t ) x e t
p( x) 
,
x!
x = 0, 1, 2, ...,
(4)
em que t é o intervalo de tempo para o cálculo da probabilidade.
Notação:
X  Poisson(t).
Desta forma, no item (c) do exemplo 6, como 30s = 0.5min, podemos
considerar a taxa de ocorrência em função da unidade de tempo, ou seja,
X  Poisson(1,41 acessos/min), ou
X  Poisson(1,40,5 acessos/30s).
Assim, pode-se calcular a probabilidade em (c) fazendo t = 0,5:
P( X  1)  1  P( X  0)  1  e 1,40,5  0,5034
Exemplo 7: (fazer em sala) Um porto consegue atender a até 4 navios que
chegam para descarga de mercadorias em um dia. Caso cheguem mais do
que 4 navios num dia, o excesso deve ser enviado a um outro porto.
Se os navios chegam a este porto numa taxa de 2 navios/dia,
a) qual a probabilidade de que cheguem exatamente 3 navios num dia?
b) qual a probabilidade de seja necessário enviar navio(s) para descarga
em outro porto?
c) De quanto deve ser ampliado o porto para que sejam atendidos todos
os navios que cheguem para descarga em 99% dos dias?
Exemplo 8: Um produtor de leite tipo A afirma que seu produto é
distribuído aos consumidores com uma média de 0.1NMP/100ml
(Número Mais Provável) de coliformes totais.
Qual a probabilidade de que, numa amostra de 100ml seja
encontrado:
a) Contagem zero de coliforme totais?
b) Não mais do que 1NMP?
c) Exatamente 3NMP/litro?
Segundo Instrução Normativa no 51, de 18/09/2002, do Ministério da
Saúde, o número máximo de coliformes permitido no leite é de
0.3/100ml.
d) Assim sendo, qual a probabilidade de que um litro do produto,
comprado no supermercado esteja impróprio para consumo?
e) Qual o número esperado de coliformes totais num galão de leite?
(1gal  4.55 litros)
Exemplo 9: Uma central de telefônica recebe, em média, 4 chamadas a
cada minuto. Qual a probabilidade da central receber:
a) Mais do que 2 ligações num minuto?
b) Nenhuma ligação num período de 30 segundos?
c) 25 ligações em 5 minutos?
d) Sabe-se que o sistema não comporta mais do que 10 ligações
simultaneamente, qual a probabilidade de que uma ligação para esse
número de ocupado?
Aproximação da binomial pela Poisson: Seja X  binomial(n , p),
então, para n grande e p pequeno, tal que  = np é constante, a
distribuição binomial pode ser aproximada pela Poisson.
Prova: p( x) 
n!
p x (1  p) n  x
x!(n  x)!
Para  = np , temos p = /n e,
x
n(n  1)(n  1)  (n  x)!    
 
p ( x) 
  1  
x!(n  x)!
n 
 n  
n x
x
x n(n  1)(n  1)  (n  x  1) 
  
 

1

1





n  
n 

x! n x
n
 x
 
 n!
x
n
  n   n 1  n  2   n  x  1 





 
  n   n   n   n  1  n  1  n 

 x
 
 n!
x
n




1
2
x

1








 1   1   1 
 1   1  

n
n
n
n  
n 


 

 x
p( x)  
 n!
x
n
  x1 


k





   1   1   1  

n  
n  
n 
 k 1 
Aplicando o limite para n   em cada um dos fatores acima,
temos:
i)
 x1 
k 
lim   1    1
n    k 1 
n 
 

ii) lim 1 

n 
n 
x
1
n
 


iii) lim 1 
  e (limite fundamental)
n 
n 
Desta forma, p(x) pode ser aproximada por:
x e 
p ( x) 
.
x!
Exemplo: O tipo sanguíneo AB− é conhecido como sangue raro, pois
aparece em apenas 0.8% da população. Num grupo de 300 pessoas, qual é
a probabilidade de que:
a) 4 sejam AB−;
b) No máximo 2 sejam AB−.
Valor Esperado e Variância de uma v.a. discreta
A-) O valor esperado, esperança ou média de uma variável aleatória
discreta é definido por:
E ( X )   x p ( x)
x
Propriedades de Esperança:
a) Se k é uma constante, E (k )  k ;
b)
E g ( X )    g ( x ) p ( x ) ;
x
c)
E (aX  b)  aE ( X )  b .
B-) A variância de uma variável aleatória discreta é definida por:
Var ( X )  EX  E ( X )2 .
Mostra-se facilmente que a Var (X ) pode ser escrita como:
Var ( X )  E ( X 2 )  E ( X )2 ,
em que: E ( X 2 )   x 2 p( x) .
x
Propriedades de Variância:
a) Se k é uma constante, Var (k )  0 ;
b) Var (aX  b)  a 2Var ( X )
Exemplo 8: Considere o exemplo do sexo dos bebês em três nascimentos
em que a f.p. da v.a. é representada por
Tabela 1: Número de bebês do sexo feminino
nos três nascimentos.
x
p(x)
0
0,125
1
0,375
2
0,375
3
0,125
O valor esperado (ou média) de X é calculado por:
E( X ) 
3
 x p( x)
x 0
E ( X )  (0) 0,125  (1) 0,375  (2) 0,375  (3) 0,125
E ( X )  0,375  0,75  0.375  1,5 nascimentos
Para calcular a variância de X, primeiro calculamos E ( X 2 ) .
E( X 2 ) 
3
 x 2 p( x)  (0) 0,125  (1) 0,375  (4) 0,375  (9) 0,125
x 0
E ( X 2 )  3,0
logo, a variância de X é:
Var ( X )  E ( X 2 )  [ E ( X )]2
Var ( X )  3,0  (1,5) 2  0,75
Var ( X )  0,75
e o desvio padrão: DP ( X )  Var ( X )  0,75
DP ( X )  0,8660 nascimentos
Exemplo 9: Seja uma v.a. discreta X com f.p. dada por:
p( x) 
x 1
10
a)
b)
c)
d)
e)
k 2 3
,
k>0
x { –2, –1, 0, 2, 4 }.
e
Achar o valor de k para que p(x) seja uma função de probabilidade;
Calcular o valor esperado de X ;
Calcular a variância de X;
Encontre P(–1  X < 4 );
Quais os valores de a e b para os quais (aX + b) tenha média zero e
variância um?
a) Achar o valor de k:
 p ( x)  1

 2 1
10
x

k 2 3
10
10
k 2 3
k 2 4
1 1

10
k 2 3
1

10
k 2 4

0 1
10
k 2 3

2 1
10
k 2 3

4 1
10
k 2 3
1
1

10

k2  4  0

k 2
Desta forma: p( x)  0.1 x  1 e, sua f.p. é representada por
x
p(x)
–2
0.3
–1
0.2
0
0.1
2
0.1
4
0.3
1
b) Valor esperado de X:
E ( X )   x p( x)  (2) 0.3  (1) 0.2  (0) 0.1  (2) 0.1  (4) 0.3
x
E ( X )  0.6
c) Variância de X:
E ( X 2 )   x 2 p( x)  (2) 2 0.3  (1) 2 0.2  (0) 2 0.1  (2) 2 0.1  (4) 2 0.3
x
 1.2  0.2  0  0.4  3.2  6.6
Var ( X )  6.6  (0.6) 2  6.24
DP ( X )  6.24  2.4980
d) P(–1  X < 4 ) = 0.2 + 0.1 + 0.1 = 0.4
e) E (aX  b)  aE ( X )  b  0.6a  b  0
Var (aX  b)  a 2Var ( X )  6.24a 2  1
Assim, temos que: b  
0.6
 0.24
6.24

a
1
 0.40
6.24
Resultado: v.a. padronizada.
Seja uma v.a. Y  aX  b , tal que Y 
X  E( X )
, então Y é uma
DP ( X )
v.a. padronizada, tendo média 0 e variância 1.
Exemplo 8: Calcular E(X) e Var(X) para os modelos:
i) binomial(n, p);
ii) geométrica(p);
iii) Poisson() - fazer como exercício.
i)
X  binomial(n, p)
E( X ) 
E( X ) 
n
x   p x (1  p) n  x
x 0  x 
n

n
x
n!
p x (1  p) n x
x!(n  x)!
n
n(n  1)!
p x (1  p) n x
x( x  1)!(n  x)!
x 1
E( X ) 
x
x 1
(n  1)!
p p x1 (1  p) n x
x 1 ( x  1)!(n  x)!
n
E( X )  n 
note que (n  1)  ( x  1)  n  1  x  1  n  x , então, teremos
E ( X )  np
n
 n  1
  x  1 p x1 (1  p) n x
x 1 

Fazendo
y  ( x  1) e m  (n  1) , podemos reescrever a soma na
expressão acima por
 m
E ( X )  np    p y (1  p) m y
y 0  y 
m
=1
Observe que a soma resultante na E (X ) nada mais é do que a soma
das probabilidades de uma distribuição binomial(m; p), tendo como
resultado o valor 1.
Desta forma, E ( X )  np .
Portanto, se uma v.a. tem distribuição binomial(n; p), então, sua
média é E ( X )  np .
Para o cálculo da variância temos que encontrar E ( X 2 ) 1:
E( X ) 
2
n
x 2   p x (1  p) n x .
 x
x 0
n

Num procedimento semelhante ao anterior, obtém-se:
E ( X 2 )  n 2 p 2  np 2  np .
Logo, a variância de uma v.a. binomial(n; p) é dada por:
Var ( X )  E ( X 2 )  [ E ( X )]2
Var ( X )  n 2 p 2  np 2  np  (np) 2
1
Uma forma alternativa é calcular E[X(X−1)], e, a partir de E[X(X-1)] = E(X 2) − E(X), obter Var(X).
Var ( X )  np(1  p)
Portanto, se X é uma v.a. com distribuição binomial(n; p), então sua
média e variância são dadas por:
E ( X )  np
ii)
Var ( X )  np(1  p) .
X  geométrica(p)
E( X ) 


x p(1  p) x 1
x 1
Observe que o termo x (1  p) x 1 na soma é a derivada de  (1  p) x
em relação a p, logo, aplicando a regra da derivada de uma soma, temos
 d

E( X )   p 
(1  p) x 
 x 1 dp

d 

E ( X )   p   (1  p) x 
 dp x 1

Mas a soma em E (X ) é a soma de uma série geométrica, logo
 d  (1  p)
E ( X )   p  
 dp  1  (1  p)
 d  (1  p)
E ( X )   p  
p
 dp 
E( X ) 
1
p



  p  (1  p) 

   p 

p2



Calculando E ( X 2 ) para a distribuição geométrica, temos:
E( X 2 ) 
1  (1  p)
p
2
,
e, a variância da geométrica é dada por
Var ( X )  E ( X 2 )  [ E ( X )]2
Var ( X ) 
Var ( X ) 
1  (1  p)
p2
 1
  
 p
2
(1  p)
p2
Portanto, se X  geométrica(p), então, sua média e variância são
dadas por:
E( X ) 
1
p
Var ( X ) 
(1  p)
p2
iii) Poisson() - mostrar que E ( X )  Var ( X )   .
Função de probabilidade de uma v.a. contínua
Para modelarmos as probabilidades associadas a uma v.a. contínua,
temos de considerar que estas assumem valores em intervalos dos reias.
Desta forma, o conjunto de possíveis valores que uma v.a. contínua
X pode assumir é dado por I = { x  R | k1  x  k2 }, k1 < k2.
Como existem infinitos pontos no intervalo [k1, k2], não faz sentido
pensarmos na probabilidade de X assumir um valor x0  I, uma vez que
essa probabilidade será igual a zero.
Desta forma, para uma v.a. contínua,
P(X = x0) = 0.
No entanto, podemos determinar a probabilidade de X assumir um
valor entre dois pontos quaisquer pertencentes a I:
P(a  X  b) ; P(X  b); P(X  a); etc…
Definição 1: Seja um função f(x) não negativa tal que
a) f(x)  0,  x  I;
b)
 f ( x)dx  1;
I
c) lim f ( x)  lim f ( x)  0 ;
x
x
b
Então para a e b  , tais que a < b: P(a  X  b) =
 f ( x)dx
a
A função f(x) é chamada de função densidade de probabilidade (fdp)
da v.a. X, ou simplesmente função densidade de X e serve para descrever
a distribuição de probabilidade de uma v.a. contínua.
A função de probabilidade f(x) pode ser aproximada pelo
histograma da v.a. X., conforme podemos observar pela figura 2.
Definição 2: Seja um função F(x) tal que
x
F ( x)  P( X  x)   f (u )du .

a) 0 ≤ F(x) ≤ 1,  x  I;
b) F(x) é não decrescente: se x1  x2  F ( x1 )  F ( x2 ) ;
c) F(x) é contínua à direita, ou seja, lim F ( x)  F (a) ;
xa 
d)
lim F ( x)  0 e lim F ( x)  1;
x
x
F(x) é chamada função de distribuição acumulada (fda) da v.a. X, ou
simplesmente função de distribuição.
Nota: Da definição de fdp segue-se que:
P(a  X  b) =
b
 f ( x)dx = F(b) – F(a)
a
Exemplo 9: Seja uma v.a. X com fdp f(x) dada por
1
f ( x)  e k x ,
2
{x  R | x  0}.
a) Para que valor de k, f(x) define uma fdp?
De



0
 f ( x)dx  
1 k x
e dx  1,
2
fazendo w = kx, segue-se que dw = kdx.

Portanto,

0
1 k x
1   w dw 1
e dx   e

 ew
2
20
k 2k

de onde se obtém:



0


1
 e   e0  1,
2k
1
1
1  k  .
2k
2
b) Encontrar a fda

x
1
1
F ( x)   e u / 2 du   2 e u / 2
2
02

x
0
 1  e x / 2 .
Portanto, F ( x)  P( X  x)  1  e  x / 2 .
Desta forma, podemos encontrar P(1  X  2) = F(2) – F(1), ou seja

 

P(1  X  2) = 1  e 2 / 2  1  e 1 / 2  e 1 / 2  e 1 = 0.2387.
Valor Esperado e Variância de uma v.a.contínua
A-) O valor esperado, esperança ou média de uma variável aleatória
contínua é definido por:
E ( X )   x f ( x)dx
x
Propriedades de Esperança:
a)
E (k )  k ,
b)
Eg ( X )   g ( x) f ( x)dx
k constante.
x
c)
E (aX  b)  aE ( X )  b
B-) A variância de uma variável aleatória contínua é definida por:
Var( X )  E X  E ( X )2  E ( X 2 )  E ( X )2 ,
Propriedades de Variância:
a) Var (k )  0 ,
k constante.
b) Var (aX  b)  a Var ( X )
2
Exemplo 10: Seja uma v.a. contínua com fdp dada por:
k
f ( x) 
, k > 0 e { x  R | 0 < x  1 }:
x
a) Achar o valor de k para que f(x) seja uma densidade de
probabilidade;
b) Calcular o valor esperado de X ;
c) Calcular a variância de X;
d) Encontre a função distribuição acumulada de X;
e) Encontre P(X  1/2) e P(1/4 < X < 9/16);
f) Quais os valores de k1 e k2 tal que P(X  k1) = 0.05 e P(X  k2) =
0.05?
 f ( x)dx  1
a) Achar o valor de k:
x
1
 k x1 / 2 
k
 x dx   1 / 2   1

0
0
1
2k (1  0)  1
2k  1
Logo: f ( x) 

1
2 x
k
1
2
, 0 < x  1 , é uma fdp.
b) Valor esperado de X :
1
E( X )  
0
x
2 x
1
x
dx
2
0
dx  
1
1  x3 / 2 
1


2  3 / 2 
3

0
c) Variância de X:
1 3/ 2
x2
x
E( X )  
dx  
dx
2
2
x
0
0
1
2
1
1  x5 / 2 
1


2  5 / 2 
5
0
2

1 1
4
Var ( X )     
5  3
45

DP ( X ) 
4
 0.2981
45
d) fda de X:
x
1
1  u1 / 2 
F ( x)  
du 
 x
 1/ 2 
2
2
u

0
0
x
 0 ,

Logo: F ( x)   x ,
 1 ,

x0
0  x  1.
x 1
E( X ) 
1
3
Figura: fdp e fda, respectivamente.
e) P(X  1/2) e P(1/4  X < 9/16):
i) P( X  1/ 2)  F (1 / 2)  1 / 2 
2
2
ii) P(1 / 4  X  9 / 16)  F (9 / 16)  F (1 / 4) 
3 1 1
 
4 2 4
f) k1 e k2 tal que P(X  k1) = 0.05 e P(X  k2) = 0.05:
i) P( X  k1)  k1  0.05

k1  0.025
ii) P( X  k2 )  1  P( X  k2 )  1  k2  0.05
k2  0.95


k2  0.9025
Modelos contínuos de probabilidade
A) O modelo Exponencial:
Seja X uma v.a. contínua com fdp dada por:
1
f ( x)  e  x /  ,  > 0 e {x  R | x  0}.

Então X tem distribuição exponencial com parâmetro .
Notação:
X  exponencial(  ).
A média e variância de uma v.a. exponencial() são:
E(X) = 
Var(X) = 2
Obs: O modelo exponencial aparece, ainda, na forma:
f ( x)   e x ,  > 0 e {x  R | x  0},
em que  = 1/.
Como o modelo exponencial é muito utilizado na modelagem de
tempos até a ocorrência de um evento (ou tempos de vida), nessas
situações  é a taxa de ocorrência do evento por unidade de tempo.
Exemplo 11: No exemplo (9), cuja v.a. contínua, tem fdp
1
f ( x)  e  x / 2 ,
2
temos que  = 2, ou seja, X  exponencial( 2 ).
Ainda:

x x / 2
1  x / 2
E( X )   e
dx   x e
dx , integrando por partes,
2
20
0
E( X )  2 .
x x / 2
1  2 x / 2
E( X )   e
dx   x e
dx , integrando p. partes,
2
2
0
0
2
 2
E( X 2 )  8 .
Logo: Var ( X )  4 .
B) A distribuição de probabilidade Normal.
Uma v.a. X tem distribuição normal ou Gaussiana, com parâmetros 
e 2 se a sua fdp for:
1
 x  2
f x 
e
 2
22
,    x   ,       e 2  0 .
Notação: X  normal( ; 2)
ou
X  N( ; 2).
As principais características da distribuição normal são:
a) X tem média E(X) =  e variância Var(X) = 2;
b) f(x) é uma função simétrica em torno de : f( – k) = f( + k);
c) f(x) tem pontos de inflexão em ( – ) e ( + );
d) f(x) tem o conhecido formato de sino com 95% de probabilidade
entre ( – 2) e ( + 2) (ver figura).
A função de distribuição acumulada (fda) do modelo normal não pode
ser determinada uma vez que a integral
F x  
x
1
 w  2 22
e
dw,
  2

não tem solução algébrica, o que dificulta as coisas, pois temos de
recorrer à programação numérica.
No entanto, o resultado a seguir vem facilitar as coisas:
Considere a va normal padronizada, dada pela transformação linear
Z
X 
.

Essa transformação padroniza a va X em relação ao seu desvio
padrão, além de centralizá-la na origem.
Desta forma, tem-se que E(Z) = 0 e Var(Z) = 1.
Resultado: Seja X uma va com distribuição normal com média  e
variância 2, então a variável Z tem distribuição normal padrão, com
média 0 e variância 1, ou seja: Z  N(0; 1),
e a sua fdp é dada por:
( z ) 
1  z2 2
e
,    z  .
2
Nota: Com este resultado, basta construir uma única tabela de
probabilidades para a distribuição normal padronizada que teremos as
probabilidades para uma va normal qualquer.
Exemplo 12: Seja uma va X com distribuição normal com média 220 e
variância 16, ou seja, X  N(220; 16). Calcular as probabilidades abaixo:
a) P(X  225)
 X  220 225  220 

  PZ  1,25 = 0,8943
4
4


P(X  225) = P
b) P(210  X  228)
 210  220 X  220 228  220 
P(210  X  228) = P



4
4
4


 P 2,50  Z  2,00 
 PZ  2,00  PZ  2,50  0,9773 – 0,0062 = 0,9711
c) Qual o valor de k tal que P(X  k) = 0,01?
 X  220 k  220 

P(X  k) = P
 = 0,01,
4
4 

Da tabela temos que
k  220
 2,33  k = 210,38
4
d) Quais os valores k1 e k2 simétricos em torno de , tal que
P(k1  X  k2) = 0,95?
k  220 
 k  220
Z 2
P(k1  X  k2) = P 1
 = 0,95,
4
4


k  220 
k  220 


Da tabela temos que P Z  1
  P Z  2
 = 0,025, e,
4 
4



k1  220
 1,96  k1 = 212,16
4
Como k1 e k2 simétricos em torno da média, então
k2  220
 1,96  k2 = 227,84
4
Exemplo 13: Suponha que o nível de dureza de uma peça de espuma
tenha distribuição N 40; 36. Qual a probabilidade de que:
a) Um item produzido tenha dureza inferior a 28,7? E acima de 50,5?
b) A especificação para esse produto é que pelo menos 95% dos itens
produzidos tenha dureza entre 28 e 52. A especificação é atendida?
a) P(X < 28,7)


28,7  40 
  PZ  1,88 = 0,0301
6



50,5  40 
  1  PZ  1,75 = 0,0401
6

P(X < 28,7) = P Z 
P(X > 50,5)
P(X > 50,5) = P Z 
b) P(28 < X < 52)
P(28 < X < 52) = P 2,0  Z  2,0  PZ  2,0  PZ  2,0
= 0,9773 – 0,0228 = 0,9545
Exemplo 14: O tempo até a falha dos televisores da marca X-View tem
distribuição normal com média 35 mil horas ( 4 anos) e desvio padrão de
2,675 mil horas ( 3,7 meses). A empresa deseja fixar a garantia do
produto de forma que, no máximo 5% dos televisores apresentem
problemas antes desse limite.
a) Encontre o limite de garantia.
L  35 

P Z 
  0,05
2,675 

P(X < L) = 0,05

L  35
 1,645
2,675
 L = 30,6 mil horas ( 3,5 anos)
b) Os diretores da companhia traçam um plano de ação para reduzir a
variabilidade do processo de produção. De quanto deve ser reduzido o
desvio padrão do processo para que, mantido o limite obtido em (a), o
percentual de itens abaixo do limite garantia caia pela metade?
P(X < 30,6) = 0,025
 4.4
30,6  35 

 1,96
P Z 
  0,025 

*

*


 * = 2,245 mil horas ( 3,1 meses)
Quantis da distribuição normal
Seja Zγ o quantil γ 100% da distribuição N(0, 1), então,
Zγ é tal que
P(Z  Zγ) = γ
Principais quantis da distribuição Normal
γ
γ = 0,01
γ = 0,025
γ = 0,05
γ = 0,10
γ = 0,5
γ = 0,90
γ = 0,95
γ = 0,975
γ = 0,99
Quantil
1%
2,5%
5%
10%
50% ou med (x)
Zγ
Z0,01 = –2,33
Z0,025 = –1,96
Z0,05 = –1,645
Z0,1 = –1,28
90%
95%
97,5%
99%
Z0,9 = 1,28
Z0,95 = 1,645
Z0,975 = 1,96
Z0,99 = 2,33
Z0,5 = 0
Obs: 1) Note que Zγ = – Z(1–γ), por exemplo Z0,025 = – Z0,975;
2) No programa R os quantis da normal são obtidos pelo comando:
qnorm(γ), 0  γ  1.
Exemplo 15: O diâmetro D (cm) de esferas usadas na fabricação de um
rolamento tem distribuição N (0,614 ; 6,2510-6 ) . Uma esfera é
classificada como:
 “boa” se 0,610  D  0,618;
 “recuperável” se 0,608  D  0,610 ou 0,618  D  0,620 e
 “descarte” se D  0,608 ou D  0,620.
Quais as probabilidades de uma esfera ser “boa”, “recuperável” e
“descarte”?
0,004 
 0,004
Z 

0,0025
 0,0025
P(“boa”) = P(0,610  D  0,618) = P 
= P(Z  1,60) – P(Z  –1,60)
= 0,9452 – 0,0548 = 0,8904
P(“rec”) = P(0,608  D < 0,610) + P(0,618 < D  0,620)
= [P(Z  –1,60) – P(Z  –2,40)]
+ [P(Z  2,40) – P(Z  1,60)]
= [0,0548 – 0,0082] + [0,9918 – 0,9452]
= 0,0466 + 0,0466 = 0,0932
P(“des”) = P(D < 0,608) + P(D > 0,620)
= P(Z  –2,40) + [1 – P(Z  2,40)]
= 0,0082 + [1 – 0,9918] = 0,0164
Classificação
boa
recuperável
descarte
Probabilidade
0,8904
0,0932
0,0164
O fabricante deseja fixar limites de especificação (inferior e
superior) para o produto “bom” de tal forma que apenas 0,5% dos
rolamentos fiquem de fora. Quais devem ser esses limites?
P(k1  D  k2) = 1 – 0,005
k  0,614 
 k  0,614
Z  2
= P 1
 = 0,995
 0,0025
0,0025 
k1  0,614
 Z 0,0025  2,81  k1 = 0,607
0,0025
Como k1 e k2 são simétricos em torno da média, então
k2  0,614
 Z 0,9975  2,81  k2 = 0,621
0,0025
Logo, P( 0,607  D  0,621 ) = 0,995
Considere que cada esfera é produzida a um custo de R$ 0,15 e
vendida a R$ 0,25 por unidade, calcule o lucro esperado na venda de 50
mil unidades do produto se cada peça recuperável tem um custo
adicional de R$ 0,05 de retrabalho.
Seja L o lucro na venda de uma esfera, então
Peça
boa
recuperável
descarte
Probabilidade
0,8904
0,0932
0,0164
Custo  C
0,15
0,15 + 0,05
0,15
Venda  V
0,25
0,25
0
E(L) = 0,8904(0,10) + 0,0932(0,05) + 0,0164(– 0,15)
= R$ 0,09124/esfera
Em 50 mil esferas, temos:
50000 E(L) = 50000 (0,09124) = R$ 4.562,00
Obs: Pode-se, ainda, encontrar o lucro esperado fazendo:
L = V – C  E(L) = E(V) – E(C),
em que V é o valor da venda de uma esfera.
Como E(V) = R$ 0,2459/un., e
E(C) = R$ 0,15466/un., então
E(L) = R$ 0,2459 – R$ 0,15466 = R$ 0,09124/un.
Lucro  L
0,10
0,05
– 0,15
Exemplo 16: Um produto é vendido em pacotes de um quilograma, sendo
que a distribuição do peso dos pacotes é normal com média 1005g e
desvio padrão 12g.
a) Qual a probabilidade de que um pacote saia com peso 15g abaixo da
média?
b) Num fardo com 12 pacotes, qual é a probabilidade de no máximo 2
estejam abaixo de 990g?
c) Um fiscal informou o produtor de que são aceitos apenas 5% dos
pacotes com peso abaixo de 995g. De quanto deve diminuir a
variabilidade para que esse limite seja atendido?
d) Como o processo não permite o ajuste na variabilidade, a opção seria
aumentar a média para atender a especificação. De quanto deve ser a
nova média?
e) Com a nova média obtida no item anterior, de quanto se espera
aumentar a perda do empacotador em uma tonelada do produto.
C) O Modelo Uniforme:
Seja X uma va contínua com distribuição Uniforme no intervalo [a , b]
 R, a < b, então sua fdp é dada por:
f ( x) 
Notação:
1
,
(b  a)
{x  R | a ≤ x ≤ b}.
X  U(a , b)
ou
X  uniforme(a ,b)
A média e variância de uma v.a. uniforme(a , b) são:
E ( x) 
ab
2
(b  a) 2
Var ( x) 
12
Caso especial: O modelo uniforme no intervalo [0 ; 1], X  U(0 , 1):
f ( x)  1,
{x  R | 0 ≤ x ≤ 1}.
Para o modelo U(0 , 1):
E ( x) 
1
2
Var ( x) 
1
12
Nota: O modelo uniforme(0 , 1) é muito importante na estatística pois ele
serve de base para muitos processos de simulação, na geração de
valores pseudoaleatórios devido ao resultado a seguir:
Resultado:
Seja a v.a. X distribuída segundo uma fdp f(x), ou seja, X  f(x).
Considere a transformação dada por Y = F(X), em que F(.) é a fda de
X, então, Y tem distribuição uniforme(0 , 1), ou seja,
Y  U(0 , 1).
D) O Modelo Gama:
Uma v.a. X tem distribuição gama com parâmetros  > 0 e  > 0 se a
sua fdp é dada por:
x  1 e  x / 
f ( x)  
,
  ( )
x  0,

em que ()   y  1 e  y dy é a função gama.
0
Notação: X ~ gama(, )
O parâmetro  é chamado de parâmetro de forma enquanto que  é
o parâmetro de escala.
0.0
0.2
0.4
0.6
0.8
1.0
Gráfico da distribuição Gama
0
1
2
3
4
5
Figura: fdp gama para  = 2 e  = 0.5 < 1 (azul);  = 1 (vermelho) e  = 1.5 > 1 (verde).
Notas:
i) Integrando por partes o lado direito de () tem-se:
()  

y  1 e y
0

  (  1) y   2 e y dy
0

 (  1)  y ( 1) 1 e y dy
0
 (  1)(  1)
Se  for um inteiro, digamos,  = n, então:
(n)  (n  1)(n  1)
 (n  1)(n  2)(n  2)
 
 (n  1)(n  2)  2 (1)  (n  1)!
Ou seja, se  é um inteiro, então: () = ( − 1)!
ii) Uma expressão para a função gama, conhecida como forma de
Weierstrass, é dada por:
1
 x   x  x 
( x)   x e  ln1     ,
k 1
 k  k

Em que γ é a constante de Euler-Mascheroni (com 10 casas decimais
  0,5772156649 )
Tomando o logaritmo de (x) , temos que:
  x  x
 ln( x)  ln( x)  x   ln1     .
k  k
k 1  

A função gama pode, ainda, ser aproximada pela fórmula de Sterling
(ver Abramowitz & Stegun2)
iii) Um caso especial da função gama é: (1 / 2)   .
2
Milton Abramowitz e Irene Stegun. Handbook of Mathematical Functions with Formulas, Graphs, and
Mathematical Tables . 1ª ed. Nova Iorque: Dover Publications, 1964.
Média e Variância
Seja uma v.a. X ~ gama(, ) , então sua média e variância são
dados por:
E(X) = 
Var(X) = 2
e

Prova:
E( X )   x
x 1 e  x / 

  ( )
0
dx
  x / 
x e

0




  ( )

1
x

dx
(  1)1  x / 
  ( ) 0
1
   ( )
1
   ( )
e
dx
1(  1)
1  ()   
Num procedimento semelhante,

2
E( X )   x
0

2
x 1 e  x / 

  ( )
dx
 2 (  1)()
   ( )
 2 (  1)
Logo, temos que:
Var(X )  2 (  1)  2 2
  2  2   2    2  2   2
Portanto, E (X )    e Var ( X )   2 .
Casos Particulares da distribuição gama:
i)
 = 1 e  > 0: X ~ exponencial ()
1
f ( x)  e  x /  , x  0 .

ii)  = n/2, n inteiro e  = 2: X ~  2n
(distribuição quiquadrado)
x n / 2 1 e x / 2
f ( x)  n / 2
, x  0.
2 (n / 2)
É a distribuição quiquadrado com n graus de liberdade.
iii)  = n, inteiro e  = 1/ > 0: X ~ Erlang(n, )
n x n 1 ex
f ( x) 
, x  0.
 ( n)
Função de distribuição acumulada
A f.d.a. de uma v.a. X ~ gama(, ) , é obtida de
x  1  u / 
F (x)  
0
F (x) 
u
e
du
  ( )
1

  ( )
x
u
 1 u / 
e
du
0
Fazendo z  u /  , então du  dz e
F (x) 
1
   ( )
x/
 1  z 
 z e  dz
0
1 x /  1  z
F (x) 
 z e dz
 ( ) 0
A função F(x) acima não tem solução algébrica, sendo identificada
como gama incompleta, ou seja
1 z0 1  z
F ( x)  IG (, z0 ) 
 z e dz ,
 ( ) 0
em que z0  x /  .
No software R a gama incompleta IG( , z0) pode ser calculada
com o comando:
pgamma(z0,).
a) Comandos do Excel para calcular a distribuição gama:
f(x) e F(x)
F –1 (q)
 =DISTGAMA(x; ; ; Cumulativo)
 =INVGAMA(q, x; ; )
Em que:  é o parâmetro de forma;
 é o de escala e
Cumulativo é um valor lógico (VERDADEIRO para f.d.a. e
FALSO para f.d.p.).
b) Comandos do software R para calcular a distribuição gama:
fdp:
fda:
xq:
f(x)
F(x)
F –1 (q)



dgamma(x, shape = , scale = )
pgamma(x, shape = , scale = )
qgamma(q, shape = , scale = )
O computador nos cálculos das probabilidades: o uso do Excel
Os modelos de probabilidades discretos e contínuos envolvem
fórmulas e somas, muitas vezes complicadas, que dificulta a obtenção dos
resultados desejados. Em outras situações, os resultados não podem ser
obtidos algebricamente, necessitando de métodos numéricos para a
obtenção de integrais, como é o caso da normal.
Diante disto, os softewares estatísticos e planilhas trazem em sua
biblioteca funções pré-programadas para o cálculo das probabilidades,
densidades, funções acumuladas e quantis das principais distribuições.
A seguir, apresentaremos os modelos: binomial; geométrico; Poisson;
uniforme contínuo; gama e normal no Excel.
Para a apresentação dos modelos, vamos utilizar as seguintes
abreviações:
 fp: função de probabilidade (para o caso discreto): p( x)  P( X  x) ;
 fdp: função densidade de probabilidade (para o caso contínuo): f (x) ;
 fda: função distribuição acumulada: F ( x)  P( X  x) ;
x
 caso discreto F ( x)   P( X  k ) :
k 0
x
 caso contínuo F ( x)   f (u )du :

 xγ = F –1 (γ): quantil de ordem γ, é tal que P( X  x )  
i)
Modelo binomial(n , p):
=DISTR.BINOM(x; n; p; Cumulativo)
Sendo que Cumulativo assume os valores lógicos:
FALSO para a fp e
VERDADEIRO para a fda.
fp
=DISTR.BINOM(x; n; p; falso)
fda
=DISTR.BINOM(x; n; p; verdadeiro)
xγ
=INV.BINOM(n; p; γ)
Exemplo: Considere X ~ binomial(12 ; 0,40) ; então, n = 12 e p = 0,40.
Obter:
a) P( X  3) :
comando: =DISTR.BINOM(3; 12; 0,40; falso)
resultado: 0,141894
b) P( X  3) :
comando: =DISTR.BINOM(3; 12; 0,40; verdadeiro)
resultado: 0,225337
c) x0, 75 , tal que P( X  x0, 75 )  0,75
comando: =INV.BINOM(12; 0,40; 0,75)
resultado: 6
ou seja, x0, 75  6 .
ii) Modelo geométrico(p):
=DISTR.BIN.NEG(x; 1; p; Cumulativo)
O modelo geométrico é um caso especial do modelo binomial
negativo quando r = 1 (por isso o valor 1 como segundo parâmetro do
comando).
fp
=DISTR.BIN.NEG(x; 1; p)
fda
não tem
xγ
não tem
Exemplo: Considere X ~ grométrica(0,20) ; então, p = 0,20.
Obter:
a) P( X  4) :
comando: =DISTR.BIN.NEG(4; 1; 0,20)
resultado: 0,08192
Nota:
O modelo geométrico no Excel é definido pela va X que conta o número de
fracassos (e não o número de ensaios) até o primeiro sucesso. Desta forma,
a função de probabilidade é da forma:
p( x)  P( X  x)  p (1  p) x ,
Neste caso, a fda é dada por:
F ( x)  P( X  x)  1  (1  p) x 1.
x  0, 1, 2, 
iii) Modelo Poisson():
=DIST.POISSON(x; ; Cumulativo)
Sendo que Cumulativo assume os valores lógicos:
FALSO para a fp e
VERDADEIRO para a fda.
fp
=DIST.POISSON(x; ; falso)
fda
=DIST.POISSON(x; ; verdadeiro)
xγ
não tem
Exemplo: Considere X ~ Poisson(3,6) ; então,  = 3.6.
Obter:
a) P( X  6) :
comando: =DIST.POISSON(6; 3,6; falso)
resultado: 0,082608
b) P( X  6) :
comando: =DIST.POISSON(6; 3,6; verdadeiro)
resultado: 0,926727
iv) Modelo exponencial():
=DISTR.EXPON(x; ; Cumulativo)
Sendo que Cumulativo assume os valores lógicos:
FALSO para a fp e
VERDADEIRO para a fda.
fdp
=DISTR.EXPON(x; ; falso)
fda
=DISTR.EXPON(x; ; verdadeiro)
xγ
não tem
Exemplo: Considere X ~ exponencial (0,25) ; então,  = 0,25 (ou  = 4).
f ( x)  0,25 e 0, 25 x .
Obter:
a) f (2) , fdp para x = 2:
comando: =DISTR.EXPON(2; 0,25; falso)
resultado: 0,151633
b) F (2)  P( X  2) :
comando: =DISTR.EXPON(2; 0,25; verdadeiro)
resultado: 0,393469
Nota: O modelo exponencial no Excel é definido pela densidade:
f ( x)   e x ,
em que  é a taxa de ocorrência.
v) Modelo gama(; ):
=DIST.GAMA(x; ; ; Cumulativo)
Sendo que Cumulativo assume os valores lógicos:
FALSO para a fp e
VERDADEIRO para a fda.
fdp
=DIST.GAMA(x; ; ; falso)
fda
=DIST.GAMA(x; ; ; verdadeiro)
xγ
=INV.GAMA(γ; ; )
Exemplo: Considere X ~ gama(4 ; 0,5) ; então,  = 4 e  = 0,5
f ( x) 
1
x 3 e  x / 0, 5 .
4
(0,5) (4)
Obter:
a) f (2) , fdp para x = 2:
comando: =DIST.GAMA(2; 4; 0,5; falso)
resultado: 0,390734
b) F (2)  P( X  2) :
comando: =DIST.GAMA(2; 4; 0,5; verdadeiro)
resultado: 0,566530
d) x0, 25 , tal que P( X  x0,25 )  0,25
comando: =INV.GAMA(0,25; 4; 0,25)
resultado: 1,268
ou seja, x0, 25  1,268.
vi) Modelo N(; 2):
=DIST.NORM.N(x; ; ; Cumulativo)
Sendo que Cumulativo assume os valores lógicos:
FALSO para a fp e
VERDADEIRO para a fda.
fdp
=DIST.NORM.N(x; ; ; falso)
fda
=DIST.NORM.N(x; ; ; verdadeiro)
xγ
=INV.NORM.N(γ; ; )
Exemplo: Considere X ~ N (50 ; 9) ; então,  = 50 e  = 3 (desv. padrão).
Obter:
a) f (48) , fdp para x = 48:
comando: =DIST.NORM.N(48; 50; 3; falso)
resultado: 0,106483
b) F (48)  P( X  48) :
comando: =DIST.NORM.N(48; 50; 3; verdadeiro)
resultado: 0,252493
e) x0,90 , tal que P( X  x0,90 )  0,90
comando: =INV.NORM.N(0,90; 50; 3)
resultado: 53,845
ou seja, x0,90  53,845 .
vii) Modelo normal padrão N(0; 1):
=DIST.NORMP.N(z; Cumulativo)
Sendo que Cumulativo assume os valores lógicos:
FALSO para a fp e
VERDADEIRO para a fda.
fdp
=DIST.NORMP.N(z; falso)
fda
=DIST.NORMP.N(z; verdadeiro)
xγ
=INV.NORMP.N(γ)
Exemplo: Considere Z ~ N (0 ; 1) ; então,  = 1 e  = 1.
Obter:
a) f (1) , fdp para x = −1:
comando: =DIST.NORMP.N(-1; falso)
resultado: 0,241971
b) F (1)  P( X  1) :
comando: =DIST.NORMP.N(48; 50; 3; verdadeiro)
resultado: 0,158655
f) x0,90 , tal que P( X  x0,90 )  0,90
comando: =INV.NORMP.N(0,95)
resultado: 1,645
ou seja, z0,95  1,645.
Download