Pobabilidade V.A`s e Modelos

Propaganda
Os exercícios a seguir são para resolver em sala
i) Uma mulher tem 1/3 de chance de ainda estar viva daqui a 30 anos e
seu marido tem 2/5 de chance. Qual é a probabilidade de, daqui a 30
anos:
a) Ambos estejam vivos
b) Ao menos um esteja vivo.
c) Só o homem estar vivo.
ii) Um dado equilibrado é lançado 12 vezes. Calcule a probabilidade de
se obter:
a) Dois seis.
b) Quatro seis.
c) Pelo menos dois seis.
d) No máximo três seis.
10.7. VARIÁVEIS ALEATÓRIAS E MODELOS DE PROBABILIDADE
10.7.1. VARIÁVEIS ALEATÓRIAS
Uma variável aleatória (v.a.) é uma característica numérica que
associa valores do conjunto dos números reais aos eventos em Ω.
A v.a. representa uma característica individual das unidades
de uma população, que podem ser observadas através de uma amostra.
Exemplo 1:
X = número de indivíduos abaixo da linha da pobreza numa amostra de
80 pessoas de uma comunidade;
T = tempo de recuperação de pacientes com fratura de femur;
Y = número de pessoas que votam no candidato Zelão;
R = renda familiar em salários mínimos, numa amostra de pessoas de
uma população rural;
W = número de nascimentos do sexo feminino em uma maternidade, no
período de uma semana;
Z = número de dias de estiagem até a ocorrência de chuva em São
Carlos.
As variáveis aleatórias podem ser classificadas como
discretas e contínuas segundo a natureza do espaço amostral:
i) v.a.’s discretas assumem valores em espaços discretos e,
normalmente, são definidas por uma contagem;
ii) v.a.’s contínuas assumem valores em espaços contínuos e,
normalmente, são definidas por uma mensuração.
10.7.2. FUNÇÃO DE PROBABILIDADE E FUNÇÃO DENSIDADE
A função de probabilidade e a função densidade são funções que
associam probabilidades a uma v.a.
a) A função de probabilidade, denotada por p(x), é uma função
que associa probabilidades diretamente aos possíveis valores de uma
v.a. discreta X, sendo definida por:
p(x) = P(X = x)
Exemplo 2: Considere os nascimentos, independentes, de três crianças e
seja a v.a. que conta o número de nascimentos do sexo feminino nesses
3 nascimentos:
Espaço amostral:
Ω = {(FFF), (FFM), (FMF), (MFF), (FMM), (MFM), (MMF), (MMM)}
Neste caso o espaço amostral é equiprovável, pois cada um de seus
elementos tem mesma probabilidade.
Considerendo que P(F) = P(M) = 1/2, e que os nascimentos são
independentes, temos que:
P(FFF) = P(F)×P(F)×P(F) = 1/8.
Obs: O mesmo vale para todos os demais elementos de Ω, resultando
P(FFF) = P(FFM) = P(FMF) = P(MFF) = P(FMM) = P(MFM) =
= P(MMF) = P(MMM) = 1/8
Associada a este espaço amostral a v.a.
X = número de crianças do sexo feminino dentre os três nascimentos,
Tabela 1: Função de probabilidade para uma v.a. discreta
Elementos de Ω
Valores de X
Probabilidade p(x)
(FFF)
3
1/8
(FFM), (FMF), (MFF)
2
3/8
(FMM), (MFM), (MMF)
1
3/8
(MMM)
0
1/8
Desta forma, a função p(x) = P(X = x), dada pela tabela acima,
associa as probabilidades aos possíveis valos de X.
b) A função densidade, denotada por f(x), associa probabilidades a
intervalos de valores de uma v.a. contínua X, sendo dada pela
área1 abaixo de sua curva (ver figura):
A função densidade recebe, ainda, os nomes: função densidade
de probabilidade ou função distribuição de probabilidade
(fdp).
Nota: Um exemplo de função densidade de uma v.a. contínua será visto
mais adiante.
1
A operação matemática que calcula a área sob a curva de uma função f(x) é a integral:
P(a  X  b) =
b
 f ( x)dx .
a
10.7.3. Principais modelos discretos de probabilidade: o modelo
binomial.
Seja X uma v.a. discreta, porém, para a definição do modelo
binomial é que necessário que, antes, seja definido o que um ensaio de
Bernoulli.
Ensaios de Bernoulli são ensaios (ou experimentos) nos quais temos
apenas dois resultados possíveis:
 sim/não;
 presença/ausência;
 ocorre/não ocorre;
 pertence/não pertence;
 0 ou 1.
Ao realizarmos um ensaio de Bernoulli estamos interessados em
apenas um apenas um dos resultados ao qual chamaremos de sucesso
sendo que, a não ocorrência do evento de interesse vamos chamar de
fracasso.
Por exemplo, a característica de interesse pode ser:
 a presença de uma doença;
 um hábito de comportamento ou de consumo;
 uma característica física;
 um defeito ou falha ;
 o resultado de uma medição classificado por um ponto de corte.
 etc...
Para um ensaio de Bernoulli temos associadas as seguintes
probabilidades:
p = P(sucesso)
e
(1 – p) = P(fracasso)
A observação individual da característica de interesse para os
elementos da amostra caracteriza realizações independentes de
ensaios de Bernoulli.
O modelo binomial é caracterizado pela realização de n ensaios
independentes com apenas dois resultados possíveis (sucesso e
fracasso). Desta forma, P(sucesso) = p é constante.
Seja a v.a. X que conta os sucessos num número fixo de
ensaios independentes de Bernoulli.
Então, X tem distribuição binomial com parâmetros n e p.
Notação: X  binomial(n; p).
A função de probabilidade binomial é dada pela fórmula:
n x
P(X = x) =   p (1 – p)n – x,
 x
x = 0, 1, 2, ..., n.
Exemplo 3:
A) Considere o exemplo dos nascimentos, independentes, de três
crianças e seja a v.a. que conta o número de nascimentos do sexo
feminino nesses 3 nascimentos:
Podemos notar que o sexo tem apenas dois resultados possíveis:
masculino e feminino.
Como o interesse está no nascimento de crianças do sexo feminino,
então, o evento caracterizado como sucesso será exatamento o
nascimento do sexo feminino.
Logo, a v.a. X = número de bebês do sexo feminino dentre os três
nascimentos tem distribuição binomial com parâmetros n = 3 e p = 1/2.
Ou seja:
X  binomial(3; 0.5).
e, a sua fnção de probabilidade é definida como:
 3
x
3 x
P(X = x) =  0.5 1  0.5 ,
 x
x = 0, 1, 2, 3.
Assim, as probabilidades para cada um dos possíveis valores de X
sãocalculadas por:
 3
1
0
3 0
 0.53  ;
 P(X = 0) =  0.5 1  0.5
8
 0
 3
3
1
31
 P(X = 1) =  0.5 1  0.5  3  (0.5)3  ;
8
1
 3
3
2
3 2
 3  (0.5)3  ;
 P(X = 2) =  0.5 1  0.5
8
 2
 3
 3
 P(X = 3) =  0.5 1  0.5
3 3
3
1
 0.53  .
8
Resolvendo as frações, temos:
 x  0,
 x  1,


 x  2,
 x  3,
p(0)  P( X
p(1)  P( X
p(2)  P( X
p(3)  P( X
 0)  0.125
 1)  0.375
 2)  0.375
 3)  0.125
Gráfico da função de probabilidade:
B) Suponha que uma característica genética é determinada por um par
de genes, sendo D o gene dominante e d o gene recessivo. Assim
sendo, DD é dominante puro; Dd é híbrido e dd recessivo puro. Sabese, ainda, que essa característica é determinada pelo gene recessivo.
Uma família na qual os pais são ambos híbridos tem quatro filhos,
determine:
i) A distribuição de probabilidade e os seus parâmetros.
Qual é a probabilidade de que:
ii) três dos filhos tenham a característica genética;
iii) no máximo dois dos filhos tenham a característica.
Com os dois pais híbridos, ou seja, ambos Dd, temos as seguintes
possibilidades de cargas genéticas para os filhos:
Considerando, ainda, P(D) = P(d) = 1/2, temos as seguintes
probabilidades associadas:
probabilidade
i)
Dominante puro
DD
Filho
Hibrído
Dd
Recessivo puro
dd
1/4
1/2
1/4
Como a característica genética é determinada pelo gene recessivo,
ela só vai se manifestar se o filho for dd. Assim sendo, teremos uma
probabilidade igual a 0.25 de que um filho apresente a característica.
Seja a v.a. X = número de filhos com a característica genética dentre
os quatro irmãos.
Então, X tem distribuição binomial com parâmetros n = 4 e p = 0.25.
X  binomial(4; 0.25).
e, a sua fnção de probabilidade é dada por:
 4
x
4 x
p(x) = P(X = x) =  0.25  0.75  ,
 x
x = 0, 1, 2, 3, 4.
ii) Probabilidade de que três filhos apresentem a característica.
 4
P( X  3)   0.25 3 0.75 1
 3
P( X  3)  4  (0.0156 )  (0.75)  0.0469
iii) Probabilidade de que, no máximo dois filhos tenham a
característica.
P( X  2)  P( X  0)  P( X  1)  P( X  2)
ou, ainda,
P( X  2)  1  P( X  3)  1  P( X  3)  P( X  4)
Como P( X  4)  0.0039 , então:
P( X  2)  1  0.0469  0.0039   0.9492
10.7.4. Principais modelos contínuos: a distribuição Normal.
Uma v.a. X tem distribuição normal ou Gaussiana, com
parâmetros  e 2 se a sua função densidade de probabilidade (f.d.p.)
for:
f x 
2
1
e  x 
 2
Notação:
22
,    x   ,       e 2  0 .
X  N( ; 2).
As principais características da distribuição normal são:
i) X tem média  e variância 2;
ii) é uma função simétrica em torno de : f( – k) = f( + k);
iii) a função muda sua curvatura nos pontos ( – ) e ( + );
iv) tem o conhecido formato de sino com probabilidade de
aproximadamente 95% entre ( – 2) e ( + 2) (ver figura).
A função de distribuição acumulada F(x) do modelo normal não pode
ser determinada algebricamente, o que dificulta o cálculo das
probabilidades, pois
F(x) = P(X  x)
No entanto, o resultado a seguir vem facilitar as coisas:
Resultado: a transformação a seguir padroniza a v.a. normal
Z
X 
.

Fazendo com que Z tenha média igual a 0 e variância igual a 1.
Com este resultado, basta construir uma única tabela de
probabilidades para a distribuição normal padronizada que teremos as
probabilidades para uma v.a. normal qualquer.
Exemplo 4:
C) Seja uma va X com distribuição normal com média 220 e variância
16, ou seja, X  N(220; 16). Calcular as probabilidades abaixo:
a) P(X  225)
X  220 225  220 
P(X  225) = P

  PZ  1.25 = 0.8943

4
4

b) P(210  X  228)
210  220 X  220 228  220 


P(210  X  228) = P


4
4
4

 P 2.50  Z  2.00 
 PZ  2.00  PZ  2.50  0.9773 – 0.0062 = 0.9711
c) Qual o valor de k tal que P(X  k) = 0.01?
X  220 k  220 
P(X  k) = P

 = 0.01,

4
Da tabela temos que
4

k  220
 2.33
4

k = 210.38
d) Quais os valores k1 e k2 simétricos em torno de , tal que
P(k1  X  k2) = 0.95?
k  220
k  220 
Z 2
P(k1  X  k2) = P 1
 = 0.95,

4
Da tabela temos que P Z 

4

k1  220 
k  220 

  P Z  2
 = 0.025,
4 
4


e,
k1  220
 1.96  k1 = 212.16
4
Como k1 e k2 simétricos em torno da média, então
k 2  220
 1.96  k2 = 227.84
4
D) Suponha que a renda de uma população (em s.m.) tenha
distribuição N 4; 0.36 . Qual a probabilidade de que:
a) Uma pessoa escolhida ao acaso desta população tenha renda
inferior a 2.87sm?
b) Uma pessoa escolhida ao acaso desta população tenha renda
superior a 5.05sm?
c) Qual a proporção de pessoas com renda entre 2.8 e 5.2
sm’s?
a) P(X < 28.7)
28.7  40 
P(X < 28.7) = P Z 
  PZ  1.88 = 0.0301

6

b) P(X > 50.5)
50.5  40 
P(X > 50.5) = P Z 
  1  PZ  1.75 = 0.0401

6

c) P(28 < X < 52)
P(28 < X < 52) = P 2.0  Z  2.0  PZ  2.0  PZ  2.0
= 0.9773 – 0.0228 = 0.9545
E) O tempo até a falha dos televisores da marca X-View tem
distribuição normal com média 35 mil horas ( 4 anos) e
desvio padrão de 2.675 mil horas ( 3.7 meses). A empresa
deseja fixar a garantia do produto de forma que, no máximo
5% dos televisores apresentem problemas abaixo desse limite.
a) Encontre o limite de garantia L?
P(X < L) = 0.05
L  35 

P Z 
  0.05
2.675 


L  35
 1.645
2.675
 L  35  (1.645)  (2.675)
 L = 30.6 mil horas ( 3.5 anos)
b) Os diretores da companhia traçam um plano de ação para
reduzir a variabilidade do processo de produção. De quanto
deve ser reduzido o desvio padrão do processo para que,
mantido o limite obtido em (a), o percentual de itens abaixo
do limite garantia caia pela metade?
P(X < 30.6) = 0.025
30.6  35 

P Z 
  0.025
* 



30.6  35
 1.96
*
 4.4
 1.96
*
 * = 2.245 mil horas ( 3.1 meses)
Definição:
Seja Z o quantil 100% da distribuição N(0, 1), então, Z é tal
que
P(Z  Z) = 
Principais quantis da distribuição Normal

 = 0.01
 = 0.025
 = 0.05
 = 0.95
 = 0.975
 = 0.99
Quantil
1%
2.5%
5%
95%
97.5%
99%
Z
Z0.01 = –2.33
Z0.025 = –1.96
Z0.05 = –1.645
Z0.95 = 1.645
Z0.975 = 1.96
Z0.99 = 2.33
Obs: 1) Note que Z = – Z(1–), por exemplo Z0.025 = – Z0.975;
2) No programa R os quantis da normal são obtidos pelo
comando: qnorm(), 0    1.
F) Um produto é vendido em pacotes de um quilograma, sendo
que a distribuição do peso dos pacotes é normal com média
1005g e desvio padrão 12g.
a) Qual a probabilidade de que um pacote saia com peso 15g
abaixo da média?
b) Num fardo com 12 pacotes, qual é a probabilidade de no
máximo 2 estejam abaixo de 990g?
c) Um fiscal informou o produtor de que são aceitos apenas
5% dos pacotes com peso abaixo de 995g. De quanto deve
diminuir a variabilidade para que esse limite seja atendido?
d) Como o processo não permite o ajuste na variabilidade, a
opção seria aumentar a média para atender a especificação.
De quanto deve ser a nova média?
e) Com a nova média obtida no item anterior, de quanto se
espera seja o aumento na perda do empacotador em uma
tonelada do produto.
Download