Resolução

Propaganda
INSTITUTO POLITÉCNICO DE SETÚBAL
ESCOLA SUPERIOR DE TECNOLOGIA DE SETÚBAL
DEPARTAMENTO DE MATEMÁTICA
PROBABILIDADES E ESTATÍSTICA
Exame Época Normal
SEMESTRE PAR
2008/2009
Data: 11 de Julho de 2009
Duração: 3h
Tópicos de Resolução
Questões:
1. Num lançamento de um dado viciado (numerado de 1 a 6), a probabilidade de sair qualquer número ímpar
é o dobro da probabilidade de sair qualquer número par.
[1.0] (a) Indique, justificando, a função de probabilidade da variável aleatória que representa o número que
sai no lançamento desse dado.
RESOLUÇÃO:
Sejam os acontecimentos A (sair número par no lançamento de um dado viciado) e B (sair número
ímpar no lançamento de um dado viciado), tais que P (A) = p e P (B) = 2p.
Deste modo tem-se
P ({2}) = P ({4}) = P ({6}) = p
P ({1}) = P ({3}) = P ({5}) = 2p
Como
1
9
Tem-se para X (valor obtido no lançamento de um dado viciado) a seguinte função de probabilidade:
 2
x ∈ {1, 3, 5}

9,



1
f (x) =
x ∈ {2, 4, 6}
9,




0, noutros casos
P ({1}) + P ({2}) + P ({3}) + P ({4}) + P ({5}) + P ({6}) = 1 ⇔ 3p + 6p = 1 ⇔ p =
[0.5] (b) Calcule a probabilidade de num lançamento desse dado sair um número que seja um quadrado
perfeito.
RESOLUÇÃO:
De 1 a 6 os quadrados perfeitos são 1 e 4, pelo que se pretende P ({1} ∪ {4}):
P ({1} ∪ {4}) = P ({1}) + P ({4}) =
2 1
1
+ =
9 9
3
2. A procura diária de refrigerantes (em centenas de litros) num supermercado junto à praia é uma variável
aleatória contínua, X, com a seguinte função de distribuição:

0
, x<0


x2
, 0≤x≤1
3
F (x) =
.
x2
1

 − 6 +x− 2 , 1<x≤3
1
, x>3
[1.0] (a) Qual a quantidade de refrigerante que deve ser diariamente colocada nas prateleiras do supermercado
para que a procura seja satisfeita em 95% dos dias?
RESOLUÇÃO:
Supondo que 1 < x ≤ 3,
P (X ≤ x)
=
0.95 ⇔ −
x2
1
+ x − = 0.95 ⇔ x2 − 6x + 8.7 = 0 ⇔
6
2
√
36 − 4 × 8.7
⇔ x = 2.45 ∨ x = 3.55
2
Então a única solução válida no intervalo considerado é x = 2.45 centenas de litros.
Nos outros intervalos nunca se obtém uma solução válida.
⇔ x=
6±
[2.0] (b) Calcule o desvio padrão da procura diária de refrigerantes neste supermercado.
RESOLUÇÃO:
2x
,0≤x≤1
3
x
f (x) = F (x) =
−3 + 1 , 1 < x ≤ 3
0
, caso contrário
E [X] =
+∞
xf (x) dx =
E X2 =
=
2x2
dx +
3
0
−∞
=
1
3 1 3
3
3 2
x
2x
x
x2
− + x dx =
+ − +
=
3
9 0
9
2 1
1
9 1 1
4
2
−3+ + − =
9
2 9 2
3
+∞
2
x f (x) dx =
1
2x3
dx +
3
0
−∞
3 1
−
4 1 4
3
x3
x
x
x3
+ x2 dx =
+ − +
=
3
6 0
12
3 1
1 81
1
1
13
−
+9+
− =
6 12
12 3
6
Logo o desvio padrão da procura diária de refrigerantes é
2
13
4
2
2
σX = V [X] = E [X ] − E [X] =
−
= 0.624 centenas de litros.
6
3
3. Numa fábrica que produz ipods sabe-se que o número de avarias por ano na máquina que produz os
circuitos para os ipods segue uma distribuição de Poisson de variância 1.2.
[1.5] (a) Calcule a probabilidade da máquina ter duas ou mais avarias num ano em que se sabe que vai haver
avarias.
RESOLUÇÃO:
Considere
X − número de avarias por ano na máquina que produz os circuitos para os ipods
tal que V [X] = 1.2 = λ, logo
X ∼ P (1.2) .
Assim:
P (X ≥ 2 / X > 0) =
=
P (X ≥ 2 ∧ X > 0)
P (X ≥ 2)
1 − P (X < 2)
=
=
=
P (X > 0)
P (X > 0)
1 − P (X ≤ 0)
1 − P (X ≤ 1)
1 − 0.6626
=
= 0.4828
1 − P (X ≤ 0)
1 − 0.3012
(b) Você acabou de comprar um ipod que tem tempo de vida (em anos) dado por uma distribuição
exponencial de parâmetro θ. A probabilidade deste durar pelo menos 3 anos é e−1.5 .
[1.5] i. Determine a probabilidade do seu ipod funcionar menos de 1 ano.
RESOLUÇÃO:
Considere
Y − tempo (em anos) de vida de um ipod
2
Y ∼ Exp (θ)
F (y) =
0
y
1 − e− θ
, y<0
, y≥0
Como
3
3
P (Y ≥ 3) = e−1.5 ⇔ 1 − P (Y < 3) = e−1.5 ⇔ 1 − (1 − e− θ ) = e−1.5 ⇔ e− θ = e−1.5 ⇔ θ = 2.
Assim
Y ∼ Exp (2)
e
F (y) =
logo
0
y
1 − e− 2
, y<0
, y≥0
1
P (Y < 1) = P (Y ≤ 1) = 1 − e− 2 = 0.3935
[1.5] ii. Suponha que o ipod que comprou vem de um lote de produção de 4000 ipods. Determine, através
de um método de aproximação adequado, a probabilidade de, ao fim de um ano, continuarem a
funcionar pelo menos 2500 desses aparelhos.
RESOLUÇÃO:
W − número de ipods, em 4000, que funcionam ao fim de um ano
n = 4000
Como
p = P (Y > 1) = 1 − P (Y ≤ 1) = 1 − 0.3935 = 0.6065
W ∼ B (4000, 0.6065)
n = 4000 ≥ 30
np = 4000 × 0.6065 = 2426 > 5 vamos aproximar a Binomial à Normal
nq = 4000 × 0.3935 = 1574 > 5
W ∼ B (4000; 0.6065) → W ∼ N (2426; 30.8971) → Z =
W − 2426
∼ N (0; 1)
30.8971
Logo,
PB (W ≥ 2500) = 1 − PB (W < 2500) = 1 − PB (W ≤ 2499) ≈ 1 − PN (W < 2499.5) =
= 1 − PN
2499.5 − 2426
Z<
= 1 − Φ (2.38) = 1 − 0.9913 = 0.0087
30.8971
4. Suponha que a variável aleatória que representa o número de acidentes por ano em Setúbal tem distribuição
Normal de valor médio µ e variância 324 e suponha que foi recolhida uma amostra aleatória de dimensão
7.
[1.5] (a) Verifique se os acontecimentos A = X > µ − 10 e B = X > µ são acontecimentos independentes.
RESOLUÇÃO:
√ População:
X − número de acidentes por ano em Setúbal
X ∼ N µ, 324
Amostra:
n=7
Tem-se uma População Normal e σ =
√
324 = 18 conhecido logo Z =
X−µ
18
√
7
∼ N (0, 1) .
A e B são acontecimentos independentes sse P (A ∩ B) = P (A) × P (B)
µ − 10 − µ
P (A) = P X > µ − 10 = P Z >
= P (Z > −1.47) =
18
√
7
= 1 − Φ (−1.47) = 1 − (1 − Φ (1.47)) = Φ (1.47) = 0.9292
P (B) = P X > µ = P
Z>
µ−µ
18
√
7
= P (Z > 0) = 0.5
P (A ∩ B) = P X > µ − 10 ∧ X > µ = P X > µ = P (B) = 0.5
Como P (A)×P (B) = 0.9292×0.5 = 0.4646 = P (A ∩ B), A e B não são acontecimentos independentes.
3
(b) Suponha que, da amostra aleatória recolhida, obteve-se:
7
7
xi = 469
i=1
i=1
(xi − x)2 = 2334.
[1.5] i. Deduza, calcule e interprete um intervalo de confiança a 95% para o número médio de acidentes
por ano em Setúbal.
RESOLUÇÃO:
Pretende-se um intervalo de confiança para µ a 95%.
População Normal
Como já vimos na alínea anterior, σ conhecido
tem-se
Z = X−µ
∼ N (0, 1)
σ
√
n
Vamos começar por deduzir o intervalo de confiança:
X −µ
P z α2 < Z < z1− α2 = 1 − α ⇔ P −z1− α2 < σ
< z1− α2 = 1 − α ⇔
√
n
σ
σ
α
α
=1−α
⇔ P X − z1− 2 √ < µ < X + z1− 2 √
n
n
concretizando vem
1 − α = 0.95 ⇔ α = 0.05 ⇔
α
α
= 0.025 ⇔ 1 − = 0.975
2
2
z0.975 = 1.96
isto é
18
18
P (−1.96 < Z < 1.96) = 0.95 ⇔ P X − 1.96 × √ < µ < X + 1.96 × √
= 0.95
7
7
Logo o intervalo de confiança a 95% para µ é:
σ
σ
x − z1− α2 √ ; x + z1− α2 √
n
n
concretizando fica
469
18 469
18
− 1.96 × √ ;
+ 1.96 × √ = ]53.665; 80.335[
7
7 7
7
Para 95% de confiança e com base na amostra, o número médio de acidentes por ano em Setúbal
está compreendido entre 53.665 e 80.335.
[1.5] ii. Se pretendesse reduzir a amplitude do intervalo de confiança anterior para 17.5 que possibilidades
é que tinha? Justifique.
RESOLUÇÃO:
A amplitude do I.C. é dada por:
σ
σ
σ
∆I.C. = x + z1− α2 √
− x − z1− α2 √
= 2z1− α2 √
n
n
n
Pretende-se
σ
18
∆I.C. = 17.5 ⇔ 2z1− α2 √ = 17.5 ⇔ 2z1− α2 √ = 17.5
n
n
Para reduzir a amplitude é necessário diminuir o grau de confiança ou aumentar a dimensão da
amostra.
Suponhamos que vamos diminuir o grau de confiança sem alterar a dimensão da amostra,
então vem
18
α
2z1− α2 √ = 17.5 ⇔ z1− α2 = 1.29 ⇔ 1 − = 0.9015 ⇔ 1 − α = 0.803
2
7
4
É necessário considerar um grau de confiança de 80.3% para reduzir a amplitude do I.C. para
17.5.
Suponhamos que vamos aumentar a dimensão da amostra sem alterar o grau de confiança,
então vem
18
2 × 1.96 × √ = 17.5 ⇔ n = 16.257 ⇒ n = 17
n
É necessário recolher uma amostra de dimensão 17 para reduzir a amplitude do I.C. para 17.5.
Também existe a possibilidade de tentar conjugar em simultâneo a diminuição do grau de confiança e o aumento da dimensão da amostra de modo a obter o que se pretende.
[1.5]
5. Seja θ∗ um estimador enviesado de um parâmetro θ. Considerando que o seu enviesamento é dado por k,
prove que
2
V [θ∗ ] = E (θ∗ − θ) − k2 .
RESOLUÇÃO:
θ∗ um estimador enviesado de θ, com enviesamento igual k, isto é
E [θ ∗ ] − θ = k ⇔ E [θ∗ ] = θ + k
2
Queremos provar que V [θ∗ ] = E (θ∗ − θ) − k2 .
2
2
2
V [θ ∗ ] = E (θ∗ − E [θ∗ ]) = E (θ∗ − (θ + k)) = E ((θ ∗ − θ) − k) =
2
2
= E (θ∗ − θ) − 2k (θ∗ − θ) + k2 = E (θ∗ − θ) − 2kE [θ∗ ] + 2kθ + k2 =
2
2
= E (θ∗ − θ) − 2k (θ + k) + 2kθ + k2 = E (θ ∗ − θ) − 2kθ − 2k2 + 2kθ + k2 =
2
= E (θ∗ − θ) − k2
6. As observações que se seguem dizem respeito à largura da estrada, em metros, em sete zonas da cidade
de Setúbal e ao número de acidentes por ano nessas zonas.
zonas (i)
largura da estrada (xi )
número de acidentes (yi )
7
xi = 35
i=1
7
x2i = 193.96
i=1
1
2.6
92
7
2
3.0
85
3
4.4
78
xi yi = 2215
i=1
4
5.0
81
7
5
6.2
54
yi = 483
i=1
Considere que ambas as variáveis em análise têm comportamento Normal.
6
6.6
53
7
7.2
40
7
yi2 = 35659.
i=1
[2.0] (a) Recorrendo ao modelo de regressão linear simples, estime o número de acidentes se a largura da
estrada for de 3.5 metros e comente a qualidade desta estimativa.
RESOLUÇÃO:
Se considerarmos a recta de regressão linear dada por
y = a + bx
obtêm-se
b=
2215 − 7 ×
35
7
193.96 − 7 ×
× 483
7
35 2 = −10.5485
7
5
e
a = 69 + 10.5485 × 5 = 121.7425
e a recta de regressão linear
y = 121.7425 − 10.5485x
Considerando x = 3.5, tem-se
y = 121.7425 − 10.5485 × 3.5 = 84.82275
número de acidentes
portanto para 3.5m de largura de estrada prevê-se a ocorrência de, aproximadamente, 85 acidentes.
Para analisar a qualidade da estimativa obtida construiu-se o diagrama de dispersão
100
90
80
70
60
50
40
30
20
10
0
0,0
1,0
2,0
3,0
4,0
5,0
6,0
7,0
8,0
largura da estrada
e calculou-se o coeficiente de correlação linear empírico,
2215 − 7 × 5 × 69
= −0.95
rXY = (193.96 − 7 × 52 ) (35659 − 7 × 692 )
A observação do diagrama de dispersão e o valor de rXY (próximo de −1) permitem concluir que
existe uma forte correlação linear negativa entre as variáveis aleatórias, X e Y , pelo que o modelo
de regressão linear se ajusta bem aos dados. Como o modelo usado para a previsão produz um bom
ajustamento e o facto de o valor considerado para x, 3.5, ser um valor dentro dos considerados na
amostra pode concluir-se que a qualidade da estimativa é boa.
[1.5] (b) Teste, ao nível de significância de 5%, a hipótese da variabilidade da largura das estradas da cidade
de Setúbal ser superior a 2 metros.
RESOLUÇÃO:
Pretende fazer-se um teste ao desvio padrão:
H0 : σ ≤ 2
H0 : σ 2 ≤ 4
⇔
com α = 0.05
H1 : σ > 2
H1 : σ 2 > 4
para tal vai recorrer-se à variável Fulcral,
População Normal
µ desconhecido
X2 =
(n − 1) S 2
∼ χ2(n−1)
σ2
Vamos construir a região crítica e tomar uma decisão usando a estatística de teste X 2 :
X 2 ∼ χ2(6)
x2n−1;1−α = x26;0.95 = 12.6
e
neste caso, tem-se na escala do χ2 que RC = [12.6; +∞[.
6
Calculando a variância amostral corrigida
s2 =
193.96 − 7 × 52
= 3.16
6
A estimativa da estatística de teste X 2 , sob H0 , é
X 2∗ =
6 × 3.16
= 4.74 ∈
/ RC
4
Face à amostra recolhida e sob um nível de significância de 5%, não há motivo para rejeitar H0 . A
decisão a tomar será a de não rejeitar H0 , isto é, admite-se que a variabilidade da largura de estradas
é no máximo de 2m.
[1.5] (c) Indique, justificando, qual o erro cometido no teste anterior se a verdadeira variabilidade for de 3.8
metros.
RESOLUÇÃO:
O erro cometido será o erro de 2a espécie, isto é,
β = P [não rejeitar H0 | H0 Falsa ] = P S 2 ∈ RA | H1 Verdadeira = P S 2 < k σ2 > 4
Para calcular este erro vamos ter de passar para a escala dos dados, isto é, k é o limite inferior da
RC e pode ser calculado do seguinte modo
6k
= 12.6 ⇔ k = 8.4
4
Assim, o erro cometido se σ = 3.8 ⇔ σ2 = 14.44 é,
2
2
6 × 8.4
2
β (14.44) = P S < 8.4 σ = 14.44 = P X <
= P X 2 < 3.49 = 0.25
14.44
Fim.
7
Download