INSTITUTO POLITÉCNICO DE SETÚBAL ESCOLA SUPERIOR DE TECNOLOGIA DE SETÚBAL DEPARTAMENTO DE MATEMÁTICA PROBABILIDADES E ESTATÍSTICA Exame Época Normal SEMESTRE PAR 2008/2009 Data: 11 de Julho de 2009 Duração: 3h Tópicos de Resolução Questões: 1. Num lançamento de um dado viciado (numerado de 1 a 6), a probabilidade de sair qualquer número ímpar é o dobro da probabilidade de sair qualquer número par. [1.0] (a) Indique, justificando, a função de probabilidade da variável aleatória que representa o número que sai no lançamento desse dado. RESOLUÇÃO: Sejam os acontecimentos A (sair número par no lançamento de um dado viciado) e B (sair número ímpar no lançamento de um dado viciado), tais que P (A) = p e P (B) = 2p. Deste modo tem-se P ({2}) = P ({4}) = P ({6}) = p P ({1}) = P ({3}) = P ({5}) = 2p Como 1 9 Tem-se para X (valor obtido no lançamento de um dado viciado) a seguinte função de probabilidade: 2 x ∈ {1, 3, 5} 9, 1 f (x) = x ∈ {2, 4, 6} 9, 0, noutros casos P ({1}) + P ({2}) + P ({3}) + P ({4}) + P ({5}) + P ({6}) = 1 ⇔ 3p + 6p = 1 ⇔ p = [0.5] (b) Calcule a probabilidade de num lançamento desse dado sair um número que seja um quadrado perfeito. RESOLUÇÃO: De 1 a 6 os quadrados perfeitos são 1 e 4, pelo que se pretende P ({1} ∪ {4}): P ({1} ∪ {4}) = P ({1}) + P ({4}) = 2 1 1 + = 9 9 3 2. A procura diária de refrigerantes (em centenas de litros) num supermercado junto à praia é uma variável aleatória contínua, X, com a seguinte função de distribuição: 0 , x<0 x2 , 0≤x≤1 3 F (x) = . x2 1 − 6 +x− 2 , 1<x≤3 1 , x>3 [1.0] (a) Qual a quantidade de refrigerante que deve ser diariamente colocada nas prateleiras do supermercado para que a procura seja satisfeita em 95% dos dias? RESOLUÇÃO: Supondo que 1 < x ≤ 3, P (X ≤ x) = 0.95 ⇔ − x2 1 + x − = 0.95 ⇔ x2 − 6x + 8.7 = 0 ⇔ 6 2 √ 36 − 4 × 8.7 ⇔ x = 2.45 ∨ x = 3.55 2 Então a única solução válida no intervalo considerado é x = 2.45 centenas de litros. Nos outros intervalos nunca se obtém uma solução válida. ⇔ x= 6± [2.0] (b) Calcule o desvio padrão da procura diária de refrigerantes neste supermercado. RESOLUÇÃO: 2x ,0≤x≤1 3 x f (x) = F (x) = −3 + 1 , 1 < x ≤ 3 0 , caso contrário E [X] = +∞ xf (x) dx = E X2 = = 2x2 dx + 3 0 −∞ = 1 3 1 3 3 3 2 x 2x x x2 − + x dx = + − + = 3 9 0 9 2 1 1 9 1 1 4 2 −3+ + − = 9 2 9 2 3 +∞ 2 x f (x) dx = 1 2x3 dx + 3 0 −∞ 3 1 − 4 1 4 3 x3 x x x3 + x2 dx = + − + = 3 6 0 12 3 1 1 81 1 1 13 − +9+ − = 6 12 12 3 6 Logo o desvio padrão da procura diária de refrigerantes é 2 13 4 2 2 σX = V [X] = E [X ] − E [X] = − = 0.624 centenas de litros. 6 3 3. Numa fábrica que produz ipods sabe-se que o número de avarias por ano na máquina que produz os circuitos para os ipods segue uma distribuição de Poisson de variância 1.2. [1.5] (a) Calcule a probabilidade da máquina ter duas ou mais avarias num ano em que se sabe que vai haver avarias. RESOLUÇÃO: Considere X − número de avarias por ano na máquina que produz os circuitos para os ipods tal que V [X] = 1.2 = λ, logo X ∼ P (1.2) . Assim: P (X ≥ 2 / X > 0) = = P (X ≥ 2 ∧ X > 0) P (X ≥ 2) 1 − P (X < 2) = = = P (X > 0) P (X > 0) 1 − P (X ≤ 0) 1 − P (X ≤ 1) 1 − 0.6626 = = 0.4828 1 − P (X ≤ 0) 1 − 0.3012 (b) Você acabou de comprar um ipod que tem tempo de vida (em anos) dado por uma distribuição exponencial de parâmetro θ. A probabilidade deste durar pelo menos 3 anos é e−1.5 . [1.5] i. Determine a probabilidade do seu ipod funcionar menos de 1 ano. RESOLUÇÃO: Considere Y − tempo (em anos) de vida de um ipod 2 Y ∼ Exp (θ) F (y) = 0 y 1 − e− θ , y<0 , y≥0 Como 3 3 P (Y ≥ 3) = e−1.5 ⇔ 1 − P (Y < 3) = e−1.5 ⇔ 1 − (1 − e− θ ) = e−1.5 ⇔ e− θ = e−1.5 ⇔ θ = 2. Assim Y ∼ Exp (2) e F (y) = logo 0 y 1 − e− 2 , y<0 , y≥0 1 P (Y < 1) = P (Y ≤ 1) = 1 − e− 2 = 0.3935 [1.5] ii. Suponha que o ipod que comprou vem de um lote de produção de 4000 ipods. Determine, através de um método de aproximação adequado, a probabilidade de, ao fim de um ano, continuarem a funcionar pelo menos 2500 desses aparelhos. RESOLUÇÃO: W − número de ipods, em 4000, que funcionam ao fim de um ano n = 4000 Como p = P (Y > 1) = 1 − P (Y ≤ 1) = 1 − 0.3935 = 0.6065 W ∼ B (4000, 0.6065) n = 4000 ≥ 30 np = 4000 × 0.6065 = 2426 > 5 vamos aproximar a Binomial à Normal nq = 4000 × 0.3935 = 1574 > 5 W ∼ B (4000; 0.6065) → W ∼ N (2426; 30.8971) → Z = W − 2426 ∼ N (0; 1) 30.8971 Logo, PB (W ≥ 2500) = 1 − PB (W < 2500) = 1 − PB (W ≤ 2499) ≈ 1 − PN (W < 2499.5) = = 1 − PN 2499.5 − 2426 Z< = 1 − Φ (2.38) = 1 − 0.9913 = 0.0087 30.8971 4. Suponha que a variável aleatória que representa o número de acidentes por ano em Setúbal tem distribuição Normal de valor médio µ e variância 324 e suponha que foi recolhida uma amostra aleatória de dimensão 7. [1.5] (a) Verifique se os acontecimentos A = X > µ − 10 e B = X > µ são acontecimentos independentes. RESOLUÇÃO: √ População: X − número de acidentes por ano em Setúbal X ∼ N µ, 324 Amostra: n=7 Tem-se uma População Normal e σ = √ 324 = 18 conhecido logo Z = X−µ 18 √ 7 ∼ N (0, 1) . A e B são acontecimentos independentes sse P (A ∩ B) = P (A) × P (B) µ − 10 − µ P (A) = P X > µ − 10 = P Z > = P (Z > −1.47) = 18 √ 7 = 1 − Φ (−1.47) = 1 − (1 − Φ (1.47)) = Φ (1.47) = 0.9292 P (B) = P X > µ = P Z> µ−µ 18 √ 7 = P (Z > 0) = 0.5 P (A ∩ B) = P X > µ − 10 ∧ X > µ = P X > µ = P (B) = 0.5 Como P (A)×P (B) = 0.9292×0.5 = 0.4646 = P (A ∩ B), A e B não são acontecimentos independentes. 3 (b) Suponha que, da amostra aleatória recolhida, obteve-se: 7 7 xi = 469 i=1 i=1 (xi − x)2 = 2334. [1.5] i. Deduza, calcule e interprete um intervalo de confiança a 95% para o número médio de acidentes por ano em Setúbal. RESOLUÇÃO: Pretende-se um intervalo de confiança para µ a 95%. População Normal Como já vimos na alínea anterior, σ conhecido tem-se Z = X−µ ∼ N (0, 1) σ √ n Vamos começar por deduzir o intervalo de confiança: X −µ P z α2 < Z < z1− α2 = 1 − α ⇔ P −z1− α2 < σ < z1− α2 = 1 − α ⇔ √ n σ σ α α =1−α ⇔ P X − z1− 2 √ < µ < X + z1− 2 √ n n concretizando vem 1 − α = 0.95 ⇔ α = 0.05 ⇔ α α = 0.025 ⇔ 1 − = 0.975 2 2 z0.975 = 1.96 isto é 18 18 P (−1.96 < Z < 1.96) = 0.95 ⇔ P X − 1.96 × √ < µ < X + 1.96 × √ = 0.95 7 7 Logo o intervalo de confiança a 95% para µ é: σ σ x − z1− α2 √ ; x + z1− α2 √ n n concretizando fica 469 18 469 18 − 1.96 × √ ; + 1.96 × √ = ]53.665; 80.335[ 7 7 7 7 Para 95% de confiança e com base na amostra, o número médio de acidentes por ano em Setúbal está compreendido entre 53.665 e 80.335. [1.5] ii. Se pretendesse reduzir a amplitude do intervalo de confiança anterior para 17.5 que possibilidades é que tinha? Justifique. RESOLUÇÃO: A amplitude do I.C. é dada por: σ σ σ ∆I.C. = x + z1− α2 √ − x − z1− α2 √ = 2z1− α2 √ n n n Pretende-se σ 18 ∆I.C. = 17.5 ⇔ 2z1− α2 √ = 17.5 ⇔ 2z1− α2 √ = 17.5 n n Para reduzir a amplitude é necessário diminuir o grau de confiança ou aumentar a dimensão da amostra. Suponhamos que vamos diminuir o grau de confiança sem alterar a dimensão da amostra, então vem 18 α 2z1− α2 √ = 17.5 ⇔ z1− α2 = 1.29 ⇔ 1 − = 0.9015 ⇔ 1 − α = 0.803 2 7 4 É necessário considerar um grau de confiança de 80.3% para reduzir a amplitude do I.C. para 17.5. Suponhamos que vamos aumentar a dimensão da amostra sem alterar o grau de confiança, então vem 18 2 × 1.96 × √ = 17.5 ⇔ n = 16.257 ⇒ n = 17 n É necessário recolher uma amostra de dimensão 17 para reduzir a amplitude do I.C. para 17.5. Também existe a possibilidade de tentar conjugar em simultâneo a diminuição do grau de confiança e o aumento da dimensão da amostra de modo a obter o que se pretende. [1.5] 5. Seja θ∗ um estimador enviesado de um parâmetro θ. Considerando que o seu enviesamento é dado por k, prove que 2 V [θ∗ ] = E (θ∗ − θ) − k2 . RESOLUÇÃO: θ∗ um estimador enviesado de θ, com enviesamento igual k, isto é E [θ ∗ ] − θ = k ⇔ E [θ∗ ] = θ + k 2 Queremos provar que V [θ∗ ] = E (θ∗ − θ) − k2 . 2 2 2 V [θ ∗ ] = E (θ∗ − E [θ∗ ]) = E (θ∗ − (θ + k)) = E ((θ ∗ − θ) − k) = 2 2 = E (θ∗ − θ) − 2k (θ∗ − θ) + k2 = E (θ∗ − θ) − 2kE [θ∗ ] + 2kθ + k2 = 2 2 = E (θ∗ − θ) − 2k (θ + k) + 2kθ + k2 = E (θ ∗ − θ) − 2kθ − 2k2 + 2kθ + k2 = 2 = E (θ∗ − θ) − k2 6. As observações que se seguem dizem respeito à largura da estrada, em metros, em sete zonas da cidade de Setúbal e ao número de acidentes por ano nessas zonas. zonas (i) largura da estrada (xi ) número de acidentes (yi ) 7 xi = 35 i=1 7 x2i = 193.96 i=1 1 2.6 92 7 2 3.0 85 3 4.4 78 xi yi = 2215 i=1 4 5.0 81 7 5 6.2 54 yi = 483 i=1 Considere que ambas as variáveis em análise têm comportamento Normal. 6 6.6 53 7 7.2 40 7 yi2 = 35659. i=1 [2.0] (a) Recorrendo ao modelo de regressão linear simples, estime o número de acidentes se a largura da estrada for de 3.5 metros e comente a qualidade desta estimativa. RESOLUÇÃO: Se considerarmos a recta de regressão linear dada por y = a + bx obtêm-se b= 2215 − 7 × 35 7 193.96 − 7 × × 483 7 35 2 = −10.5485 7 5 e a = 69 + 10.5485 × 5 = 121.7425 e a recta de regressão linear y = 121.7425 − 10.5485x Considerando x = 3.5, tem-se y = 121.7425 − 10.5485 × 3.5 = 84.82275 número de acidentes portanto para 3.5m de largura de estrada prevê-se a ocorrência de, aproximadamente, 85 acidentes. Para analisar a qualidade da estimativa obtida construiu-se o diagrama de dispersão 100 90 80 70 60 50 40 30 20 10 0 0,0 1,0 2,0 3,0 4,0 5,0 6,0 7,0 8,0 largura da estrada e calculou-se o coeficiente de correlação linear empírico, 2215 − 7 × 5 × 69 = −0.95 rXY = (193.96 − 7 × 52 ) (35659 − 7 × 692 ) A observação do diagrama de dispersão e o valor de rXY (próximo de −1) permitem concluir que existe uma forte correlação linear negativa entre as variáveis aleatórias, X e Y , pelo que o modelo de regressão linear se ajusta bem aos dados. Como o modelo usado para a previsão produz um bom ajustamento e o facto de o valor considerado para x, 3.5, ser um valor dentro dos considerados na amostra pode concluir-se que a qualidade da estimativa é boa. [1.5] (b) Teste, ao nível de significância de 5%, a hipótese da variabilidade da largura das estradas da cidade de Setúbal ser superior a 2 metros. RESOLUÇÃO: Pretende fazer-se um teste ao desvio padrão: H0 : σ ≤ 2 H0 : σ 2 ≤ 4 ⇔ com α = 0.05 H1 : σ > 2 H1 : σ 2 > 4 para tal vai recorrer-se à variável Fulcral, População Normal µ desconhecido X2 = (n − 1) S 2 ∼ χ2(n−1) σ2 Vamos construir a região crítica e tomar uma decisão usando a estatística de teste X 2 : X 2 ∼ χ2(6) x2n−1;1−α = x26;0.95 = 12.6 e neste caso, tem-se na escala do χ2 que RC = [12.6; +∞[. 6 Calculando a variância amostral corrigida s2 = 193.96 − 7 × 52 = 3.16 6 A estimativa da estatística de teste X 2 , sob H0 , é X 2∗ = 6 × 3.16 = 4.74 ∈ / RC 4 Face à amostra recolhida e sob um nível de significância de 5%, não há motivo para rejeitar H0 . A decisão a tomar será a de não rejeitar H0 , isto é, admite-se que a variabilidade da largura de estradas é no máximo de 2m. [1.5] (c) Indique, justificando, qual o erro cometido no teste anterior se a verdadeira variabilidade for de 3.8 metros. RESOLUÇÃO: O erro cometido será o erro de 2a espécie, isto é, β = P [não rejeitar H0 | H0 Falsa ] = P S 2 ∈ RA | H1 Verdadeira = P S 2 < k σ2 > 4 Para calcular este erro vamos ter de passar para a escala dos dados, isto é, k é o limite inferior da RC e pode ser calculado do seguinte modo 6k = 12.6 ⇔ k = 8.4 4 Assim, o erro cometido se σ = 3.8 ⇔ σ2 = 14.44 é, 2 2 6 × 8.4 2 β (14.44) = P S < 8.4 σ = 14.44 = P X < = P X 2 < 3.49 = 0.25 14.44 Fim. 7