Edital 03/2008

Propaganda
Instituto Brasileiro de Geografia e Estatística
Concurso Público – Edital 03/2008
Prova discursiva
Área de conhecimento de Estatística
Questão 1 (valor: 10 pontos): Em um teste de múltipla escolha, a probabilidade de um
aluno saber a resposta é p. Havendo m escolhas, se ele sabe a resposta ele responde
corretamente com probabilidade 1; se não sabe, ele responde corretamente com
1
.
probabilidade
m
a) Dado que a pergunta foi respondida corretamente, qual a probabilidade que ele
soubesse a resposta?
b) Calcule o limite da probabilidade obtida no item a) quando m → ∞ com p fixo. De
forma sucinta e clara, interprete o resultado obtido.
Questão 2 (valor: 15 pontos): O número de acidentes que ocorrem em uma certa
fábrica em uma semana é uma variável aleatória com média µ e variância σ2. Os
números de indivíduos feridos nos diferentes acidentes são independentes e
identicamente distribuídos com média ξ e variância τ2 e são independentes do número
de acidentes. Determine a média e a variância do número de indivíduos feridos em uma
semana.
Questão 3 (valor: 10 pontos): Suponha que Xn tem distribuição binomial com
parâmetros (n, pn), e suponha que npn = λn → λ > 0 . Prove, usando função
característica, que Xn converge em distribuição para X com distribuição de Poisson com
n
⎛ a ⎞
parâmetro λ. (Nota: Supondo que an → a então ⎜1 + n ⎟ → e a ).
n ⎠
⎝
Questão 4 (valor: 15 pontos): Suponha que X tenha distribuição simétrica e suponha
ainda que existam todos os momentos necessários.
a) Mostre que X e X 2 são dependentes, porém não correlacionadas.
b) Ache a distribuição conjunta de
X e X 2 se a distribuição de X estiver
concentrada nos pontos 0, ± 1, ± 2, ± 3 com probabilidades 1 .
7
c) Prove que X e f(X) são não correlacionadas se f for par.
1
www.estrategiaconcursos.com.br
Questão 5 (valor: 10 pontos): Seja X uma variável aleatória com valores x = −1, 0, 1 e
tendo função de probabilidade f ( x;θ ) , definida para cada θ = 0, 1, 2 por:
θ
0
x
-1
0
1
1
0.2
0.3
0.5
2
0.3
0.4
0.3
0.4
0.3
0.3
a) Ache o estimador de máxima verossimilhança de θ.
b) Determine o teste da razão de verossimilhança para testar
H 0 : θ = 1 contra H1 : θ = 0 ou 2
ao nível de 0,3.
Questão 6 (valor: 10 pontos): Vinte e quatro alunos em treinamento foram
aleatoriamente divididos em três grupos de 8. Cada grupo aprendeu um tipo diferente
de editor de texto. No final do treinamento, todos os alunos receberam a mesma tarefa
e o tempo necessário para completá-la foi registrado. O objetivo era comparar o tempo
médio para os três editores de texto.
a) Qual é a unidade experimental?
b) O estudo é experimental ou observacional?
c) Identifique o fator estudado e os seus níveis. O fator é fixo ou aleatório?
d) Qual é a resposta do estudo?
e) Apresente o modelo de análise de variância para esta situação e as suposições
associadas a ele.
f) Estabeleça as hipóteses que se deseja testar de acordo com o modelo
apresentado no item (e).
g) A seguinte tabela de Análise de Variância foi obtida para o experimento descrito:
Fonte
Tratamento
Erro
Total
SQ
18335
166403
181738
gl
2
21
23
QM
9167,5
7923,9
F0
1,16
Valor-p
0,33
Se as suposições estabelecidas do modelo forem válidas, qual é a sua conclusão?
Questão 7 (valor: 15 pontos): Deseja-se comparar duas populações de tempos de
vida. Uma amostra de tamanho n, t1, ...., tn, foi obtida da população 1, que tem
distribuição exponencial com média α. Uma amostra de tamanho m, s1,..., sm, foi obtida
da população 2, que tem distribuição exponencial com média α + ∆.
a) Estabeleça as hipóteses que se deseja testar.
2
www.estrategiaconcursos.com.br
b) Apresente a função de log-verossimilhança para θ = (α , ∆ ) t . Ou seja, encontre
l (θ ) = log L(θ ) .
c) Se n = m = 100 , as somas dos valores observados para as populações 1 e 2,
respectivamente, são:
100
∑t
i =1
i
= 110 ;
100
∑s
i =1
i
= 90
e
()
()
l θˆ = log L θˆ = −198.
Faça o teste da razão de verossimilhança para as hipóteses estabelecidas no item (a).
Conclua utilizando um nível de significância de 0,05 e sabendo que o valor da
distribuição qui-quadrado com um grau de liberdade neste nível é 3,84.
Questão 8 (valor: 15 pontos): Uma pesquisa tem como população alvo os jovens de
15 anos completos de idade residentes no Estado do Rio de Janeiro que estejam
matriculados e freqüentando escola no mês de abril durante o ano letivo de 2009. Uma
pesquisa está sendo planejada para investigar uma amostra desta população, visando
estimar uma série de indicadores de interesse. Para fins de discussão de opções para o
planejamento, considera-se que o principal parâmetro alvo de interesse é a proporção
de jovens desta população que sofreram ao menos uma reprovação ao longo de sua
vida escolar (denomina-se esta proporção por P).
a) Supondo que existisse um cadastro completo e atualizado desta população, uma
amostra aleatória simples sem reposição de n = 1500 jovens poderia ser
selecionada e, a proporção amostral de jovens que sofreram ao menos uma
reprovação (denominada p) poderia ser utilizada para estimar a correspondente
proporção populacional. Especifique qual seria o erro máximo provável da
estimativa para um nível de confiança de 95% considerando que informações
sobre o parâmetro P em ocasiões anteriores situam esta proporção entre 5% e
30%.
b) Na hipótese de não haver um cadastro de jovens de 15 anos de idade
matriculados e freqüentando escola, mas de posse de um cadastro completo das
escolas existentes no estado, um planejamento alternativo da amostra poderia
ser selecionar uma amostra de m escolas e, em cada uma destas escolas obter
uma lista dos alunos da população de interesse. De tais listas, selecionar k
alunos de tal modo que o tamanho total da amostra seja igual a n = m × k . O
estatístico encarregado do planejamento propôs tomar k = 16 . Se a seleção de
escolas é feita por amostragem aleatória simples, e sob a hipótese de que o
número de jovens de 15 anos por escola é aproximadamente constante, o efeito
de usar a amostragem conglomerada descrita é multiplicar a variância da
estimativa da proporção por um fator igual a 1 + (k − 1)ρ , onde ρ é a correlação
intraclasse do indicador de ter sofrido ao menos uma reprovação para jovens da
mesma escola. Supondo agora que não se conhece o intervalo de variação da
proporção populacional P e, sabendo que a correlação intraclasse é da ordem de
0,10 indique o tamanho da amostra de escolas (m) necessário para que o erro
máximo provável para a estimativa do parâmetro P seja de 2% com nível de
confiança de 95%.
3
www.estrategiaconcursos.com.br
Download