Instituto Brasileiro de Geografia e Estatística Concurso Público – Edital 03/2008 Prova discursiva Área de conhecimento de Estatística Questão 1 (valor: 10 pontos): Em um teste de múltipla escolha, a probabilidade de um aluno saber a resposta é p. Havendo m escolhas, se ele sabe a resposta ele responde corretamente com probabilidade 1; se não sabe, ele responde corretamente com 1 . probabilidade m a) Dado que a pergunta foi respondida corretamente, qual a probabilidade que ele soubesse a resposta? b) Calcule o limite da probabilidade obtida no item a) quando m → ∞ com p fixo. De forma sucinta e clara, interprete o resultado obtido. Questão 2 (valor: 15 pontos): O número de acidentes que ocorrem em uma certa fábrica em uma semana é uma variável aleatória com média µ e variância σ2. Os números de indivíduos feridos nos diferentes acidentes são independentes e identicamente distribuídos com média ξ e variância τ2 e são independentes do número de acidentes. Determine a média e a variância do número de indivíduos feridos em uma semana. Questão 3 (valor: 10 pontos): Suponha que Xn tem distribuição binomial com parâmetros (n, pn), e suponha que npn = λn → λ > 0 . Prove, usando função característica, que Xn converge em distribuição para X com distribuição de Poisson com n ⎛ a ⎞ parâmetro λ. (Nota: Supondo que an → a então ⎜1 + n ⎟ → e a ). n ⎠ ⎝ Questão 4 (valor: 15 pontos): Suponha que X tenha distribuição simétrica e suponha ainda que existam todos os momentos necessários. a) Mostre que X e X 2 são dependentes, porém não correlacionadas. b) Ache a distribuição conjunta de X e X 2 se a distribuição de X estiver concentrada nos pontos 0, ± 1, ± 2, ± 3 com probabilidades 1 . 7 c) Prove que X e f(X) são não correlacionadas se f for par. 1 www.estrategiaconcursos.com.br Questão 5 (valor: 10 pontos): Seja X uma variável aleatória com valores x = −1, 0, 1 e tendo função de probabilidade f ( x;θ ) , definida para cada θ = 0, 1, 2 por: θ 0 x -1 0 1 1 0.2 0.3 0.5 2 0.3 0.4 0.3 0.4 0.3 0.3 a) Ache o estimador de máxima verossimilhança de θ. b) Determine o teste da razão de verossimilhança para testar H 0 : θ = 1 contra H1 : θ = 0 ou 2 ao nível de 0,3. Questão 6 (valor: 10 pontos): Vinte e quatro alunos em treinamento foram aleatoriamente divididos em três grupos de 8. Cada grupo aprendeu um tipo diferente de editor de texto. No final do treinamento, todos os alunos receberam a mesma tarefa e o tempo necessário para completá-la foi registrado. O objetivo era comparar o tempo médio para os três editores de texto. a) Qual é a unidade experimental? b) O estudo é experimental ou observacional? c) Identifique o fator estudado e os seus níveis. O fator é fixo ou aleatório? d) Qual é a resposta do estudo? e) Apresente o modelo de análise de variância para esta situação e as suposições associadas a ele. f) Estabeleça as hipóteses que se deseja testar de acordo com o modelo apresentado no item (e). g) A seguinte tabela de Análise de Variância foi obtida para o experimento descrito: Fonte Tratamento Erro Total SQ 18335 166403 181738 gl 2 21 23 QM 9167,5 7923,9 F0 1,16 Valor-p 0,33 Se as suposições estabelecidas do modelo forem válidas, qual é a sua conclusão? Questão 7 (valor: 15 pontos): Deseja-se comparar duas populações de tempos de vida. Uma amostra de tamanho n, t1, ...., tn, foi obtida da população 1, que tem distribuição exponencial com média α. Uma amostra de tamanho m, s1,..., sm, foi obtida da população 2, que tem distribuição exponencial com média α + ∆. a) Estabeleça as hipóteses que se deseja testar. 2 www.estrategiaconcursos.com.br b) Apresente a função de log-verossimilhança para θ = (α , ∆ ) t . Ou seja, encontre l (θ ) = log L(θ ) . c) Se n = m = 100 , as somas dos valores observados para as populações 1 e 2, respectivamente, são: 100 ∑t i =1 i = 110 ; 100 ∑s i =1 i = 90 e () () l θˆ = log L θˆ = −198. Faça o teste da razão de verossimilhança para as hipóteses estabelecidas no item (a). Conclua utilizando um nível de significância de 0,05 e sabendo que o valor da distribuição qui-quadrado com um grau de liberdade neste nível é 3,84. Questão 8 (valor: 15 pontos): Uma pesquisa tem como população alvo os jovens de 15 anos completos de idade residentes no Estado do Rio de Janeiro que estejam matriculados e freqüentando escola no mês de abril durante o ano letivo de 2009. Uma pesquisa está sendo planejada para investigar uma amostra desta população, visando estimar uma série de indicadores de interesse. Para fins de discussão de opções para o planejamento, considera-se que o principal parâmetro alvo de interesse é a proporção de jovens desta população que sofreram ao menos uma reprovação ao longo de sua vida escolar (denomina-se esta proporção por P). a) Supondo que existisse um cadastro completo e atualizado desta população, uma amostra aleatória simples sem reposição de n = 1500 jovens poderia ser selecionada e, a proporção amostral de jovens que sofreram ao menos uma reprovação (denominada p) poderia ser utilizada para estimar a correspondente proporção populacional. Especifique qual seria o erro máximo provável da estimativa para um nível de confiança de 95% considerando que informações sobre o parâmetro P em ocasiões anteriores situam esta proporção entre 5% e 30%. b) Na hipótese de não haver um cadastro de jovens de 15 anos de idade matriculados e freqüentando escola, mas de posse de um cadastro completo das escolas existentes no estado, um planejamento alternativo da amostra poderia ser selecionar uma amostra de m escolas e, em cada uma destas escolas obter uma lista dos alunos da população de interesse. De tais listas, selecionar k alunos de tal modo que o tamanho total da amostra seja igual a n = m × k . O estatístico encarregado do planejamento propôs tomar k = 16 . Se a seleção de escolas é feita por amostragem aleatória simples, e sob a hipótese de que o número de jovens de 15 anos por escola é aproximadamente constante, o efeito de usar a amostragem conglomerada descrita é multiplicar a variância da estimativa da proporção por um fator igual a 1 + (k − 1)ρ , onde ρ é a correlação intraclasse do indicador de ter sofrido ao menos uma reprovação para jovens da mesma escola. Supondo agora que não se conhece o intervalo de variação da proporção populacional P e, sabendo que a correlação intraclasse é da ordem de 0,10 indique o tamanho da amostra de escolas (m) necessário para que o erro máximo provável para a estimativa do parâmetro P seja de 2% com nível de confiança de 95%. 3 www.estrategiaconcursos.com.br