INSTITUTO SUPERIOR DE ECONOMIA E GESTÃO Estatística II - Licenciatura em Gestão Época de Recurso - Parte prática – (14 valores) – 24/01/2011 Nome: ____________________________________________________________________Nº _____________ Espaço reservado para a classificação (não escrever aqui) Cot. a) I b) 10 15 ------- Soma 25 Classif. ------- Cot. Classif. a) II b) 15 15 ------- ------- Cot. Classif. Teór. Nota Cot. Classif. a) III 30 15 --------- --------- 15 a) b) IV c) d) e) 15 15 15 15 10 70 I Considere os seguintes estimadores para Ѳ, média de uma população de Bernoulli, obtidos a partir de uma amostra aleatória de dimensão n: T ∑ ; T ∑ a) Verifique se T e T são estimadores centrados para Ѳ. 1 b) Dos dois estimadores, qual o mais eficiente. Justifique. II Numa amostra aleatória de 100 eleitores de certo aglomerado populacional, 38 revelaram tencionar votar no candidato A nas próximas eleições. a) Utilizando um nível de significância de 0,01, ensaie a hipótese de a percentagem dos que tencionam votar nesse candidato ser de 40% contra a alternativa de ser inferior. 2 b) Qual a probabilidade de, na alínea anterior, ter tomado uma decisão errada, se de facto essa percentagem for de 30%? III a) O gestor de recursos humanos de certa empresa pretende averiguar se o nível de absentismo está ou não relacionado com o facto de o trabalhador ser do sexo feminino ou masculino. Para tal, recolheu uma amostra aleatória de 100 pessoas, a qual forneceu os resultados constantes do quadro abaixo. Nível/ Sexo Homens Mulheres 20 15 Baixo 15 20 Médio 5 25 Elevado Em face destes resultados, e com um nível de significância de 0,05, o que pode o gestor concluir? 3 IV Um investigador pretende formular um modelo para explicar o salário dos licenciados de Portugal (variável SAL). Como variáveis explicativas propõe as seguintes: EXP – Anos de experiência no mercado de trabalho de um licenciado; EDUC – Anos de educação académica de um licenciado; IDADE – idade do licenciado; FILHOS – número de filhos de um licenciado. Representando as variáveis em logaritmos pelo seu nome precedido de um L, o modelo de regressão linear proposto é o seguinte: LSAL Com base em LSAL β β β β β β 321 observações obteve-se a seguinte regressão estimada: 4,359 0,213 (0,013) 0,0227 (0,005) 0,972065 ; 0,533 (0,031) erro 0,0045 (0,001) padrão da regressão 0,008 (0,009) 0,17956 a) Interprete o coeficiente de determinação e estude (ao nível de significância de 5%) a significância das variáveis explicativas em conjunto; 4 b) Interprete as estimativas obtidas para os coeficientes das variáveis experiência e filhos (β2 e β6) e, para um nível de significância de 10%, investigue a significância estatística de cada um destes coeficientes; c) Alguns especialistas afirmam que a única variável relevante para a explicação do salário de um licenciado em Portugal é a relativa à sua experiência. Estimado o correspondente modelo, obteve-se a seguinte regressão estimada: LSAL 8,322 0,306 0,053139 O que pode concluir acerca da afirmação destes especialistas (considere uma dimensão do teste de 5%)? 5 d) Suspeitando-se de que poderiam não ser válidas algumas das hipóteses do MRL, realizou-se a regressão a seguir indicada e onde RES representa os resíduos do modelo inicial e os valores previstos pelo modelo para o logaritmo do salário: 0,096 0,021 L 0,002 L 0,015022 Explicite o objectivo da regressão presente acima e, em face dos resultados, o que pode concluir? e) Tendo em consideração o modelo inicial, preveja o valor do salário de um certo licenciado com 5 anos de experiência, 9 anos de educação académica, 30 anos de idade e um filho. 6 INSTITUTO SUPERIOR DE ECONOMIA E GESTÃO Estatística II - Licenciatura em Gestão Época de Recurso – Parte teórica – (6 valores) - 24/01/2011 Nome:______________________________________________________________________Nº____________ 1. Questões de Verdadeiro/Falso (2 valores). Para cada afirmação, assinale se esta é verdadeira (V) ou falsa (F). Uma resposta certa vale 0,25 e uma resposta errada penaliza em idêntico valor. V F Um intervalo de confiança a 95% para um parâmetro é uma realização particular de um intervalo aleatório de probabilidade igual a 0,95. Seja ( X 1 , X 2 ,..., X n ) uma amostra aleatória de uma população X de média µ. Então T = X 1 pode ser tomado como estimador centrado de µ. No teste bilateral de uma hipótese estatística sobre a média de uma população normal existe uma região crítica óptima (ou mais potente). No teste de ajustamento de uma variável contínua, : ~ , a não rejeição da hipótese aparentada, : ; 1,2, … ; | , implica a não rejeição de H0. No modelo de regressão linear (MRL), para testar uma restrição linear dos coeficientes de regressão é indiferente usar a estatística T~t(n-k) ou a F~F(1,n-k). Se no MRL não se verifica a hipótese Cov (u t , u s | X ) = 0 ; t , s = 1,2,..., n ; t ≠ s , então os estimadores dos mínimos quadrados dos coeficientes de regressão estão correlacionados. Num modelo de regressão linear, com dados seccionais, não pode existir autocorrelação. No modelo y t = β 1 + β 2 xt 2 + β 3 d t + u t , a verificar as hipóteses básicas e onde d t é uma variável artificial, β 3 é o efeito da presença da característica sobre o termo independente. 2. Questões de resposta múltipla (2 valores). Escolha a alternativa correcta com um X. Uma resposta certa vale 0,5 valores e uma resposta errada penaliza em 0,25 valores. a) Nos testes de hipóteses paramétricas desempenha papel importante: [ ] A desigualdade de Frechet-Crámer-Rao. [ ] O Lema de Neyman-Pearson. [ ] O Teorema de Gauss-Markov. b) Pretendendo-se testar, no MRL a verificar as hipóteses H1-H6, a hipótese do coeficiente de regressão ser negativo, as hipóteses nula e alternativa são: [] [] [] : 0 e : 0 : 0 e : 0 : 0 e : 0 c) Os estimadores dos mínimos quadrados dos coeficientes de regressão no MRL deixam de ser BLUE quando: [ ] Não se verifica a hipótese da normalidade (H6). [ ] Existe multicolinearidade (não perfeita). [] Existe heterocedasticidade. 7 d) Para reduzir a amplitude de um intervalo de confiança para a média de uma população normal de variância conhecida pode diminuir-se: [ ] A dimensão da amostra mantendo-se fixo o grau de confiança. [ ] O grau de confiança mantendo-se fixa a dimensão da amostra. [ ] A variância da população mantendo fixos o grau de confiança e a dimensão da amostra. 3. Perguntas de desenvolvimento (2 valores) – Cada resposta certa vale 1 valor. a) Obtenha o estimador de máxima verosimilhança para o parâmetro 1 ; 1,2, … ; 0 1. da população ~ | b) Considere o MRL y = β1 + β 2 x2 + β 3 x3 + ... + β k xk + u a verificar as hipóteses H1-H6 e suponha que pretendia testar a seguinte restrição linear: 2 =1. Obtenha o correspondente modelo restrito e diga como procederia para realizar o referido teste. 8