Estatística – Bacen – Área 4 Aula 00 – Demonstrativa Prof. Alexandre Lima Aula 00 Olá, tudo bem com você? Bem vindo às aulas de Estatística! Sou o professor Alexandre Lima. É uma imensa satisfação tê-lo como meu aluno. Como este é o nosso primeiro encontro, peço a sua licença para uma breve apresentação sobre a minha formação e a minha experiência como professor para concursos. Em seguida, tecerei alguns comentários preliminares que julgo serem pertinentes. Obtive o grau de Bacharel em Ciências Navais com ênfase em Eletrônica pela Escola Naval e os de Engenheiro Elétrico (com ênfase em Telecomunicações), Mestre e Doutor em Engenharia Elétrica (com ênfase em sistemas eletrônicos) pela Escola Politécnica da Universidade de São Paulo. Sou Auditor-Fiscal Tributário Municipal de São Paulo (“Fiscal do ISS/SP”) há mais de uma década. Em paralelo, exerço o magistério universitário e ministro aulas de Métodos Quantitativos, Estatística, Contabilidade e Raciocínio Lógico-Quantitativo para concursos. Este curso de Este curso de Estatística – Teoria e Exercícios – BACEN – Área 4 – Contabilidade e Finanças visa a abordagem de todo o conteúdo programático do último edital publicado pelo CESPE-UnB em 2013. Pretendo resolver junto com você muitas questões do CESPE que já caíram em concursos anteriores. Não obstante, é bom esclarecer que também costumo resolver, por razões didáticas, questões propostas por outras bancas. Observe que todas as questões incluídas nas aulas são cuidadosamente selecionadas para que o seu aproveitamento seja máximo. As soluções apresentadas são resultantes de um longo processo evolutivo, fruto de uma intensa interação com os alunos via forum web etc. O conteúdo programático proposto para este curso está detalhado a seguir. Ressalto que a aula 4, apesar de não abordar de forma direta nenhum item do edital, é necessária para o bom andamento do curso. Aula 0: Aula demonstrativa: modelo de exercícios comentados. Aula 1: 1 População e amostra. 2 Histograma e curvas de frequência. 3 Medidas de posição: média, moda, mediana e separatrizes. 4 Medidas de dispersão absoluta e relativa. Aula 2: 5 Probabilidade condicional, independência. www.pontodosconcursos.com.br | Prof. Alexandre Lima 1 Estatística – Bacen – Área 4 Aula 00 – Demonstrativa Prof. Alexandre Lima Aula 3: 6 Variável aleatória e funções de distribuição. 7 Distribuições de probabilidade, esperança matemática, momentos, esperança condicionais. Aula 4: Variável Aleatória Bivariada: função de probabilidade conjunta, função de probabilidade marginal, função de probabilidade condicional. Variáveis aleatórias independentes. Esperanças envolvendo duas ou mais variáveis: correlação e covariância. Introdução à Regressão Linear. Aula 5: 8 Lei dos grandes números. 9.2 Amostragem. Aula 6: 9 Inferência. 9.1 Estimação de parâmetros por ponto e intervalo. 9.3 Intervalo de confiança. Aula 7: 9.4. Testes de hipóteses. Aula 8: 10. Regressão simples. Aula 9: 10. Regressão múltipla. As dúvidas serão sanadas por meio do fórum do curso, ao qual todos os matriculados terão acesso. As críticas e/ou sugestões também poderão ser enviadas para a caixa postal [email protected]. O preguiçoso deseja e nada consegue, mas os desejos do diligente são amplamente satisfeitos, Provérbios 13.4. Nunca desista do seu sonho. Deus nos deu o livre arbítrio para que possamos fazer as nossas escolhas. Se você deseja ser aprovado em um concurso público, lute por isso, com dedicação e sacrifício, sempre visando ao seu objetivo. Desta forma, você conseguirá ser aprovado! Prof. Alexandre Lima Março/2015 www.pontodosconcursos.com.br | Prof. Alexandre Lima 2 Estatística – Bacen – Área 4 Aula 00 – Demonstrativa Prof. Alexandre Lima Exercícios Comentados Nota: nesta aula demonstrativa serão apresentadas apenas questões comentadas; contudo, o curso será de teoria e exercícios. (BACEN – Área 5/CESPE-UnB/2013) Com relação às medidas estatísticas de dispersão e à distribuição normal, julgue os itens que se seguem. 1. Considere que determinado fornecedor oferece um produto ao preço de $ 40. Nesse contexto, sabendo-se que o preço médio do mercado é $ 30 e supondo-se que os preços de mercado apresentem uma distribuição normal de probabilidade e que a quantidade padronizada (z) seja igual a 1,22, o desvio padrão dos preços é superior a $ 8. Resolução Dados: Preço: Preço médio: Preço padronizado: Sabemos que X=40 ´ X=30 z=1,22 ´ X− X . Logo, z= σ ´ X − X 40−30 σ= = =8,20>8 z 1,22 Item certo. GABARITO: C 2. Numa curva normal, há coincidência entre os valores da média e da mediana, mas não da moda da distribuição. Resolução A figura abaixo mostra que a curva normal tem a forma de um sino e que essa distribuição é simétrica. Deste modo, os valores da média, da mediana e da moda da normal são coincidentes. Item errado! www.pontodosconcursos.com.br | Prof. Alexandre Lima 3 Estatística – Bacen – Área 4 Aula 00 – Demonstrativa Prof. Alexandre Lima Densidade normal 0.45 0.4 0.35 f(x) 0.3 0.25 0.2 0.15 0.1 0.05 0 -3 -2 -1 0 1 2 3 x GABARITO: E (ANAC-Área 4/CESPE-UnB/2012) Com relação à teoria de probabilidades, julgue os itens que se seguem. 3. Se X é uma variável aleatória e se {X1, X2, ..., Xn} são observações aleatórias independentes dessa variável, então, com base na lei forte dos grandes números, é correto afirmar que, quando o tamanho amostral cresce (até o infinito), a média amostral tem distribuição normal de média = E(X). Resolução A lei forte dos grandes números diz que a média de uma sequência de variáveis aleatórias independentes com mesma distribuição converge, com probabilidade 1, para a média daquela distribuição 1. Ou seja, se X é uma variável aleatória com média = E[ X] e se {X1, X2, ..., Xn} são observações aleatórias independentes dessa variável, então, é certo que, X 1 X 2 ... X n n quando n (a média amostral converge para a média de X quando o tamanho da amostra tende a infinito) X Observe que a lei forte dos grandes números não afirma que, quando o tamanho amostral cresce (até o infinito), a média amostral tem distribuição 1 S. Ross, Probabilidade: Um Curso Moderno com Aplicações, 8ª edição, Porto Alegre: Bookman, 2010, pág472. www.pontodosconcursos.com.br | Prof. Alexandre Lima 4 Estatística – Bacen – Área 4 Aula 00 – Demonstrativa Prof. Alexandre Lima normal. A lei é omissa quanto à forma da distribuição da média amostral e é por isso que o item é errado. Quando o tamanho da amostra aumenta, independentemente da forma da distribuição da variável aleatória X, a distribuição da média amostral X aproxima-se cada vez mais de uma distribuição normal. Esse resultado, fundamental em Inferência Estatística, é assegurado pelo Teorema do Limite Central (TLC). Lei Forte dos Grandes Números: a média de uma sequência de variáveis aleatórias independentes com mesma distribuição converge, com probabilidade 1, para a média daquela distribuição. TLC: a soma de um grande número de variáveis aleatórias independentes tem uma distribuição que é aproximadamente normal. GABARITO: E 4. Considere que X1, X2, ..., Xn seja uma amostra independente e identicamente distribuída de uma variável aleatória com média e variância 2 x x ... xn xn 1 2 n e . Nessas condições, para 0 , a lei fraca dos grandes números não garante que se encontre algum xn , tal que | xn | . Resolução A lei fraca dos grandes números diz que, para qualquer valor n grande específico, é provável que ( x1 x2 ... xn ) / n esteja próximo de . Portanto, para 0 , a lei fraca dos grandes números garante que se encontre algum xn , tal que | xn | . Item certo. Segue o enunciado do teorema da lei fraca dos grandes números em “matematiquês”: www.pontodosconcursos.com.br | Prof. Alexandre Lima 5 Estatística – Bacen – Área 4 Aula 00 – Demonstrativa Prof. Alexandre Lima Seja X1, X2, ... uma sequência de variáveis aleatórias independentes e identicamente distribuídas, cada uma com média finita E[Xi] = . Então, para qualquer > 0, X X 2 ... X n P 1 0 n quando n GABARITO: C 5. Considere que X seja uma variável aleatória com média e variância 2 desconhecidas e que uma amostra aleatória, grande o suficiente e com observações independentes e identicamente distribuídas, dessa variável tenha sido obtida. Nessa situação, a probabilidade do desvio de cada observação amostral em relação à média populacional () não exceder 3 será inferior a 80%. Resolução Desigualdade de Chebyshev: seja X uma variável aleatória com média e variância 2. Então, para qualquer = k > 0 P[| X | k ] 1 1 k2 (a probabilidade do desvio de cada observação amostral em relação à média populacional não exceder k é no mínimo igual a 1 – 1/k2) P[| X | k ] 1 k2 (a probabilidade do desvio de cada observação amostral em relação à média populacional () exceder k é no máximo igual a 1/k2) O item adota k = 3. Logo, P[| X | 3 ] 1 1 32 P[| X | 3 ] 0,89 (*) (*) resultado aproximado para 2 casas decimais. www.pontodosconcursos.com.br | Prof. Alexandre Lima 6 Estatística – Bacen – Área 4 Aula 00 – Demonstrativa Prof. Alexandre Lima Ou seja, a probabilidade do desvio de cada observação amostral em relação à média populacional não exceder 3 é no mínimo igual a 89% (pode ser maior!). Item errado. Revisão da teoria A desigualdade de Chebyshev (ou Tchebysheff) fornece um limitante superior da probabilidade de quanto uma variável aleatória X pode desviar-se de sua média . Seja X uma variável aleatória arbitrária com média e variância 2. Então, para qualquer > 0 2 P[| X | ] 2 . Comentários: - Observe que o teorema de Chebyshev não requer que a distribuição de probabilidades de X seja conhecida. - Como {| X | } {| X | } (evento certo), segue-se que P[| X | ] 1 2 . 2 Às vezes, é mais conveniente expressar em termos de , de forma que = k, em que k é um valor constante. Então o teorema de Chebyshev pode ser expresso nas formas equivalentes: 1 k2 1 P[| X | k] 2 k P[| X | k] 1 www.pontodosconcursos.com.br | Prof. Alexandre Lima 7 Estatística – Bacen – Área 4 Aula 00 – Demonstrativa Prof. Alexandre Lima 0.8 f(x) P(X - < -k ) 0.7 P(X - > k ) 0.6 Densidade 0.5 0.4 0.3 0.2 0.1 0 10 10.5 11 11.5 - k 12 12.5 + k 13 13.5 x 14 Note que a soma das áreas azul e vermelha na figura acima é 1/k 2, pois o limite superior da área azul é - k e o limite inferior da área vermelha é + k. Por outro lado, a área para |x - |> k sempre será menor que 1/k 2. GABARITO: E 6. (Analista do TJ-RO/CESPE-UnB/2012) Considere que X representa a média amostral de uma amostra aleatória simples de tamanho n retirada de uma distribuição X, e e denotam, respectivamente, a média e desvio padrão dessa distribuição X. Com relação a inferência estatística, é correto afirmar que a relação X P 1,96 0,95 / n n é consequência do importante resultado que se intitula (A) princípio da invariância (B) lei fraca dos grandes números (C) desigualdade de Chebyshev (D) lei forte dos grandes números (E) teorema limite central Resolução www.pontodosconcursos.com.br | Prof. Alexandre Lima 8 Estatística – Bacen – Área 4 Aula 00 – Demonstrativa Prof. Alexandre Lima Seja a soma S n X 1 X 2 ... X n de n variáveis aleatórias independentes e identicamente distribuídas X 1 , X 2 ,..., X n com média finita e variância 2, em 2 que E ( S n ) n e Var ( S n ) n . De acordo com o teorema limite central, a variável aleatória padronizada S n E (S n ) Var ( S n ) S n n n é assintoticamente normal com média nula e desvio-padrão igual a um (normal padrão ou reduzida). Divida o numerador e o denominador da relação acima pela constante n: S n n S n n X n n Z* n / n n n Ora, a variável resultante continua sendo assintoticamente normal com média zero e variância unitária. Portanto, PZ * 1,96 0,95 n Dica: o resultado PZ 1,96 0,95 , em que Z é a normal padrão, é tão utilizado em Estatística, que às vezes as bancas assumem que você conhece esse valor de cor. GABARITO: E ˆ ˆ* 7. (Analista do TJ-RO/Cespe-UnB/2012) Os estimadores n e n são estimadores pontuais do parâmetro de certa distribuição, em que n ˆ representa o tamanho da amostra. Nesse caso, o estimador é dito ser consistente se (A) lim n P(| ˆn | ) 0 , para todo 0 . www.pontodosconcursos.com.br | Prof. Alexandre Lima 9 Estatística – Bacen – Área 4 Aula 00 – Demonstrativa Prof. Alexandre Lima P ( x1 , x2 ,..., xn | ˆn ) (B) , em que x1 , x2 ,..., xn são as observações amostrais, não depende de . 2 ˆ 2 ˆ* 2 (C) ( n ) ( n ) , em que (.) é a variância do estimador. L(ˆn | x1 , x2 ,..., xn ) L(ˆn* | x1 , x2 ,..., xn ) (D) em que L(.) é a função de verossimilhança associada ao modelo e x1 , x2 ,..., xn são as observações amostrais. (E) E (ˆn ) Resolução Um estimador é consistente, se, à medida que a amostra cresce, converge para o verdadeiro valor do parâmetro. Ou seja, quando o tamanho da amostra vai aumentando, o viés (se existir) vai diminuindo e a variância também. Um estimador consistente é aquele que converge para o valor do parâmetro quando o tamanho da amostra tende a infinito. Considere a média amostral X calculada para diversos tamanhos de amostras; obtemos, na realidade, uma sequência de estimadores X n , n 1,2,... . À medida que n cresce, a distribuição de X torna-se mais concentrada ao redor da verdadeira média populacional . Dizemos que consistente de estimadores de . X n , n 1,2,... é uma sequência Um estimador T de um parâmetro é consistente se, para todo > 0, P{| T | } 0, n Isso significa, em termos práticos, que, sendo o estimador consistente, podese, com amostras suficientemente grandes, tornar o erro de estimação tão pequeno quanto se queira. Em vez de usar a definição acima para verificar se um estimador é consistente, podemos usar o seguinte resultado. Um estimador T de um parâmetro é consistente se lim E (T ) , n www.pontodosconcursos.com.br | Prof. Alexandre Lima 10 Estatística – Bacen – Área 4 Aula 00 – Demonstrativa Prof. Alexandre Lima lim var(T ) 0 n Se o estimador for justo, a condição de consistência equivale a dizer que sua variância tende a zero quando o tamanho da amostra tende a infinito, isto é, para n , var(T ) 0 . Análise das alternativas (A) Correta, conforme explicação dada anteriormente. P ( x1 , x2 ,..., xn | ˆn ) (B) Incorreta. A condição “ , em que x1 , x2 ,..., xn são as observações amostrais, não depende de ” não faz o menor sentido no contexto da consistência de um estimador. 2 ˆ 2 ˆ* ˆ (C) Incorreta. A condição ( n ) ( n ) quer dizer que o estimador n pode ser ˆ* mais eficiente que o estimador n . (D) Incorreta. Estimação por máxima verossimilhança não tem nada a ver com a definição de consistência de um estimador. O método da máxima verossimilhança é um critério para a escolha do estimador. A consistência é uma propriedade do estimador. ˆ (E) Incorreta. Foi dada a definição de justeza do estimador n . GABARITO: A 8. (Analista do TJ-RO/Cespe-UnB/2012) Com relação a intervalo de confiança e intervalo de credibilidade, é correto afirmar que, se I = [a; b] for um intervalo de (A) confiança para o parâmetro , então esse parâmetro é uma variável aleatória. (B) confiança para o parâmetro de nível 1 – , então a probabilidade do verdadeiro valor do parâmetro estar fora do intervalo é igual a . (C) credibilidade para o parâmetro , então esse parâmetro é uma variável aleatória. (D) confiança para o parâmetro , então o valor esperado para esse parâmetro ba ˆ 2 . é www.pontodosconcursos.com.br | Prof. Alexandre Lima 11 Estatística – Bacen – Área 4 Aula 00 – Demonstrativa Prof. Alexandre Lima (E) credibilidade para o parâmetro , então a mediana deste parâmetro é ba ˆ 2 . Resolução Análise das opções (A) Incorreta, porque se I = [a; b] for um intervalo de confiança para o parâmetro , então esse parâmetro é não uma variável aleatória, sendo uma quantidade fixa. (B) Incorreta, porque se I = [a; b] for um intervalo de confiança para o parâmetro de nível 1 - , então a probabilidade do verdadeiro valor do parâmetro estar fora do intervalo é igual a 0 ou 1. (C) Correta, por definição. (D) Incorreta, porque se I = [a; b] for um intervalo de confiança para o parâmetro , então o valor esperado de é igual a , pois o parâmetro não é uma variável aleatória. (E) Incorreta, porque se I = [a; b] for um intervalo de credibilidade para o ba ˆ 2 é um belo parâmetro , então dizer que a mediana deste parâmetro é chute. GABARITO: C 9. (Analista do TJ-RO/Cespe-UnB/2012) Com relação a acurácia e precisão, é correto afirmar que o estimador ENVUMV (estimador não viciado uniformemente de mínima variância) (A) é um estimador acurado e é o mais preciso. (B) não é um estimador acurado e nem é o mais preciso. (C) é um estimador acurado mas não é o mais preciso. (D) é um estimador não acurado mas é o mais preciso. (E) é um estimador acurado e assintoticamente o mais preciso. Resolução O ENVUMV é o “sonho de consumo” dos estatísticos, pois é o melhor estimador dentre todos os estimadores não viciados, no sentido de que possui a menor variância, para todo valor de , em que denota o parâmetro a ser estimado. 12 www.pontodosconcursos.com.br | Prof. Alexandre Lima Estatística – Bacen – Área 4 Aula 00 – Demonstrativa Prof. Alexandre Lima O ENVUMV é o mais preciso porque a dispersão das suas estimativas é a menor de todas e é acurado porque é não viciado e de variância mínima. GABARITO: A (Serpro/CESPE-UnB/2010/Adaptada) Certa empresa, em determinado mês, realizou levantamento acerca da quantidade diárias de acessos simultâneos ao seu sistema cujo resultado é mostrado na figura acima. A partir das informações apresentadas nessa figura, e considerando que a distribuição da quantidade diárias de acessos simultâneos é representada pela variável X, julgue os itens a seguir. 10. A quantidade de 6 mil acessos simultâneos por dia representa a moda de X. Resolução A moda de X (valor que apresenta a maior frequência) é igual a 3 mil, cuja frequência é 10. A quantidade de 6 mil acessos simultâneos é o valor de menor frequência (= 1). Item errado. GABARITO: E 11. O mês em que esse levantamento foi realizado possui mais de 30 dias. Resolução quantidade de acessos simultâneos frequência (no de dias) 1.000 2.000 3.000 4.000 5 6 10 6 www.pontodosconcursos.com.br | Prof. Alexandre Lima 13 Estatística – Bacen – Área 4 Aula 00 – Demonstrativa Prof. Alexandre Lima 5.000 6.000 Total 3 1 31 Os dados foram tabulados na tabela acima, a qual indica que o mês em que esse levantamento foi realizado possui 31 dias. Item certo. GABARITO: C 12. A quantidade de 2.000 acessos simultâneos diários representa o primeiro quartil da distribuição X. Resolução quantidade de acessos simultâneos 1.000 2.000 3.000 4.000 5.000 6.000 Total frequência (no de dias) 5 6 10 6 3 1 31 frequência relativa 5/31 = 16,1% 6/31 = 19,4% 10/31 = 32,3% 6/31 = 19,4% 3/31 = 9,7% 1/31 = 3,1% 31/31 = 100% frequência acumulada 16,1% 35,5% 67,8% 87,2% 96,9% 100,0% Os dados tabulados acima indicam que o primeiro quartil Q1 (valor que delimita os 25% menores valores) da distribuição de X é a quantidade de 2 mil acessos simultâneos, haja vista o fato de a frequência acumulada para essa quantidade ultrapassar a frequência acumulada de 25%. Observe que a frequência acumulada para 2000 acessos é 35,5% e isto NÃO implica que 2000 não seja o primeiro quartil da série. Resolvamos de outra maneira. O rol de acesso é o seguinte: 1000, 1000, 1000, 1000, 1000 (5 dias) 2000, 2000, 2000, 2000, 2000, 2000(6 dias) 3000, 3000, 3000, 3000, 3000, 3000, 3000, 3000, 3000, 3000 (10 dias) 4000, 4000, 4000, 4000, 4000, 4000 (6 dias) 5000, 5000, 5000 (3 dias) 6000 (1 dia) www.pontodosconcursos.com.br | Prof. Alexandre Lima 14 Estatística – Bacen – Área 4 Aula 00 – Demonstrativa Prof. Alexandre Lima Número total de dias = 31. Logo, a Mediana do rol corresponde ao décimo sexto valor: 3.000. Temos agora a seguinte sub-série até a Mediana: 1000, 1000, 1000, 1000, 1000, 2000, 2000, 2000, 2000, 2000, 2000, 3000, 3000, 3000, 3000, 3000 Como esta sub-série tem 16 elementos, a sua mediana (= 1 o Quartil da série completa) é o valor médio entre os valores da oitava e da nona posição, ou seja, 2000. Então, Q1 = 2000. Entendo que a primeira resolução é mais rápida, portanto mais adequada de ser usada em uma situação real de prova. Note que esta questão cobra DADOS TABULADOS. Quando há muitos dados, como é o caso da questão, é mais rápido resolver usando o raciocínio das frequências acumuladas. GABARITO: C 13. É correto classificar a variável X como uma variável quantitativa ordinal. Resolução Errado. Tal classificação é aplicável aos atributos ou variáveis qualitativas quando é possível estabelecer uma ordem ou hierarquia entre as respostas obtidas no levantamento estatístico. Por exemplo, o IBGE efetua periodicamente o levantamento do grau de instrução dos brasileiros por meio de um censo completo da população. As respostas possíveis para essa pesquisa seriam algo como “sem instrução escolar”, “nível fundamental incompleto”, “nível fundamental completo”, “nível médio incompleto”, “nível médio completo”, “nível superior incompleto” e “nível superior completo. Essas respostas não são números, são variáveis qualitativas. Como é possível estabelecer uma hierarquia entre as possíveis respostas, tem-se uma variável qualitativa ordinal. GABARITO: E 14. A mediana amostral de X é igual a 3.500. Resolução www.pontodosconcursos.com.br | Prof. Alexandre Lima 15 Estatística – Bacen – Área 4 Aula 00 – Demonstrativa Prof. Alexandre Lima Os dados tabulados anteriormente mostram que a mediana da distribuição de X é a quantidade de 3 mil acessos simultâneos, pois a frequência acumulada para essa quantidade ultrapassa a frequência acumulada de 50%. GABARITO: E (ANAC/CESPE-UnB/2012/Adaptada) Na região Sul do país, em decorrência de mau tempo durante os meses de inverno, é comum o fechamento de aeroportos. Com base nessa informação e de acordo com a teoria de probabilidades, julgue os itens de 15 a 17. 15. Sabendo-se que o processo de precipitação da chuva depende da temperatura ambiente e da temperatura de condensação do ar, considere que tais grandezas sejam representadas, respectivamente, pelas variáveis aleatórias X e Y contínuas com distribuição conjunta f(X,Y). Nessa situação, é correto afirmar que a probabilidade da temperatura ambiente ser 30 oC e da temperatura de condensação do ar ser 9 oC é igual a f(30,9). Resolução Sejam X e Y variáveis aleatórias contínuas. A figura a seguir mostra uma função densidade de probabilidade conjunta f(x,y). 0.15 0.1 0.05 0 2 0 -2 y -3 -2 0 -1 1 2 3 x A integral dupla de f(x,y) ao longo de uma região R no plano xy (ex.: a X b, c Y d ) fornece a probabilidade de (X,Y) assumir um valor em R www.pontodosconcursos.com.br | Prof. Alexandre Lima 16 Estatística – Bacen – Área 4 Aula 00 – Demonstrativa Prof. Alexandre Lima b d P{( X , Y ) R} P (a X b, c Y d ) f ( x, y )dydx a c Essa integral dupla pode ser interpretada como o volume sob a superfície f(x,y) ao longo da região R. Ora, se a região R se resume a um ponto P = (x,y) do plano, no caso (x=30,y=9}, temos que o resultado da integral dupla é igual a zero, pois o volume sob a superfície f(x,y) é nulo em um dado ponto do plano. Logo, é incorreto afirmar que a probabilidade da temperatura ambiente ser 30 oC e da temperatura de condensação do ar ser 9 oC é igual a f(30,9). O valor f(30,9) fornece a densidade de probabilidade conjunta no ponto (30,9). Item errado GABARITO: E 16. Supondo que a probabilidade de não haver vaga no estacionamento de um aeroporto dependa do fato de ter ocorrido mau tempo na cercania desse aeroporto, é correto afirmar que a probabilidade de não haver vaga no estacionamento desse aeroporto, caso tenha ocorrido mau tempo na sua cercania, é igual a 1 menos a probabilidade de ter vaga no estacionamento do referido aeroporto, caso não tenha ocorrido mau tempo em sua cercania. Resolução Notação: Probabilidade de NÃO haver vaga no estacionamento de um aeroporto condicionada ao fato de ter ocorrido mau tempo na cercania desse aeroporto: P(NVG|MT); Probabilidade de haver vaga no estacionamento de um aeroporto condicionada ao fato de ter ocorrido mau tempo na cercania desse aeroporto: P(VG|MT); Probabilidade de não haver vaga no estacionamento de um aeroporto condicionada ao fato de NÃO ter ocorrido mau tempo na cercania desse aeroporto: P(NVG|NMT); Probabilidade de haver vaga no estacionamento de um aeroporto condicionada ao fato de NÃO ter ocorrido mau tempo na cercania desse aeroporto: P(VG|NMT); É correto afirmar que P(NVG|MT) = 1 – P(VG|NMT) ? Sabemos que www.pontodosconcursos.com.br | Prof. Alexandre Lima 17 Estatística – Bacen – Área 4 Aula 00 – Demonstrativa Prof. Alexandre Lima P(VG|MT) + P(NVG|MT) = 1 P(NVG|MT) = 1 – P(VG|MT) P(VG|NMT) + P(NVG|NMT) = 1 O item é errado, pois P(NVG|MT) = 1 – P(VG|MT) 1 – P(VG|NMT) GABARITO: E 17. Considere que o número de voos atrasados por mês em um aeroporto da região Sul seja explicado pela regressão Y = 15 + 5X + , ~ N(0, 2), em que Y é o número de voos atrasados no mês, X é o número de horas que o aeroporto permaneceu fechado por mau tempo no referido mês e é uma variável aleatória com distribuição normal de média zero e variância desconhecida 2. Nesse caso, é correto afirmar que o desvio padrão de X será proporcional a 1/5 do desvio padrão de Y. Resolução O enunciado forneceu a equação da “verdadeira” reta de regressão: E (Y | X ) 1 2 X 15 5 X A estimativa da inclinação 2 é dada pela fórmula: ˆ 2 r Y X em que | r | 1 é o coeficiente de correlação, Y e X são os desvios padrão amostrais de X e Y. Não é necessário estimar a inclinação, pois o seu valor verdadeiro já foi dado pela questão: 2 5 . Então, ˆ 2 5 r Y X r Y X 5 Conclui-se que é correto afirmar que o desvio padrão dos valores de X será proporcional a 1/5 do desvio padrão dos valores de Y (o coeficiente de proporcionalidade é o coeficiente de correlação). www.pontodosconcursos.com.br | Prof. Alexandre Lima 18 Estatística – Bacen – Área 4 Aula 00 – Demonstrativa Prof. Alexandre Lima GABARITO: C Abraços e até a próxima aula. Bons estudos! Alexandre Lima [email protected] www.pontodosconcursos.com.br | Prof. Alexandre Lima 19 Estatística – Bacen – Área 4 Aula 00 – Demonstrativa Prof. Alexandre Lima Lista de Questões Comentadas na Aula (BACEN – Área 5/CESPE-UnB/2013) Com relação às medidas estatísticas de dispersão e à distribuição normal, julgue os itens que se seguem. 1. Considere que determinado fornecedor oferece um produto ao preço de $ 40. Nesse contexto, sabendo-se que o preço médio do mercado é $ 30 e supondo-se que os preços de mercado apresentem uma distribuição normal de probabilidade e que a quantidade padronizada (z) seja igual a 1,22, o desvio padrão dos preços é superior a $ 8. 2. Numa curva normal, há coincidência entre os valores da média e da mediana, mas não da moda da distribuição. (ANAC-Área 4/CESPE-UnB/2012) Com relação à teoria de probabilidades, julgue os itens que se seguem. 3. Se X é uma variável aleatória e se {X1, X2, ..., Xn} são observações aleatórias independentes dessa variável, então, com base na lei forte dos grandes números, é correto afirmar que, quando o tamanho amostral cresce (até o infinito), a média amostral tem distribuição normal de média = E(X). 4. Considere que X1, X2, ..., Xn seja uma amostra independente e identicamente distribuída de uma variável aleatória com média e variância 2 x x2 ... xn xn 1 n e . Nessas condições, para 0 , a lei fraca dos grandes números não garante que se encontre algum xn , tal que | xn | . 5. Considere que X seja uma variável aleatória com média e variância 2 desconhecidas e que uma amostra aleatória, grande o suficiente e com observações independentes e identicamente distribuídas, dessa variável tenha sido obtida. Nessa situação, a probabilidade do desvio de cada observação amostral em relação à média populacional () não exceder 3 será inferior a 80%. 6. (Analista do TJ-RO/CESPE-UnB/2012) Considere que X representa a média amostral de uma amostra aleatória simples de tamanho n retirada de uma distribuição X, e e denotam, respectivamente, a média e desvio padrão dessa distribuição X. Com relação a inferência estatística, é correto afirmar que a relação X P 1,96 0,95 / n n www.pontodosconcursos.com.br | Prof. Alexandre Lima 20 Estatística – Bacen – Área 4 Aula 00 – Demonstrativa Prof. Alexandre Lima é consequência do importante resultado que se intitula (A) princípio da invariância (B) lei fraca dos grandes números (C) desigualdade de Chebyshev (D) lei forte dos grandes números (E) teorema limite central ˆ ˆ* 7. (Analista do TJ-RO/Cespe-UnB/2012) Os estimadores n e n são estimadores pontuais do parâmetro de certa distribuição, em que n ˆ representa o tamanho da amostra. Nesse caso, o estimador é dito ser consistente se (A) lim n P(| ˆn | ) 0 , para todo 0 . P ( x1 , x2 ,..., xn | ˆn ) (B) , em que x1 , x2 ,..., xn são as observações amostrais, não depende de . 2 ˆ 2 ˆ* 2 (C) ( n ) ( n ) , em que (.) é a variância do estimador. L(ˆn | x1 , x2 ,..., xn ) L(ˆn* | x1 , x2 ,..., xn ) (D) em que L(.) é a função de verossimilhança associada ao modelo e x1 , x2 ,..., xn são as observações amostrais. (E) E (ˆn ) 8. (Analista do TJ-RO/Cespe-UnB/2012) Com relação a intervalo de confiança e intervalo de credibilidade, é correto afirmar que, se I = [a; b] for um intervalo de (A) confiança para o parâmetro , então esse parâmetro é uma variável aleatória. (B) confiança para o parâmetro de nível 1 – , então a probabilidade do verdadeiro valor do parâmetro estar fora do intervalo é igual a . (C) credibilidade para o parâmetro , então esse parâmetro é uma variável aleatória. (D) confiança para o parâmetro , então o valor esperado para esse parâmetro ba ˆ 2 . é www.pontodosconcursos.com.br | Prof. Alexandre Lima 21 Estatística – Bacen – Área 4 Aula 00 – Demonstrativa Prof. Alexandre Lima (E) credibilidade para o parâmetro , então a mediana deste parâmetro é ba ˆ 2 . 9. (Analista do TJ-RO/Cespe-UnB/2012) Com relação a acurácia e precisão, é correto afirmar que o estimador ENVUMV (estimador não viciado uniformemente de mínima variância) (A) é um estimador acurado e é o mais preciso. (B) não é um estimador acurado e nem é o mais preciso. (C) é um estimador acurado mas não é o mais preciso. (D) é um estimador não acurado mas é o mais preciso. (E) é um estimador acurado e assintoticamente o mais preciso. (Serpro/CESPE-UnB/2010/Adaptada) Certa empresa, em determinado mês, realizou levantamento acerca da quantidade diárias de acessos simultâneos ao seu sistema cujo resultado é mostrado na figura acima. A partir das informações apresentadas nessa figura, e considerando que a distribuição da quantidade diárias de acessos simultâneos é representada pela variável X, julgue os itens a seguir. 10. A quantidade de 6 mil acessos simultâneos por dia representa a moda de X. 11. O mês em que esse levantamento foi realizado possui mais de 30 dias. 12. A quantidade de 2.000 acessos simultâneos diários representa o primeiro quartil da distribuição X. 13. É correto classificar a variável X como uma variável quantitativa ordinal. www.pontodosconcursos.com.br | Prof. Alexandre Lima 22 Estatística – Bacen – Área 4 Aula 00 – Demonstrativa Prof. Alexandre Lima 14. A mediana amostral de X é igual a 3.500. (ANAC/CESPE-UnB/2012/Adaptada) Na região Sul do país, em decorrência de mau tempo durante os meses de inverno, é comum o fechamento de aeroportos. Com base nessa informação e de acordo com a teoria de probabilidades, julgue os itens de 15 a 17. 15. Sabendo-se que o processo de precipitação da chuva depende da temperatura ambiente e da temperatura de condensação do ar, considere que tais grandezas sejam representadas, respectivamente, pelas variáveis aleatórias X e Y contínuas com distribuição conjunta f(X,Y). Nessa situação, é correto afirmar que a probabilidade da temperatura ambiente ser 30 oC e da temperatura de condensação do ar ser 9 oC é igual a f(30,9). 16. Supondo que a probabilidade de não haver vaga no estacionamento de um aeroporto dependa do fato de ter ocorrido mau tempo na cercania desse aeroporto, é correto afirmar que a probabilidade de não haver vaga no estacionamento desse aeroporto, caso tenha ocorrido mau tempo na sua cercania, é igual a 1 menos a probabilidade de ter vaga no estacionamento do referido aeroporto, caso não tenha ocorrido mau tempo em sua cercania. 17. Considere que o número de voos atrasados por mês em um aeroporto da região Sul seja explicado pela regressão Y = 15 + 5X + , ~ N(0, 2), em que Y é o número de voos atrasados no mês, X é o número de horas que o aeroporto permaneceu fechado por mau tempo no referido mês e é uma variável aleatória com distribuição normal de média zero e variância desconhecida 2. Nesse caso, é correto afirmar que o desvio padrão de X será proporcional a 1/5 do desvio padrão de Y. www.pontodosconcursos.com.br | Prof. Alexandre Lima 23 Estatística – Bacen – Área 4 Aula 00 – Demonstrativa Prof. Alexandre Lima GABARITO 1. C 2. E 3. E 4. C 5. E 6. E 7. A 8. C 9. A 10. E 11. C 12. C 13. E 14. E 15. E 16. E 17. C 24 www.pontodosconcursos.com.br | Prof. Alexandre Lima 24