Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados em Exercícios, incluindo Matemática, Matemática Financeira e Estatística Profs. Alexandre Lima e Moraes Junior Aula 9 - Questões Comentadas e Resolvidas Variável Aleatória Bivariada: função de probabilidade conjunta, função de probabilidade marginal, função de probabilidade condicional. Variáveis aleatórias independentes. Esperanças envolvendo duas ou mais variáveis: correlação e covariância. Introdução à Regressão Linear. 1. (Analista da SUSEP/Atuária/2001/ESAF) Uma loja vende lavadoras e secadoras de roupa. A distribuição conjunta do número N1 de secadoras e do número N2 de lavadoras vendidas num mesmo dia é dada na tabela abaixo. Assinale a opcão que dá a probabilidade de que a venda, num mesmo dia, de lavadoras seja igual à de secadoras. N1 N2 0 1 2 3 0 0,25 0,15 0,08 0,01 1 0,13 0,11 0,06 0,01 2 0,04 0,02 0,05 0,01 3 0,02 0,01 0,02 0,03 (A) 0,54 (B) 0,50 (C) 0,49 (D) 0,44 (E) 0,19 Resolução REVISÃO DA NOÇÃO DE FUNÇÃO DE PROBABILIDADE CONJUNTA Na aula anterior, estudamos distribuições de probabilidade para uma única variável aleatória. Entretanto, em muitas situações práticas, atribuímos a um mesmo ponto amostral os valores de duas ou mais variáveis aleatórias ao descrevermos os resultados de um experimento. Nesta aula, nos concentraremos no caso de um par de variáveis aleatórias. Exemplo: Considere o lançamento simultâneo de duas moedas não viciadas. Os resultados desse experimento aleatório são cara-cara (CC), cara-coroa (CK), coroa-cara (KC) e coroa-coroa (KK). Logo, o espaço amostral é CK, KC, KK}. Defina as variáveis aleatórias X=0 se pelo menos uma das moedas der cara (X=1 para os demais casos) e Y=-1 se der uma cara e uma coroa (Y=+1 para os demais casos). Então Profs. Alexandre Lima e Moraes Junior www.pontodosconcursos.com.br 1 Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados em Exercícios, incluindo Matemática, Matemática Financeira e Estatística Profs. Alexandre Lima e Moraes Junior P[X=0] = P[CC] + P[CK] + P[KC] = 1/4 + 1/4 + 1/4 = 3/4, P[X=1] = P[KK] = 1/4 = 1 - P[X=0], P[Y=-1] = P[CK] + P[KC] = 1/2 e P[Y= + 1] = P[CC] + P[KK] = 1/2 = 1 - P[Y=-1]. Considere o evento resultante da interseção dos eventos obter pelo menos uma cara e não obter uma cara e uma coroa, ou seja, {(CC u CK u KC) n (CC u KK)} = {CC}. Esse evento pode ser representado pela notação compacta (X=0,Y= + 1). Como P(CC) = 1/4, temos que P(X=0,Y= + 1) = 1/4. O evento (X=0,Y= + 1) é dito conjunto porque envolve as variáveis X e Y. Os demais eventos conjuntos são: (X=0,Y=-1), (X=1,Y= + 1) e (X=1,Y=-1). Diz-se que o par (X,Y) é uma variável aleatória bivariada ou bidimensional. Exemplo: A variável aleatória contínua X representa o comprimento de uma dimensão de uma peça moldada por injeção, enquanto a variável aleatória contínua Y denota o comprimento de outra dimensão. Estamos interessados em probabilidades que possam ser escritas em termos de X e Y. Suponha que as especificações para X e Y sejam (3,95 a 4,05) e (8,10 a 8,20) milímetros, respectivamente. Então podemos estar interessados na probabilidade de uma peça satisfazer as duas especificações simultaneamente, ou seja, P[(3,95 < X < 4,05) e (8,10 < Y < 8,20)]. Variáveis Discretas Sejam X e Y variáveis aleatórias discretas, como no primeiro exemplo dado. Então a função discreta de probabilidade conjunta (ou distribuição conjunta) de X e Y, denotada por f(x,y), satisfaz Exemplo 1 : Um total de 15.064.859 alunos está matriculado no ensino superior, divididos entre cursos com duração de 4 anos, de 2 anos e de menos de 2 anos. A matrícula, separada por sexo, é mostrada na tabela a seguir. 1 HILL, R. Carter; GRIFFITHS, William E.; JUDGE, George G. Econometria. 2. ed. São Paulo: Saraiva, 2006. Profs. Alexandre Lima e Moraes Junior www.pontodosconcursos.com.br 2 Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados em Exercícios, incluindo Matemática, Matemática Financeira e Estatística Profs. Alexandre Lima e Moraes Junior Homens Mulheres Fonte: 4 anos 4.076.416 4.755.790 2 anos 2.437.905 3.310.086 Digest of Educational Statistics 1997, Tabela Menos de 2 anos 172.874 311.788 170. Nessa população, as probabilidades aproximadas de matrícula em um dos tipos de instituição de ensino superior, por sexo, são Homens Mulheres 4 anos 0,27 0,32 2 anos 0,16 0,22 Menos de 2 anos 0,01 0,02 Considere o experimento de extrair aleatoriamente um estudante matriculado dessa população. Defina a variável aleatória X = 0, se um homem é selecionado, e X = 1, se uma mulher é selecionada. Defina a variável aleatória Y = 1, se o estudante escolhido é de um curso de 4 anos, Y = 2, se o estudante escolhido é de um curso de 2 anos e Y = 3, se é de um curso de menos de 2 anos. Seja f(x,y) a função discreta de probabilidade conjunta da população de homens e mulheres da questão. Sendo assim, temos as seguintes probabilidades conjuntas: P(homens matriculados em cursos de 4 anos) P(homens matriculados em cursos de 2 anos) P(homens matriculados em cursos < 2 anos) P(mulheres matriculadas em cursos de 4 anos) P(mulheres matriculadas em cursos de 2 anos) P(mulheres matriculadas em cursos < 2 anos) Note que é a probabilidade do evento certo. Variáveis Contínuas Sejam X e Y duas variáveis aleatórias contínuas. Neste caso, a distribuição conjunta das duas variáveis é caracterizada por uma função f(x,y) chamada função de densidade conjunta de X e Y, que satisfaz Profs. Alexandre Lima e Moraes Junior www.pontodosconcursos.com.br 3 Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados em Exercícios, incluindo Matemática, Matemática Financeira e Estatística Profs. Alexandre Lima e Moraes Junior (2) (3) A relação (2) nos diz que o volume sob a superfície representada por f(x,y) é igual a 1. A figura abaixo mostra uma função de densidade conjunta. A equação (3) dá a probabilidade do par (x,y) estar num retângulo de lados ba e d-c. Exemplo: e a probabilidade Exemplo: Suponha que a variável aleatória distribuída no quadrado da figura abaixo. Profs. Alexandre Lima e Moraes Junior (X,Y) esteja www.pontodosconcursos.com.br uniformemente 4 Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados em Exercícios, incluindo Matemática, Matemática Financeira e Estatística Profs. Alexandre Lima e Moraes Junior contrário. A figura a seguir ilustra a densidade conjunta uniforme (é a superfície delimitada pelo perímetro azul). Sabemos que o volume do cubo deve ser 1 x 1 x K = 1, pois o volume delimitado por uma densidade de probabilidade conjunta é igual a 1 por definição. Logo, K =1 é a altura do cubo. GABARITO: D Julgue os itens a seguir. 2. Seja a distribuição conjunta de X e Y Então, a densidade marginal f X (x) é dada por Profs. Alexandre Lima e Moraes Junior www.pontodosconcursos.com.br 5 Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados em Exercícios, incluindo Matemática, Matemática Financeira e Estatística Profs. Alexandre Lima e Moraes Junior Resolução Como f X (x) é uma função exponencial de x, e não de y, temos que o item está errado. REVISÃO DA NOÇÃO DE FUNÇÃO DE PROBABILIDADE MARGINAL Dada uma função densidade de probabilidade conjunta, pode-se obter a função densidade de probabilidade de cada uma das variáveis aleatórias individuais. Sejam X e Y variáveis aleatórias contínuas com densidade conjunta f(x,y). Então fX(x) e fY(y) são denominadas densidades marginais de X e Y, respectivamente, se são obtidas de f(x,y) por meio das expressões Note que as funções de densidade de probabilidade marginal fX(x) e fY(y) correspondem às funções de densidade de probabilidade individuais de X e Y, respectivamente. Pode-se obter resultados similares para variáveis aleatórias discretas. Dada a função discreta de probabilidade conjunta f(x i ,y k ), as funções discretas de probabilidade marginal são dadas por Profs. Alexandre Lima e Moraes Junior www.pontodosconcursos.com.br 6 Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados em Exercícios, incluindo Matemática, Matemática Financeira e Estatística Profs. Alexandre Lima e Moraes Junior Exemplo: Considere a tabela abaixo (exemplo visto na resolução do exercício 1). Homens (X=0) Mulheres (X=1) A probabilidade 4 anos (Y=1) 0,27 0,32 P[X = 0] 2 anos (Y=2) 0,16 0,22 (probabilidade Menos de 2 anos (Y=3) 0,01 0,02 de o estudante escolhido aleatoriamente ser homem) é igual à probabilidade marginal fX (x) no ponto x A probabilidade P[X = 1], probabilidade de o estudante selecionado aleatoriamente ser mulher, é igual à probabilidade marginal fX (x) no ponto x =1. Então Note que fX(x=0) + fX(x=1) = 0,44 + 0,56 = 1, e isto acontece porque a soma das probabilidades de uma função discreta de probabilidades é unitária, por definição. A probabilidade P[Y = 1], que representa a probabilidade de o estudante escolhido ao acaso estar matriculado em um curso de 4 anos, é igual à probabilidade marginal fY (y) no ponto y =1, dada por soma da 1 a coluna da tabela. A probabilidade P[Y = 2] é a probabilidade de o estudante estar matriculado em um curso de 2 anos e é igual à probabilidade marginal fY (y) no ponto y =2: Profs. Alexandre Lima e Moraes Junior www.pontodosconcursos.com.br 7 Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados em Exercícios, incluindo Matemática, Matemática Financeira e Estatística Profs. Alexandre Lima e Moraes Junior Finalmente, a probabilidade P[Y = 3] denota a probabilidade de o estudante estar matriculado em um curso com duração menor que 2 anos e corresponde à probabilidade marginal fY (y) no ponto y =3: soma da 3 a coluna da tabela. Não por acaso, temos que = 1. Y=1 0,27 0,32 0,59 X=0 X=1 fY(y) Y=2 0,16 0,22 0,38 Y=3 0,01 0,02 0,03 fX(x) 0,44 0,56 1 A tabela acima mostra que as probabilidades marginais f X (x) e f Y (y) são obtidas somando as linhas e colunas, respectivamente (memorize para a prova!). GABARITO: Errado 3. Sejam X e Y variáveis aleatórias discretas com a seguinte distribuição conjunta: Y=1 0,27 0,32 X=0 X=1 Y=2 0,16 0,22 Y=3 0,01 0,02 Então a tabela abaixo especifica a distribuição condicional de X dado que Y=1: x fX|Y(x y=1) 0 0,458 1 0,542 Resolução As probabilidades condicionais especificam a distribuição Da definição de condicional de X dado que Y=1, denotada por probabilidade condicional, obtemos Profs. Alexandre Lima e Moraes Junior www.pontodosconcursos.com.br 8 Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados em Exercícios, incluindo Matemática, Matemática Financeira e Estatística Profs. Alexandre Lima e Moraes Junior Assim, P(X=0|Y=1) = P(X=0,Y=1)/P(Y=1) = 0,27/0,59 = 0,458 e P(X=1|Y=1) = P(X=1,Y=1)/P(Y=1) = 0,32/0,59 = 0,542. Note que P(X=0|Y=1) + P(X=1|Y=1) = 0,458 + 0,542 = 1. O item está certo. COMENTÁRIOS ADICIONAIS A média da distribuição condicional de X, dado que Y=1, é E(X|Y=1) = (0 x 0,458) + (1 x 0,542) = 0,542. As probabilidades condicionais P(Y=y|X=1) condicional de Y dado que X=1. Aplicando obtemos especificam a a probabilidade distribuição condicional, P(Y=1|X=1) = P(Y=1,X = 1)/P(X=1) = 0,32/0,56 = 0,571, P(Y=2|X=1) = P(Y=2,X = 1)/P(X=1) = 0,22/0,56 = 0,393, P(Y=3|X=1) = P(Y=3,X = 1)/P(X=1) = 0,02/0,56 = 0,036. De modo que a distribuição condicional de Y, dado que X=1, denotada por está na tabela abaixo: A média da distribuição condicional de Y, dado que X=1, é igual a E(Y|X=1) = (1 x 0,571) + (2 x 0,393) + (3 x 0,036) = 1,465. Formalizemos o que foi visto acima. Sejam X e Y variáveis aleatórias discretas com função de probabilidade conjunta f(x i ,y k ). Então as funções discretas de probabilidade condicional (ou distribuições condicionais) são definidas como Profs. Alexandre Lima e Moraes Junior www.pontodosconcursos.com.br 9 Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados em Exercícios, incluindo Matemática, Matemática Financeira e Estatística Profs. Alexandre Lima e Moraes Junior De (1) e (2) resulta que (3) A esperança condicional de X, dado que Y = yj, é dada por (4) Uma definição análoga vale para Podemos definir as densidades condicionais associadas a duas variáveis aleatórias contínuas X e Y (com densidade conjunta e densidades marginais de forma similar. A densidade condicional de Y dado o resultado X = x é definida por (5) e a densidade condicional de X dado o resultado Y = y como (6) A fórmula (3) também é válida para o caso de variáveis contínuas. A interpretação de (5) e (6) é a seguinte. Seja a densidade conjunta = 0 caso contrário representada na figura a seguir. Considere o plano paralelo ao plano xz que passa por Esse plano determina na superfície a densidade condicional Por exemplo, suponha que X denote o salário de uma população e que Y represente o consumo da mesma população. Então, fixado o consumo a densidade condicional representa a densidade dos salários para o nível de consumo. Profs. Alexandre Lima e Moraes Junior www.pontodosconcursos.com.br 10 Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados em Exercícios, incluindo Matemática, Matemática Financeira e Estatística Profs. Alexandre Lima e Moraes Junior As densidades condicionais também caracterizadas por meio de suas médias, variâncias, etc. podem ser A esperança condicional de Y, dado que X=x, é dada por (7) Definição análoga pode ser dada para E(X|y). Observe que E(Y|x) é uma função de x, isto é, E(Y|x) = f(x), sendo denominada curva de regressão de Y sobre x. A regressão será vista em detalhes mais adiante. Exemplo: Seja a densidade condicional A esperança condicional E(Y|x) é dada por Note que E(Y|x) é, de fato, uma função de x. GABARITO: Certo 4. Considere a função de distribuição conjunta Profs. Alexandre Lima e Moraes Junior www.pontodosconcursos.com.br 11 Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados em Exercícios, incluindo Matemática, Matemática Financeira e Estatística Profs. Alexandre Lima e Moraes Junior Pode-se afirmar que X e Y são variáveis aleatórias independentes. Resolução Vimos que as densidades marginais da densidade conjunta x>0, y>0 são dadas por Como independentes. concluímos que X e Y são REVISÃO DA NOÇÃO DE VARIÁVEIS ALEATÓRIAS INDEPENDENTES Quando X e Y são variáveis aleatórias independentes a função de probabilidade conjunta é igual ao produto das funções marginais de probabilidade, ou seja Podemos generalizar a fórmula acima. Sejam variáveis aleatórias independentes com função de probabilidade conjunta Então é válida e funções marginais de probabilidade a expressão densidade conjunta é igual ao produto das densidades marginais. Se X e Y são independentes; então a densidade condicional de X, dado que Y = y é, distribuição condicional de X dado Y não depende da variável Y; é função somente de X. e a densidade condicional de Y, dado que X = x é, Profs. Alexandre Lima e Moraes Junior www.pontodosconcursos.com.br 12 Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados em Exercícios, incluindo Matemática, Matemática Financeira e Estatística Profs. Alexandre Lima e Moraes Junior distribuição condicional de Y dado X não depende da variável X; é função somente de Y. GABARITO: Certo 5. As variáveis aleatórias X e Y são independentes. Então é válida a expressão Resolução Provaremos que E[XY] = E[X]E[Y] supondo que X e Y sejam variáveis contínuas. Prova similar pode ser dada se as variáveis forem discretas (tente você mesmo fazer após estudar a nossa solução para variáveis contínuas). Primeiramente, lembre que pois X e Y são independentes. Aplicando esse conceito na integral de E[XY], obtemos Note que variáveis independentes são não correlacionadas, uma vez que a covariância entre X e Y é nula: REVISÃO DOS CONCEITOS DE CORRELAÇÃO E COVARIÂNCIA Introdução É muito duas ou funções discretas variáveis comum estarmos interessados no comportamento conjunto de mais variáveis aleatórias. Apresentamos para você os conceitos de de probabilidade conjunta, marginal e condicional para variáveis e contínuas. Também estudamos a noção de independência entre aleatórias. Aqui, daremos continuidade ao estudo da associação entre variáveis. Frequentemente, estamos interessados em saber se existe uma associação entre duas variáveis. Considere, por exemplo, a Economia. Em geral, estamos Profs. Alexandre Lima e Moraes Junior www.pontodosconcursos.com.br 13 Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados em Exercícios, incluindo Matemática, Matemática Financeira e Estatística Profs. Alexandre Lima e Moraes Junior interessados em investigar as relações que possam existir entre variáveis econômicas. Por exemplo: quão estreitamente caminham duas variáveis preço? Veremos que os conceitos de covariância e correlação nos ajudam a responder a essa pergunta. Correlação e Covariância Seja uma amostra de dez altura (cm) e o peso respectivamente. Para cada y). Teremos então n = 10 ser representadas em um diagrama de dispersão. pessoas adultas, do sexo masculino, e sejam a (kg) dessas pessoas denotadas por X e Y, elemento da amostra, temos um par ordenado (x, pares de valores das duas variáveis, que poderão diagrama cartesiano bidimensional denominado Pessoa 1 2 3 4 5 6 7 8 9 10 Tabela Altura (cm) 174 161 171 181 182 165 155 168 176 175 Peso (kg) 74 68 63 92 80 73 61 64 90 81 Suponha que tenham sido obtidos os valores apresentados na tabela acima. O diagrama de dispersão correspondente é o da próxima figura. A vantagem do diagrama de dispersão está em que, muitas vezes, sua simples observação já nos dá uma boa ideia de como as duas variáveis se correlacionam, isto é, qual a tendência de variação conjunta que apresentam. Profs. Alexandre Lima e Moraes Junior www.pontodosconcursos.com.br 14 Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados em Exercícios, incluindo Matemática, Matemática Financeira e Estatística Profs. Alexandre Lima e Moraes Junior Observando o diagrama de dispersão acima com atenção, constatamos que existe, para maiores valores de X (altura), uma tendência a obter maiores valores de Y (peso) e vice-versa. Quando isso ocorre, diz-se que há correlação linear positiva entre X e Y. Entretanto, também podemos ter casos em que o diagrama de dispersão apresenta o aspecto da figura que se segue, indicando que, para maiores valores de X, a tendência é observarem-se menores valores de Y e vice-versa. Diz-se que nesse caso a correlação é negativa. Por exemplo, a renda per capita de países e o índice de analfabetismo são variáveis negativamente correlacionadas. É claro que também pode ocorrer o caso em que as variáveis são não correlacionadas. Neste caso, o aspecto do diagrama de dispersão é o da próxima figura. Profs. Alexandre Lima e Moraes Junior www.pontodosconcursos.com.br 15 Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados em Exercícios, incluindo Matemática, Matemática Financeira e Estatística Profs. Alexandre Lima e Moraes Junior Vimos que o sinal da correlação indica a tendência da variação conjunta das duas variáveis. Além disso, devemos considerar também a intensidade ou o grau da correlação. A correlação linear (em valor absoluto) entre X e Y na figura em que a correlação é negativa é mais intensa do que a da figura em que a correlação é positiva, pois os pontos da primeira apresentam uma tendência mais acentuada de se colocarem segundo uma reta do que os da última. Sejam X e Y variáveis aleatórias. Então a covariância de X e Y é definida por (1) em que Se X e Y são variáveis aleatórias discretas e é probabilidade conjunta, a covariância entre X e Y é dada por sua função de (2) Caso X e Y sejam variáveis aleatórias contínuas com função densidade de probabilidade conjunta f(x,y), a covariância é calculada pela integral (3) A covariância mede a intensidade da correlação linear existente entre duas variáveis. Além disso, ela também nos dá o sinal da correlação, se positivo ou negativo. Suponha que tenhamos uma amostra de n pares ordenados (x,y). Neste caso, a covariância pode ser estimada pela estatística Profs. Alexandre Lima e Moraes Junior www.pontodosconcursos.com.br 16 Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados em Exercícios, incluindo Matemática, Matemática Financeira e Estatística Profs. Alexandre Lima e Moraes Junior Observe que a covariância depende das unidades de medida das variáveis X e Y. Percebe-se mais claramente o significado da covariação dividindo-se a covariância entre X e Y por seus respectivos desvios-padrão. Define-se a razão resultante como a correlação entre as variáveis aleatórias X e Y, denotada pela letra grega (5) denotam os desvios-padrão de X e Y, respectivamente. em que A correlação é estimada pela estatística denominada correlação linear de Pearson, ou, simplesmente, correlação, definido por coeficiente coeficiente de de (6) em que s xy é a covariância amostral de X e Y (4), sx é o desvio-padrão amostral de X (7) desvio-padrão amostral de Y (8) Substituindo (4), (7) e (8) em (6), obtemos Profs. Alexandre Lima e Moraes Junior www.pontodosconcursos.com.br 17 Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados em Exercícios, incluindo Matemática, Matemática Financeira e Estatística Profs. Alexandre Lima e Moraes Junior (9) em que S x y = n.covariância amostrai Sxx = n.variância amostral de X e S yy = n.variância amostral de Y A representação abreviada dos somatórios de (9) por meio de é útil e importante para a prova. Não é difícil mostrar que Sxy = "soma dos produtos entre X (10) e Y" ou simplesmente "soma dos produtos" (11) Sxx = "soma dos quadrados de X" (12) Syy = "soma dos quadrados de Y" As fórmulas (10), (11) e (12) devem ser memorizadas porque são importantes para a prova. O coeficiente de correlação tem as importantes propriedades adimensional e de variar entre -1 e +1 , o que não ocorre covariância. A vantagem de ser adimensional está no fato de seu valor afetado pelas unidades adotadas. Por outro lado, o fato de se ter com que um dado valor de R seja facilmente interpretado. Note que corresponde ao caso de correlação linear negativa perfeita e R corresponde ao caso de correlação linear positiva perfeita. Profs. Alexandre Lima e Moraes Junior www.pontodosconcursos.com.br de ser com a não ser R = -1 = +1 18 Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados em Exercícios, incluindo Matemática, Matemática Financeira e Estatística Profs. Alexandre Lima e Moraes Junior Ressaltamos que ; i correlação nula, isto é, p = 0, significa que não há associação linear entre X e Y. Mesmo que X e Y tenham covariância zero, elas podem ter uma associação não linear, como em (equação de uma circunferência centrada em (0,0) e de raio 1). Uma importante consequência da independência estatística é a seguinte: - se X e Y são variáveis aleatórias independentes, então a covariância e a correlação entre elas é nula (memorize para a prova!). GABARITO: B 6. (Fiscal de Rendas-MS/2006/FGV) Analise as afirmativas a seguir, a respeito de duas variáveis aleatórias X e Y: I. II. III. IV. se se se se X e Y são independentes, então Cov(X,Y) = 0; Cov(X,Y) = 0, então X e Y são independentes; X e Y são independentes, então E(XY) = E(X).E(Y); E(XY) = E(X).E(Y), então X e Y são independentes. Assinale: (A) se nenhuma afirmativa estiver correta. (B) se somente as afirmativas I e III estiverem corretas. (C) se somente as afirmativas I e IV estiverem corretas. (D) se somente as afirmativas II e IV estiverem corretas. (E) se todas as afirmativas estiverem corretas. Resolução Sejam X e Y variáveis aleatórias. Então a covariância de X e Y é definida como Se X e Y são variáveis aleatórias independentes, então a covariância entre elas é nula (o que indica que não há associação linear entre elas!), ou seja, Cov(X,Y) = 0 (p/ X e Y independentes) Diz-se que X e Y são não correlacionadas quando Cov(X,Y) = 0. A relação recíproca não é verdadeira: se X e Y são não correlacionadas não podemos afirmar que X e Y sejam independentes. Porém, a não correlação entre X e Y implica independência estatística somente Profs. Alexandre Lima e Moraes Junior www.pontodosconcursos.com.br 19 Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados em Exercícios, incluindo Matemática, Matemática Financeira e Estatística Profs. Alexandre Lima e Moraes Junior quando X e Y têm distribuição conjunta normal, ou seja, quando têm distribuição normal bidimensional, a qual será apresentada mais adiante, após a análise das afirmativas. Análise das afirmativas: I. "se X e Y são independentes, então Cov(X,Y) definição. Verdadeira, por II. "se Cov(X,Y) = 0, então X e Y são independentes" Falsa, pois a relação recíproca não é verdadeira: se X e Y são não correlacionadas não podemos afirmar que X e Y sejam independentes. III. "se X e Y são independentes, então E(XY) = E(X).E(Y)" Cov(X,Y) = 0 implica E(XY) = E(X).E(Y). Verdadeira, pois IV. "se E(XY) = E(X).E(Y), então X e Y são independentes" correlação não implica independência. Falsa, pois a não COMENTÁRIOS ADICIONAIS Distribuição Normal Bidimensional A distribuição normal bivariada ou bidimensional é um modelo importante para variáveis aleatórias contínuas bidimensionais. A variável (X,Y) tem conjunta for dada por distribuição Profs. Alexandre Lima e Moraes Junior normal bidimensional www.pontodosconcursos.com.br se sua densidade 20 Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados em Exercícios, incluindo Matemática, Matemática Financeira e Estatística Profs. Alexandre Lima e Moraes Junior A normal bidimensional possui as seguintes propriedades: (a) As distribuições unidimensionais: marginais de X e Y (b) As distribuições condicionais são normais, com são normais Se X e Y são conjuntamente normais e não correlacionadas (p=0), podemos escrever a densidade conjunta como ou seja, a densidade conjunta é o produto das duas marginais, que são normais. Isto quer dizer que X e Y são independentes no caso em que X e Y tiverem densidade conjunta normal com p=0 (memorize para a prova!) Atenção: a não correlação entre X e Y implica independência estatística somente quando X e Y são variáveis aleatórias conjuntamente Profs. Alexandre Lima e Moraes Junior www.pontodosconcursos.com.br 21 Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados em Exercícios, incluindo Matemática, Matemática Financeira e Estatística Profs. Alexandre Lima e Moraes Junior normais. Isto não é verdade quando X e Y tem distribuição conjunta diferente da normal bidimensional. GABARITO: B Resolução A média condicional é uma função linear de y, ou seja E(X|y) = g(y). Desta forma, E(X|Y=y) é a regressão de X em Y e isso implica que as opções A e B poderiam ser descartadas logo de início, pois ambas são funções da variável x. A opção D contém a expressão correta. GABARITO: D 8. (Analista da SUSEP/Atuária/2010/ESAF) A partir de uma amostra foram obtidas as estatísticas: Qual a reta de regressão estimada de Y em X? Profs. Alexandre Lima e Moraes Junior www.pontodosconcursos.com.br 22 Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados em Exercícios, incluindo Matemática, Matemática Financeira e Estatística Profs. Alexandre Lima e Moraes Junior Resolução A reta a estimar é em que o parâmetro b (estimativa da declividade) é dado por e o parâmetro a (estimativa do intercepto) por Observe que estamos usando uma notação diferente do quantidade S xy definida acima não é a covariância entre X e Y. enunciado: a Vimos que s xy = S xy / n (covariância amostral = soma dos produtos - n) e que sx = S xx /n (variância amostral de X = soma dos quadrados de X - n) Logo, se dividirmos o numerador e o denominador da fórmula de b dada acima por n, poderemos reescrevê-la da seguinte maneira: b = covariância amostral - variância amostral de X Ou seja, b pode ser calculado, de forma alternativa, pela razão entre a covariância amostral Sxy (estamos usando uma notação diferente da do Profs. Alexandre Lima e Moraes Junior www.pontodosconcursos.com.br 23 Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados em Exercícios, incluindo Matemática, Matemática Financeira e Estatística Profs. Alexandre Lima e Moraes Junior enunciado, mas que está coerente com a vista no texto!) e a variância . Logo, e Deste modo, a reta de regressão estimada de Y em X é REVISÃO DA NOÇÃO DE REGRESSÃO LINEAR SIMPLES Seja Y a variável dependente e X a variável suposta sem erro, ou seja, não aleatória. A regressão linear simples pressupõe que seja adotado o modelo (1) em que é o intercepto, da variação de Y ( é a declividade e denota a componente aleatória é uma variável aleatória). É razoável supor que a variável aleatória tenha média nula, a fim de que toda a variação explicada de Y fique em torno da reta de regressão. Isso implica que a reta de regressão fornece a média de Y para cada valor de x considerado. Uma outra suposição básica que pode ser adotada é a de que a variação residual da variável Y seja independente de x. Ou seja, usualmente admite-se que a variação de Y em torno da linha teórica de regressão pode ser descrita por um desvio padrão residual que independe do ponto em consideração. Por fim, admitiremos que a variação de Y em torno da linha teórica de regressão se dê segundo distribuições normais independentes, para qualquer valor de x; o que implica dizer que as variações residuais em relação à reta de regressão são independentes e normalmente distribuídas 2 (vide figura a seguir). 2 Os professores estão cientes do fato de que os resíduos do modelo ajustado nem sempre seguem uma distribuição normal. Contudo, o importante é ter em mente que as variações residuais em relação à reta de regressão são independentes e normalmente distribuídas por hipótese. Isto não implica dizer que os resíduos, de fato, sejam normalmente distribuídos. Acredite: há muitos dados empíricos que violam a hipótese de normalidade! Profs. Alexandre Lima e Moraes Junior www.pontodosconcursos.com.br 24 Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados em Exercícios, incluindo Matemática, Matemática Financeira e Estatística Profs. Alexandre Lima e Moraes Junior Suponhamos que a reta estimativa de (1) seja (2) em que denota os valores dados pela reta estimativa, é a estimativa do também denominado coeficiente de regressão linear, é a parâmetro estimativa do parâmetro Existem diversos métodos de estimação da reta de regressão. Podemos até mesmo estimar a reta visualmente. O método de ajuste visual consiste em traçar diretamente a reta, com auxílio de uma régua, no diagrama de dispersão, procurando fazer, da melhor forma possível, com que essa reta passe por entre os pontos. Esse procedimento, por ser subjetivo, somente será razoável se a correlação linear for muito forte, caso contrário levará a resultados pobres. Por outro lado, o ajuste quadrados, segundo o qual torna mínima a soma dos experimentais i em que a consideração como ilustrado a reta para a qual se pode ser feito pelo método dos mínimos a reta a ser adotada deverá ser aquela que quadrados das distâncias da reta aos pontos distância é igual ao erro aleatório no ponto em pela próxima figura). Ou seja, devemos procurar consiga minimizar A ideia central desse procedimento é simplesmente a de minimizar a variação residual em torno da reta estimativa. Profs. Alexandre Lima e Moraes Junior www.pontodosconcursos.com.br 25 Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados em Exercícios, incluindo Matemática, Matemática Financeira e Estatística Profs. Alexandre Lima e Moraes Junior Tendo em vista a expressão (2), devemos, portanto, impor a condição (3) De acordo com o Cálculo, os parâmetros a e b que minimizam (3) serão aqueles que anulam as derivadas parciais de (3) (4) Não é difícil chegar às expressões (5) (6) as quais fornecem o seguinte sistema de duas equações a duas incógnitas: (7) Profs. Alexandre Lima e Moraes Junior www.pontodosconcursos.com.br 26 Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados em Exercícios, incluindo Matemática, Matemática Financeira e Estatística Profs. Alexandre Lima e Moraes Junior Os pontos (x,y) fornecem os elementos para a montagem de (7), cuja solução forneceria os coeficientes a e b. Entretanto, é mais fácil considerar de uma vez a solução analítica do sistema, segundo a qual (8) GABARITO: C 9. (Técnico de Defesa Aérea e Controle de Tráfego Aéreo/Estatística/2009/CESGRANRIO) Um pesquisador estudou a relação entre o tempo, medido em segundos, que um inspetor leva para reagir a um estímulo visual (Y) e a idade (X), medida em anos completos. Os dados de 25 inspetores foram coletados e obtidas as seguintes informações: As estimativas dos mínimos quadrados, para o coeficiente linear e a inclinação da reta, respectivamente, são: (A) 80 e 3,25 (B) 50 e 2,85 (C) 30 e 2,50 (D) 20 e 4,0 (E) 10 e 3,62 Resolução O modelo de regressão linear simples é Pede-se os valores de a e b, respectivamente. Profs. Alexandre Lima e Moraes Junior www.pontodosconcursos.com.br 27 Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados em Exercícios, incluindo Matemática, Matemática Financeira e Estatística Profs. Alexandre Lima e Moraes Junior Logo, em que b é a inclinação da reta ajustada. Como a única opção em que a inclinação é 2,50 é o item (C), na prova já marcaríamos essa opção sem continuar os cálculos. Não obstante, calcularemos o coeficiente linear (ou intercepto) Assim, encontramos a reta ajustada y = 30 + 2,5x. GABARITO: C 10. (ICMS-SP/2009/FCC) O gráfico abaixo demonstra a evolução da receita tributária anual no estado de São Paulo desde 1999, com os valores arrecadados em bilhões de reais. Profs. Alexandre Lima e Moraes Junior www.pontodosconcursos.com.br 28 Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados em Exercícios, incluindo Matemática, Matemática Financeira e Estatística Profs. Alexandre Lima e Moraes Junior dos mínimos quadrados, com base nas observações de 1999 a 2008, obteve-se para a estimativa de A previsão da receita tributária para 2009, em bilhões de reais, em função da equação obtida pelo método dos mínimos quadrados é igual a Resolução Logo, GABARITO: B 11. (APOFP-SP/2009/ESAF) Uma amostra aleatória simples (X1,Y0, (X 2 ,Y 2 ), ..., (X n ,Y n ) de duas variáveis aleatórias X e Y forneceu as seguintes quantidades: Profs. Alexandre Lima e Moraes Junior www.pontodosconcursos.com.br 29 Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados em Exercícios, incluindo Matemática, Matemática Financeira e Estatística Profs. Alexandre Lima e Moraes Junior Calcule o valor mais próximo do coeficiente de determinação da regressão linear de Y em X. (A) 0,85 (B) 0,83 (C) 0,80 (D) 0,88 (E) 0,92 Resolução PRELIMINARES O Coeficiente de Determinação R 2 Considere as equações reta estimativa da regressão linear simples e estimativas da declividade (b) e do intercepto (a) Então podemos escrever que (1) Se considerarmos a média entre os valores de todos os valores y i e tomarmos as diferenças teremos Usando as fórmulas das somas e a fórmula do coeficiente b, obtemos (2) Profs. Alexandre Lima e Moraes Junior www.pontodosconcursos.com.br 30 Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados em Exercícios, incluindo Matemática, Matemática Financeira e Estatística Profs. Alexandre Lima e Moraes Junior em que a soma de quadrados é calculada com base nos desvios da reta de mínimos quadrados em relação à horizontal como ilustrado pela figura a seguir. Considerando as diferenças residuais, podemos escrever Distribuindo o somatório acima e usando a fórmula de a, chega-se à expressão (3) Substituindo (4) Profs. Alexandre Lima e Moraes Junior www.pontodosconcursos.com.br 31 Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados em Exercícios, incluindo Matemática, Matemática Financeira e Estatística Profs. Alexandre Lima e Moraes Junior É usual escrever (4) usando a notação (5) SQT = SQE + SQR, em que soma dos quadrados total (variação total), soma dos quadrados dos erros (variação residual) e soma dos quadrados da regressão (variação explicada). variação total = variação residual +variação explicada A soma de quadrados SQT mede a variação total de Y independentemente de X, a soma de quadrados SQE mede a variação residual e a soma de quadrados SQR mede o desvio da reta de mínimos quadrados em relação à média (é a variação "explicada" pela reta de regressão). Dividindo ambos os membros da equação (5) por SQT, temos (6) Podemos querer saber quanto representa proporcionalmente a parcela da variação total de Y que é explicada pela reta de regressão, ou seja, quanto vale a razão SQR/SQT. Utilizando (2), podemos escrever (7) Substituindo em (7) obtemos (8) ou Profs. Alexandre Lima e Moraes Junior www.pontodosconcursos.com.br 32 Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados em Exercícios, incluindo Matemática, Matemática Financeira e Estatística Profs. Alexandre Lima e Moraes Junior (9) A fórmula (8) mostra que o coeficiente R 2 de uma regressão linear simples exprime a porcentagem da variação total de Y (SQT) que é explicada pela reta de regressão ajustada. Essa grandeza é chamada coeficiente de determinação 1-R 2 é o coeficiente de indeterminação). O R 2 quantifica o grau de ajuste de um conjunto de dados à reta de regressão estimada. Quanto mais próximo de 1 estiver R 2 melhor terá sido nosso trabalho para explicar a variação em y, com e maior será a capacidade de previsão de nosso modelo sobre todas as observações amostrais. Observe que o coeficiente de determinação é igual ao quadrado do coeficiente de correlação linear de Pearson R. adimensional). No caso de ajuste perfeito, temos R 2 = 1, e não há variação residual, pois todos os pontos estão alinhados. Se, por exemplo, R = ±0,7, teremos um coeficiente de determinação igual a 0,49, significando que a reta de regressão não consegue explicar nem mesmo a metade da variação de Y. Para a reta de regressão explicará mais de 80% da variação total de Y. Voltemos à resolução. Apreendemos que Temos que Logo, O valor mais próximo é 0,80 (C). Profs. Alexandre Lima e Moraes Junior www.pontodosconcursos.com.br 33 Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados em Exercícios, incluindo Matemática, Matemática Financeira e Estatística Profs. Alexandre Lima e Moraes Junior GABARITO: C 12. (ICMS-SP/2006/FCC) Em um determinado país, deseja-se determinar a relação entre a renda disponível (Y), em bilhões de dólares, e o consumo (C), também em bilhões de dólares. Foi utilizado o modelo linear simples em que Ci é o consumo no ano i, Yi é o valor da renda disponível no o erro aleatório com as respectivas hipóteses para a regressão linear àão parâmetros desconhecidos, cujas estimativas foram obtidas através do método dos mínimos quadrados. Para obtenção desta relação considerou-se ainda as seguintes informações colhidas através da observação nos últimos 10 anos: Para o cálculo do coeficiente de correlação de Pearson (R), usou-se a fórmula: em que Cov(Y,C) é a covariância de Y e C, DP(Y) é o desviopadrão de Y e DP(C) é o desvio-padrão de C. Então, (A) o coeficiente de explicação (R 2 ) correspondente é igual a 64%. (B) utilizando a equação da reta obtida pelo método dos mínimos quadrados, tem-se que, em um ano, caso a renda disponível seja igual a 15 bilhões de dólares, o consumo será igual a 13 bilhões de dólares. (C) obtendo para um determinado ano uma previsão para o consumo de 10 bilhões de dólares, significa que a renda disponível considerada foi de 12,5 bilhões de dólares. (D) o valor da estimativa encontrado para o parâmetro (E) o valor da estimativa encontrado para o parâmetro Resolução Atenção: a variável independente dependente é C (consumo). é Y (renda disponível) e a Seja um conjunto de n pares ordenados variáveis Y e C. Vimos que Profs. Alexandre Lima e Moraes Junior www.pontodosconcursos.com.br 34 Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados em Exercícios, incluindo Matemática, Matemática Financeira e Estatística Profs. Alexandre Lima e Moraes Junior Essa quantidade é denominada coeficiente de correlação quando Y e C são tratadas como variáveis aleatórias. O quadrado da mesma quantidade é chamado coeficiente de determinação. No contexto da regressão linear simples, uma das variáveis é considerada determinística ou não estocástica (na questão, a variável independente ou explicativa é Y) e a outra (a variável dependente C) é considerada aleatória. O problema da regressão consiste em determinar a relação funcional entre as variáveis dependente e explicativa. A função de regressão C = a + by nos dá o valor médio de uma das variáveis ( C ) em função do valor observado da outra ( y ) , isto é, E[C|y] = C. Análise das alternativas: Logo, VERDADEIRA (C) FALSA (vide item B). (D) FALSA (vide item B). Profs. Alexandre Lima e Moraes Junior www.pontodosconcursos.com.br 35 Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados em Exercícios, incluindo Matemática, Matemática Financeira e Estatística Profs. Alexandre Lima e Moraes Junior (E) FALSA (vide item B). GABARITO: B 13. (ICMS-RJ/2008/FGV) Sejam X e Y duas variáveis aleatórias quaisquer. Então: A) VAR(X-Y) = VAR(X) - VAR(Y) B) VAR(X-Y) = VAR(X) + VAR(Y) - COV(X,Y) C) VAR(X-Y) = VAR(X) + VAR(Y) - 2COV(X,Y) D) VAR(X-Y) = VAR(X) + VAR(Y) + COV(X,Y) E) VAR(X-Y) = VAR(X) + VAR(Y) + 2COV(X,Y) Resolução Sejam a e b constantes. Então VAR(aX + bY) = a 2 VAR(X) + b 2 VAR(Y) + 2abCOV(X,Y). Nesta questão, a =1 e b = -1. Logo, VAR(X-Y) = VAR(X) + VAR(Y) - 2COV(X,Y). Obs.: leia a revisão de conceitos a seguir caso você não tenha entendido a resolução deste exercício. REVISÃO: MÉDIA E VARIÂNCIA VARIÁVEIS ALEATÓRIAS DE UMA COMBINAÇÃO LINEAR DE Sejam X e Y variáveis aleatórias e Z=g(X,Y) uma função dessas variáveis. Vamos admitir que essa função tenha a forma (1) Z = aX + bY em que a e b são constantes. Essa expressão é uma combinação linear (ou soma ponderada). A esperança de (1) é dada por (2) A Eq. (2) nos diz que o valor esperado de uma combinação linear de duas variáveis aleatórias é a combinação linear de seus respectivos valores esperados. Essa regra pode ser generalizada para um número arbitrário de variáveis aleatórias, quer elas sejam discretas ou continuas. As seguintes regras relativas à variância são válidas: 1. Se X, Y e Z são variáveis aleatórias e a, b e c são constantes, então Profs. Alexandre Lima e Moraes Junior www.pontodosconcursos.com.br 36 Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados em Exercícios, incluindo Matemática, Matemática Financeira e Estatística Profs. Alexandre Lima e Moraes Junior (3) Note que 2. Se X, Y e Z são independentes ou não correlacionadas (4) Se fizermos obtemos (5) A expressão (5) nos diz que a variância da soma de variáveis aleatórias independentes é igual à soma das variâncias (memorize para a prova!). • W • • As regras sobre a variância de três generalizadas para n variáveis aleatórias. • variáveis • f aleatórias m m a podem J m ser GABARITO: C 14. (Analista Técnico da SUSEP/2006/ESAF) Sendo X uma v. a. d. variável aleatória discreta e sendo Y = aX + b, pode concluir-se que var (aX + b) é igual a: Resolução Var(aX + b) = a 2 Var(X) GABARITO: D 15. (AFRF/2005/ESAF) Para uma amostra de dez casais residentes em um mesmo bairro, registram-se os seguintes salários mensais (em salários mínimos): Profs. Alexandre Lima e Moraes Junior www.pontodosconcursos.com.br 37 Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados em Exercícios, incluindo Matemática, Matemática Financeira e Estatística Profs. Alexandre Lima e Moraes Junior 1 2 4 7 Identificação do casal 3 5 6 8 9 10 Salário do marido (Y) 30 25 18 15 20 20 21 20 25 27 Salário da esposa (X) 20 25 12 10 10 20 18 15 18 13 Sabe-se que: Assinale a opção cujo valor corresponda à correlação entre os salários dos homens e os salários das mulheres. A) 0,72 B) 0,75 C) 0,68 D) 0,81 E) 0,78 Resolução Logo, GABARITO: B 16. (Analista do BACEN/Área 3/2006/FCC) Sejam X e Y duas variáveis aleatórias e Profs. Alexandre Lima e Moraes Junior www.pontodosconcursos.com.br 38 Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados em Exercícios, incluindo Matemática, Matemática Financeira e Estatística Profs. Alexandre Lima e Moraes Junior I. E(X) e E(Y) as expectâncias de X e Y, respectivamente; II. Var(X) e Var(Y) as variâncias de X e Y, respectivamente; III. Cov(X,Y) a covariância de X e Y. Tem-se, em qualquer situação, A) E(X).E(Y) = E(XY) - Cov(X,Y) B) Cov(X,Y) = Var(X).Var(Y) C) E(2X+5) = 4E(X) D) Se E(XY) = E(X).E(Y), então X e Y são independentes. E) Var(X+10) = Var(X) + 10 Resolução Sabemos que em que Portanto, a alternativa correta é a (A). A alternativa (B) está errada porque não está de acordo com a definição de covariância. A alternativa (C) não é verdadeira, pois E(2X+5) = 2E(X) + 5. A alternativa (D) é incorreta porque E(XY) = E(X).E(Y) (variáveis X e Y não correlacionadas) não implica independência (mas a recíproca é verdadeira, ou seja, independência implica a não correlação). A alternativa (E) é falsa porque Var(X+10) = Var(X). GABARITO: A 17. (AFRF/2009/ESAF) Na análise de regressão linear simples, as obtidas pelo método de Mínimos Quadrados. Nesse caso, os valores dessas estimativas são obtidos através de uma amostra Yi com (i =1, 2, ...,n) pode-se estabelecer o desvio ou resíduo - aqui denotado por e-t - entre a reta de regressão Y-, e sua estimativa Y i . Sabe-se que o Método de Mínimos Quadrados consiste em Profs. Alexandre Lima e Moraes Junior adotar como www.pontodosconcursos.com.br estimativas dos 39 Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados em Exercícios, incluindo Matemática, Matemática Financeira e Estatística Profs. Alexandre Lima e Moraes Junior os valores que minimizam a soma dos quadrados dos desvios Desse modo, o Método expressão dada por: de Mínimos Quadrados consiste em minimizar a Resolução A questão forneceu todas as informações necessárias para a resolução. Pelo Método dos Mínimos Quadrados temos que minimizar a soma dos quadrados das diferenças entre os valores de Y-t e as respectivas estimativas por meio da reta de regressão. Logo teríamos: Logo alternativa correta é a "B". alternativa "A", mas está errado. O gabarito oficial preliminar indicou a GABARITO: B O enunciado a seguir refere-se às questões de números 18 e 19. A função densidade de probabilidade conjunta de duas variáveis aleatórias discretas é dada pela tabela a seguir: X 2 4 6 1 1/8 1/4 1/8 Y 3 1/24 1/4 1/24 Profs. Alexandre Lima e Moraes Junior 9 1/12 0 1/12 www.pontodosconcursos.com.br 40 Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados em Exercícios, incluindo Matemática, Matemática Financeira e Estatística Profs. Alexandre Lima e Moraes Junior 18. A covariância entre X e Y é A) 1 B) 3 C) 4 D) 12 E) 0 Resolução A covariância expressão entre as variáveis aleatórias discretas X e Y é dada pela Antes, é preciso calcular os valores das médias em que g x (x) é a função de probabilidade marginal de X, dada por é a função de probabilidade marginal de Y, dada por Agora já podemos calcular a covariância, pois temos os valores de Sendo assim, Profs. Alexandre Lima e Moraes Junior www.pontodosconcursos.com.br 41 Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados em Exercícios, incluindo Matemática, Matemática Financeira e Estatística Profs. Alexandre Lima e Moraes Junior Cov(X, Y) = 1/2 + 0 -1 + 0 + 0 + 0 - 1 / 2 + 0 +1 = 0 Logo, X e Y são variáveis não correlacionadas. Você também chegaria ao mesmo resultado se usasse a fórmula equivalente Confirme você mesmo que E[XY ] = 12. Portanto, Cov(X, Y) = 12 - 4 x 3 = 0 GABARITO: E 19. Assinale a alternativa correta. A) X e Y não são independentes. B) X e Y são independentes. C) X e Y são correlacionadas. D) X e Y têm distribuição conjuntamente normal. E) X e Y têm distribuições marginais normais. Resolução Análise das alternativas: (A) Se X e Y são independentes, deve valer f(x i , y d ) = gX (xi) x hY (yd) para quaisquer valores de X e Y. Entretanto, observe que Logo, X e Y não são independentes, apesar de serem não correlacionadas ^ alternativa CORRETA. Profs. Alexandre Lima e Moraes Junior www.pontodosconcursos.com.br 42 Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados em Exercícios, incluindo Matemática, Matemática Financeira e Estatística Profs. Alexandre Lima e Moraes Junior (B) Alternativa INCORRETA, haja vista o explicado acima. (C) Alternativa INCORRETA, pois X e Y são não correlacionadas. (D) Nada se pode afirmar sobre a distribuição conjunta de X e Y ^ alternativa INCORRETA. (E) Nada se pode afirmar sobre alternativa INCORRETA. as distribuições marginais de X e Y ^ GABARITO: A O enunciado a seguir refere-se às questões de números 20 e 21. Considere as variáveis aleatórias independentes X l3 X 2 ,...,X n . Suponha que essas n variáveis possuam a mesma distribuição de probabilidades com média ^ e variância a 2 . Seja 20. Podemos afirmar que o valor esperado de Resolução GABARITO: C 21. Podemos afirmar que a variância de Profs. Alexandre Lima e Moraes Junior www.pontodosconcursos.com.br 43 Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados em Exercícios, incluindo Matemática, Matemática Financeira e Estatística Profs. Alexandre Lima e Moraes Junior Resolução Observação: os resultados obtidos são conseqüência da Lei (fraca) dos Grandes Números. Por exemplo, assuma que você tenha registrado o de uma variável aleatória X com média conjunto de observações (desconhecida) e variância também desconhecida). Suponha que n seja um número suficientemente grande. Então a média pode ser estimada pela média amostral As duas questões desejadas para posterior). mostram qualquer que o estimador estimador (este é assunto será não visto viesado em aula GABARITO: B 22. (Analista do BACEN/Área 3/2006/FCC) Uma empresa, com a finalidade de determinar a relação entre os gastos anuais com propaganda (X), em R$ 1 000,00, e o lucro bruto anual (Y), em R$1.000,00, optou por utilizar o Considerou, para o estudo, as seguintes observações nos últimos 10 anos da empresa: Profs. Alexandre Lima e Moraes Junior informações www.pontodosconcursos.com.br referentes às 44 Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados em Exercícios, incluindo Matemática, Matemática Financeira e Estatística Profs. Alexandre Lima e Moraes Junior Utilizando a equação da reta obtida pelo método dos mínimos quadrados, temse que, caso haja um gasto anual com propaganda de 80 mil reais, a previsão do lucro bruto anual, em mil reais, será de A) 84 B) 102,5 C) 121 D) 128,4 E) 158 Resolução Fazendo os cálculos, temos que Logo, A equação da reta de mínimos quadrados é Substituindo o valor x = 80 na equação acima obtemos Profs. Alexandre Lima e Moraes Junior www.pontodosconcursos.com.br 45 Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados em Exercícios, incluindo Matemática, Matemática Financeira e Estatística Profs. Alexandre Lima e Moraes Junior GABARITO: B 23. (INÉDITA) Considere os dados da questão 22. O coeficiente de correlação é de A) 0 B) 2,5 C) 1,25 D) 0,88 E) 0,63 Resolução GABARITO: D 24. (ICMS-RJ/2008/FGV) Sejam X, Y e Z três variáveis com correlações de Pearson expressas pela matriz abaixo: X Y Z X 1,000 0,800 0,000 Y Z 1,000 -0,500 1,000 Pode-se, então, afirmar que: A) X e Z são independentes. B) a correlação parcial entre X e Y, após a correção para Z, é negativa. C) o coeficiente de determinação da regressão de Y em X é maior do que 60%. D) a correlação entre é negativa. Profs. Alexandre Lima e Moraes Junior www.pontodosconcursos.com.br 46 Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados em Exercícios, incluindo Matemática, Matemática Financeira e Estatística Profs. Alexandre Lima e Moraes Junior E) a covariância entre X e Y é igual a 0,64. Resolução Análise das alternativas: (A) "X e Z são independentes." A tabela indica que X e Z são não correlacionadas, pois RXZ = 0. Contudo, a não correlação não implica independência ^ alternativa INCORRETA. (B) "a correlação parcial entre X e Y, após a correção para Z, é negativa." A tabela indica que a correlação ente X e Y é igual a 0,8 (positiva) ^ alternativa INCORRETA. (C) "o coeficiente de determinação da regressão de 60%." Y em X é maior do que A tabela indica que a correlação ente X e Y é R = 0,8. Logo o coeficiente de determinação é R 2 = 0,8 2 = 0,64 = 64% (maior do que 60%) ^ alternativa CORRETA. d<0 é negativa." Note que V e W são funções lineares de X e Z, respectivamente. Se a correlação entre X e Z é nula, então a correlação entre V e W também é nula ^ alternativa INCORRETA. (E) "a covariância entre X e Y é igual a 0,64." Aprendemos que R = s xy /(sxsy), em que sxy é a covariância amostral entre X e Y, s x denota o desvio-padrão amostral de X e s y denota o desvio-padrão amostral de Y. Como não foram dados os valores de sx e de sy, nada se pode afirmar sobre o valor da covariância entre X e Y ^ alternativa INCORRETA. GABARITO: C Profs. Alexandre Lima e Moraes Junior www.pontodosconcursos.com.br 47 Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados em Exercícios, incluindo Matemática, Matemática Financeira e Estatística Profs. Alexandre Lima e Moraes Junior Assinale: A) se somente a afirmativa I for verdadeira. B) se somente as afirmativas I e II forem verdadeiras. C) se somente as afirmativas I e III forem verdadeiras. D) se somente as afirmativas II e II forem verdadeiras. E) se todas as afirmativas forem verdadeiras. Resolução Análise das afirmativas: (I) VERDADEIRA, pois a 2 = 10a1, conforme demonstrado acima. (II) FALSA, dado que b 2 = 10b! +100 . (III) Dados: - aplicação da transformação linear ^ = 10y + 100 resulta no coeficiente de Vimos que a correlação amostral R é dada por Então, Profs. Alexandre Lima e Moraes Junior www.pontodosconcursos.com.br 48 Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados em Exercícios, incluindo Matemática, Matemática Financeira e Estatística Profs. Alexandre Lima e Moraes Junior e Conclui-se que a transformação qualidade da regressão original linear Y' = 10Y + 100 não altera a Portanto, a assertiva (III) é VERDADEIRA. (*) Esta propriedade é válida para qualquer transformação que seja linear. GABARITO: C para os demais valores de x. Suponha que X 1 e X 2 sejam variáveis aleatórias independentes, cada uma delas com a função densidade de probabilidade f(x). Então podemos afirmar que a função densidade de probabilidade conjunta f(x1,x2) é Profs. Alexandre Lima e Moraes Junior www.pontodosconcursos.com.br 49 Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados em Exercícios, incluindo Matemática, Matemática Financeira e Estatística Profs. Alexandre Lima e Moraes Junior Resolução para os demais valores de xj. Logo, caso contrário. GABARITO: D 27. (Fiscal de Rendas do Município do RJ/2010/ESAF) A partir de uma amostra aleatória simples formada por 22 observações das variáveis X e Y calculou-se Obtenha a reta de regressão linear de Y em X. Resolução Modelo de regressão linear simples: é o intercepto, denota a componente aleatória da variação de Y (s é uma variável aleatória). denota os valores dados pela reta estimativa, é a estimativa do parâmetro Profs. Alexandre Lima e Moraes Junior www.pontodosconcursos.com.br é a estimativa do 50 Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados em Exercícios, incluindo Matemática, Matemática Financeira e Estatística Profs. Alexandre Lima e Moraes Junior Dados: - cov. amostral - (desvio padrão amostral de X) 2 - média de Y = - média de X = Logo, Reta estimativa: (opção E). GABARITO: E 28. (Fiscal de Rendas do Município do RJ/2010/ESAF) Com os dados da questão anterior, calcule o valor mais próximo do coeficiente de determinação R 2 da regressão linear de X em Y. A) 0,65 B) 0,81 C) 0,85 D) 0,91 E) 0,88 Resolução Nunca podemos esquecer os conceitos fundamentais. Lembre que a correlação entre as variáveis aleatórias X e Y, denotada por p(X,Y), é dada por: Profs. Alexandre Lima e Moraes Junior www.pontodosconcursos.com.br 51 Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados em Exercícios, incluindo Matemática, Matemática Financeira e Estatística Profs. Alexandre Lima e Moraes Junior = covariância/(desvio padrão de X . desvio padrão de Y) O módulo da correlação sempre é menor ou igual a A correlação amostral ou coeficiente de correlação linear de Pearson (R) é o estimador da correlação p(X,Y), sendo dada por: R = cov. amostral/(desv. padrão amostral de X . desv. padrão amostral de Y) ou NOTA: não confunda correlação amostral R com correlação p(X,Y)! A primeira é uma estimativa da segunda. A correlação é um momento estatístico. Só conseguimos calcular a correlação p(X,Y) quando conhecemos a distribuição conjunta de probabilidade de X e Y, ou seja, quando sabemos quem é a função f(X,Y). GABARITO: C 29. (ICMS-RJ/2011/FGV) variáveis, X e Y. A tabela X 4 4 3 2 abaixo mostra os valores de duas Y 4,5 5 5 5,5 Sabe-se que Profs. Alexandre Lima e Moraes Junior www.pontodosconcursos.com.br 52 Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados em Exercícios, incluindo Matemática, Matemática Financeira e Estatística Profs. Alexandre Lima e Moraes Junior O valor de b na regressão simples Y = a + bX é A) 11/5 B) -3/8 C) -4/11 D) -4/17 E) -11/65 Resolução O valor de b na regressão simples é dado por Lembre que A tabela tem n = 4 pares de dados (X,Y). Agora podemos efetuar as contas: Profs. Alexandre Lima e Moraes Junior www.pontodosconcursos.com.br 53 Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados em Exercícios, incluindo Matemática, Matemática Financeira e Estatística Profs. Alexandre Lima e Moraes Junior GABARITO: C 30. (ICMS-RJ/2011/FGV) Para duas variáveis populacionais, X e Y, o desvio-padrão de X é 40, o desvio-padrão de Y é 20 e a covariância entre Y e X é -100. Assim, o coeficiente de correlação entre X e Y é A) -0,5. B) 2 C) -0,25 D) -0,125 E) 0,125 Resolução Questão imediata. Sabemos que GABARITO: D 31. (Economista-CODEBA/2010/FGV) Sejam aleatórias para uma amostra de tamanho N. Defina a Média amostral avalie as afirmativas abaixo: I. O valor esperado da média amostral II. A variância da média amostral é III. O valor esperado de Assinale A) se apenas as afirmativas I e II estiverem corretas. B) se apenas as afirmativas I e III estiverem corretas. Profs. Alexandre Lima e Moraes Junior www.pontodosconcursos.com.br 54 Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados em Exercícios, incluindo Matemática, Matemática Financeira e Estatística Profs. Alexandre Lima e Moraes Junior C) se apenas as afirmativas II e III estiverem corretas. D) se todas as afirmativas estiverem corretas. E) se nenhuma das afirmativas estiver correta. Resolução Apesar de o enunciado ter sido omisso quanto à independência das variáveis aleatórias X13 X 2, X 3,..., X N , é razoável assumir que elas sejam independentes (*). Vimos que afirmativa I está correta. afirmativa II está correta. Além disso, afirmativa III está correta. (*) Entendemos que o enunciado não é preciso, haja vista que as observações de uma amostra nem sempre são independentes. Por exemplo, isso ocorre em algumas séries financeiras do mundo real, em que as amostras podem apresentar um alto grau de correlação. GABARITO: D Exercícios de Revisão (AFTM-SP/2007/FCC/Adaptada) Instruções: para responder à próxima questão, utilize, dentre as informações abaixo, as que julgar adequadas. Se Z tem distribuição normal padrão, então: P(0< Z < 1) = 0,341, P(0< Z < 1,6) = 0,445, P(0< Z < 2) = 0,477 32. Os depósitos efetuados no Banco B, num determinado mês, têm distribuição normal com média R$ 9.000,00 e desvio padrão R$ 1.500,00. Um Profs. Alexandre Lima e Moraes Junior www.pontodosconcursos.com.br 55 Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados em Exercícios, incluindo Matemática, Matemática Financeira e Estatística Profs. Alexandre Lima e Moraes Junior depósito é selecionado ao acaso dentre todos os referentes ao mês em questão. A probabilidade de que o depósito exceda R$ 6.000,00 é de A) 97,7% B) 94,5% C) 68,2% D) 47,7% E) 34,1% Resolução Dados: X é uma variável aleatória normal com Normal padrão: P(Z > -2,0) = P(Z < 2,0) = 0,5 + P(0,0 < Z < 2,0) = 0,5 + 0,477 = 0,977 = 97,7% GABARITO: A 33. (AFTE-RS/2009/Fundatec) Seja X uma variável aleatória contínua, com A) 0,5 B) 0 C) 2/3 D) 1 E) 1/3 Resolução Profs. Alexandre Lima e Moraes Junior www.pontodosconcursos.com.br 56 Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados em Exercícios, incluindo Matemática, Matemática Financeira e Estatística Profs. Alexandre Lima e Moraes Junior O gráfico da figura acima ilustra a forma da função densidade de probabilidade de X, denotada por f(x). Como f(x) é simétrica em relação a zero, temos que a média de X é zero (opção B). Repare que resolvemos a questão sem fazer nenhuma conta! Bastou saber esboçar o gráfico de f(x). Por completeza, calculemos o valor da constante "c". Sabemos que a área sob f(x) é unitária. Então, 2 x (área do triângulo retângulo delimitado por 0<x<1/c) = 1 2 x (base x altura)/2 = 1 base x altura = 1 A figura a seguir mostra o gráfico de f(x). GABARITO: B 34. (AFTE-RS/2009/Fundatec) Seja Z uma variável aleatória contínua normalmente distribuída com média zero e desvio padrão um. Seja Seja X uma variável aleatória contínua normalmente distribuída P(180<X<240), é: com média 200 e desvio padrão 20, então A) 0,9772 B) 0,8413 C) 0,3413 D) 0,8185 E) 0,4772 Resolução Profs. Alexandre Lima e Moraes Junior www.pontodosconcursos.com.br 57 Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados em Exercícios, incluindo Matemática, Matemática Financeira e Estatística Profs. Alexandre Lima e Moraes Junior Dados: X1 = 180, X2 = 240, P(Z < - 1 ) = 0,1587 e P(Z > 2) = 0,0228. Z1 = (180 - 200)/20 = -1 Z2 = (240 - 200)/20 = 2 Pede-se P(180<X<240) = P(-1<Z<2). P(-1<Z<2) = P(-1<Z<0) + P(0<Z<2) Mas P(-1<Z<0) = 0,5 - P(Z<-1) e P(0<Z<2) = 0,5 - P(Z>2). Logo, P(-1<Z<2) = 0,5 - P(Z<-1) + 0,5 - P(Z>2) = 0,5 - 0,1587 + 0,5 - 0,0228 = 0,8185 (opção D). GABARITO: D Abraços e até a próxima aula. Bons estudos! Moraes Junior [email protected] Alexandre Lima [email protected] Profs. Alexandre Lima e Moraes Junior www.pontodosconcursos.com.br 58 Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados em Exercícios, incluindo Matemática, Matemática Financeira e Estatística Profs. Alexandre Lima e Moraes Junior Questões Comentadas e Resolvidas Nesta Aula 1. (Analista da SUSEP/Atuária/2001/ESAF) Uma loja vende lavadoras e secadoras de roupa. A distribuicão conjunta do número N1 de secadoras e do número N2 de lavadoras vendidas num mesmo dia é dada na tabela abaixo. Assinale a opcão que dá a probabilidade de que a venda, num mesmo dia, de lavadoras seja igual à de secadoras. N1 N2 0 1 2 3 1 0,13 0,11 0,06 0,01 0 0,25 0,15 0,08 0,01 2 0,04 0,02 0,05 0,01 3 0,02 0,01 0,02 0,03 (A) 0,54 (B) 0,50 (C) 0,49 (D) 0,44 (E) 0,19 Julgue os itens a seguir. 2. Seja a distribuição conjunta de X e Y f(x,y) = e -x-y , x>0, y>0. Então, a densidade marginal f X (x) é dada por f x (x) = e -y , para x>0. 3. Sejam X e Y variáveis aleatórias discretas com a seguinte distribuição conjunta: Y=1 0,27 0,32 X=0 X=1 Y=2 0,16 0,22 Y=3 0,01 0,02 Então a tabela abaixo especifica a distribuição condicional de X dado que Y=1: x f X |Y(x y=1) 0 0,458 1 0,542 4. Considere a função de distribuição conjunta f(x,y) = e -x-y , Profs. Alexandre Lima e Moraes Junior x>0, y>0. www.pontodosconcursos.com.br 59 Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados em Exercícios, incluindo Matemática, Matemática Financeira e Estatística Profs. Alexandre Lima e Moraes Junior Pode-se afirmar que X e Y são variáveis aleatórias independentes. 5. As variáveis aleatórias X e Y são independentes. Então é válida a expressão (A) E[XY] = E[X 2]E[Y2] (B) E[XY] = E[X]E[Y] (C) E[XY ] = E[X]/ E[Y] (D) E[XY] = Cov(X, Y) (E) E[XY] = (E[X]E[Y])2 6. (Fiscal de Rendas-MS/2006/FGV) Analise as afirmativas a seguir, a respeito de duas variáveis aleatórias X e Y: I. II. III. IV. se se se se X e Y são independentes, então Cov(X,Y) = 0; Cov(X,Y) = 0, então X e Y são independentes; X e Y são independentes, então E(XY) = E(X).E(Y); E(XY) = E(X).E(Y), então X e Y são independentes. Assinale: (A) se nenhuma afirmativa estiver correta. (B) se somente as afirmativas I e III estiverem corretas. (C) se somente as afirmativas I e IV estiverem corretas. (D) se somente as afirmativas II e IV estiverem corretas. (E) se todas as afirmativas estiverem corretas. 7. (Analista da SUSEP/Atuária/2010/ESAF). Y e X são variáveis aleatórias com distribuição normal conjunta com E(Y) = |jY, E(X) = j X , e Cov(Y,X) = pa Y a X , onde a Y e G x são os desvios padrões de Y e X, respectivamente, e p o coeficiente de correlação entre Y e X. Qual a expressão da regressão de X em Y, E(X|Y=y)? 8. (Analista da SUSEP/Atuária/2010/ESAF) A partir de uma amostra aleatória (X 1 ,Y 1 ), (X 2 ,Y 2 ),..., (X 20 ,Y 20 ) foram obtidas as estatísticas: Profs. Alexandre Lima e Moraes Junior www.pontodosconcursos.com.br 60 Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados em Exercícios, incluindo Matemática, Matemática Financeira e Estatística Profs. Alexandre Lima e Moraes Junior Qual a reta de regressão estimada de Y em X? 9. (Técnico de Defesa Aérea e Controle de Tráfego Aéreo/Estatística/2009/CESGRANRIO) Um pesquisador estudou a relação entre o tempo, medido em segundos, que um inspetor leva para reagir a um estímulo visual (Y) e a idade (X), medida em anos completos. Os dados de 25 inspetores foram coletados e obtidas as seguintes informações: As estimativas dos mínimos quadrados, para o coeficiente linear e a inclinação da reta, respectivamente, são: (A) 80 e 3,25 (B) 50 e 2,85 (C) 30 e 2,50 (D) 20 e 4,0 (E) 10 e 3,62 10. (ICMS-SP/2009/FCC) O gráfico abaixo demonstra a evolução da receita tributária anual no estado de São Paulo desde 1999, com os valores arrecadados em bilhões de reais. Profs. Alexandre Lima e Moraes Junior www.pontodosconcursos.com.br 61 Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados em Exercícios, incluindo Matemática, Matemática Financeira e Estatística Profs. Alexandre Lima e Moraes Junior (Fonte: Secretaria da Fazenda do Estado de São Paulo - Histórico da receita tributária) Para estimar a receita tributária em um determinado ano com base no comportamento sugerido pelo gráfico, adotou-se o modelo 1, 2, 3, ..., sendo Yt = ln(RT t ), em que RTt é a receita tributária no ano (1998+t) em bilhões de reais e ln o logaritmo neperiano parâmetros desconhecidos e o erro aleatório com as respectivas hipóteses consideradas para o modelo de regressão linear simples. Utilizando o método dos mínimos quadrados, com base nas observações de 1999 a 2008, obteve-se valor de 0,12, sabendo-se que: para a estimativa de A previsão da receita tributária para 2009, em bilhões de reais, em função da equação obtida pelo método dos mínimos quadrados é igual a 11. (APOFP-SP/2009/ESAF) Uma amostra aleatória simples de duas variáveis aleatórias X e Y forneceu as seguintes quantidades: Profs. Alexandre Lima e Moraes Junior www.pontodosconcursos.com.br 62 Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados em Exercícios, incluindo Matemática, Matemática Financeira e Estatística Profs. Alexandre Lima e Moraes Junior Calcule o valor mais próximo do coeficiente de determinação da regressão linear de Y em X. (A) 0,85 (B) 0,83 (C) 0,80 (D) 0,88 (E) 0,92 12. (ICMS-SP/2006/FCC) Em um determinado país, deseja-se determinar a relação entre a renda disponível (Y), em bilhões de dólares, e o consumo (C), também em bilhões de dólares. Foi utilizado o modelo linear simples em que Ci é o consumo no ano i, Yi é o valor da renda disponível no o erro aleatório com as respectivas hipóteses para a regressão linear simples. são parâmetros desconhecidos, cujas estimativas foram obtidas através do método dos mínimos quadrados. Para obtenção desta relação considerou-se ainda as seguintes informações colhidas através da observação nos últimos 10 anos: Para o cálculo do coeficiente de correlação de Pearson (R), usou-se a fórmula: em que Cov(Y, C) é a covariância de Y e C, DP(Y) é o desviopadrão de Y e DP(C) é o desvio-padrão de C. Então, (A) o coeficiente de explicação (R 2 ) correspondente é igual a 64%. (B) utilizando a equação da reta obtida pelo método dos mínimos quadrados, tem-se que, em um ano, caso a renda disponível seja igual a 15 bilhões de dólares, o consumo será igual a 13 bilhões de dólares. (C) obtendo para um determinado ano uma previsão para o consumo de 10 bilhões de dólares, significa que a renda disponível considerada foi de 12,5 bilhões de dólares. (D) o valor da estimativa encontrado para o parâmetro (E) o valor da estimativa encontrado para o parâmetro Profs. Alexandre Lima e Moraes Junior www.pontodosconcursos.com.br 63 Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados em Exercícios, incluindo Matemática, Matemática Financeira e Estatística Profs. Alexandre Lima e Moraes Junior 13. (ICMS-RJ/2008/FGV) Sejam X e Y duas variáveis aleatórias quaisquer. Então: A) VAR(X-Y) = VAR(X) - VAR(Y) B) VAR(X-Y) = VAR(X) + VAR(Y) - COV(X,Y) C) VAR(X-Y) = VAR(X) + VAR(Y) - 2COV(X,Y) D) VAR(X-Y) = VAR(X) + VAR(Y) + COV(X,Y) E) VAR(X-Y) = VAR(X) + VAR(Y) + 2COV(X,Y) 14. (Analista Técnico da SUSEP/2006/ESAF) Sendo X uma v. a. d. variável aleatória discreta e sendo Y = aX + b, pode concluir-se que var (aX + b) é igual a: A) = var X. B) = E(X 2 ) - (EX) 2 . C) = E(X - E(X)) 2 . D) = a 2 var X. E) = a 2 var X - b. 15. (AFRF/2005/ESAF) Para uma amostra de dez casais residentes em um mesmo bairro, registram-se os seguintes salários mensais (em salários mínimos): Identificação do casal Salário do marido (Y) Salário da esposa (X) 1 30 20 2 25 25 3 18 12 4 15 10 5 20 10 6 20 20 7 21 18 8 20 15 9 25 18 10 27 13 Sabe-se que: Assinale a opção cujo valor corresponda à correlação entre os salários dos homens e os salários das mulheres. A) 0,72 B) 0,75 C) 0,68 D) 0,81 E) 0,78 Profs. Alexandre Lima e Moraes Junior www.pontodosconcursos.com.br 64 Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados em Exercícios, incluindo Matemática, Matemática Financeira e Estatística Profs. Alexandre Lima e Moraes Junior 16. (Analista do BACEN/Área 3/2006/FCC) Sejam X e Y duas variáveis aleatórias e I. E(X) e E(Y) as expectâncias de X e Y, respectivamente; II. Var(X) e Var(Y) as variâncias de X e Y, respectivamente; III. Cov(X,Y) a covariância de X e Y. Tem-se, em qualquer situação, A) E(X).E(Y) = E(XY) - Cov(X,Y) B) Cov(X,Y) = Var(X).Var(Y) C) E(2X+5) = 4E(X) D) Se E(XY) = E(X).E(Y), então X e Y são independentes. E) Var(X+10) = Var(X) + 10 17. (AFRF/2009/ESAF) Na análise estimativas de regressão linear simples, as da reta de regressão podem ser obtidas pelo método de Mínimos Quadrados. Nesse caso, os valores dessas estimativas são obtidos através de uma amostra de n pares de valores Xi Y com (i =1, 2, ....,n), obtendo-se: é a estimativa de Para cada par de valores Xi Yi com (i =1, 2, ...,n) pode-se estabelecer o desvio ou resíduo - aqui denotado por ei - entre a reta de regressão Yi e sua estimativa Sabe-se que o Método de Mínimos Quadrados consiste em adotar como estimativas dos os valores que minimizam a soma dos quadrados dos desvios parâmetros ei. Desse modo, o Método expressão dada por: de Mínimos Quadrados consiste em minimizar a O enunciado a seguir refere-se às questões de números 18 e 19. Profs. Alexandre Lima e Moraes Junior www.pontodosconcursos.com.br 65 Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados em Exercícios, incluindo Matemática, Matemática Financeira e Estatística Profs. Alexandre Lima e Moraes Junior A função densidade de probabilidade conjunta de duas variáveis aleatórias discretas é dada pela tabela a seguir: X 2 4 6 Y 3 1/24 1/4 1/24 1 1/8 1/4 1/8 9 1/12 0 1/12 18. A covariância entre X e Y é A) 1 B) 3 C) 4 D) 12 E) 0 19. Assinale a alternativa correta. A) X e Y não são independentes. B) X e Y são independentes. C) X e Y são correlacionadas. D) X e Y têm distribuição conjuntamente normal. E) X e Y têm distribuições marginais normais. O enunciado a seguir refere-se às questões de números 20 e 21. Considere as variáveis aleatórias independentes Xl,X2,...,Xn. Suponha que essas n variáveis possuam a mesma distribuição de probabilidades com média 20. Podemos afirmar que o valor esperado de Profs. Alexandre Lima e Moraes Junior www.pontodosconcursos.com.br 66 Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados em Exercícios, incluindo Matemática, Matemática Financeira e Estatística Profs. Alexandre Lima e Moraes Junior 21. Podemos afirmar que a variância de 22. (Analista do BACEN/Área 3/2006/FCC) Uma empresa, com a finalidade de determinar a relação entre os gastos anuais com propaganda (X), em R$ 1 000,00, e o lucro bruto anual (Y), em R$1.000,00, optou por utilizar o modelo linear simples é o valor do lucro bruto auferido no ano i, X i é o valor gasto com propaganda no ano aleatório com as respectivas hipóteses consideradas para a regressão linear simples são parâmetros desconhecidos). Considerou, para o estudo, as seguintes observações nos últimos 10 anos da empresa: informações referentes às Utilizando a equação da reta obtida pelo método dos mínimos quadrados, temse que, caso haja um gasto anual com propaganda de 80 mil reais, a previsão do lucro bruto anual, em mil reais, será de A) 84 B) 102,5 C) 121 D) 128,4 E) 158 23. (INÉDITA) Considere os dados da questão 22. O coeficiente de correlação é de A) 0 B) 2,5 C) 1,25 D) 0,88 Profs. Alexandre Lima e Moraes Junior www.pontodosconcursos.com.br 67 Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados em Exercícios, incluindo Matemática, Matemática Financeira e Estatística Profs. Alexandre Lima e Moraes Junior E) 0,63 24. (ICMS-RJ/2008/FGV) Sejam X, Y e Z três variáveis com correlações de Pearson expressas pela matriz abaixo: X Y Z X 1,000 0,800 0,000 Y Z 1,000 -0,500 1,000 Pode-se, então, afirmar que: A) X e Z são independentes. B) a correlação parcial entre X e Y, após a correção para Z, é negativa. C) o coeficiente de determinação da regressão de Y em X é maior do que 60%. D) a correlação entre V = a + b.X e W = c + d.Z, com a ^ 0, c ^ 0, b>0 e d<0 é negativa. E) a covariância entre X e Y é igual a 0,64. 25. (ICMS-RJ/2009/FGV) Utilizando uma análise de regressão linear simples, um pesquisador obteve um ajuste Y = aX + bi e um coeficiente de determinação R 2 . Um segundo pesquisador analisou os mesmos dados, mas antes aplicou a cada observação de Y a transformação Y' = 10Y + 100, obtendo um outro ajuste Y' = a2x + b2, com um coeficiente de determinação R 2 . Considere as afirmativas abaixo, relativas à comparação entre os valores obtidos nas duas análises: Assinale: A) se somente a afirmativa I for verdadeira. B) se somente as afirmativas I e II forem verdadeiras. C) se somente as afirmativas I e III forem verdadeiras. D) se somente as afirmativas II e II forem verdadeiras. E) se todas as afirmativas forem verdadeiras. 26. Seja a função densidade de probabilidade para os demais valores de x. Suponha que X1 e X2 sejam variáveis aleatórias independentes, cada uma delas com a função densidade de probabilidade f(x). Profs. Alexandre Lima e Moraes Junior www.pontodosconcursos.com.br 68 Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados em Exercícios, incluindo Matemática, Matemática Financeira e Estatística Profs. Alexandre Lima e Moraes Junior Então podemos afirmar que a função densidade de probabilidade conjunta f(x1,x2) é 27. (Fiscal de Rendas do Município do RJ/2010/ESAF) A partir de uma amostra aleatória simples formada por 22 observações das variáveis X e Y calculou-se Obtenha a reta de regressão linear de Y em X. 28. (Fiscal de Rendas do Município do RJ/2010/ESAF) Com os dados da questão anterior, calcule o valor mais próximo do coeficiente de determinação R 2 da regressão linear de X em Y. A) 0,65 B) 0,81 C) 0,85 D) 0,91 E) 0,88 Profs. Alexandre Lima e Moraes Junior www.pontodosconcursos.com.br 69 Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados em Exercícios, incluindo Matemática, Matemática Financeira e Estatística Profs. Alexandre Lima e Moraes Junior 29. (ICMS-RJ/2011/FGV) variáveis, X e Y. A tabela abaixo X 4 4 3 2 mostra os valores de duas Y 4,5 5 5 5,5 Sabe-se que O valor de b na regressão simples Y = a + bX é A) 11/5 B) -3/8 C) -4/11 D) -4/17 E) -11/65 30. (ICMS-RJ/2011/FGV) Para duas variáveis populacionais, X e Y, o desvio-padrão de X é 40, o desvio-padrão de Y é 20 e a covariância entre Y e X é -100. Assim, o coeficiente de correlação entre X e Y é A) -0,5. B) 2 C) -0,25 D) -0,125 E) 0,125 31. (Economista-CODEBA/2010/FGV) Sejam X, X2, X3,..., X N variáveis aleatórias para uma amostra de tamanho N. Defina a Média amostral avalie as afirmativas abaixo: Profs. Alexandre Lima e Moraes Junior www.pontodosconcursos.com.br 70 Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados em Exercícios, incluindo Matemática, Matemática Financeira e Estatística Profs. Alexandre Lima e Moraes Junior I. O valor esperado da média amostral é II. A variância da média amostral é III. O valor esperado de Assinale A) se apenas as afirmativas I e II estiverem corretas. B) se apenas as afirmativas I e III estiverem corretas. C) se apenas as afirmativas II e III estiverem corretas. D) se todas as afirmativas estiverem corretas. E) se nenhuma das afirmativas estiver correta. Exercícios de Revisão (AFTM-SP/2007/FCC/Adaptada) Instruções: para responder à próxima questão, utilize, dentre as informações abaixo, as que julgar adequadas. Se Z tem distribuição normal padrão, então: P(0< Z < 1) = 0,341, P(0< Z < 1,6) = 0,445, P(0< Z < 2) = 0,477 32. Os depósitos efetuados no Banco B, num determinado mês, têm distribuição normal com média R$ 9.000,00 e desvio padrão R$ 1.500,00. Um depósito é selecionado ao acaso dentre todos os referentes ao mês em questão. A probabilidade de que o depósito exceda R$ 6.000,00 é de A) 97,7% B) 94,5% C) 68,2% D) 47,7% E) 34,1% 33. (AFTE-RS/2009/Fundatec) Seja X uma variável aleatória contínua, com função densidade de probabilidade dada por O valor da média de X é A) 0,5 B) 0 C) 2/3 D) 1 E) 1/3 34. (AFTE-RS/2009/Fundatec) Profs. Alexandre Lima e Moraes Junior Seja Z uma variável www.pontodosconcursos.com.br aleatória contínua 71 Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados em Exercícios, incluindo Matemática, Matemática Financeira e Estatística Profs. Alexandre Lima e Moraes Junior normalmente distribuída com média zero e desvio padrão um. Seja P(Z < - 1 ) = 0,1587 e P(Z > 2) = 0,0228 . Seja X uma variável aleatória contínua normalmente distribuída P(180<X<240), é: com média 200 e desvio padrão 20, então A) 0,9772 B) 0,8413 C) 0,3413 D) 0,8185 E) 0,4772 Profs. Alexandre Lima e Moraes Junior www.pontodosconcursos.com.br 72