[2011] Raciocínio Lógico para Traumatizados

Propaganda
Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados em
Exercícios, incluindo Matemática, Matemática Financeira e Estatística
Profs. Alexandre Lima e Moraes Junior
Aula 9 - Questões Comentadas e Resolvidas
Variável Aleatória Bivariada: função de probabilidade conjunta, função
de probabilidade marginal, função de probabilidade condicional.
Variáveis aleatórias independentes. Esperanças envolvendo duas ou
mais variáveis: correlação e covariância. Introdução à Regressão
Linear.
1. (Analista da SUSEP/Atuária/2001/ESAF) Uma loja vende lavadoras e
secadoras de roupa. A distribuição conjunta do número N1 de secadoras e do
número N2 de lavadoras vendidas num mesmo dia é dada na tabela abaixo.
Assinale a opcão que dá a probabilidade de que a venda, num mesmo dia, de
lavadoras seja igual à de secadoras.
N1 N2
0
1
2
3
0
0,25
0,15
0,08
0,01
1
0,13
0,11
0,06
0,01
2
0,04
0,02
0,05
0,01
3
0,02
0,01
0,02
0,03
(A) 0,54
(B) 0,50
(C) 0,49
(D) 0,44
(E) 0,19
Resolução
REVISÃO DA NOÇÃO DE FUNÇÃO DE PROBABILIDADE CONJUNTA
Na aula anterior, estudamos distribuições de probabilidade para uma única
variável aleatória. Entretanto, em muitas situações práticas, atribuímos a um
mesmo ponto amostral os valores de duas ou mais variáveis aleatórias ao
descrevermos
os
resultados
de
um
experimento.
Nesta
aula,
nos
concentraremos no caso de um par de variáveis aleatórias.
Exemplo: Considere o lançamento simultâneo de duas moedas não viciadas.
Os resultados desse experimento aleatório são cara-cara (CC), cara-coroa
(CK), coroa-cara (KC) e coroa-coroa (KK). Logo, o espaço amostral é
CK, KC, KK}. Defina as variáveis aleatórias X=0 se pelo menos uma das
moedas der cara (X=1 para os demais casos) e Y=-1 se der uma cara e uma
coroa (Y=+1 para os demais casos). Então
Profs. Alexandre Lima e Moraes Junior
www.pontodosconcursos.com.br
1
Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados em
Exercícios, incluindo Matemática, Matemática Financeira e Estatística
Profs. Alexandre Lima e Moraes Junior
P[X=0] = P[CC] + P[CK] + P[KC] = 1/4 + 1/4 + 1/4 = 3/4,
P[X=1] = P[KK] = 1/4 = 1 - P[X=0],
P[Y=-1] = P[CK] + P[KC] = 1/2 e
P[Y= + 1] = P[CC] + P[KK] = 1/2 = 1 - P[Y=-1].
Considere o evento resultante da interseção dos eventos obter pelo menos
uma cara e não obter uma cara e uma coroa, ou seja, {(CC u CK u KC) n (CC
u KK)} = {CC}. Esse evento pode ser representado pela notação compacta
(X=0,Y= + 1). Como P(CC) = 1/4, temos que P(X=0,Y= + 1) = 1/4. O evento
(X=0,Y= + 1) é dito conjunto porque envolve as variáveis X e Y.
Os demais eventos conjuntos são: (X=0,Y=-1), (X=1,Y= + 1) e (X=1,Y=-1).
Diz-se que o par (X,Y) é uma variável aleatória bivariada ou
bidimensional.
Exemplo: A variável aleatória contínua X representa o comprimento de uma
dimensão de uma peça moldada por injeção, enquanto a variável aleatória
contínua Y denota o comprimento de outra dimensão. Estamos interessados
em probabilidades que possam ser escritas em termos de X e Y. Suponha que
as especificações para X e Y sejam (3,95 a 4,05) e (8,10 a 8,20) milímetros,
respectivamente. Então podemos estar interessados na probabilidade de uma
peça satisfazer as duas especificações simultaneamente, ou seja, P[(3,95 < X
< 4,05) e (8,10 < Y < 8,20)].
Variáveis Discretas
Sejam X e Y variáveis aleatórias discretas, como no primeiro exemplo dado.
Então a função discreta de probabilidade conjunta (ou distribuição
conjunta) de X e Y, denotada por f(x,y), satisfaz
Exemplo 1 : Um total de 15.064.859 alunos está matriculado no ensino
superior, divididos entre cursos com duração de 4 anos, de 2 anos e de menos
de 2 anos. A matrícula, separada por sexo, é mostrada na tabela a seguir.
1
HILL, R. Carter; GRIFFITHS, William E.; JUDGE, George G. Econometria. 2. ed. São Paulo:
Saraiva, 2006.
Profs. Alexandre Lima e Moraes Junior
www.pontodosconcursos.com.br
2
Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados em
Exercícios, incluindo Matemática, Matemática Financeira e Estatística
Profs. Alexandre Lima e Moraes Junior
Homens
Mulheres
Fonte:
4 anos
4.076.416
4.755.790
2 anos
2.437.905
3.310.086
Digest of Educational Statistics 1997, Tabela
Menos de 2 anos
172.874
311.788
170.
Nessa população, as probabilidades aproximadas de matrícula em um dos tipos
de instituição de ensino superior, por sexo, são
Homens
Mulheres
4 anos
0,27
0,32
2 anos
0,16
0,22
Menos de 2 anos
0,01
0,02
Considere o experimento de extrair aleatoriamente um estudante matriculado
dessa população. Defina a variável aleatória X = 0, se um homem é
selecionado, e X = 1, se uma mulher é selecionada. Defina a variável aleatória
Y = 1, se o estudante escolhido é de um curso de 4 anos, Y = 2, se o
estudante escolhido é de um curso de 2 anos e Y = 3, se é de um curso de
menos de 2 anos.
Seja f(x,y) a função discreta de probabilidade conjunta da população de
homens e mulheres da questão. Sendo assim, temos as seguintes
probabilidades conjuntas:
P(homens matriculados em cursos de 4 anos)
P(homens matriculados em cursos de 2 anos)
P(homens matriculados em cursos < 2 anos)
P(mulheres matriculadas em cursos de 4 anos)
P(mulheres matriculadas em cursos de 2 anos)
P(mulheres matriculadas em cursos < 2 anos)
Note que
é a probabilidade do evento certo.
Variáveis Contínuas
Sejam X e Y duas variáveis aleatórias contínuas. Neste caso, a distribuição
conjunta das duas variáveis é caracterizada por uma função f(x,y) chamada
função de densidade conjunta de X e Y, que satisfaz
Profs. Alexandre Lima e Moraes Junior
www.pontodosconcursos.com.br
3
Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados em
Exercícios, incluindo Matemática, Matemática Financeira e Estatística
Profs. Alexandre Lima e Moraes Junior
(2)
(3)
A relação (2) nos diz que o volume sob a superfície representada por f(x,y) é
igual a 1. A figura abaixo mostra uma função de densidade conjunta.
A equação (3) dá a probabilidade do par (x,y) estar num retângulo de lados ba e d-c.
Exemplo:
e a probabilidade
Exemplo: Suponha que a variável aleatória
distribuída no quadrado da figura abaixo.
Profs. Alexandre Lima e Moraes Junior
(X,Y)
esteja
www.pontodosconcursos.com.br
uniformemente
4
Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados em
Exercícios, incluindo Matemática, Matemática Financeira e Estatística
Profs. Alexandre Lima e Moraes Junior
contrário. A figura a seguir ilustra a densidade conjunta uniforme (é a
superfície delimitada pelo perímetro azul). Sabemos que o volume do cubo
deve ser 1 x 1 x K = 1, pois o volume delimitado por uma densidade de
probabilidade conjunta é igual a 1 por definição. Logo, K =1 é a altura do cubo.
GABARITO: D
Julgue os itens a seguir.
2. Seja a distribuição conjunta de X e Y
Então, a densidade marginal f X (x) é dada por
Profs. Alexandre Lima e Moraes Junior
www.pontodosconcursos.com.br
5
Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados em
Exercícios, incluindo Matemática, Matemática Financeira e Estatística
Profs. Alexandre Lima e Moraes Junior
Resolução
Como f X (x) é uma função exponencial de x, e não de y, temos que o item está
errado.
REVISÃO DA NOÇÃO DE FUNÇÃO DE PROBABILIDADE MARGINAL
Dada uma função densidade de probabilidade conjunta, pode-se obter a função
densidade de probabilidade de cada uma das variáveis aleatórias individuais.
Sejam X e Y variáveis aleatórias contínuas com densidade conjunta f(x,y).
Então fX(x) e fY(y) são denominadas densidades marginais de X e Y,
respectivamente, se são obtidas de f(x,y) por meio das expressões
Note que as funções de densidade de probabilidade marginal fX(x) e fY(y)
correspondem às funções de densidade de probabilidade individuais de X e Y,
respectivamente.
Pode-se obter resultados similares para variáveis aleatórias discretas. Dada a
função discreta de probabilidade conjunta f(x i ,y k ), as funções discretas de
probabilidade marginal são dadas por
Profs. Alexandre Lima e Moraes Junior
www.pontodosconcursos.com.br
6
Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados em
Exercícios, incluindo Matemática, Matemática Financeira e Estatística
Profs. Alexandre Lima e Moraes Junior
Exemplo: Considere a tabela abaixo (exemplo visto na resolução do exercício
1).
Homens (X=0)
Mulheres (X=1)
A
probabilidade
4 anos
(Y=1)
0,27
0,32
P[X = 0]
2 anos
(Y=2)
0,16
0,22
(probabilidade
Menos de 2 anos
(Y=3)
0,01
0,02
de
o
estudante
escolhido
aleatoriamente ser homem) é igual à probabilidade marginal fX (x) no ponto x
A
probabilidade
P[X = 1],
probabilidade
de
o
estudante
selecionado
aleatoriamente ser mulher, é igual à probabilidade marginal fX (x) no ponto x
=1. Então
Note que fX(x=0) + fX(x=1) = 0,44 + 0,56 = 1, e isto acontece porque a soma
das probabilidades de uma função discreta de probabilidades é unitária, por
definição.
A probabilidade P[Y = 1], que representa a probabilidade de o estudante
escolhido ao acaso estar matriculado em um curso de 4 anos, é igual à
probabilidade marginal fY (y) no ponto y =1, dada por
soma da 1 a coluna da tabela.
A probabilidade P[Y = 2] é a probabilidade de o estudante estar matriculado em
um curso de 2 anos e é igual à probabilidade marginal fY (y) no ponto y =2:
Profs. Alexandre Lima e Moraes Junior
www.pontodosconcursos.com.br
7
Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados em
Exercícios, incluindo Matemática, Matemática Financeira e Estatística
Profs. Alexandre Lima e Moraes Junior
Finalmente, a probabilidade P[Y = 3] denota a probabilidade de o estudante
estar matriculado em um curso com duração menor que 2 anos e corresponde
à probabilidade marginal fY (y) no ponto y =3:
soma da 3 a coluna da tabela.
Não por acaso, temos que
= 1.
Y=1
0,27
0,32
0,59
X=0
X=1
fY(y)
Y=2
0,16
0,22
0,38
Y=3
0,01
0,02
0,03
fX(x)
0,44
0,56
1
A tabela acima mostra que as probabilidades marginais f X (x) e f Y (y) são
obtidas somando as linhas e colunas, respectivamente (memorize para a
prova!).
GABARITO: Errado
3. Sejam X e Y variáveis aleatórias discretas com a seguinte distribuição
conjunta:
Y=1
0,27
0,32
X=0
X=1
Y=2
0,16
0,22
Y=3
0,01
0,02
Então a tabela abaixo especifica a distribuição condicional de X dado que Y=1:
x
fX|Y(x y=1)
0
0,458
1
0,542
Resolução
As
probabilidades
condicionais
especificam
a
distribuição
Da definição de
condicional de X dado que Y=1, denotada por
probabilidade condicional, obtemos
Profs. Alexandre Lima e Moraes Junior
www.pontodosconcursos.com.br
8
Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados em
Exercícios, incluindo Matemática, Matemática Financeira e Estatística
Profs. Alexandre Lima e Moraes Junior
Assim,
P(X=0|Y=1) = P(X=0,Y=1)/P(Y=1) = 0,27/0,59 = 0,458
e
P(X=1|Y=1) = P(X=1,Y=1)/P(Y=1) = 0,32/0,59 = 0,542.
Note que P(X=0|Y=1) + P(X=1|Y=1) = 0,458 + 0,542 = 1. O item está certo.
COMENTÁRIOS ADICIONAIS
A média da distribuição condicional de X, dado que Y=1, é
E(X|Y=1) = (0 x 0,458) + (1 x 0,542) = 0,542.
As
probabilidades
condicionais
P(Y=y|X=1)
condicional de Y dado que X=1. Aplicando
obtemos
especificam
a
a probabilidade
distribuição
condicional,
P(Y=1|X=1) = P(Y=1,X = 1)/P(X=1) = 0,32/0,56 = 0,571,
P(Y=2|X=1) = P(Y=2,X = 1)/P(X=1) = 0,22/0,56 = 0,393,
P(Y=3|X=1) = P(Y=3,X = 1)/P(X=1) = 0,02/0,56 = 0,036.
De modo que a distribuição condicional de Y, dado que X=1, denotada por
está na tabela abaixo:
A média da distribuição condicional de Y, dado que X=1, é igual a
E(Y|X=1) = (1 x 0,571) + (2 x 0,393) + (3 x 0,036) = 1,465.
Formalizemos o que foi visto acima. Sejam X e Y variáveis aleatórias discretas
com função de probabilidade conjunta f(x i ,y k ). Então as funções discretas de
probabilidade condicional (ou distribuições condicionais)
são definidas como
Profs. Alexandre Lima e Moraes Junior
www.pontodosconcursos.com.br
9
Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados em
Exercícios, incluindo Matemática, Matemática Financeira e Estatística
Profs. Alexandre Lima e Moraes Junior
De (1) e (2) resulta que
(3)
A esperança condicional de X, dado que Y = yj, é dada por
(4)
Uma definição análoga vale para
Podemos definir as densidades condicionais associadas a duas variáveis
aleatórias contínuas X e Y (com densidade conjunta
e densidades
marginais
de forma similar. A densidade condicional de Y dado o
resultado X = x é definida por
(5)
e a densidade condicional de X dado o resultado Y = y como
(6)
A fórmula (3) também é válida para o caso de variáveis contínuas.
A interpretação de (5) e (6) é a seguinte. Seja a densidade conjunta
= 0 caso contrário
representada na figura a seguir. Considere o plano paralelo ao plano xz que
passa por
Esse plano determina na superfície
a densidade
condicional
Por exemplo, suponha que X denote o salário de
uma população e que Y represente o consumo da mesma população. Então,
fixado o consumo
a densidade condicional
representa a
densidade dos salários para o nível
de consumo.
Profs. Alexandre Lima e Moraes Junior
www.pontodosconcursos.com.br
10
Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados em
Exercícios, incluindo Matemática, Matemática Financeira e Estatística
Profs. Alexandre Lima e Moraes Junior
As
densidades
condicionais
também
caracterizadas por meio de suas médias, variâncias, etc.
podem
ser
A esperança condicional de Y, dado que X=x, é dada por
(7)
Definição análoga pode ser dada para E(X|y). Observe que E(Y|x) é uma
função de x, isto é, E(Y|x) = f(x), sendo denominada curva de regressão
de Y sobre x. A regressão será vista em detalhes mais adiante.
Exemplo: Seja a densidade condicional
A esperança condicional E(Y|x) é dada por
Note que E(Y|x) é, de fato, uma função de x.
GABARITO: Certo
4. Considere a função de distribuição conjunta
Profs. Alexandre Lima e Moraes Junior
www.pontodosconcursos.com.br
11
Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados em
Exercícios, incluindo Matemática, Matemática Financeira e Estatística
Profs. Alexandre Lima e Moraes Junior
Pode-se afirmar que X e Y são variáveis aleatórias independentes.
Resolução
Vimos que as densidades marginais da densidade conjunta
x>0, y>0
são dadas por
Como
independentes.
concluímos
que
X
e
Y
são
REVISÃO DA NOÇÃO DE VARIÁVEIS ALEATÓRIAS INDEPENDENTES
Quando X e Y são variáveis aleatórias independentes a função de
probabilidade conjunta é igual ao produto das funções marginais de
probabilidade, ou seja
Podemos generalizar a fórmula acima. Sejam
variáveis
aleatórias independentes com função de probabilidade conjunta
Então é válida
e funções marginais de probabilidade
a expressão
densidade conjunta é igual ao
produto das densidades marginais.
Se X e Y são independentes; então a densidade condicional de X, dado
que Y = y é,
distribuição condicional de X dado Y
não depende da variável Y; é função somente de X.
e a densidade condicional de Y, dado que X = x é,
Profs. Alexandre Lima e Moraes Junior
www.pontodosconcursos.com.br
12
Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados em
Exercícios, incluindo Matemática, Matemática Financeira e Estatística
Profs. Alexandre Lima e Moraes Junior
distribuição condicional de Y dado X
não depende da variável X; é função somente de Y.
GABARITO: Certo
5. As variáveis aleatórias X e Y são independentes. Então é válida a expressão
Resolução
Provaremos que E[XY] = E[X]E[Y] supondo que X e Y sejam variáveis contínuas.
Prova similar pode ser dada se as variáveis forem discretas (tente você mesmo
fazer após estudar a nossa solução para variáveis contínuas).
Primeiramente, lembre que
pois X e Y são independentes.
Aplicando esse conceito na integral de E[XY], obtemos
Note que variáveis independentes são não correlacionadas, uma vez que
a covariância entre X e Y é nula:
REVISÃO DOS CONCEITOS DE CORRELAÇÃO E COVARIÂNCIA
Introdução
É muito
duas ou
funções
discretas
variáveis
comum estarmos interessados no comportamento conjunto de
mais variáveis aleatórias. Apresentamos para você os conceitos de
de probabilidade conjunta, marginal e condicional para variáveis
e contínuas. Também estudamos a noção de independência entre
aleatórias.
Aqui, daremos continuidade ao estudo da associação entre variáveis.
Frequentemente, estamos interessados em saber se existe uma associação
entre duas variáveis. Considere, por exemplo, a Economia. Em geral, estamos
Profs. Alexandre Lima e Moraes Junior
www.pontodosconcursos.com.br
13
Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados em
Exercícios, incluindo Matemática, Matemática Financeira e Estatística
Profs. Alexandre Lima e Moraes Junior
interessados em investigar as relações que possam existir entre variáveis
econômicas. Por exemplo: quão estreitamente caminham duas variáveis
preço? Veremos que os conceitos de covariância e correlação nos ajudam a
responder a essa pergunta.
Correlação e Covariância
Seja uma amostra de dez
altura (cm) e o peso
respectivamente. Para cada
y). Teremos então n = 10
ser representadas em um
diagrama de dispersão.
pessoas adultas, do sexo masculino, e sejam a
(kg) dessas pessoas denotadas por X e Y,
elemento da amostra, temos um par ordenado (x,
pares de valores das duas variáveis, que poderão
diagrama cartesiano bidimensional denominado
Pessoa
1
2
3
4
5
6
7
8
9
10
Tabela
Altura (cm)
174
161
171
181
182
165
155
168
176
175
Peso (kg)
74
68
63
92
80
73
61
64
90
81
Suponha que tenham sido obtidos os valores apresentados na tabela acima. O
diagrama de dispersão correspondente é o da próxima figura. A vantagem do
diagrama de dispersão está em que, muitas vezes, sua simples observação já
nos dá uma boa ideia de como as duas variáveis se correlacionam, isto é,
qual a tendência de variação conjunta que apresentam.
Profs. Alexandre Lima e Moraes Junior
www.pontodosconcursos.com.br
14
Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados em
Exercícios, incluindo Matemática, Matemática Financeira e Estatística
Profs. Alexandre Lima e Moraes Junior
Observando o diagrama de dispersão acima com atenção, constatamos que
existe, para maiores valores de X (altura), uma tendência a obter maiores
valores de Y (peso) e vice-versa. Quando isso ocorre, diz-se que há
correlação linear positiva entre X e Y.
Entretanto, também podemos ter casos em que o diagrama de dispersão
apresenta o aspecto da figura que se segue, indicando que, para maiores
valores de X, a tendência é observarem-se menores valores de Y e vice-versa.
Diz-se que nesse caso a correlação é negativa. Por exemplo, a renda per
capita de países e o índice de analfabetismo são variáveis negativamente
correlacionadas.
É claro que também pode ocorrer o caso em que as variáveis são não
correlacionadas. Neste caso, o aspecto do diagrama de dispersão é o da
próxima figura.
Profs. Alexandre Lima e Moraes Junior
www.pontodosconcursos.com.br
15
Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados em
Exercícios, incluindo Matemática, Matemática Financeira e Estatística
Profs. Alexandre Lima e Moraes Junior
Vimos que o sinal da correlação indica a tendência da variação conjunta das
duas variáveis. Além disso, devemos considerar também a intensidade ou o
grau da correlação. A correlação linear (em valor absoluto) entre X e Y na
figura em que a correlação é negativa é mais intensa do que a da figura em
que a correlação é positiva, pois os pontos da primeira apresentam uma
tendência mais acentuada de se colocarem segundo uma reta do que os da
última.
Sejam X e Y variáveis aleatórias. Então a covariância de X e Y é definida por
(1)
em que
Se X e Y são variáveis aleatórias discretas e
é
probabilidade conjunta, a covariância entre X e Y é dada por
sua
função
de
(2)
Caso X e Y sejam variáveis aleatórias contínuas com função densidade de
probabilidade conjunta f(x,y), a covariância é calculada pela integral
(3)
A covariância mede a intensidade da correlação linear existente entre
duas variáveis. Além disso, ela também nos dá o sinal da correlação, se
positivo ou negativo. Suponha que tenhamos uma amostra de n pares
ordenados (x,y). Neste caso, a covariância pode ser estimada pela estatística
Profs. Alexandre Lima e Moraes Junior
www.pontodosconcursos.com.br
16
Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados em
Exercícios, incluindo Matemática, Matemática Financeira e Estatística
Profs. Alexandre Lima e Moraes Junior
Observe que a covariância depende das unidades de medida das
variáveis X e Y. Percebe-se mais claramente o significado da covariação
dividindo-se a covariância entre X e Y por seus respectivos desvios-padrão.
Define-se a razão resultante como a correlação entre as variáveis aleatórias X
e Y, denotada pela letra grega
(5)
denotam os desvios-padrão de X e Y, respectivamente.
em que
A correlação é estimada pela estatística denominada
correlação
linear de
Pearson, ou,
simplesmente,
correlação, definido por
coeficiente
coeficiente
de
de
(6)
em que s xy é a covariância amostral de X e Y (4), sx é o desvio-padrão
amostral de X
(7)
desvio-padrão amostral de Y
(8)
Substituindo (4), (7) e (8) em (6), obtemos
Profs. Alexandre Lima e Moraes Junior
www.pontodosconcursos.com.br
17
Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados em
Exercícios, incluindo Matemática, Matemática Financeira e Estatística
Profs. Alexandre Lima e Moraes Junior
(9)
em que
S x y = n.covariância amostrai
Sxx = n.variância amostral de X
e
S yy = n.variância amostral de Y
A representação abreviada dos somatórios de (9) por meio de
é útil e importante para a prova. Não é difícil mostrar que
Sxy = "soma dos produtos entre X
(10)
e Y" ou simplesmente "soma dos produtos"
(11)
Sxx = "soma dos quadrados de X"
(12)
Syy = "soma dos quadrados de Y"
As fórmulas (10), (11) e (12) devem ser memorizadas porque são
importantes para a prova.
O coeficiente de correlação tem as importantes propriedades
adimensional e de variar entre -1 e +1 , o que não ocorre
covariância. A vantagem de ser adimensional está no fato de seu valor
afetado pelas unidades adotadas. Por outro lado, o fato de se ter
com que um dado valor de R seja facilmente interpretado. Note que
corresponde ao caso de correlação linear negativa perfeita e R
corresponde ao caso de correlação linear positiva perfeita.
Profs. Alexandre Lima e Moraes Junior
www.pontodosconcursos.com.br
de ser
com a
não ser
R = -1
= +1
18
Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados em
Exercícios, incluindo Matemática, Matemática Financeira e Estatística
Profs. Alexandre Lima e Moraes Junior
Ressaltamos que ; i correlação nula, isto é, p = 0, significa que não há
associação linear entre X e Y. Mesmo que X e Y tenham covariância zero,
elas podem ter uma associação não linear, como em
(equação de
uma circunferência centrada em (0,0) e de raio 1).
Uma importante consequência da independência estatística é a seguinte:
- se X e Y são variáveis aleatórias independentes, então a covariância e a
correlação entre elas é nula (memorize para a prova!).
GABARITO: B
6. (Fiscal de Rendas-MS/2006/FGV) Analise as afirmativas a seguir, a
respeito de duas variáveis aleatórias X e Y:
I.
II.
III.
IV.
se
se
se
se
X e Y são independentes, então Cov(X,Y) = 0;
Cov(X,Y) = 0, então X e Y são independentes;
X e Y são independentes, então E(XY) = E(X).E(Y);
E(XY) = E(X).E(Y), então X e Y são independentes.
Assinale:
(A) se nenhuma afirmativa estiver correta.
(B) se somente as afirmativas I e III estiverem corretas.
(C) se somente as afirmativas I e IV estiverem corretas.
(D) se somente as afirmativas II e IV estiverem corretas.
(E) se todas as afirmativas estiverem corretas.
Resolução
Sejam X e Y variáveis aleatórias. Então a covariância de X e Y é definida como
Se X e Y são variáveis aleatórias
independentes, então a covariância entre elas é nula (o que indica que
não há associação linear entre elas!), ou seja,
Cov(X,Y) = 0 (p/ X e Y independentes)
Diz-se que X e Y são não correlacionadas quando Cov(X,Y) = 0.
A relação recíproca não é verdadeira: se X e Y são não correlacionadas não
podemos afirmar que X e Y sejam independentes. Porém, a não
correlação entre X e Y implica independência estatística somente
Profs. Alexandre Lima e Moraes Junior
www.pontodosconcursos.com.br
19
Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados em
Exercícios, incluindo Matemática, Matemática Financeira e Estatística
Profs. Alexandre Lima e Moraes Junior
quando X e Y têm distribuição conjunta normal, ou seja, quando têm
distribuição normal bidimensional, a qual será apresentada mais adiante,
após a análise das afirmativas.
Análise das afirmativas:
I. "se X e Y são independentes, então Cov(X,Y)
definição.
Verdadeira,
por
II. "se Cov(X,Y) = 0, então X e Y são independentes"
Falsa, pois a relação
recíproca não é verdadeira: se X e Y são não correlacionadas não podemos
afirmar que X e Y sejam independentes.
III. "se X e Y são independentes, então E(XY) = E(X).E(Y)"
Cov(X,Y) = 0 implica E(XY) = E(X).E(Y).
Verdadeira, pois
IV. "se E(XY) = E(X).E(Y), então X e Y são independentes"
correlação não implica independência.
Falsa, pois a não
COMENTÁRIOS ADICIONAIS
Distribuição Normal Bidimensional
A distribuição normal bivariada ou bidimensional é um modelo importante para
variáveis aleatórias contínuas bidimensionais.
A variável (X,Y) tem
conjunta for dada por
distribuição
Profs. Alexandre Lima e Moraes Junior
normal
bidimensional
www.pontodosconcursos.com.br
se sua
densidade
20
Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados em
Exercícios, incluindo Matemática, Matemática Financeira e Estatística
Profs. Alexandre Lima e Moraes Junior
A normal bidimensional possui as seguintes propriedades:
(a)
As
distribuições
unidimensionais:
marginais
de
X
e
Y
(b)
As distribuições condicionais são normais, com
são
normais
Se X e Y são conjuntamente normais e não correlacionadas (p=0),
podemos escrever a densidade conjunta como
ou seja, a densidade conjunta é o produto das duas marginais, que são
normais. Isto quer dizer que X e Y são independentes no caso em que X e Y
tiverem densidade conjunta normal com p=0 (memorize para a prova!)
Atenção: a não correlação entre X e Y implica independência estatística
somente quando X e Y são variáveis aleatórias conjuntamente
Profs. Alexandre Lima e Moraes Junior
www.pontodosconcursos.com.br
21
Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados em
Exercícios, incluindo Matemática, Matemática Financeira e Estatística
Profs. Alexandre Lima e Moraes Junior
normais. Isto não é verdade quando X e Y tem distribuição conjunta
diferente da normal bidimensional.
GABARITO: B
Resolução
A média condicional
é uma função linear de y, ou seja E(X|y) = g(y). Desta forma, E(X|Y=y) é a
regressão de X em Y e isso implica que as opções A e B poderiam ser
descartadas logo de início, pois ambas são funções da variável x.
A opção D contém a expressão correta.
GABARITO: D
8.
(Analista da SUSEP/Atuária/2010/ESAF) A partir de uma amostra
foram obtidas as estatísticas:
Qual a reta de regressão estimada de Y em X?
Profs. Alexandre Lima e Moraes Junior
www.pontodosconcursos.com.br
22
Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados em
Exercícios, incluindo Matemática, Matemática Financeira e Estatística
Profs. Alexandre Lima e Moraes Junior
Resolução
A reta a estimar é
em que o parâmetro b (estimativa da declividade) é dado por
e o parâmetro a (estimativa do intercepto) por
Observe que estamos usando uma notação diferente do
quantidade S xy definida acima não é a covariância entre X e Y.
enunciado:
a
Vimos que
s xy = S xy / n (covariância amostral = soma dos produtos - n)
e que
sx = S xx /n (variância amostral de X = soma dos quadrados de X - n)
Logo, se dividirmos o numerador e o denominador da fórmula de b dada acima
por n, poderemos reescrevê-la da seguinte maneira:
b = covariância amostral - variância amostral de X
Ou seja, b pode ser calculado, de forma alternativa, pela razão entre a
covariância amostral Sxy (estamos usando uma notação diferente da do
Profs. Alexandre Lima e Moraes Junior
www.pontodosconcursos.com.br
23
Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados em
Exercícios, incluindo Matemática, Matemática Financeira e Estatística
Profs. Alexandre Lima e Moraes Junior
enunciado, mas que está coerente com a vista no texto!) e a variância
. Logo,
e
Deste modo, a reta de regressão estimada de Y em X é
REVISÃO DA NOÇÃO DE REGRESSÃO LINEAR SIMPLES
Seja Y a variável dependente e X a variável suposta sem erro, ou seja, não
aleatória. A regressão linear simples pressupõe que seja adotado o modelo
(1)
em que
é o intercepto,
da variação de Y (
é a declividade e
denota a componente aleatória
é uma variável aleatória).
É razoável supor que a variável aleatória
tenha média nula, a fim de que
toda a variação explicada de Y fique em torno da reta de regressão. Isso
implica que a reta de regressão fornece a média de Y para cada valor de x
considerado.
Uma outra suposição básica que pode ser adotada é a de que a variação
residual da variável Y seja independente de x. Ou seja, usualmente
admite-se que a variação de Y em torno da linha teórica de regressão pode ser
descrita por um desvio padrão residual que independe do ponto em
consideração.
Por fim, admitiremos que a variação de Y em torno da linha teórica de
regressão se dê segundo distribuições normais independentes, para
qualquer valor de x; o que implica dizer que as variações residuais em
relação à reta de regressão são independentes e normalmente distribuídas 2
(vide figura a seguir).
2
Os professores estão cientes do fato de que os resíduos do modelo ajustado nem sempre seguem
uma distribuição normal. Contudo, o importante é ter em mente que as variações residuais em
relação à reta de regressão são independentes e normalmente distribuídas por hipótese. Isto não
implica dizer que os resíduos, de fato, sejam normalmente distribuídos. Acredite: há muitos dados
empíricos que violam a hipótese de normalidade!
Profs. Alexandre Lima e Moraes Junior
www.pontodosconcursos.com.br
24
Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados em
Exercícios, incluindo Matemática, Matemática Financeira e Estatística
Profs. Alexandre Lima e Moraes Junior
Suponhamos que a reta estimativa de (1) seja
(2)
em que
denota os valores dados pela reta estimativa,
é a estimativa do
também denominado coeficiente de regressão linear, é a
parâmetro
estimativa do parâmetro
Existem diversos métodos de estimação da reta de regressão. Podemos até
mesmo estimar a reta visualmente. O método de ajuste visual consiste em
traçar diretamente a reta, com auxílio de uma régua, no diagrama de
dispersão, procurando fazer, da melhor forma possível, com que essa reta
passe por entre os pontos. Esse procedimento, por ser subjetivo, somente será
razoável se a correlação linear for muito forte, caso contrário levará a
resultados pobres.
Por outro lado, o ajuste
quadrados, segundo o qual
torna mínima a soma dos
experimentais i em que a
consideração como ilustrado
a
reta
para
a
qual
se
pode ser feito pelo método dos mínimos
a reta a ser adotada deverá ser aquela que
quadrados das distâncias da reta aos pontos
distância é igual ao erro aleatório no ponto em
pela próxima figura). Ou seja, devemos procurar
consiga
minimizar
A
ideia
central
desse
procedimento é simplesmente a de minimizar a variação residual em torno da
reta estimativa.
Profs. Alexandre Lima e Moraes Junior
www.pontodosconcursos.com.br
25
Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados em
Exercícios, incluindo Matemática, Matemática Financeira e Estatística
Profs. Alexandre Lima e Moraes Junior
Tendo em vista a expressão (2), devemos, portanto, impor a condição
(3)
De acordo com o Cálculo, os parâmetros a e b que minimizam (3) serão
aqueles que anulam as derivadas parciais de (3)
(4)
Não é difícil chegar às expressões
(5)
(6)
as quais fornecem o seguinte sistema de duas equações a duas incógnitas:
(7)
Profs. Alexandre Lima e Moraes Junior
www.pontodosconcursos.com.br
26
Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados em
Exercícios, incluindo Matemática, Matemática Financeira e Estatística
Profs. Alexandre Lima e Moraes Junior
Os pontos (x,y) fornecem os elementos para a montagem de (7), cuja solução
forneceria os coeficientes a e b. Entretanto, é mais fácil considerar de uma vez
a solução analítica do sistema, segundo a qual
(8)
GABARITO: C
9.
(Técnico
de
Defesa
Aérea
e
Controle
de
Tráfego
Aéreo/Estatística/2009/CESGRANRIO) Um pesquisador estudou a relação
entre o tempo, medido em segundos, que um inspetor leva para reagir a um
estímulo visual (Y) e a idade (X), medida em anos completos. Os dados de 25
inspetores foram coletados e obtidas as seguintes informações:
As estimativas dos mínimos quadrados, para o coeficiente linear e a inclinação
da reta, respectivamente, são:
(A) 80 e 3,25
(B) 50 e 2,85
(C) 30 e 2,50
(D) 20 e 4,0
(E) 10 e 3,62
Resolução
O modelo de regressão linear simples é
Pede-se os valores de a e b, respectivamente.
Profs. Alexandre Lima e Moraes Junior
www.pontodosconcursos.com.br
27
Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados em
Exercícios, incluindo Matemática, Matemática Financeira e Estatística
Profs. Alexandre Lima e Moraes Junior
Logo,
em que b é a inclinação da reta ajustada. Como a única opção em que a
inclinação é 2,50 é o item (C), na prova já marcaríamos essa opção sem
continuar os cálculos.
Não obstante, calcularemos o coeficiente linear (ou intercepto)
Assim, encontramos a reta ajustada y = 30 + 2,5x.
GABARITO: C
10. (ICMS-SP/2009/FCC) O gráfico abaixo demonstra a evolução da receita
tributária anual no estado de São Paulo desde 1999, com os valores
arrecadados em bilhões de reais.
Profs. Alexandre Lima e Moraes Junior
www.pontodosconcursos.com.br
28
Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados em
Exercícios, incluindo Matemática, Matemática Financeira e Estatística
Profs. Alexandre Lima e Moraes Junior
dos mínimos quadrados, com base nas observações de 1999 a 2008, obteve-se
para a estimativa de
A previsão da receita tributária para 2009, em bilhões de reais, em função da
equação obtida pelo método dos mínimos quadrados é igual a
Resolução
Logo,
GABARITO: B
11. (APOFP-SP/2009/ESAF) Uma amostra aleatória simples (X1,Y0,
(X 2 ,Y 2 ), ..., (X n ,Y n ) de duas variáveis aleatórias X e Y forneceu as seguintes
quantidades:
Profs. Alexandre Lima e Moraes Junior
www.pontodosconcursos.com.br
29
Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados em
Exercícios, incluindo Matemática, Matemática Financeira e Estatística
Profs. Alexandre Lima e Moraes Junior
Calcule o valor mais próximo do coeficiente de determinação da regressão
linear de Y em X.
(A) 0,85
(B) 0,83
(C) 0,80
(D) 0,88
(E) 0,92
Resolução
PRELIMINARES
O Coeficiente de Determinação R 2
Considere as equações
reta estimativa da regressão linear simples
e
estimativas da declividade (b) e do intercepto (a)
Então podemos escrever que
(1)
Se considerarmos a média
entre os valores
de todos os valores y i e tomarmos as diferenças
teremos
Usando as fórmulas das somas
e a fórmula do coeficiente b,
obtemos
(2)
Profs. Alexandre Lima e Moraes Junior
www.pontodosconcursos.com.br
30
Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados em
Exercícios, incluindo Matemática, Matemática Financeira e Estatística
Profs. Alexandre Lima e Moraes Junior
em que a soma de quadrados
é calculada com base nos desvios
da reta de mínimos quadrados em relação à horizontal
como ilustrado pela
figura a seguir.
Considerando as diferenças residuais, podemos escrever
Distribuindo o somatório acima e usando a fórmula de a, chega-se à expressão
(3)
Substituindo
(4)
Profs. Alexandre Lima e Moraes Junior
www.pontodosconcursos.com.br
31
Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados em
Exercícios, incluindo Matemática, Matemática Financeira e Estatística
Profs. Alexandre Lima e Moraes Junior
É usual escrever (4) usando a notação
(5)
SQT = SQE + SQR,
em que
soma dos quadrados total (variação total),
soma
dos
quadrados
dos
erros
(variação
residual) e
soma dos quadrados da regressão (variação
explicada).
variação total = variação residual +variação explicada
A soma de quadrados SQT mede a variação total de Y independentemente de
X, a soma de quadrados SQE mede a variação residual e a soma de
quadrados SQR mede o desvio da reta de mínimos quadrados em relação à
média
(é a variação "explicada" pela reta de regressão).
Dividindo ambos os membros da equação (5) por SQT, temos
(6)
Podemos querer saber quanto representa proporcionalmente a parcela da
variação total de Y que é explicada pela reta de regressão, ou seja, quanto
vale a razão SQR/SQT. Utilizando (2), podemos escrever
(7)
Substituindo
em (7) obtemos
(8)
ou
Profs. Alexandre Lima e Moraes Junior
www.pontodosconcursos.com.br
32
Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados em
Exercícios, incluindo Matemática, Matemática Financeira e Estatística
Profs. Alexandre Lima e Moraes Junior
(9)
A fórmula (8) mostra que o coeficiente R 2 de uma regressão linear simples
exprime a porcentagem da variação total de Y (SQT) que é explicada
pela reta de regressão ajustada. Essa grandeza é chamada coeficiente de
determinação 1-R 2 é o coeficiente de indeterminação). O R 2 quantifica o
grau de ajuste de um conjunto de dados à reta de regressão estimada.
Quanto mais próximo de 1 estiver R 2 melhor terá sido nosso trabalho para
explicar a variação em y, com
e maior será a capacidade de
previsão de nosso modelo sobre todas as observações amostrais.
Observe que o coeficiente de determinação é igual ao quadrado do
coeficiente de correlação linear de Pearson R.
adimensional).
No caso de ajuste perfeito, temos R 2 = 1, e não há variação residual, pois
todos os pontos estão alinhados. Se, por exemplo, R = ±0,7, teremos um
coeficiente de determinação igual a 0,49, significando que a reta de regressão
não consegue explicar nem mesmo a metade da variação de Y. Para
a reta de regressão explicará mais de 80% da variação total de Y.
Voltemos à resolução.
Apreendemos que
Temos que
Logo,
O valor mais próximo é 0,80 (C).
Profs. Alexandre Lima e Moraes Junior
www.pontodosconcursos.com.br
33
Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados em
Exercícios, incluindo Matemática, Matemática Financeira e Estatística
Profs. Alexandre Lima e Moraes Junior
GABARITO: C
12. (ICMS-SP/2006/FCC) Em um determinado país, deseja-se determinar a
relação entre a renda disponível (Y), em bilhões de dólares, e o consumo (C),
também em bilhões de dólares. Foi utilizado o modelo linear simples
em que Ci é o consumo no ano i, Yi é o valor da renda disponível no
o erro aleatório com as respectivas hipóteses para a regressão linear
àão parâmetros desconhecidos, cujas estimativas foram obtidas
através do método dos mínimos quadrados. Para obtenção desta relação
considerou-se ainda as seguintes informações colhidas através da observação
nos últimos 10 anos:
Para o cálculo do coeficiente de correlação de Pearson (R), usou-se a fórmula:
em que Cov(Y,C) é a covariância de Y e C, DP(Y) é o desviopadrão de Y e DP(C) é o desvio-padrão de C.
Então,
(A) o coeficiente de explicação (R 2 ) correspondente é igual a 64%.
(B) utilizando a equação da reta obtida pelo método dos mínimos quadrados,
tem-se que, em um ano, caso a renda disponível seja igual a 15 bilhões de
dólares, o consumo será igual a 13 bilhões de dólares.
(C) obtendo para um determinado ano uma previsão para o consumo de 10
bilhões de dólares, significa que a renda disponível considerada foi de 12,5
bilhões de dólares.
(D) o valor da estimativa encontrado para o parâmetro
(E) o valor da estimativa encontrado para o parâmetro
Resolução
Atenção: a variável independente
dependente é C (consumo).
é
Y
(renda
disponível)
e
a
Seja um conjunto de n pares ordenados
variáveis Y e C. Vimos que
Profs. Alexandre Lima e Moraes Junior
www.pontodosconcursos.com.br
34
Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados em
Exercícios, incluindo Matemática, Matemática Financeira e Estatística
Profs. Alexandre Lima e Moraes Junior
Essa quantidade é denominada coeficiente de correlação quando Y e C são
tratadas como variáveis aleatórias. O quadrado da mesma quantidade é
chamado coeficiente de determinação. No contexto da regressão linear
simples, uma das variáveis é considerada determinística ou não estocástica (na
questão, a variável independente ou explicativa é Y) e a outra (a variável
dependente C) é considerada aleatória.
O problema da regressão consiste em determinar a relação funcional entre as
variáveis dependente e explicativa.
A função de regressão C = a + by nos dá o valor médio de uma das variáveis
( C ) em função do valor observado da outra ( y ) , isto é, E[C|y] = C.
Análise das alternativas:
Logo,
VERDADEIRA
(C) FALSA (vide item B).
(D) FALSA (vide item B).
Profs. Alexandre Lima e Moraes Junior
www.pontodosconcursos.com.br
35
Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados em
Exercícios, incluindo Matemática, Matemática Financeira e Estatística
Profs. Alexandre Lima e Moraes Junior
(E) FALSA (vide item B).
GABARITO: B
13. (ICMS-RJ/2008/FGV) Sejam X e Y duas variáveis aleatórias quaisquer.
Então:
A) VAR(X-Y) = VAR(X) - VAR(Y)
B) VAR(X-Y) = VAR(X) + VAR(Y) - COV(X,Y)
C) VAR(X-Y) = VAR(X) + VAR(Y) - 2COV(X,Y)
D) VAR(X-Y) = VAR(X) + VAR(Y) + COV(X,Y)
E) VAR(X-Y) = VAR(X) + VAR(Y) + 2COV(X,Y)
Resolução
Sejam a e b constantes. Então
VAR(aX + bY) = a 2 VAR(X) + b 2 VAR(Y) + 2abCOV(X,Y).
Nesta questão, a =1 e b = -1. Logo,
VAR(X-Y) = VAR(X) + VAR(Y) - 2COV(X,Y).
Obs.: leia a revisão de conceitos a seguir caso você não tenha entendido a
resolução deste exercício.
REVISÃO: MÉDIA E VARIÂNCIA
VARIÁVEIS ALEATÓRIAS
DE
UMA
COMBINAÇÃO
LINEAR DE
Sejam X e Y variáveis aleatórias e Z=g(X,Y) uma função dessas variáveis.
Vamos admitir que essa função tenha a forma
(1)
Z = aX + bY
em que a e b são constantes. Essa expressão é uma combinação linear (ou
soma ponderada). A esperança de (1) é dada por
(2)
A Eq. (2) nos diz que o valor esperado de uma combinação linear de
duas variáveis aleatórias é a combinação linear de seus respectivos
valores esperados. Essa regra pode ser generalizada para um número
arbitrário de variáveis aleatórias, quer elas sejam discretas ou continuas.
As seguintes regras relativas à variância são válidas:
1.
Se X, Y e Z são variáveis aleatórias e a, b e c são constantes, então
Profs. Alexandre Lima e Moraes Junior
www.pontodosconcursos.com.br
36
Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados em
Exercícios, incluindo Matemática, Matemática Financeira e Estatística
Profs. Alexandre Lima e Moraes Junior
(3)
Note que
2.
Se X, Y e Z são independentes ou não correlacionadas
(4)
Se fizermos
obtemos
(5)
A expressão (5) nos diz que a variância da soma de variáveis aleatórias
independentes é igual à soma das variâncias (memorize para a prova!).
• W
•
•
As regras sobre a variância de três
generalizadas para n variáveis aleatórias.
•
variáveis
•
f
aleatórias
m
m
a
podem
J
m
ser
GABARITO: C
14. (Analista Técnico da SUSEP/2006/ESAF) Sendo X uma v. a. d. variável aleatória discreta e sendo Y = aX + b, pode concluir-se que var (aX +
b) é igual a:
Resolução
Var(aX + b) = a 2 Var(X)
GABARITO: D
15. (AFRF/2005/ESAF) Para uma amostra de dez casais residentes em um
mesmo bairro, registram-se os seguintes salários mensais (em salários
mínimos):
Profs. Alexandre Lima e Moraes Junior
www.pontodosconcursos.com.br
37
Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados em
Exercícios, incluindo Matemática, Matemática Financeira e Estatística
Profs. Alexandre Lima e Moraes Junior
1
2
4
7
Identificação do casal
3
5
6
8
9
10
Salário do marido (Y) 30 25 18 15 20 20 21 20 25 27
Salário da esposa (X) 20 25 12 10 10 20 18 15 18 13
Sabe-se que:
Assinale a opção cujo valor corresponda à correlação entre os salários dos
homens e os salários das mulheres.
A) 0,72
B) 0,75
C) 0,68
D) 0,81
E) 0,78
Resolução
Logo,
GABARITO: B
16. (Analista do BACEN/Área 3/2006/FCC) Sejam X e Y duas variáveis
aleatórias e
Profs. Alexandre Lima e Moraes Junior
www.pontodosconcursos.com.br
38
Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados em
Exercícios, incluindo Matemática, Matemática Financeira e Estatística
Profs. Alexandre Lima e Moraes Junior
I.
E(X) e E(Y) as expectâncias de X e Y, respectivamente;
II.
Var(X) e Var(Y) as variâncias de X e Y, respectivamente;
III.
Cov(X,Y) a covariância de X e Y.
Tem-se, em qualquer situação,
A) E(X).E(Y) = E(XY) - Cov(X,Y)
B) Cov(X,Y) = Var(X).Var(Y)
C) E(2X+5) = 4E(X)
D) Se E(XY) = E(X).E(Y), então X e Y são independentes.
E) Var(X+10) = Var(X) + 10
Resolução
Sabemos que
em que
Portanto, a alternativa correta é a (A).
A alternativa (B) está errada porque não está de acordo com a definição de
covariância.
A alternativa (C) não é verdadeira, pois E(2X+5) = 2E(X) + 5.
A alternativa (D) é incorreta porque E(XY) = E(X).E(Y) (variáveis X e Y não
correlacionadas) não implica independência (mas a recíproca é verdadeira, ou
seja, independência implica a não correlação).
A alternativa (E) é falsa porque Var(X+10) = Var(X).
GABARITO: A
17.
(AFRF/2009/ESAF)
Na
análise
de
regressão
linear
simples,
as
obtidas pelo método de Mínimos Quadrados.
Nesse caso, os valores dessas estimativas são obtidos através de uma amostra
Yi com (i =1, 2, ...,n) pode-se estabelecer o desvio ou resíduo - aqui denotado
por e-t - entre a reta de regressão Y-, e sua estimativa Y i . Sabe-se que o
Método
de
Mínimos Quadrados consiste em
Profs. Alexandre Lima e Moraes Junior
adotar como
www.pontodosconcursos.com.br
estimativas dos
39
Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados em
Exercícios, incluindo Matemática, Matemática Financeira e Estatística
Profs. Alexandre Lima e Moraes Junior
os valores que minimizam a soma dos quadrados dos desvios
Desse modo, o Método
expressão dada por:
de
Mínimos
Quadrados
consiste
em
minimizar a
Resolução
A questão forneceu todas as informações necessárias para a resolução.
Pelo Método dos Mínimos Quadrados temos que minimizar a soma dos
quadrados das diferenças entre os valores de Y-t e as respectivas estimativas
por meio da reta de regressão. Logo teríamos:
Logo alternativa correta é a "B".
alternativa "A", mas está errado.
O
gabarito
oficial
preliminar indicou
a
GABARITO: B
O enunciado a seguir refere-se às questões de números 18 e 19.
A função densidade de probabilidade conjunta de duas variáveis aleatórias
discretas é dada pela tabela a seguir:
X
2
4
6
1
1/8
1/4
1/8
Y
3
1/24
1/4
1/24
Profs. Alexandre Lima e Moraes Junior
9
1/12
0
1/12
www.pontodosconcursos.com.br
40
Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados em
Exercícios, incluindo Matemática, Matemática Financeira e Estatística
Profs. Alexandre Lima e Moraes Junior
18. A covariância entre X e Y é
A) 1
B) 3
C) 4
D) 12
E) 0
Resolução
A covariância
expressão
entre as variáveis
aleatórias
discretas X
e Y é dada
pela
Antes, é preciso calcular os valores das médias
em que g x (x) é a função de probabilidade marginal de X,
dada por
é a função de probabilidade marginal de Y,
dada por
Agora já podemos calcular a covariância, pois temos os valores de
Sendo assim,
Profs. Alexandre Lima e Moraes Junior
www.pontodosconcursos.com.br
41
Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados em
Exercícios, incluindo Matemática, Matemática Financeira e Estatística
Profs. Alexandre Lima e Moraes Junior
Cov(X, Y) = 1/2 + 0 -1 + 0 + 0 + 0 - 1 / 2 + 0 +1 = 0
Logo, X e Y são variáveis não correlacionadas.
Você também chegaria ao mesmo resultado se usasse a fórmula equivalente
Confirme você mesmo que E[XY ] = 12. Portanto,
Cov(X, Y) = 12 - 4 x 3 = 0
GABARITO: E
19. Assinale a alternativa correta.
A) X e Y não são independentes.
B) X e Y são independentes.
C) X e Y são correlacionadas.
D) X e Y têm distribuição conjuntamente normal.
E) X e Y têm distribuições marginais normais.
Resolução
Análise das alternativas:
(A) Se X e Y são independentes, deve valer
f(x i , y d ) = gX (xi) x hY (yd) para quaisquer valores de X e Y.
Entretanto, observe que
Logo, X e Y não são independentes, apesar de serem não correlacionadas
^ alternativa CORRETA.
Profs. Alexandre Lima e Moraes Junior
www.pontodosconcursos.com.br
42
Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados em
Exercícios, incluindo Matemática, Matemática Financeira e Estatística
Profs. Alexandre Lima e Moraes Junior
(B) Alternativa INCORRETA, haja vista o explicado acima.
(C) Alternativa INCORRETA, pois X e Y são não correlacionadas.
(D) Nada se pode afirmar sobre a distribuição conjunta de X e Y ^ alternativa
INCORRETA.
(E) Nada se pode afirmar sobre
alternativa INCORRETA.
as distribuições
marginais
de X
e Y ^
GABARITO: A
O enunciado a seguir refere-se às questões de números 20 e 21.
Considere as variáveis aleatórias
independentes
X l3 X 2 ,...,X n .
Suponha
que
essas n variáveis possuam a mesma distribuição de probabilidades com média
^ e variância a 2 . Seja
20. Podemos afirmar que o valor esperado de
Resolução
GABARITO: C
21. Podemos afirmar que a variância de
Profs. Alexandre Lima e Moraes Junior
www.pontodosconcursos.com.br
43
Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados em
Exercícios, incluindo Matemática, Matemática Financeira e Estatística
Profs. Alexandre Lima e Moraes Junior
Resolução
Observação: os resultados obtidos são conseqüência da Lei (fraca) dos
Grandes Números. Por exemplo, assuma que você tenha registrado o
de uma variável aleatória X com média
conjunto de observações
(desconhecida) e variância
também desconhecida). Suponha que n seja
um número suficientemente grande. Então a média
pode ser estimada pela
média amostral
As
duas
questões
desejadas para
posterior).
mostram
qualquer
que
o
estimador
estimador
(este
é
assunto
será
não
visto
viesado
em
aula
GABARITO: B
22. (Analista do BACEN/Área 3/2006/FCC) Uma empresa, com a
finalidade de determinar a relação entre os gastos anuais com propaganda (X),
em R$ 1 000,00, e o lucro bruto anual (Y), em R$1.000,00, optou por utilizar o
Considerou,
para o estudo,
as seguintes
observações nos últimos 10 anos da empresa:
Profs. Alexandre Lima e Moraes Junior
informações
www.pontodosconcursos.com.br
referentes
às
44
Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados em
Exercícios, incluindo Matemática, Matemática Financeira e Estatística
Profs. Alexandre Lima e Moraes Junior
Utilizando a equação da reta obtida pelo método dos mínimos quadrados, temse que, caso haja um gasto anual com propaganda de 80 mil reais, a previsão
do lucro bruto anual, em mil reais, será de
A) 84
B) 102,5
C) 121
D) 128,4
E) 158
Resolução
Fazendo os cálculos, temos que
Logo,
A equação da reta de mínimos quadrados é
Substituindo o valor x = 80 na equação acima obtemos
Profs. Alexandre Lima e Moraes Junior
www.pontodosconcursos.com.br
45
Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados em
Exercícios, incluindo Matemática, Matemática Financeira e Estatística
Profs. Alexandre Lima e Moraes Junior
GABARITO: B
23. (INÉDITA) Considere os dados da questão 22. O coeficiente de correlação
é de
A) 0
B) 2,5
C) 1,25
D) 0,88
E) 0,63
Resolução
GABARITO: D
24. (ICMS-RJ/2008/FGV) Sejam X, Y e Z três variáveis com correlações de
Pearson expressas pela matriz abaixo:
X
Y
Z
X
1,000
0,800
0,000
Y
Z
1,000
-0,500
1,000
Pode-se, então, afirmar que:
A) X e Z são independentes.
B) a correlação parcial entre X e Y, após a correção para Z, é negativa.
C) o coeficiente de determinação da regressão de Y em X é maior do que 60%.
D) a correlação entre
é negativa.
Profs. Alexandre Lima e Moraes Junior
www.pontodosconcursos.com.br
46
Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados em
Exercícios, incluindo Matemática, Matemática Financeira e Estatística
Profs. Alexandre Lima e Moraes Junior
E) a covariância entre X e Y é igual a 0,64.
Resolução
Análise das alternativas:
(A) "X e Z são independentes."
A tabela indica que X e Z são não correlacionadas, pois RXZ = 0. Contudo, a
não correlação não implica independência ^ alternativa INCORRETA.
(B) "a correlação parcial entre X e Y, após a correção para Z, é negativa."
A tabela indica que a correlação ente X e Y é igual a 0,8 (positiva) ^
alternativa INCORRETA.
(C) "o coeficiente de determinação da regressão de
60%."
Y em X é maior do que
A tabela indica que a correlação ente X e Y é R = 0,8. Logo o coeficiente de
determinação é R 2 = 0,8 2 = 0,64 = 64% (maior do que 60%) ^ alternativa
CORRETA.
d<0 é negativa."
Note que V e W são funções lineares de X e Z, respectivamente. Se a
correlação entre X e Z é nula, então a correlação entre V e W também é nula
^ alternativa INCORRETA.
(E) "a covariância entre X e Y é igual a 0,64."
Aprendemos que R = s xy /(sxsy), em que sxy é a covariância amostral entre X e
Y, s x denota o desvio-padrão amostral de X e s y denota o desvio-padrão
amostral de Y. Como não foram dados os valores de sx e de sy, nada se pode
afirmar sobre o valor da covariância entre X e Y ^ alternativa INCORRETA.
GABARITO: C
Profs. Alexandre Lima e Moraes Junior
www.pontodosconcursos.com.br
47
Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados em
Exercícios, incluindo Matemática, Matemática Financeira e Estatística
Profs. Alexandre Lima e Moraes Junior
Assinale:
A) se somente a afirmativa I for verdadeira.
B) se somente as afirmativas I e II forem verdadeiras.
C) se somente as afirmativas I e III forem verdadeiras.
D) se somente as afirmativas II e II forem verdadeiras.
E) se todas as afirmativas forem verdadeiras.
Resolução
Análise das afirmativas:
(I) VERDADEIRA, pois a 2 = 10a1, conforme demonstrado acima.
(II) FALSA, dado que b 2 = 10b! +100 .
(III) Dados:
- aplicação da transformação linear ^ = 10y + 100 resulta no coeficiente de
Vimos que a correlação amostral R é dada por
Então,
Profs. Alexandre Lima e Moraes Junior
www.pontodosconcursos.com.br
48
Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados em
Exercícios, incluindo Matemática, Matemática Financeira e Estatística
Profs. Alexandre Lima e Moraes Junior
e
Conclui-se que a transformação
qualidade da regressão original
linear
Y' = 10Y + 100
não altera
a
Portanto, a assertiva (III) é VERDADEIRA.
(*) Esta propriedade é válida para qualquer transformação que seja linear.
GABARITO: C
para os demais valores de x. Suponha que X 1 e X 2 sejam variáveis aleatórias
independentes, cada uma delas com a função densidade de probabilidade f(x).
Então podemos afirmar que a função densidade de probabilidade conjunta
f(x1,x2) é
Profs. Alexandre Lima e Moraes Junior
www.pontodosconcursos.com.br
49
Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados em
Exercícios, incluindo Matemática, Matemática Financeira e Estatística
Profs. Alexandre Lima e Moraes Junior
Resolução
para os demais valores de xj.
Logo,
caso contrário.
GABARITO: D
27. (Fiscal de Rendas do Município do RJ/2010/ESAF) A partir de uma
amostra aleatória simples formada por 22 observações das variáveis X e Y
calculou-se
Obtenha a reta de regressão linear de Y em X.
Resolução
Modelo de regressão linear simples:
é o intercepto,
denota a componente aleatória
da variação de Y (s é uma variável aleatória).
denota os valores dados pela reta estimativa,
é a estimativa do parâmetro
Profs. Alexandre Lima e Moraes Junior
www.pontodosconcursos.com.br
é a estimativa do
50
Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados em
Exercícios, incluindo Matemática, Matemática Financeira e Estatística
Profs. Alexandre Lima e Moraes Junior
Dados:
- cov. amostral
- (desvio padrão amostral de X) 2
- média de Y =
- média de X =
Logo,
Reta estimativa:
(opção E).
GABARITO: E
28. (Fiscal de Rendas do Município do RJ/2010/ESAF) Com os dados da
questão anterior, calcule o valor mais próximo do coeficiente de determinação
R 2 da regressão linear de X em Y.
A) 0,65
B) 0,81
C) 0,85
D) 0,91
E) 0,88
Resolução
Nunca podemos esquecer os conceitos fundamentais.
Lembre que a
correlação entre as variáveis aleatórias X e Y, denotada por p(X,Y), é dada
por:
Profs. Alexandre Lima e Moraes Junior
www.pontodosconcursos.com.br
51
Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados em
Exercícios, incluindo Matemática, Matemática Financeira e Estatística
Profs. Alexandre Lima e Moraes Junior
= covariância/(desvio padrão de X . desvio padrão de Y)
O módulo da correlação sempre é menor ou igual a
A correlação amostral ou coeficiente de correlação linear de Pearson
(R) é o estimador da correlação p(X,Y), sendo dada por:
R = cov. amostral/(desv. padrão amostral de X . desv. padrão amostral de Y)
ou
NOTA: não confunda correlação amostral R com correlação p(X,Y)! A primeira
é uma estimativa da segunda. A correlação é um momento estatístico. Só
conseguimos calcular a correlação p(X,Y) quando conhecemos a distribuição
conjunta de probabilidade de X e Y, ou seja, quando sabemos quem é a função
f(X,Y).
GABARITO: C
29. (ICMS-RJ/2011/FGV)
variáveis, X e Y.
A tabela
X
4
4
3
2
abaixo
mostra
os valores
de
duas
Y
4,5
5
5
5,5
Sabe-se que
Profs. Alexandre Lima e Moraes Junior
www.pontodosconcursos.com.br
52
Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados em
Exercícios, incluindo Matemática, Matemática Financeira e Estatística
Profs. Alexandre Lima e Moraes Junior
O valor de b na regressão simples Y = a + bX é
A) 11/5
B) -3/8
C) -4/11
D) -4/17
E) -11/65
Resolução
O valor de b na regressão simples é dado por
Lembre que
A tabela tem n = 4 pares de dados (X,Y). Agora podemos efetuar as contas:
Profs. Alexandre Lima e Moraes Junior
www.pontodosconcursos.com.br
53
Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados em
Exercícios, incluindo Matemática, Matemática Financeira e Estatística
Profs. Alexandre Lima e Moraes Junior
GABARITO: C
30. (ICMS-RJ/2011/FGV) Para duas variáveis populacionais, X e Y, o
desvio-padrão de X é 40, o desvio-padrão de Y é 20 e a covariância entre Y e X
é -100. Assim, o coeficiente de correlação entre X e Y é
A) -0,5.
B) 2
C) -0,25
D) -0,125
E) 0,125
Resolução
Questão imediata. Sabemos que
GABARITO: D
31.
(Economista-CODEBA/2010/FGV)
Sejam
aleatórias para uma amostra de tamanho N.
Defina a Média amostral
avalie as afirmativas abaixo:
I. O valor esperado da média amostral
II. A variância da média amostral é
III. O valor esperado de
Assinale
A) se apenas as afirmativas I e II estiverem corretas.
B) se apenas as afirmativas I e III estiverem corretas.
Profs. Alexandre Lima e Moraes Junior
www.pontodosconcursos.com.br
54
Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados em
Exercícios, incluindo Matemática, Matemática Financeira e Estatística
Profs. Alexandre Lima e Moraes Junior
C) se apenas as afirmativas II e III estiverem corretas.
D) se todas as afirmativas estiverem corretas.
E) se nenhuma das afirmativas estiver correta.
Resolução
Apesar de o enunciado ter sido omisso quanto à independência das variáveis
aleatórias X13 X 2, X 3,..., X N , é razoável assumir que elas sejam independentes
(*).
Vimos que
afirmativa I está correta.
afirmativa II está correta.
Além disso,
afirmativa III está correta.
(*) Entendemos que o enunciado não é preciso, haja vista que as observações
de uma amostra nem sempre são independentes. Por exemplo, isso ocorre em
algumas séries financeiras do mundo real, em que as amostras podem
apresentar um alto grau de correlação.
GABARITO: D
Exercícios de Revisão
(AFTM-SP/2007/FCC/Adaptada) Instruções: para responder à próxima
questão, utilize, dentre as informações abaixo, as que julgar adequadas. Se Z
tem distribuição normal padrão, então:
P(0< Z < 1) = 0,341, P(0< Z < 1,6) = 0,445, P(0< Z < 2) = 0,477
32. Os depósitos efetuados no Banco B, num determinado mês, têm
distribuição normal com média R$ 9.000,00 e desvio padrão R$ 1.500,00. Um
Profs. Alexandre Lima e Moraes Junior
www.pontodosconcursos.com.br
55
Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados em
Exercícios, incluindo Matemática, Matemática Financeira e Estatística
Profs. Alexandre Lima e Moraes Junior
depósito é selecionado ao acaso dentre todos os referentes ao mês em
questão. A probabilidade de que o depósito exceda R$ 6.000,00 é de
A) 97,7%
B) 94,5%
C) 68,2%
D) 47,7%
E) 34,1%
Resolução
Dados: X é uma variável aleatória normal com
Normal padrão:
P(Z > -2,0) = P(Z < 2,0) = 0,5 + P(0,0 < Z < 2,0) = 0,5 + 0,477 = 0,977 =
97,7%
GABARITO: A
33. (AFTE-RS/2009/Fundatec) Seja X uma variável aleatória contínua, com
A) 0,5
B) 0
C) 2/3
D) 1
E) 1/3
Resolução
Profs. Alexandre Lima e Moraes Junior
www.pontodosconcursos.com.br
56
Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados em
Exercícios, incluindo Matemática, Matemática Financeira e Estatística
Profs. Alexandre Lima e Moraes Junior
O gráfico da figura acima ilustra a forma da função densidade de probabilidade
de X, denotada por f(x). Como f(x) é simétrica em relação a zero, temos
que a média de X é zero (opção B). Repare que resolvemos a questão sem
fazer nenhuma conta! Bastou saber esboçar o gráfico de f(x).
Por completeza, calculemos o valor da constante "c". Sabemos que a área sob
f(x) é unitária. Então,
2 x (área do triângulo retângulo delimitado por 0<x<1/c) = 1
2 x (base x altura)/2 = 1
base x altura = 1
A figura a seguir mostra o gráfico de f(x).
GABARITO: B
34. (AFTE-RS/2009/Fundatec) Seja Z uma variável aleatória contínua
normalmente distribuída com média zero e desvio padrão um. Seja
Seja X uma variável aleatória contínua
normalmente distribuída
P(180<X<240), é:
com
média
200
e
desvio
padrão
20,
então
A) 0,9772
B) 0,8413
C) 0,3413
D) 0,8185
E) 0,4772
Resolução
Profs. Alexandre Lima e Moraes Junior
www.pontodosconcursos.com.br
57
Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados em
Exercícios, incluindo Matemática, Matemática Financeira e Estatística
Profs. Alexandre Lima e Moraes Junior
Dados: X1 = 180, X2 = 240, P(Z < - 1 ) = 0,1587 e P(Z > 2) = 0,0228.
Z1 = (180 - 200)/20 = -1
Z2 = (240 - 200)/20 = 2
Pede-se P(180<X<240) = P(-1<Z<2).
P(-1<Z<2) = P(-1<Z<0) + P(0<Z<2)
Mas P(-1<Z<0) = 0,5 - P(Z<-1) e P(0<Z<2) = 0,5 - P(Z>2). Logo,
P(-1<Z<2) = 0,5 - P(Z<-1) + 0,5 - P(Z>2) = 0,5 - 0,1587 + 0,5 - 0,0228 =
0,8185 (opção D).
GABARITO: D
Abraços e até a próxima aula.
Bons estudos!
Moraes Junior
[email protected]
Alexandre Lima
[email protected]
Profs. Alexandre Lima e Moraes Junior
www.pontodosconcursos.com.br
58
Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados em
Exercícios, incluindo Matemática, Matemática Financeira e Estatística
Profs. Alexandre Lima e Moraes Junior
Questões Comentadas e Resolvidas Nesta Aula
1. (Analista da SUSEP/Atuária/2001/ESAF) Uma loja vende lavadoras e
secadoras de roupa. A distribuicão conjunta do número N1 de secadoras e do
número N2 de lavadoras vendidas num mesmo dia é dada na tabela abaixo.
Assinale a opcão que dá a probabilidade de que a venda, num mesmo dia, de
lavadoras seja igual à de secadoras.
N1 N2
0
1
2
3
1
0,13
0,11
0,06
0,01
0
0,25
0,15
0,08
0,01
2
0,04
0,02
0,05
0,01
3
0,02
0,01
0,02
0,03
(A) 0,54
(B) 0,50
(C) 0,49
(D) 0,44
(E) 0,19
Julgue os itens a seguir.
2. Seja a distribuição conjunta de X e Y
f(x,y) = e -x-y ,
x>0, y>0.
Então, a densidade marginal f X (x) é dada por
f x (x) = e -y , para x>0.
3. Sejam X e Y variáveis aleatórias discretas com a seguinte distribuição
conjunta:
Y=1
0,27
0,32
X=0
X=1
Y=2
0,16
0,22
Y=3
0,01
0,02
Então a tabela abaixo especifica a distribuição condicional de X dado que Y=1:
x
f X |Y(x y=1)
0
0,458
1
0,542
4. Considere a função de distribuição conjunta
f(x,y) = e -x-y ,
Profs. Alexandre Lima e Moraes Junior
x>0, y>0.
www.pontodosconcursos.com.br
59
Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados em
Exercícios, incluindo Matemática, Matemática Financeira e Estatística
Profs. Alexandre Lima e Moraes Junior
Pode-se afirmar que X e Y são variáveis aleatórias independentes.
5. As variáveis aleatórias X e Y são independentes. Então é válida a expressão
(A) E[XY] = E[X 2]E[Y2]
(B) E[XY] = E[X]E[Y]
(C) E[XY ] = E[X]/ E[Y]
(D) E[XY] = Cov(X, Y)
(E) E[XY] = (E[X]E[Y])2
6. (Fiscal de Rendas-MS/2006/FGV) Analise as afirmativas a seguir, a
respeito de duas variáveis aleatórias X e Y:
I.
II.
III.
IV.
se
se
se
se
X e Y são independentes, então Cov(X,Y) = 0;
Cov(X,Y) = 0, então X e Y são independentes;
X e Y são independentes, então E(XY) = E(X).E(Y);
E(XY) = E(X).E(Y), então X e Y são independentes.
Assinale:
(A) se nenhuma afirmativa estiver correta.
(B) se somente as afirmativas I e III estiverem corretas.
(C) se somente as afirmativas I e IV estiverem corretas.
(D) se somente as afirmativas II e IV estiverem corretas.
(E) se todas as afirmativas estiverem corretas.
7. (Analista da SUSEP/Atuária/2010/ESAF). Y e X são variáveis aleatórias
com distribuição normal conjunta com E(Y) = |jY, E(X) = j X , e Cov(Y,X) =
pa Y a X , onde a Y e G x são os desvios padrões de Y e X, respectivamente, e p o
coeficiente de correlação entre Y e X. Qual a expressão da regressão de X em
Y, E(X|Y=y)?
8. (Analista da SUSEP/Atuária/2010/ESAF) A partir de uma amostra
aleatória (X 1 ,Y 1 ), (X 2 ,Y 2 ),..., (X 20 ,Y 20 ) foram obtidas as estatísticas:
Profs. Alexandre Lima e Moraes Junior
www.pontodosconcursos.com.br
60
Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados em
Exercícios, incluindo Matemática, Matemática Financeira e Estatística
Profs. Alexandre Lima e Moraes Junior
Qual a reta de regressão estimada de Y em X?
9.
(Técnico
de
Defesa
Aérea
e
Controle
de
Tráfego
Aéreo/Estatística/2009/CESGRANRIO) Um pesquisador estudou a relação
entre o tempo, medido em segundos, que um inspetor leva para reagir a um
estímulo visual (Y) e a idade (X), medida em anos completos. Os dados de 25
inspetores foram coletados e obtidas as seguintes informações:
As estimativas dos mínimos quadrados, para o coeficiente linear e a inclinação
da reta, respectivamente, são:
(A) 80 e 3,25
(B) 50 e 2,85
(C) 30 e 2,50
(D) 20 e 4,0
(E) 10 e 3,62
10. (ICMS-SP/2009/FCC) O gráfico abaixo demonstra a evolução da receita
tributária anual no estado de São Paulo desde 1999, com os valores
arrecadados em bilhões de reais.
Profs. Alexandre Lima e Moraes Junior
www.pontodosconcursos.com.br
61
Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados em
Exercícios, incluindo Matemática, Matemática Financeira e Estatística
Profs. Alexandre Lima e Moraes Junior
(Fonte: Secretaria da Fazenda do Estado de São Paulo - Histórico da
receita tributária)
Para
estimar a
receita
tributária
em
um
determinado
ano
com
base no
comportamento sugerido pelo gráfico, adotou-se o modelo
1, 2, 3, ..., sendo Yt = ln(RT t ), em que RTt é a receita tributária no ano
(1998+t) em bilhões de reais e ln o logaritmo neperiano
parâmetros desconhecidos e
o erro aleatório com as respectivas hipóteses
consideradas para o modelo de regressão linear simples. Utilizando o método
dos mínimos quadrados, com base nas observações de 1999 a 2008, obteve-se
valor de 0,12, sabendo-se que:
para a estimativa de
A previsão da receita tributária para 2009, em bilhões de reais, em função da
equação obtida pelo método dos mínimos quadrados é igual a
11.
(APOFP-SP/2009/ESAF) Uma amostra aleatória simples
de duas variáveis aleatórias X e Y forneceu as seguintes
quantidades:
Profs. Alexandre Lima e Moraes Junior
www.pontodosconcursos.com.br
62
Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados em
Exercícios, incluindo Matemática, Matemática Financeira e Estatística
Profs. Alexandre Lima e Moraes Junior
Calcule o valor mais próximo do coeficiente de determinação da regressão
linear de Y em X.
(A) 0,85
(B) 0,83
(C) 0,80
(D) 0,88
(E) 0,92
12. (ICMS-SP/2006/FCC) Em um determinado país, deseja-se determinar a
relação entre a renda disponível (Y), em bilhões de dólares, e o consumo (C),
também em bilhões de dólares. Foi utilizado o modelo linear simples
em que Ci é o consumo no ano i, Yi é o valor da renda disponível no
o erro aleatório com as respectivas hipóteses para a regressão linear
simples.
são parâmetros desconhecidos, cujas estimativas foram obtidas
através do método dos mínimos quadrados. Para obtenção desta relação
considerou-se ainda as seguintes informações colhidas através da observação
nos últimos 10 anos:
Para o cálculo do coeficiente de correlação de Pearson (R), usou-se a fórmula:
em que Cov(Y, C) é a covariância de Y e C, DP(Y) é o desviopadrão de Y e DP(C) é o desvio-padrão de C.
Então,
(A) o coeficiente de explicação (R 2 ) correspondente é igual a 64%.
(B) utilizando a equação da reta obtida pelo método dos mínimos quadrados,
tem-se que, em um ano, caso a renda disponível seja igual a 15 bilhões de
dólares, o consumo será igual a 13 bilhões de dólares.
(C) obtendo para um determinado ano uma previsão para o consumo de 10
bilhões de dólares, significa que a renda disponível considerada foi de 12,5
bilhões de dólares.
(D) o valor da estimativa encontrado para o parâmetro
(E) o valor da estimativa encontrado para o parâmetro
Profs. Alexandre Lima e Moraes Junior
www.pontodosconcursos.com.br
63
Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados em
Exercícios, incluindo Matemática, Matemática Financeira e Estatística
Profs. Alexandre Lima e Moraes Junior
13. (ICMS-RJ/2008/FGV) Sejam X e Y duas variáveis aleatórias quaisquer.
Então:
A) VAR(X-Y) = VAR(X) - VAR(Y)
B) VAR(X-Y) = VAR(X) + VAR(Y) - COV(X,Y)
C) VAR(X-Y) = VAR(X) + VAR(Y) - 2COV(X,Y)
D) VAR(X-Y) = VAR(X) + VAR(Y) + COV(X,Y)
E) VAR(X-Y) = VAR(X) + VAR(Y) + 2COV(X,Y)
14. (Analista Técnico da SUSEP/2006/ESAF) Sendo X uma v. a. d. variável aleatória discreta e sendo Y = aX + b, pode concluir-se que var (aX +
b) é igual a:
A) = var X.
B) = E(X 2 ) - (EX) 2 .
C) = E(X - E(X)) 2 .
D) = a 2 var X.
E) = a 2 var X - b.
15. (AFRF/2005/ESAF) Para uma amostra de dez casais residentes em um
mesmo bairro, registram-se os seguintes salários mensais (em salários
mínimos):
Identificação do casal
Salário do marido (Y)
Salário da esposa (X)
1
30
20
2
25
25
3
18
12
4
15
10
5
20
10
6
20
20
7
21
18
8
20
15
9
25
18
10
27
13
Sabe-se que:
Assinale a opção cujo valor corresponda à correlação entre os salários dos
homens e os salários das mulheres.
A) 0,72
B) 0,75
C) 0,68
D) 0,81
E) 0,78
Profs. Alexandre Lima e Moraes Junior
www.pontodosconcursos.com.br
64
Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados em
Exercícios, incluindo Matemática, Matemática Financeira e Estatística
Profs. Alexandre Lima e Moraes Junior
16. (Analista do BACEN/Área 3/2006/FCC) Sejam X e Y duas variáveis
aleatórias e
I.
E(X) e E(Y) as expectâncias de X e Y, respectivamente;
II.
Var(X) e Var(Y) as variâncias de X e Y, respectivamente;
III.
Cov(X,Y) a covariância de X e Y.
Tem-se, em qualquer situação,
A) E(X).E(Y) = E(XY) - Cov(X,Y)
B) Cov(X,Y) = Var(X).Var(Y)
C) E(2X+5) = 4E(X)
D) Se E(XY) = E(X).E(Y), então X e Y são independentes.
E) Var(X+10) = Var(X) + 10
17.
(AFRF/2009/ESAF)
Na
análise
estimativas
de
regressão
linear
simples,
as
da reta de regressão podem ser
obtidas pelo método de Mínimos Quadrados.
Nesse caso, os valores dessas estimativas são obtidos através de uma amostra
de n pares de valores Xi Y com (i =1, 2, ....,n), obtendo-se:
é a estimativa de
Para cada par de valores Xi
Yi com (i =1, 2, ...,n) pode-se estabelecer o desvio ou resíduo - aqui denotado
por ei - entre a reta de regressão Yi e sua estimativa
Sabe-se que o
Método de Mínimos Quadrados consiste em adotar como estimativas dos
os valores que minimizam a soma dos quadrados dos desvios
parâmetros
ei.
Desse modo, o Método
expressão dada por:
de
Mínimos
Quadrados
consiste
em
minimizar a
O enunciado a seguir refere-se às questões de números 18 e 19.
Profs. Alexandre Lima e Moraes Junior
www.pontodosconcursos.com.br
65
Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados em
Exercícios, incluindo Matemática, Matemática Financeira e Estatística
Profs. Alexandre Lima e Moraes Junior
A função densidade de probabilidade conjunta de duas variáveis aleatórias
discretas é dada pela tabela a seguir:
X
2
4
6
Y
3
1/24
1/4
1/24
1
1/8
1/4
1/8
9
1/12
0
1/12
18. A covariância entre X e Y é
A) 1
B) 3
C) 4
D) 12
E) 0
19. Assinale a alternativa correta.
A) X e Y não são independentes.
B) X e Y são independentes.
C) X e Y são correlacionadas.
D) X e Y têm distribuição conjuntamente normal.
E) X e Y têm distribuições marginais normais.
O enunciado a seguir refere-se às questões de números 20 e 21.
Considere
as
variáveis
aleatórias
independentes
Xl,X2,...,Xn.
Suponha
que
essas n variáveis possuam a mesma distribuição de probabilidades com média
20. Podemos afirmar que o valor esperado de
Profs. Alexandre Lima e Moraes Junior
www.pontodosconcursos.com.br
66
Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados em
Exercícios, incluindo Matemática, Matemática Financeira e Estatística
Profs. Alexandre Lima e Moraes Junior
21. Podemos afirmar que a variância de
22. (Analista do BACEN/Área 3/2006/FCC) Uma empresa, com a
finalidade de determinar a relação entre os gastos anuais com propaganda (X),
em R$ 1 000,00, e o lucro bruto anual (Y), em R$1.000,00, optou por utilizar o
modelo linear simples
é o valor do lucro bruto
auferido no ano i, X i é o valor gasto com propaganda no ano
aleatório com as respectivas hipóteses consideradas para a regressão linear
simples
são parâmetros desconhecidos).
Considerou,
para o estudo,
as seguintes
observações nos últimos 10 anos da empresa:
informações
referentes
às
Utilizando a equação da reta obtida pelo método dos mínimos quadrados, temse que, caso haja um gasto anual com propaganda de 80 mil reais, a previsão
do lucro bruto anual, em mil reais, será de
A) 84
B) 102,5
C) 121
D) 128,4
E) 158
23. (INÉDITA) Considere os dados da questão 22. O coeficiente de correlação
é de
A) 0
B) 2,5
C) 1,25
D) 0,88
Profs. Alexandre Lima e Moraes Junior
www.pontodosconcursos.com.br
67
Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados em
Exercícios, incluindo Matemática, Matemática Financeira e Estatística
Profs. Alexandre Lima e Moraes Junior
E) 0,63
24. (ICMS-RJ/2008/FGV) Sejam X, Y e Z três variáveis com correlações de
Pearson expressas pela matriz abaixo:
X
Y
Z
X
1,000
0,800
0,000
Y
Z
1,000
-0,500
1,000
Pode-se, então, afirmar que:
A) X e Z são independentes.
B) a correlação parcial entre X e Y, após a correção para Z, é negativa.
C) o coeficiente de determinação da regressão de Y em X é maior do que 60%.
D) a correlação entre V = a + b.X e W = c + d.Z, com a ^ 0, c ^ 0, b>0 e d<0
é negativa.
E) a covariância entre X e Y é igual a 0,64.
25. (ICMS-RJ/2009/FGV) Utilizando uma análise de regressão linear
simples, um pesquisador obteve um ajuste Y = aX + bi e um coeficiente de
determinação R 2 . Um segundo pesquisador analisou os mesmos dados, mas
antes aplicou a cada observação de Y a transformação Y' = 10Y + 100, obtendo
um outro ajuste Y' = a2x + b2, com um coeficiente de determinação R 2 . Considere
as afirmativas abaixo, relativas à comparação entre os valores obtidos nas
duas análises:
Assinale:
A) se somente a afirmativa I for verdadeira.
B) se somente as afirmativas I e II forem verdadeiras.
C) se somente as afirmativas I e III forem verdadeiras.
D) se somente as afirmativas II e II forem verdadeiras.
E) se todas as afirmativas forem verdadeiras.
26. Seja a função densidade de probabilidade
para os demais valores de x. Suponha que X1 e X2 sejam variáveis aleatórias
independentes, cada uma delas com a função densidade de probabilidade f(x).
Profs. Alexandre Lima e Moraes Junior
www.pontodosconcursos.com.br
68
Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados em
Exercícios, incluindo Matemática, Matemática Financeira e Estatística
Profs. Alexandre Lima e Moraes Junior
Então podemos afirmar que a função densidade de probabilidade conjunta
f(x1,x2) é
27. (Fiscal de Rendas do Município do RJ/2010/ESAF) A partir de uma
amostra aleatória simples formada por 22 observações das variáveis X e Y
calculou-se
Obtenha a reta de regressão linear de Y em X.
28. (Fiscal de Rendas do Município do RJ/2010/ESAF) Com os dados da
questão anterior, calcule o valor mais próximo do coeficiente de determinação
R 2 da regressão linear de X em Y.
A) 0,65
B) 0,81
C) 0,85
D) 0,91
E) 0,88
Profs. Alexandre Lima e Moraes Junior
www.pontodosconcursos.com.br
69
Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados em
Exercícios, incluindo Matemática, Matemática Financeira e Estatística
Profs. Alexandre Lima e Moraes Junior
29. (ICMS-RJ/2011/FGV)
variáveis, X e Y.
A tabela
abaixo
X
4
4
3
2
mostra
os valores
de
duas
Y
4,5
5
5
5,5
Sabe-se que
O valor de b na regressão simples Y = a + bX é
A) 11/5
B) -3/8
C) -4/11
D) -4/17
E) -11/65
30. (ICMS-RJ/2011/FGV) Para duas variáveis populacionais, X e Y, o
desvio-padrão de X é 40, o desvio-padrão de Y é 20 e a covariância entre Y e X
é -100. Assim, o coeficiente de correlação entre X e Y é
A) -0,5.
B) 2
C) -0,25
D) -0,125
E) 0,125
31.
(Economista-CODEBA/2010/FGV)
Sejam
X, X2, X3,..., X N
variáveis
aleatórias para uma amostra de tamanho N.
Defina a Média amostral
avalie as afirmativas abaixo:
Profs. Alexandre Lima e Moraes Junior
www.pontodosconcursos.com.br
70
Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados em
Exercícios, incluindo Matemática, Matemática Financeira e Estatística
Profs. Alexandre Lima e Moraes Junior
I. O valor esperado da média amostral é
II. A variância da média amostral é
III. O valor esperado de
Assinale
A) se apenas as afirmativas I e II estiverem corretas.
B) se apenas as afirmativas I e III estiverem corretas.
C) se apenas as afirmativas II e III estiverem corretas.
D) se todas as afirmativas estiverem corretas.
E) se nenhuma das afirmativas estiver correta.
Exercícios de Revisão
(AFTM-SP/2007/FCC/Adaptada) Instruções: para responder à próxima
questão, utilize, dentre as informações abaixo, as que julgar adequadas. Se Z
tem distribuição normal padrão, então:
P(0< Z < 1) = 0,341, P(0< Z < 1,6) = 0,445, P(0< Z < 2) = 0,477
32. Os depósitos efetuados no Banco B, num determinado mês, têm
distribuição normal com média R$ 9.000,00 e desvio padrão R$ 1.500,00. Um
depósito é selecionado ao acaso dentre todos os referentes ao mês em
questão. A probabilidade de que o depósito exceda R$ 6.000,00 é de
A) 97,7%
B) 94,5%
C) 68,2%
D) 47,7%
E) 34,1%
33. (AFTE-RS/2009/Fundatec) Seja X uma variável aleatória contínua, com
função densidade de probabilidade dada por
O valor da média de X é
A) 0,5
B) 0
C) 2/3
D) 1
E) 1/3
34.
(AFTE-RS/2009/Fundatec)
Profs. Alexandre Lima e Moraes Junior
Seja
Z
uma
variável
www.pontodosconcursos.com.br
aleatória
contínua
71
Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados em
Exercícios, incluindo Matemática, Matemática Financeira e Estatística
Profs. Alexandre Lima e Moraes Junior
normalmente distribuída com média zero e desvio padrão um. Seja
P(Z < - 1 ) = 0,1587 e P(Z > 2) = 0,0228 . Seja X uma variável aleatória contínua
normalmente distribuída
P(180<X<240), é:
com
média
200
e
desvio
padrão
20,
então
A) 0,9772
B) 0,8413
C) 0,3413
D) 0,8185
E) 0,4772
Profs. Alexandre Lima e Moraes Junior
www.pontodosconcursos.com.br
72
Download