Professor ERICK Y. MIZUNO - CENTRAL DE CONCURSOS www.math.iridium.com.br [email protected] __________________________________________________________________________ Resolução da 1ª lista de exercícios de ESTATÍSTICA 15 de Fevereiro de 2009 Prof.: Erick Create PDF files without this message by purchasing novaPDF printer (http://www.novapdf.com) Professor ERICK Y. MIZUNO - CENTRAL DE CONCURSOS www.math.iridium.com.br [email protected] __________________________________________________________________________ 1. (ICMS/RJ - 2007 - Prova Amarela) Uma amostra de 100 servidores de uma repartição apresentou média salarial de R$ 1.700,00 com uma dispersão de R$ 240,00. Pode-se afirmar que: (A) a média aritmética não é uma boa medida para representar a amostra em função do elevado valor do desvio-padrão. (B) a melhor medida para representar a amostra é a remuneração por unidade de desvio-padrão. (C) o salário mediano representaria melhor a amostra devido ao alto nível de heterogeneidade dos salários na amostra. (D) a amostra não é suficientemente grande para analisarmos o valor encontrado para a média dos salários. (E) a média aritmética pode perfeitamente representar os salários da amostra pelo fato de esta apresentar uma dispersão relativa inferior a 20%. RESOLUÇÃO: Foram fornecidos, no enunciado, os valores da média e do desvio padrão. Pelas opções de resposta, vemos que a primeira providência será calcular o CV (Coeficiente de Variação), que será encontrado dividindo-se o desvio padrão pela média. Assim o fazendo, teremos: CV = 240/1.700 = 0,141176 que é, aproximadamente, 14,1%. Tal CV (abaixo de 50%) indica que a distribuição é homogênea e a média é representativa para a distribuição. Dado que: "Considera-se que um CV superior a 50% indica alto grau de dispersão e conseqüentemente pequena representatividade da Média, enquanto para um CV inferior a 50% a Média será tanto mais representativa quanto menor for o valor do CV, ou seja, quanto menor for o CV mais homogênea será considerada a série e quanto maior for o CV, mais heterogênea." Somente com esse raciocínio já eliminamos, imediatamente, as opções A, B e C e observamos que a opção da letra E está absolutamente correta. A letra D está errada porque o tamanho da amostra (n = 100) é suficientemente grande (é maior do que 30). Alternativa: e). Create PDF files without this message by purchasing novaPDF printer (http://www.novapdf.com) Professor ERICK Y. MIZUNO - CENTRAL DE CONCURSOS www.math.iridium.com.br [email protected] __________________________________________________________________________ 2. Se a média e a variância da variável aleatória X são 12 e 80 respectivamente, então a média e a variância da variável aleatória Y = X/4 + 1 são dadas respectivamente por (A) 4 e 20 (B) 4 e 5 (C) 3 e 20 (D) 4 e 21 (E) 3 e 5 RESOLUÇÃO: Novamente, recordande-mo-nos da aula sobre Dispersões. Naquela ocasião, discutimos sobre as propriedades da Média e da Variância (e, Desvio-Padrão). 1ª Propriedade da Média/Desvio-Padrão: Se multiplicarmos cada termo de uma coleção de dados amostrais por uma mesma constante, a nova Média/Desvio-Padrão será igual ao produto da anterior por esta constante. 2ª Propriedade da Média/Desvio-Padrão: Se somarmos a cada termo de uma coleção de dados amostrais uma mesma constante, a Média será aumentada da mesma constante. Já o Desvio-Padrão da nova variável será idêntico ao da anterior! Temos que a média X = 12 e a variância de x é σ2 = 80. Como definiu-se Y=X/4 + 1, temos que: Y = X /4 +1, ou seja: Y = 12/4 +1 = 4 Y2 = X2 = 80/16 = 5 42 Alternativa b). Create PDF files without this message by purchasing novaPDF printer (http://www.novapdf.com) Professor ERICK Y. MIZUNO - CENTRAL DE CONCURSOS www.math.iridium.com.br [email protected] __________________________________________________________________________ 3. (ICMS/RJ - 2007 - Prova Amarela) Considere as informações contidas no Box Plot abaixo, referente aos salários dos engenheiros de uma empresa, por sexo. É correto afirmar que: (A) o desvio interquartílico dos salários das mulheres é maior do que o dos homens. (B) a distribuição dos salários das mulheres é assimétrica negativa. (C) o salário médio dos homens é igual ao das mulheres. (D) a distribuição dos salários dos homens é atípica. (E) o salário mediano das mulheres é superior ao dos homens. RESOLUÇÃO: A mecânica necessária para a resolução deste exercício, como já deve ter sido possível imaginar, será o uso do “BOX PLOT”. Como estou certo de que ‘todos’ estão perfeitamente lembrados do assunto... recordo: É apresentado na questão o desenho esquemático chamado Diagrama de Caixa (Box Plot), que utiliza o "esquema dos cinco números" (best known as: “Five Number Summary”) a saber: Mínimo, 1º Quartil, Mediana (que é o 2º Quartil), 3º Quartil e o Máximo da distribuição, onde os quartis são chamados de "juntas" da Caixa. A distância entre as juntas (d ) corresponde à amplitude interquartílica (ou distância interquartílica ou ainda j desvio interquartílico) e será obtida através da diferença entre o 3º Quartil (Q ) e o 1º Quartil (Q ), ou seja: 3 1 d = Q − Q . Essa medida, serve para a detecção de Outiliers (valores atípicos) de uma distribuição. j 3 1 Serão considerados Outliers os valores inferiores a Q − 1,5d ou superiores a Q + 1,5d . 1 j 3 Create PDF files without this message by purchasing novaPDF printer (http://www.novapdf.com) j Professor ERICK Y. MIZUNO - CENTRAL DE CONCURSOS www.math.iridium.com.br [email protected] __________________________________________________________________________ Com o entendimento do "esquema dos cinco números", uma rápida visualização do diagrama é suficiente para verificar que a alternativa correta de resposta encontra-se na opção da letra A, pois a distância entre os quartis na caixa do sexo feminino é bem maior do que na caixa do sexo masculino. Vemos ainda que a opção da letra B está errada, pois se a mediana (Md) está mais próxima do 1º Quartil (Q ), a distribuição será assimétrica positiva. 1 Vemos também que a letra E também está errada porque as medianas serão iguais para ambos os sexos. Quanto às opções das letras C e D, nada podemos afirmar quanto ao valor da média ou quanto aos valores atípicos, pois não dispomos no diagrama de informações precisas dos valores necessários aos cálculos. Alternativa: a). Create PDF files without this message by purchasing novaPDF printer (http://www.novapdf.com) Professor ERICK Y. MIZUNO - CENTRAL DE CONCURSOS www.math.iridium.com.br [email protected] __________________________________________________________________________ 4. Para se estudar o desempenho das corretoras de ações A e B, selecionou-se de cada uma delas amostras aleatórias das ações negociadas. Para cada ação selecionada computou-se a porcentagem de lucro apresentada durante o período de um ano. Os gráficos a seguir apresentam os desenhos esquemáticos relativos à porcentagem de lucro das amostras de A e B durante o período citado. Relativamente à porcentagem de lucro obtida por essas corretoras pode-se afirmar que (A) exatamente 25% dos valores de A são inferiores a 55. (B) menos de 50% dos valores de B são superiores a 55. (C) o maior valor de A é 60. (D) os valores de A apresentam maior variabilidade que os de B. (E) os valores de B apresentam assimetria positiva. RESOLUÇÃO: Observando o desenho esquemático, agora com as cinco medidas posicionadas nas caixas correspondentes às Corretoras A e B, vemos que: Para a Corretora A: O valor mínimo (MIN) é aproximadamente igual a 45; O valor do 1º Quartil (Q1) está entre 50 e 55; O valor da Mediana (Md) é aproximadamente igual a 55; O valor do 3º Quartil (Q3) é aproximadamente igual a 60; O valor máximo (MAX) é aproximadamente igual a 70. Para a Corretora B: O valor mínimo (MIN) é aproximadamente igual a 50; O valor do 1º Quartil (Q1) está entre 50 e 55; O valor da Mediana (Md) está entre 55 e 60; O valor do 3º Quartil (Q3) está entre 55 e 60; O valor máximo (MAX) está entre 60 e 65; Analisando agora as opções de resposta, vemos que: Create PDF files without this message by purchasing novaPDF printer (http://www.novapdf.com) Professor ERICK Y. MIZUNO - CENTRAL DE CONCURSOS www.math.iridium.com.br [email protected] __________________________________________________________________________ A 1ª opção está errada porque não é exatamente 25% dos valores da Corretora A que são inferiores a 55 e sim aproximadamente 50%, pois é a Mediana (e não o 1º Quartil) que está próxima do valor 55; A 2ª opção está errada, porque a Mediana de B é um valor maior do que 55. Então entre este valor e a Mediana teremos X% e acima de 55 teremos: 50% + X%, ou seja, mais de 50% serão superiores a 55; A 3ª opção está errada porque o maior valor de A não é igual a 60, mas sim superior a 60. Como podemos notar no desenho esquemático, o máximo de A é aproximadamente igual a 70; A 4ª opção de resposta está correta, porque a Amplitude Total (diferença entre o máximo e o mínimo) da distribuição A é bem maior do que a da distribuição B (basta olhar para o tamanho das caixas). Então a variabilidade de A, com certeza, será maior; A 5ª opção de resposta está errada, pois na distribuição B a mediana está mais próxima do 3º quartil e assim a assimetria é negativa (e não positiva). Haverá assimetria positiva na distribuição A, pois naquela a mediana está mais próxima do 1º quartil. Quando a mediana está exatamente no meio (da amplitude entre os dois quartis), a distribuição será simétrica. Basta lembrar do Coeficiente Quartílico de Assimetria de Pearson, dado por: AS1 Q1 Q3 2 M d . Q3 Q1 Repare que o denominador, dado pela amplitude interquartílica (diferença entre os quartis) será sempre positivo, pois o 3º quartil sempre será maior do que o 1º quartil. Logo a assimetria (positiva, negativa ou nula) depende do resultado do numerador, que variará em função da posição da mediana. Para facilitar o entendimento, vamos arbitrar valores para as medidas, por exemplo, suponha que Q3 = 60, Q1 = 50 e que a mediana esteja exatamente entre estes valores, ou seja, Md = 55. Neste caso, a assimetria será nula, pois Q3 + Q1 - 2Md = 0. Agora suponha que, a mediana é igual a 57 (está mais próxima do 3º quartil). Neste caso, a assimetria será negativa (caso da distribuição B), pois Q3 + Q1 2Md = 60 + 50 - 114 = −4. Agora suponha que a mediana é igual a 52 (mais próxima do 1º quartil). Então teremos uma assimetria positiva (caso da distribuição A), pois Q3 + Q1 - 2Md = 60 + 50 - 104 = 6. Create PDF files without this message by purchasing novaPDF printer (http://www.novapdf.com)