RACIOCÍNIO LÓGICO QUANTITATIVO PARA AFRFB PROFESSOR: GUILHERME NEVES Aula 11 Estatística . ........................................................................................... 2 Classe . ................................................................................................ 7 Limites de classe .................................................................................... 7 Amplitude de um intervalo de classe. ........................................................ 7 Amplitude total da Distribuição . ............................................................... 8 Ponto médio de uma classe ..................................................................... 8 Tipos de frequências ............................................................................... 9 Medidas de Posição ...............................................................................11 Médias . ...............................................................................................11 Propriedades da média aritmética . ..........................................................13 Cálculo breve da Média Aritmética . ..........................................................15 23 Mediana (Md) ..................................................................................... Moda . .................................................................................................31 Moda Bruta ..........................................................................................32 Processo de Czuber ...............................................................................33 33 Processo de King . ................................................................................ Propriedades da Moda............................................................................34 Medidas de dispersão ou variabilidade . ....................................................36 Desvio Absoluto Médio (Dm). ..................................................................36 Desvio padrão e Variância . .....................................................................40 Propriedades da Variância . .....................................................................46 Propriedades do Desvio-padrão . ..............................................................46 Método simplificado para o desvio padrão e variância . ...............................48 Relação das questões comentadas . .........................................................61 Gabaritos .............................................................................................69 Prof. Guilherme Neves www.pontodosconcursos.com.br 1 RACIOCÍNIO LÓGICO QUANTITATIVO PARA AFRFB PROFESSOR: GUILHERME NEVES Estatística A Estatística, ramo da Matemática Aplicada, teve origem na história do homem. Desde a Antiguidade, vários povos registravam o número de habitantes, de nascimentos, de óbitos, distribuíam equitativamente terras ao povo. Na Idade Média colhiam-se informações, geralmente com finalidades tributárias ou bélicas. No início do século XVIII o estudo de tais fatos foi adquirindo feição verdadeiramente científica. A palavra foi proposta pela primeira vez no século XVII, em latim, por Schmeitzel na Universidade de Lena e adotada pelo acadêmico alemão Godofredo Achenwall. As tabelas tornaram-se mais completas, surgiram as representações gráficas e o cálculo das probabilidades, e a Estatística deixou de ser uma simples catalogação de dados numéricos para se tornar o estudo de “como chegar a conclusões sobre o todo (população), partindo da observação de partes do todo (amostras)”. Podemos dizer, então, que a Estatística é uma parte da Matemática Aplicada que fornece métodos para a c oleta, organização, descrição, análise e interpretação de dados para a utilização dos mesmos na tomada de decisões. A coleta, organização e a descrição dos dados estão a cargo da Estatística Descritiva. A análise e a interpretação dos dados ficam a cargo da Estatística Inferencial. O aspecto essencial da Estatística é o de proporcionar métodos inferenciais, que permitam obter conclusões que transcendam os dados obtidos inicialmente. Vamos à primeira fase de um processo estatístico. Imagine que você foi o encarregado para fazer uma pesquisa sobre a altura dos alunos do Ponto dos Concursos. Como são muitos alunos, você decidiu realizar uma pesquisa com apenas 40 alunos. Suponhamos termos feito uma coleta de dados relativos às estaturas de quarenta alunos, que compõem uma amostra dos alunos do Ponto, resultando a seguinte tabela de valores: 166 164 160 155 156 160 160 155 155 172 161 162 164 169 153 150 161 168 151 157 162 168 155 170 156 160 163 152 164 158 165 156 163 154 158 167 173 160 161 161 Obviamente, quando você começa a sua pesquisa, os seus dados não estão organizados. A esses dados desorganizados denominamos dados brutos. Prof. Guilherme Neves www.pontodosconcursos.com.br 2 RACIOCÍNIO LÓGICO QUANTITATIVO PARA AFRFB PROFESSOR: GUILHERME NEVES A esse tipo de tabela, cujos elementos não foram numericamente organizados, denominamos tabela primitiva. O próximo passo, após realizar a coleta dos dados, é organizar esses dados em ordem crescente ou decrescente. Denominamos os dados dispostos em ordem crescente ou decrescente de rol. Em suma, um rol é um arranjo de dados numéricos brutos em ordem crescente ou decrescente. Colocar os dados brutos em rol é uma das fases da Estatística Descritiva. À diferença entre o maior e o menor número do rol chama-se amplitude total dos dados. Então vamos lá... Coloquemos os dados em ordem crescente! 150 151 152 153 154 155 155 155 155 156 156 156 157 158 158 160 160 160 160 160 161 161 161 161 162 162 163 163 164 164 164 165 166 167 168 168 169 170 172 173 Um pouco melhor ou não? Agora, podemos saber, com relativa facilidade, qual a menor estatura (150 cm) e qual a maior (173 cm); que a amplitude total de variação foi de 173 – 150 = 23 cm. 01. (Economista - Instituto de Previdência do Estado de Santa Catarina – FEPESE/2006) Verifique os conjuntos A, B, C e D abaixo, no formato de rol e assinale a alternativa correta. a) A amplitude total do conjunto C é igual a 0,28. b) Não é possível calcular a amplitude total do conjunto D, pois estamos diante de um rol decrescente. c) A amplitude de todos os conjuntos é igual a 7. d) A amplitude total do conjunto A é 2,1. e) A amplitude total do conjunto B é o dobro da amplitude total do conjunto A. Resolução Prof. Guilherme Neves www.pontodosconcursos.com.br 3 RACIOCÍNIO LÓGICO QUANTITATIVO PARA AFRFB PROFESSOR: GUILHERME NEVES O primeiro passo é organizar os conjuntos A, B, C e D em formato de rol. Tanto faz organizar em ordem crescente ou decrescente. Por questão de costume, organizarei em ordem crescente. A B C D 0,05 0,25 0,01 1 0,5 0,5 0,02 2 1 1 0,03 2 2 3 0,04 3 3 7 0,05 3 5 10 0,06 4 5,1 10,35 0,07 5 A amplitude total de um conjunto é a diferença entre o maior elemento e o menor elemento. Assim: a) A amplitude total do conjunto C é igual a 0,07 – 0,01 = 0,06. A letra A é, portanto, falsa. b) A amplitude total do conjunto D é 5 – 1 = 4. A letra B é, portanto, falsa. c) A amplitude de todos os conjuntos é igual a 10,35 – 0,01 =10,34. A letra C é, portanto, falsa. d) A amplitude total do conjunto A é igual a 5,1 – 0,05 = 5,05. A letra D é , portanto, falsa. e) A amplitude total do conjunto B é igual a 10,35 – 0,25 = 10,1. Portanto a amplitude total do conjunto B é o dobro da amplitude total do conjunto A e a alternativa E é verdadeira. Letra E 02. (Auditor Interno do Poder Executivo- Secretarias de Estado da Fazenda e da Administração – 2005 – FEPESE) Os pesos de 80 pacientes internados em um hospital estão relacionados na tabela abaixo. Com referência a essa tabela, determine a amplitude total. Assinale a única alternativa correta. a) 49 b) 53 Prof. Guilherme Neves www.pontodosconcursos.com.br 4 RACIOCÍNIO LÓGICO QUANTITATIVO PARA AFRFB PROFESSOR: GUILHERME NEVES c) 79 d) 80 e) 97 Resolução A amplitude total de um conjunto é a diferença entre o maior elemento e o menor elemento. O maior elemento desse conjunto é 99 (4ª coluna e 6ª linha) e o menor elemento é 50 (9ª coluna e 7ª linha). Assim a amplitude total é 99 – 50 = 49. Letra A Vamos começar um estudo pormenorizado das distribuições de frequências, seus elementos e propriedades. Voltemos ao exemplo inicial de nossa aula para entendermos as próximas explicações. Imagine que você foi o encarregado de fazer uma pesquisa sobre a altura dos alunos do Ponto dos Concursos. Como são muitos alunos, você decidiu realizar uma pesquisa com apenas 40 alunos. Suponhamos termos feito uma coleta de dados relativos às estaturas de quarenta alunos, que compõem uma amostra dos alunos do Ponto, resultando a seguinte tabela de valores: 166 164 160 155 156 160 160 155 155 172 161 162 164 169 153 150 161 168 151 157 162 168 155 170 156 160 163 152 164 158 165 156 163 154 158 167 173 160 161 161 Denominamos os dados dispostos em ordem crescente ou decrescente de rol. 150 151 152 153 154 155 155 155 155 156 156 156 157 158 158 160 160 160 160 160 161 161 161 161 162 162 163 163 164 164 164 165 166 167 168 168 169 170 172 173 Denominamos frequência o número de alunos que fica relacionado a um determinado valor da variável. Obtemos, assim, uma tabela que recebe o nome de distribuição de frequência. Por exemplo, temos 4 alunos com 161 cm de altura. Portanto 4 é a frequência do dado 161 cm. Vamos relacionar cada dado com a sua frequência correspondente. Prof. Guilherme Neves www.pontodosconcursos.com.br 5 RACIOCÍNIO LÓGICO QUANTITATIVO PARA AFRFB PROFESSOR: GUILHERME NEVES Estat. (cm) Freq. Estat. (cm) Freq. Estat. (cm) Freq. 150 1 158 2 167 1 151 1 160 5 168 2 152 1 161 4 169 1 153 1 162 2 170 1 154 1 163 2 172 1 155 4 164 3 173 1 156 3 165 1 157 1 166 1 Total 40 O processo dado é ainda inconveniente, já que exige muito espaço, mesmo quando o número de valores da variável é de tamanho razoável. Sendo possível, a solução mais aceitável, pela própria natureza da variável contínua, é o agrupamento em vários intervalos. Assim, se um dos intervalos for, por exemplo, 154 158 (154 ≤ x< 158), em vez de dizermos que a estatura de 1 aluno é 154 cm; de 4 alunos, 155 cm; de 3 alunos, 156 cm; e de 1 aluno, 157 cm, diremos que 9 alunos têm estaturas entre 154, inclusive, e 158 cm, exclusive. Deste modo, estaremos agrupando os valores da variável em intervalos, sendo que, em Estatística, preferimos chamar os intervalos de classes. O símbolo ⊢ será muito utilizado e significa que incluímos o limite inferior do intervalo e excluímos o limite superior do intervalo. Chamando de frequência de uma classe o número de valores da variável pertencentes à classe, os dados da tabela acima podem ser dispostos como na próxima tabela, denominada distribuição de frequência com intervalos de classe: Estaturas de 40 alunos do Ponto dos Concursos Estaturas Frequência (cm) 150 154 4 154 158 9 158 162 11 162 166 8 166 170 5 170 174 3 Total 40 Ao agruparmos os valores da variável em classes, ganhamos em simplicidade, mas perdemos em pormenores. Não sabemos mais qual a altura exata de cada um dos alunos. Prof. Guilherme Neves www.pontodosconcursos.com.br 6 RACIOCÍNIO LÓGICO QUANTITATIVO PARA AFRFB PROFESSOR: GUILHERME NEVES O que pretendemos com a construção dessa nova tabela, é realçar o que há de essencial nos dados e, também tornar possível o uso de técnicas analíticas para sua total descrição, até porque a Estatística tem por finalidade específica analisar o c onjunto de valores, desinteressando-se por casos isolados. Analisemos, agora, detalhadamente, uma distribuição de frequências. cada um dos elementos de Elementos de uma distribuição de frequência Estaturas de 40 alunos Ponto dos Concursos Estaturas Frequência (cm) 150⊢154 4 154⊢158 9 158⊢162 11 162⊢166 8 166⊢170 5 170⊢174 3 Total 40 Classe É cada um dos grupos ou intervalos obtidos a partir do agrupamento ou conjunto de dados. Por exemplo, a terceira classe é 158⊢162. Limites de classe Denominamos limites de classe os extremos de cada classe. O menor número é o limite inferior da classe ( linf ) e o maior número, o limite superior da classe ( lsup ). Na segunda classe, por exemplo, temos: linf = 154 e lsup = 158 Amplitude de um intervalo de classe Amplitude de um intervalo de classe ou, simplesmente, intervalo de classe é a medida do intervalo que define a classe. É obtida pela diferença entre os limites superior e inferior dessa classe e designamos por h . Assim, h = lsup − linf Prof. Guilherme Neves www.pontodosconcursos.com.br 7 RACIOCÍNIO LÓGICO QUANTITATIVO PARA AFRFB PROFESSOR: GUILHERME NEVES Por exemplo, na terceira classe da tabela acima, temos: h = 162 − 158 = 4 Amplitude total da Distribuição Amplitude total da distribuição (AT) é a diferença entre o limite superior da última classe (limite superior máximo) e o limite inferior da primeira classe (limite inferior mínimo). AT = lmáx − lmín Em nosso exemplo, temos: AT = 174 − 150 = 24 ⇒ AT = 24cm É evidente que, se as classes possuem o mesmo intervalo, verificamos a rela AT = K ⋅ h . Essa expressão é de fácil compreensão, visto que são 6 classes e que a amplitude de cada classe é igual a 4. Assim, a amplitude total é igual a 6 x 4 = 24. Ponto médio de uma classe Ponto médio de uma classe ( xi ) é, como o próprio nome indica, o ponto que divide o intervalo de classe em duas partes iguais. Para obtermos o ponto médio de uma classe, calculamos a média aritmética dos limites da classe. lim infi + lim supi xi = 2 Assim, o ponto médio da quarta classe, em nosso exemplo é: liminf4 + limsup4 162 + 166 ⇒ x4 = = 164 x4 = 2 2 x4 = 164cm O ponto médio de uma classe é o valor que a representa. Se as amplitudes dos intervalos de classes forem constantes (como aconteceu no nosso exemplo), podemos calcular os pontos médios das classes da seguinte maneira: i) Calculamos o primeiro ponto médio. ii) Para calcular os próximos pontos médios, basta adicionar a amplitude de cada classe ao ponto médio da classe anterior. Dessa forma, como o primeiro ponto médio é 152 cm, o próximo ponto médio é 152 + 4 = 156. O terceiro ponto médio é 156 + 4 = 160 cm. Estaturas (cm) 150 154 154⊢ ⊢158 158 162 162 166 166⊢ ⊢170 170 174 Prof. Guilherme Neves Xi 152 156 160 164 168 172 www.pontodosconcursos.com.br 8 RACIOCÍNIO LÓGICO QUANTITATIVO PARA AFRFB PROFESSOR: GUILHERME NEVES Tipos de frequências Frequências simples ou absolutas ( f i ) São os valores que realmente representam o número de dados de cada classe. A soma das freqüências simples é igual ao número total dos dados. k ∑f i =n O símbolo ∑ significa somatório. Nesse caso, como k = 6 (número de classes), então i =1 = + + + + í + 1 6. = 4 + 9 + 11 + 8 + 5 + 3 = 40 Frequências relativas ( fri ) São os valores das razões entre as frequências simples e a frequência total, normalmente expressas em porcentagem. f fri = i n Lembre-se que para transformar qualquer fração para a forma percentual devemos multiplicá-la por 100%. No nosso exemplo, a freqüência relativa da terceira classe é: f 11 fr3 = 3 = ⋅100% = 27,5% ∴ fr3 = 27,5% 40 40 Evidentemente o somatório das frequências relativas é igual a 1 (100%). O propósito das frequências relativas é o de permitir a análise ou facilitar as comparações de cada classe com o total de observações. Prof. Guilherme Neves www.pontodosconcursos.com.br 9 RACIOCÍNIO LÓGICO QUANTITATIVO PARA AFRFB PROFESSOR: GUILHERME NEVES Frequência absoluta acumulada crescente – “abaixo de” ( fac ) É o total das frequências de todos os valores inferiores ao limite superior do intervalo de uma dada classe. faci = f1 + f 2 + ... + fi O procedimento para o cálculo desta frequência é o seguinte: i) Repete-se a frequência absoluta da primeira classe. ii) Para calcular a próxima frequência acumulada, devemos somar a frequência acumulada anterior com a frequência absoluta da classe correspondente. Estaturas (cm) 150 154 fi fac 4 4 154 158 9 13 158 162 11 24 162 166 8 32 166 170 5 37 170 174 3 40 Total 40 O que significa existirem 24 alunos com estatura abaixo de 162 cm (limite superior da terceira classe). Frequência absoluta acumulada decrescente ( fad ) É o total das frequências de todos os valores superiores ao limite inferior do intervalo de uma dada classe. fad i = f i + f i +1 + ... + f k O procedimento para o cálculo desta frequência é o seguinte: i) Repete-se a frequência absoluta da última classe. ii) Para calcular a próxima frequência acumulada (de baixo para cima), devemos somar a frequência acumulada anterior com a frequência absoluta da classe correspondente. Estaturas (cm) 150 154 154 158 158 162 162 166 166 170 170 174 Total fi fad 4 9 11 8 5 3 40 40 36 27 16 8 3 O que significa existirem 27 alunos com estatura igual ou superior a 158 cm (limite inferior da terceira classe). Prof. Guilherme Neves www.pontodosconcursos.com.br 10 RACIOCÍNIO LÓGICO QUANTITATIVO PARA AFRFB PROFESSOR: GUILHERME NEVES Podemos representar essas frequências acumuladas na forma percentual (frequência relativa acumulada) dividindo pelo total de observações (n) e multiplicando por 100%. Medidas de Posição Nos itens anteriores, vimos como resumir um conjunto de dados em tabelas de frequência e também como representá-los graficamente. Agora, a partir dos valores assumidos por uma variável quantitativa, vamos estabelecer medidas correspondentes a um resumo da distribuição de tais valores. Estabeleceremos um valor médio ou central e um valor indicativo do grau de variabilidade ou dispersão em torno do valor central. Como valores centrais vamos estudar a média, a mediana (e outras medidas separatrizes (quantis) como o decil, quartil, percentil, etc) e a moda. Médias Uma ideia bastante importante é a de média. Estudaremos apenas a média aritmética. Vejamos um exemplo. Sabendo-se que a produção leiteira diária de uma vaca, durante uma semana, foi de 10, 14, 13, 15, 16, 18 e 12 litros, temos para produção média da semana: x= 10 + 14 + 13 + 15 + 16 + 18 + 12 98 = = 14 7 7 Logo, x = 14 litros . Ou seja, para calcular a média aritmética de uma lista de números, devemos somar os valores e dividir pela quantidade de dados. x + x + x + ... + xn x= 1 2 3 n Em suma, média aritmética para o rol é o quociente da divisão da soma dos valores da variável pelo número deles: ∑ xi x= n Dados agrupados ●Sem intervalos de classe Consideramos a distribuição relativa a 34 famílias de quatro filhos, tomando para variável o número de filhos do sexo masculino. Nº de fi meninos 0 2 1 6 2 10 3 12 4 4 Prof. Guilherme Neves www.pontodosconcursos.com.br 11 RACIOCÍNIO LÓGICO QUANTITATIVO PARA AFRFB PROFESSOR: GUILHERME NEVES Neste caso, como as frequências são números indicadores da intensidade de cada valor da variável, elas funcionam como fatores de ponderação, o que nos leva a calcular a média aritmética ponderada, dada pela fórmula: ∑ xi ⋅ fi x= n O modo mais prático de obtenção da média ponderada é abrir, na tabela, uma coluna correspondente aos produtos xi f i . xi fi xi f i 0 1 2 3 4 2 6 10 12 4 0 6 20 36 16 ∑ xi fi = 78 A primeira linha nos diz que existem 2 famílias com nenhum filho homem, totalizando 0 filhos. A segunda linha nos diz que existem 6 famílias com 1 filho homem, totalizando 6 filhos homens. A terceira linha nos diz que existem 10 famílias com 2 filhos homens, totalizando 20 filhos homens. E assim sucessivamente. No total, essas 34 famílias, possuem juntas 78 filhos homens. Temos, então: ∑ xi fi = 78 = 2,3 x= 34 n Isto é, x = 2,3 meninos Observação: Sendo x uma variável discreta, como interpretar o resultado obtido, 2 meninos e 3 décimos de menino? O valor médio 2,3 meninos sugere, neste caso, que o maior número de famílias tem 2 meninos e 2 meninas, sendo, porém, a tendência geral de uma leve superioridade numérica em relação ao número de meninos. ● Com intervalos de classe Neste caso, convencionamos que todos os valores incluídos em um determinado intervalo de classe coincidem com o seu ponto médio, e determinamos a média aritmética ponderada por meio da fórmula ∑ xi fi x= n Onde xi é o ponto médio da classe. Ora, quando temos dados distribuídos em classes perdemos informações. Não temos mais as alturas exatas de cada um dos alunos. Olhe, por exemplo, para a segunda classe da tabela seguinte. Temos 9 alunos com a altura entre 154 Prof. Guilherme Neves www.pontodosconcursos.com.br 12 RACIOCÍNIO LÓGICO QUANTITATIVO PARA AFRFB PROFESSOR: GUILHERME NEVES (inclusive) e 158 cm. Não sabemos a altura de cada um dos 9 alunos. Convencionamos que os 9 alunos possuem 156 cm (ponto médio da classe). Estaturas de 40 alunos do Ponto dos Concursos Estaturas Frequência (cm) 150 154 4 154 158 9 158 162 11 162 166 8 166 170 5 170 174 3 Total 40 Vamos, inicialmente, abrir uma coluna para os pontos médios e outra para os produtos xi f i . Estaturas (cm) 150 154 154 158 158 162 162 166 166 170 170 174 Total fi xi xi f i 4 9 11 8 5 3 40 152 156 160 164 168 172 608 1404 1760 1312 840 516 ∑ xi fi = 6440 Neste caso, x= ∑x f i i n = 6440 = 161 cm 40 Vamos agora conhecer algumas propriedades importantíssimas sobre média aritmética para que possamos garantir alguma eventual questão teórica sobre este assunto e aproveitar para aprendermos um método mais fácil para calcular média aritmética em distribuições de frequências. Propriedades da média aritmética i) A média aritmética sempre existe e é única. ii) Somando-se (ou subtraindo-se) uma constante c de todos os valores de uma variável, a média do conjunto fica aumentada (ou diminuída) dessa constante. iii) Multiplicando-se (ou dividindo-se) todos os valores de uma variável por uma constante c , a média do conjunto fica multiplicada (ou dividida) por essa constante. iv) A soma algébrica dos desvios tomados em relação à média é nula. v) A soma dos quadrados dos desvios tomados em relação à média aritmética é um valor mínimo. Prof. Guilherme Neves www.pontodosconcursos.com.br 13 RACIOCÍNIO LÓGICO QUANTITATIVO PARA AFRFB PROFESSOR: GUILHERME NEVES Vamos verificar essas propriedades através de exemplos. Consideremos a sequência de dados (2,4,6,8,10,10,12,12), calculemos sua média e verifiquemos as propriedades acima: 2 + 4 + 6 + 8 + 10 + 10 + 12 + 12 8 ∴x = 8 Consideremos uma constante c=2. Adicionando essa constante a todos os valores da sequência acima, temos a sequência (4,6,8,10,12,12,14,14). E a nova média será: 4 + 6 + 8 + 10 + 12 + 12 + 14 + 14 x' = 8 ∴ x ' = 10 Observe que x ' = x + 2 . Multipliquemos agora a constante c=2 e obtemos a sequência (4,8,12,16,20,20,24,24) cuja média é: x= x '' = 4 + 8 + 12 + 16 + 20 + 20 + 24 + 24 8 ∴ x '' = 16 Observe que x '' = 2 ⋅ x . Ainda trabalhando na sequência (2,4,6,8,10,10,12,12). Sabemos que a média aritmética desse conjunto de dados é x = 8 . Denominamos desvio em relação à média a diferença entre cada elemento de um conjunto de valores e a média aritmética. Para o exemplo dado, temos: d1 = x1 − x = −6 d5 = x5 − x = 2 d 2 = x2 − x = −4 d 6 = x6 − x = 2 d3 = x3 − x = −2 d7 = x7 − x = 4 d 4 = x4 − x = 0 d8 = x8 − x = 4 Facilmente verificamos que a soma dos desvios em relação à média é igual a zero. De fato, ∑ di = − 6 − 4 − 2 + 0 + 2 + 2 + 4 = 0 Finalmente, verifiquemos a 5ª propriedade. Calculemos a soma dos quadrados dos desvios em relação à média aritmética: ∑ di2 =(−6)2 + (−4)2 + (−2)2 + 02 + 22 + 22 + 42 + 42 ∑d 2 i =96 A propriedade nos diz que, para este conjunto A, o valor 96 é um valor mínimo. Isso porque, se construirmos um conjunto dos desvios d i ' formado pela diferença entre os elementos xi do conjunto e uma constante que não seja a média, ou seja, um conjunto dos desvios em torno de um valor qualquer Prof. Guilherme Neves www.pontodosconcursos.com.br 14 RACIOCÍNIO LÓGICO QUANTITATIVO PARA AFRFB PROFESSOR: GUILHERME NEVES diferente da média e, feito isso, acharmos o conjunto (di ') 2 e em seguida calcularmos o seu somatório ∑ (d ') 2 i , este último valor será maior do que 96. Por exemplo, calculemos a soma dos quadrados dos desvios em relação ao número 5 (diferente da média aritmética 8). ∑ (d ') 2 i =( −3) 2 + ( −1) 2 + 12 + 32 + 52 + 52 + 7 2 + 7 2 ∑ (d ') i Assim, ∑ (d ') > ∑ (d ) 2 i 2 i 2 =168 . De posse dessas propriedades, vamos aprender um método simplificado (através de uma questão resolvida) para o cálculo da média aritmética em distribuições de frequências. Esse método só é válido nos casos em que as amplitudes das classes são constantes! Cálculo breve da Média Aritmética 03. (PETROBRAS 2008 – Administrador Júnior – CESGRANRIO) A tabela abaixo apresenta os pesos de um grupo de pessoas e suas respectivas frequências. Não há observações coincidentes com os extremos das classes. Classes (em kgf) 40 – 50 50 – 60 60 – 70 70 – 80 80 – 90 Frequências 2 5 7 8 3 O peso médio do conjunto de pessoas, em kgf, é (A) 60 (B) 65 (C) 67 (D) 70 (E) 75 Resolução I Para calcular a média aritmética de uma distribuição de frequências, convencionamos que todos os valores incluídos em um determinado intervalo de classe coincidem com o seu ponto médio. Abriremos inicialmente uma coluna para os pontos médios das classes (xi) e em seguida multiplicaremos esses valores pelas suas respectivas frequências. O ponto médio é a média aritmética dos extremos da classe. Por exemplo, o ponto médio da primeira classe é Prof. Guilherme Neves 40 + 50 90 = = 45 . 2 2 www.pontodosconcursos.com.br 15 RACIOCÍNIO LÓGICO QUANTITATIVO PARA AFRFB PROFESSOR: GUILHERME NEVES Classes (em kgf) 40 – 50 50 – 60 60 – 70 70 – 80 80 – 90 Frequências xi xi.fi 2 5 7 8 3 45 55 65 75 85 90 275 455 600 255 Basta-nos agora somar os valores da coluna xi f i e dividir pela quantidade de observações. x= ∑x f i i n = 90 + 275 + 455 + 600 + 255 1675 = = 67kgf 2+5+7 +8+3 25 Letra C Resolução II Baseado nas propriedades da média aritmética que descrevi na anteriormente, podemos agora resolver essa questão usando um artifício: calcular a média com o auxílio da variável transformada. Este método que irei descrever só poderá ser utilizado se as amplitudes de TODAS c lasses forem iguais. No nosso exemplo, as amplitudes de todas as classes são iguais a 10 kgf (50 – 40 = 60 – 50 = ... = 90 – 80 = 10). Média aritmética i) Somando-se (ou subtraindo-se) uma constante qualquer de todos os valores de uma variável, a média do conjunto fica aumentada (ou diminuída) dessa constante. ii) Multiplicando-se (ou dividindo-se) todos os valores de uma variável por uma constante qualquer, a média do conjunto fica multiplicada (ou dividida) por essa constante. A mudança de variável será feita da seguinte forma: subtrairemos c erta c onstante a todos os valores da variável. Assim, a média aritmética também será subtraída. Em seguida, dividiremos por outra c onstante todos os valores obtidos. Assim, a média aritmética será dividida por essa constante. A c onstante que iremos subtrair será qualquer um dos pontos médios. A c onstante que iremos dividir será a amplitude das c lasses. Daremos origem a uma variável Y definida por Y= X − Xi , onde Xi é o h ponto médio de uma classe qualquer e h é amplitude das classes. Prof. Guilherme Neves www.pontodosconcursos.com.br 16 RACIOCÍNIO LÓGICO QUANTITATIVO PARA AFRFB PROFESSOR: GUILHERME NEVES Daremos preferência ao ponto médio da primeira classe! Dessa forma, a variável transformada será Assim, 45 − 45 =0 10 75 − 45 Y4 = =3 10 Y1 = Y= X − 45 . 10 55 − 45 =1 10 85 − 45 Y5 = =4 10 Y2 = Y3 = 65 − 45 =2 10 Não foi coincidência!! Se fizermos essa mudança de variável (subtrair o ponto médio da primeira classe e dividir pela amplitude das classes), a variável transformada sempre assumirá os valores 0,1,2,3,4,... Construímos a seguinte tabela: yi 0 1 2 3 4 Frequências 2 5 7 8 3 Calcularemos a média aritmética da variável transformada Y. Para isso, multiplicaremos os valores obtidos pelas suas respectivas frequências: Frequências yi.fi yi 0 2 0 1 5 5 2 7 14 3 8 24 4 3 12 A média será y f ∑ y= i i n = 0 + 5 + 14 + 24 + 12 55 = = 2, 2kgf 2+5+7 +8+3 25 . Essa é a média da variável transformada Y! Se Y= X − 45 , então concluímos que X = 10 ⋅ Y + 45 . 10 Agora aplicamos as propriedades da média aritmética. A média de X será a média de Y multiplicada por 10 e adicionada 45 unidades. Se X = aY + b , então X = aY + b X = 10 ⋅ 2, 2 + 45 = 67 kgf . Letra C Prof. Guilherme Neves www.pontodosconcursos.com.br 17 RACIOCÍNIO LÓGICO QUANTITATIVO PARA AFRFB PROFESSOR: GUILHERME NEVES Deixe-me resumir o método (admitindo que escolheremos o primeiro ponto médio para a mudança de variável e que as amplitudes de todas as classes são iguais): i) Construa a coluna da variável transformada Y, constituída pelos números naturais 0,1,2,3,4,5... (Você não precisa fazer o cálculo para descobrir os valores da variável Y. Eles sempre assumirão esses valores.) ii) Multiplique os valores da variável transformada pelas respectivas frequências, some os valores e divida por n (n é o somatório das frequências). Assim, c alculamos a média da variável transformada. iii) Para calcular a média da variável original, devemos multiplicar a média aritmética encontrada pela amplitude e somar o ponto médio da primeira classe. Vamos resolver novamente a questão utilizando o dispositivo prático. Classes (em Frequências kgf) 40 – 50 2 50 – 60 5 60 – 70 7 70 – 80 8 80 – 90 3 Abrimos a coluna da variável transformada e multiplicamos pelas respectivas frequências. Classes (em kgf) 40 – 50 50 – 60 60 – 70 70 – 80 80 – 90 y= ∑y f i i n = Frequências yi yi.fi 2 5 7 8 3 0 1 2 3 4 2x0=0 5x1=5 7x2=14 8x3=24 3x4=12 0 + 5 + 14 + 24 + 12 55 = = 2, 2kgf 2+5+7 +8+3 25 Agora, multiplicamos esse valor pela amplitude dos intervalos (10) e adicionamos o ponto médio da primeira classe (45). X = 10 ⋅ 2, 2 + 45 = 67 kgf Vamos calcular novamente a média aritmética das estaturas dos 40 alunos do Ponto dos Concursos. Prof. Guilherme Neves www.pontodosconcursos.com.br 18 RACIOCÍNIO LÓGICO QUANTITATIVO PARA AFRFB PROFESSOR: GUILHERME NEVES Estaturas de 40 alunos do Ponto dos Concursos Estaturas Frequência (cm) 150 154 4 154 158 9 158 162 11 162 166 8 166 170 5 170 174 3 Total 40 Já que as amplitudes são constantes (154 – 150 = ... = 174 -170 = 4 ), podemos aplicar o dispositivo prático com o auxílio da variável transformada. Abrimos a coluna da variável transformada e multiplicamos pelas respectivas frequências. Estaturas (cm) 150 154 154 158 158 162 fi yi yi ⋅ f i 4 9 11 0 1 2 162 166 166 170 170 174 Total 8 5 3 40 3 4 5 4x0=0 9x1=9 11 x 2 = 22 8 x 3 = 24 5 x 4 = 20 3 x 5 =15 ∑ yi ⋅ fi = 90 y f ∑ y= i i n = 90 = 2, 25 40 Agora, multiplicamos esse valor pela amplitude dos intervalos (4) e adicionamos o ponto médio da primeira classe ( 150 + 154 = 152 ). 2 X = 4 ⋅ 2, 25 + 152 = 161cm . 04. (Auditor IBGE – CESGRANRIO 2010) A tabela abaixo apresenta a distribuição de frequências das idades de um grupo de crianças. Classes (em anos) 0 ˫- 2 2 ˫- 4 4 ˫- 6 6 ˫- 8 8 ˫- 10 Prof. Guilherme Neves fi 5 2 4 2 7 www.pontodosconcursos.com.br 19 RACIOCÍNIO LÓGICO QUANTITATIVO PARA AFRFB PROFESSOR: GUILHERME NEVES A média das idades dessas crianças, em anos, é (A) 5,0 (B) 5,2 (C) 5,4 (D) 5,6 (E) 5,8 Resolução Já que as amplitudes são constantes (2 – 0 = 4 – 2 = ... = 10 – 8 = 2), podemos calcular a média aritmética com o auxílio da variável transformada. i) Construa a c oluna da variável transformada Y, c onstituída pelos números naturais 0,1,2,3,4,5... ii) Multiplique os valores da variável transformada pelas respectivas frequências, some os valores e divida por n (n é o somatório das frequências). Assim, c alculamos a média da variável transformada. iii) Para calcular a média da variável original, devemos multiplicar a média aritmética encontrada pela amplitude e somar o ponto médio da primeira classe. yi fi yi ⋅ f i 0 1 2 3 4 Total 5 2 4 2 7 20 0 2 8 6 28 44 y= ∑y f i i n = 44 = 2, 2 20 Agora, multiplicamos esse valor pela amplitude dos intervalos (2) e adicionamos o ponto médio da primeira classe ( 0+2 = 1 ). 2 X = 2 ⋅ 2, 2 + 1 = 5, 4 . Letra C 05. (Estatístico – Pref. Manaus 2004 CESGRANRIO) Analise as afirmativas a seguir, a respeito da média aritmética. I - a soma dos resíduos em relação à média aritmética é sempre igual a zero; II - é em relação à média aritmética que a soma dos valores absolutos dos resíduos é mínima; Prof. Guilherme Neves www.pontodosconcursos.com.br 20 RACIOCÍNIO LÓGICO QUANTITATIVO PARA AFRFB PROFESSOR: GUILHERME NEVES III - é em relação à média aritmética que a soma dos quadrados dos resíduos é mínima. Está(ão) correta(s) a(s) afirmativa(s): (A) II, somente. (B) I e II somente. (C) I e III somente. (D) II e III somente. (E) I, II e III. Resolução Questão puramente teórica! Uma digna aula sobre média aritmética. Vamos analisar cada um dos itens: I. A soma dos resíduos em relação à média aritmética é sempre igual a zero. (VERDADEIRO) Já justifiquei essa propriedade com um exemplo. Ei-lo novamente. Consideremos a sequência de dados (2,4,6,8,10,10,12,12). A média aritmética é dada por x= 2 + 4 + 6 + 8 + 10 + 10 + 12 + 12 8 ∴x = 8 Sabemos que a média aritmética desse conjunto de dados é x = 8 . Denominamos desvio ou resíduo em relação à média a diferença entre cada elemento de um conjunto de valores e a média aritmética. Para o exemplo dado, temos: d1 = x1 − x = −6 d 5 = x5 − x = 2 d 2 = x2 − x = −4 d 6 = x6 − x = 2 d 3 = x3 − x = −2 d 7 = x7 − x = 4 d 4 = x4 − x = 0 d8 = x8 − x = 4 Facilmente verificamos que a soma dos desvios em relação à média é igual a zero. De fato, ∑d i =−6−4−2+0+2+2+4 = 0. Obviamente essa não foi uma demonstração matemática. Apenas ilustrei a propriedade através de um exemplo. De fato, qualquer que seja a distribuição de dados, a soma dos desvios em relação à média sempre é igual a zero! II - é em relação à média aritmética que a soma dos valores absolutos dos resíduos é mínima. (FALSO) A proposição é falsa, pois é em relação à mediana (estudaremos ainda nesta aula) que a soma dos valores absolutos dos resíduos é mínima. III - é em relação à média aritmética que a soma dos quadrados dos resíduos é mínima. (VERDADEIRO) Prof. Guilherme Neves www.pontodosconcursos.com.br 21 RACIOCÍNIO LÓGICO QUANTITATIVO PARA AFRFB PROFESSOR: GUILHERME NEVES Voltemos ao nosso exemplo: a sequência (2,4,6,8,10,10,12,12). Os desvios em relação à media já foram calculados. Para calcular a soma dos quadrados, devemos elevar cada resíduo ao quadrado e depois somar. ∑d 2 i =(−6) 2 + (−4)2 + (−2) 2 + 02 + 22 + 22 + 42 + 42 ∑d 2 i =96 A propriedade nos diz que, para este conjunto A, o valor 96 é um valor mínimo. Isso porque, se construirmos um conjunto dos desvios d i ' formado pela diferença entre os elementos xi do conjunto e uma constante que não seja a média, ou seja, um conjunto dos desvios em torno de um valor qualquer diferente da média e, feito isso, acharmos o conjunto (di ') 2 e em seguida calcularmos o seu somatório ∑ (d ') i 2 , este último valor será maior do que 96. Por exemplo, calculemos a soma dos quadrados dos desvios em relação ao número 5 (diferente da média aritmética 8). ∑ (d ') i 2 =( −3) 2 + (−1)2 + 12 + 32 + 52 + 52 + 7 2 + 7 2 ∑ (d ') 2 i Assim, ∑ (d ') > ∑ (d ) 2 i i 2 =168 . Letra C 06. (MPE-RO CESGRANRIO 2005) A tabela apresenta uma distribuição de frequência dos salários dos 200 empregados de certa empresa. Salário (R$) 260 – 520 520 – 1040 1040 – 1560 1560 - 2600 Frequência 50 100 30 20 O salário médio, aproximadamente, vale: (A) R$ 600,00 (B) R$ 780,00 (C) R$ 890,50 (D) R$ 1 040,00 (E) R$ 1430,00 Nessa questão as amplitudes não são constantes!! Portanto, não poderemos calcular a média aritmética com o auxílio da variável transformada. Para calcular a média aritmética de uma distribuição de frequências, convencionamos que todos os valores incluídos em um determinado intervalo de classe coincidem com o seu ponto médio. Prof. Guilherme Neves www.pontodosconcursos.com.br 22 RACIOCÍNIO LÓGICO QUANTITATIVO PARA AFRFB PROFESSOR: GUILHERME NEVES Abriremos inicialmente uma coluna para os pontos médios das classes (xi) e em seguida multiplicaremos esses valores pelas suas respectivas frequências. Lembre-se que para calcular o ponto médio das classes, basta calcular a média aritmética dos extremos das classes, por exemplo, o primeiro ponto médio é 260 + 520 = 390 . 2 Salário (R$) 260 – 520 520 – 1040 1040 – 1560 1560 - 2600 x= ∑x f i i n = xi 390 780 1300 2080 fi 50 100 30 20 xi.fi 19.500 78.000 39.000 41.600 19.500 + 78.000 + 39.000 + 41.600 178.100 = = 890,50 200 200 Letra C Mediana (Md) A mediana é outra medida de posição definida como número que se encontra no centro de uma série de números, estando estes dispostos segundo uma ordem. Em outras palavras, a mediana de um conjunto de valores, ordenados segundo uma ordem de grandeza, é o valor situado de tal forma no conjunto que o separa em dois subconjuntos de mesmo número de elementos. Dados não-agrupados Dada uma série de valores, como, por exemplo: 5,10,13,12,7,8,4,3,9. De acordo com a definição de mediana, o primeiro passo a ser dado é o da ordenação (colocar os dados brutos em rol) dos valores. 3,4,5,7,8,9,10,12,13. Em seguida, tomamos aquele valor central que apresenta o mesmo número de elementos à direita e à esquerda. Em nosso exemplo, esse valor é o número 8, já que, nessa série, há 4 elementos acima dele e quatro abaixo. Temos então, Md=8. Se, porém a série dada tiver um número par de termos, a mediana será, por definição, qualquer dos números compreendidos entre os dois valores centrais da série. Convencionou-se utilizar o ponto médio. Prof. Guilherme Neves www.pontodosconcursos.com.br 23 RACIOCÍNIO LÓGICO QUANTITATIVO PARA AFRFB PROFESSOR: GUILHERME NEVES Assim, a série de valores 2,6,7,10,12,13,18,21 tem para mediana a média aritmética entre 10 e 12. Logo, 10 + 12 Md = = 11 2 ∴ Md = 11 Verificamos que, estando ordenados os valores de uma série e sendo n o número de elementos da série, o valor mediano será: n +1 - o termo de ordem , se n for ímpar. 2 n n - a média aritmética dos termos de ordem e + 1 , se n for par. 2 2 Observações: i) O valor da mediana pode coincidir ou não com um elemento da série. Quando o número de elementos da série é ímpar, há coincidência. O mesmo não acontece, porém, quando esse número é par. ii) A mediana depende da posição e não dos valores dos elementos na série ordenada. Essa é uma das diferenças marcantes entre a mediana e a média (que se deixa influenciar, e muito, pelos valores extremos). iii) A mediana é também designada por valor mediano. Dados Agrupados Sem intervalos de classe Neste caso, é o bastante identificar a frequência acumulada imediatamente superior à metade da soma das freqüências. A mediana será aquele valor da variável que corresponde a tal frequência acumulada. Xi fac fi 2 2 2 4 6 8 6 10 18 8 12 30 10 9 39 Verificamos facilmente que o número de elementos da distribuição é ímpar. Desta forma, temos apenas uma posição central. 39 + 1 Posição central: = 20 2 Temos então que a mediana será o termo da 20ª posição. Através da frequência acumulada temos que Md=8. Xi 2 4 6 8 10 Prof. Guilherme Neves fi 2 6 10 12 10 fac 2 8 18 30 40 www.pontodosconcursos.com.br 24 RACIOCÍNIO LÓGICO QUANTITATIVO PARA AFRFB PROFESSOR: GUILHERME NEVES Neste segundo exemplo, o número de elementos da distribuição é par, e, como 40 vimos, teremos duas posições centrais: =20 e 20 + 1 = 21 2 Novamente, através da frequência acumulada verificamos que as duas posições centrais são iguais a 8. 8+8 Assim, Md = =8. 2 E como último exemplo: Xi fi fac 2 2 2 4 6 8 6 10 18 8 12 30 10 6 36 Como o número de elementos é par, teremos duas posições centrais. 36 =18 e 18 + 1 = 19 . 2 O termo de posição 18 é igual a 6 e o termo de posição 19 é igual a 8. Temos então que a mediana será Md = 6+8 =7. 2 E quanto ao cálculo da mediana em distribuições de frequências? Vejamos através das próximas questões resolvidas. 07. (PETROBRAS 2008 – Administrador Júnior – CESGRANRIO) A tabela abaixo apresenta os pesos de um grupo de pessoas e suas respectivas frequências. Não há observações coincidentes com os extremos das classes. Classes (em kgf) 40 – 50 50 – 60 60 – 70 70 – 80 80 – 90 Frequências 2 5 7 8 3 O valor aproximado, em kgf, do peso mediano do conjunto de pessoas é (A) 67 (B) 68 (C) 69 (D) 70 (E) 71 Prof. Guilherme Neves www.pontodosconcursos.com.br 25 RACIOCÍNIO LÓGICO QUANTITATIVO PARA AFRFB PROFESSOR: GUILHERME NEVES Resolução A mediana é outra medida de posição definida como número que se encontra no centro de uma série de números, estando estes dispostos segundo uma ordem. Em outras palavras, a mediana de um conjunto de valores, ordenados segundo uma ordem de grandeza, é o valor situado de tal forma no conjunto que o separa em dois subconjuntos de mesmo número de elementos. No cálculo da mediana em uma distribuição de frequência não teremos a preocupação de determinarmos se o número de elementos é par ou ímpar. Os passos básicos para determinar a mediana de uma distribuição serão: i) Descobrir a classe mediana. ii) Aplicar a fórmula da mediana para distribuição de frequências. n . Em Para determinarmos a classe mediana, deveremos calcular o valor 2 seguida comparamos esse valor com os valores da frequência absoluta acumulada crescente. Procuraremos a classe cuja frequência acumulada seja n maior ou igual ao valor de . 2 n 25 No nosso caso, n=2+5+7+8+3=25. Assim, = = 12,5 . Devemos construir a 2 2 coluna de frequência absoluta acumulada crescente. E como se constrói essa coluna? Para a primeira classe devemos simplesmente repetir a frequência absoluta. Para as outras, devemos somar a frequência absoluta da classe com a frequência acumulada anterior. Deixe-me mostrar no exemplo: Ou seja, Classes (em kgf) 40 – 50 50 – 60 60 – 70 70 – 80 80 – 90 Frequências Fac 2 5 7 8 3 2 2+5=7 7+7=14 8+14=22 3+22=25 Classes (em kgf) 40 – 50 50 – 60 60 – 70 70 – 80 80 – 90 Frequências Fac 2 5 7 8 3 2 7 14 22 25 Prof. Guilherme Neves www.pontodosconcursos.com.br 26 RACIOCÍNIO LÓGICO QUANTITATIVO PARA AFRFB PROFESSOR: GUILHERME NEVES Para determinar a classe mediana, devemos comparar cada uma das frequências acumuladas com o valor 12,5. Quando encontrarmos o primeiro valor que for maior ou igual a 12,5 teremos determinado a classe mediana. Classes (em kgf) 40 – 50 50 – 60 60 – 70 70 – 80 80 – 90 Frequências Fac 2 5 7 8 3 2 7 14 22 25 Classe mediana (14 > 12,5) Estamos prontos para aplicarmos a fórmula da mediana. n 2 − facANT Md = linf + ⋅h f i Precisaremos dos seguintes valores: Limite inferior da classe mediana ( linf = 60 ). n = 12, 5 2 Frequência acumulada da classe anterior à classe mediana ( fac ANT = 7 ). Frequência absoluta da classe mediana ( f i = 7 ) Amplitude da classe mediana ( h = 70 − 60 = 10 ) A mediana é dada por: n 2 − fac ANT Md = linf + fi 12,5 − 7 ⋅ h = 60 + ⋅10 ≅ 67,85 ≅ 68cm 7 Letra B 08. (Auditor IBGE – CESGRANRIO 2010) A tabela abaixo apresenta a distribuição de frequências das idades de um grupo de crianças. Classes (em anos) 0 ˫- 2 2 ˫- 4 4 ˫- 6 6 ˫- 8 8 ˫- 10 fi 5 2 4 2 7 A mediana da distribuição de frequências apresentada é Prof. Guilherme Neves www.pontodosconcursos.com.br 27 RACIOCÍNIO LÓGICO QUANTITATIVO PARA AFRFB PROFESSOR: GUILHERME NEVES (A) 5,5 (B) 5,6 (C) 5,7 (D) 5,8 (E) 5,9 Resolução Os passos básicos para determinar a mediana de uma distribuição serão: i) Descobrir a classe mediana. ii) Aplicar a fórmula da mediana para distribuição de frequências. n . Em Para determinarmos a classe mediana, deveremos calcular o valor 2 seguida comparamos esse valor com os valores da frequência absoluta acumulada crescente. Procuraremos a classe cuja frequência acumulada seja n 20 n maior ou igual ao valor de . No nosso caso, n = 20. Logo, = = 10 . 2 2 2 Devemos construir a coluna de frequência absoluta acumulada crescente. Classes (em anos) 0 ˫- 2 2 ˫- 4 4 ˫- 6 6 ˫- 8 8 ˫- 10 fi 5 2 4 2 7 Fac 5 7 11 13 20 Vamos procurar a classe mediana. Basta olhar para a coluna de frequências n = 10 . A primeira frequência acumulada acumuladas e comparar com o valor 2 que for maior ou igual a 10 caracterizará a classe mediana. Verificamos facilmente que 11>10. Classes (em anos) 0 ˫- 2 2 ˫- 4 4 ˫- 6 6 ˫- 8 8 ˫- 10 fi 5 2 4 2 7 Fac 5 7 11 13 20 Classe mediana (11 > 10) Coloquei em vermelho os valores que utilizaremos na fórmula da mediana. Precisaremos dos seguintes valores: Limite inferior da classe mediana ( linf = 4 ). n = 10 2 Frequência acumulada da classe anterior à classe mediana ( fac ANT = 7 ). Frequência absoluta da classe mediana ( f i = 4 ) Amplitude da classe mediana ( h = 6 − 4 = 2 ) Prof. Guilherme Neves www.pontodosconcursos.com.br 28 RACIOCÍNIO LÓGICO QUANTITATIVO PARA AFRFB PROFESSOR: GUILHERME NEVES A mediana é dada por: n 2 − fac ANT Md = linf + fi 10 − 7 ⋅h = 4+ ⋅ 2 = 5,5 4 Letra A (MPE-RO CESGRANRIO 2005) O enunciado a seguir refere-se às questões de números 09 e 10. A tabela apresenta uma distribuição de frequência dos salários dos 200 empregados de certa empresa. Salário (R$) Frequência 260 – 520 50 520 – 1040 100 1040 – 1560 30 1560 - 2600 20 09. O salário mediano vale, aproximadamente: (A) R$ 600,00 (B) R$ 780,00 (C) R$ 890,50 (D) R$ 1 040,00 (E) R$ 1 430,00 Resolução Os passos básicos para determinar a mediana de uma distribuição serão: i) Descobrir a classe mediana. ii) Aplicar a fórmula da mediana para distribuição de frequências. Para descobrir a classe mediana devemos calcular n . Como n = 200, temos 2 n = 100 . E o que fazer agora? Construir a coluna das frequências 2 acumuladas. que Salário (R$) 260 – 520 520 – 1040 1040 – 1560 1560 - 2600 Frequência 50 100 30 20 fac 50 150 180 200 Classe mediana (150 > 100) Novamente em vermelho os valores que utilizaremos na fórmula da mediana. Precisaremos dos seguintes valores: Limite inferior da classe mediana ( linf = 520 ). Prof. Guilherme Neves www.pontodosconcursos.com.br 29 RACIOCÍNIO LÓGICO QUANTITATIVO PARA AFRFB PROFESSOR: GUILHERME NEVES n = 100 2 Frequência acumulada da classe anterior à classe mediana ( fac ANT = 50 ). Frequência absoluta da classe mediana ( f i = 100 ) Amplitude da classe mediana ( h = 1040 − 520 = 520 ). Observe que nessa questão as amplitudes não são constantes. Para o cálculo da mediana deveremos utilizar a amplitude da classe mediana!! Cuidado... A mediana é dada por: n 2 − fac ANT Md = linf + fi 100 − 50 ⋅ h = 520 + ⋅ 520 = 780 100 Letra B 10. O terceiro quartil, aproximadamente, vale: (A) R$ 600,00 (B) R$ 780,00 (C) R$ 890,50 (D) R$ 1 040,00 (E) R$ 1 430,00 Resolução O método para calcular o terceiro quartil (e as outras medidas separatrizes como decis, percentis e os outros quartis) é muito parecido com o da mediana. Em tempo: os decis dividem a distribuição em 10 partes de mesma frequência. Os percentis dividem a distribuição em 100 partes de mesma frequência. Os quartis dividem a distribuição em 4 partes de mesma frequência. A mediana divide a distribuição em 2 partes de mesma frequência. n 3n calcularemos . O denominador 4 2 é igual a 4 porque trata-se de um quartil (dividimos a distribuição em quatros partes). O numerador é 3n porque estamos calculando o terceiro quartil. Então, a única coisa que vai mudar na fórmula, é que ao invés de utilizarmos n 3n utilizaremos . E para calcular a classe do terceiro quartil deveremos 4 2 3n procurar a frequência acumulada que é maior ou igual a . A fórmula do 4 terceiro quartil ficará 3n 4 − fac ANT Q3 = linf + ⋅h f i Diferença: ao invés de calcularmos o valor Prof. Guilherme Neves www.pontodosconcursos.com.br 30 RACIOCÍNIO LÓGICO QUANTITATIVO PARA AFRFB PROFESSOR: GUILHERME NEVES Já que n = 200, então 3n 3 ⋅ 200 = = 150 . 4 4 E o que fazer agora? Construir a coluna das frequências acumuladas. Salário (R$) 260 – 520 520 – 1040 1040 – 1560 1560 - 2600 Frequência 50 100 30 20 fac 50 150 180 200 Classe do terceiro quartil (150=150) Novamente em vermelho os valores que utilizaremos na fórmula da mediana. Precisaremos dos seguintes valores: Limite inferior da classe mediana ( linf = 520 ). 3n = 150 4 Frequência acumulada da classe anterior à classe do terceiro quartil ( fac ANT = 50 ). Frequência absoluta da classe do terceiro quartil ( f i = 100 ) Amplitude da classe do terceiro quartil ( h = 1040 − 520 = 520 ). Observe que nessa questão as amplitudes não são constantes. Para o cálculo do terceiro quartil deveremos utilizar a amplitude da classe do terceiro quartil!! Cuidado... O terceiro quartil é dado por: 3n 4 − fac ANT Q3 = linf + fi 150 − 50 ⋅ = + 520 h 100 ⋅ 520 = 1040 Letra D Moda Foi Karl Pearson quem introduziu em Estatística pela primeira vez,no século XIX, o conceito de moda, talvez baseado no próprio significado da palavra. A moda é definida como sendo aquele valor ou valores que ocorrem com maior frequência em um rol. Baseado neste contexto, um conjunto de valores pode apresentar mais de uma moda. Neste caso dizemos ser plurimodal, caso contrário, será unimodal, ou ainda, amodal (quando todos os valores das variáveis em estudo apresentarem uma mesma frequência). i) Para dados não agrupados em classe Para a identificação da moda em um conjunto ordenado de valores não agrupados em classe, basta verificar, no conjunto, aquele valore que aparece com maior frequência. Prof. Guilherme Neves www.pontodosconcursos.com.br 31 RACIOCÍNIO LÓGICO QUANTITATIVO PARA AFRFB PROFESSOR: GUILHERME NEVES Exemplos: X1={1,2,3,4,5,6} (Conjunto amodal) X2={10,10,12,13,18} Mo=10 (Conjunto Unimodal) X3={100,100,200,200,300,600} Mo=100 e Mo=200 (Conjunto bimodal) ii) Para dados agrupados – não agrupados em classe Quando os dados estiverem dispostos em uma Tabela de Frequência, não agrupados em classe, a localização da moda é imediata, bastando para isso, verificar na tabela, qual o valor predominante. Estatura Freq. (m) 1,60 3 8 1,62 1,64 12 1,70 20 1,73 10 7 1,80 1,83 3 1,88 1 Na tabela o valor modal é 1,70m, isto porque é o resultado que apresenta o maior número de alunos (20). iii) Dados agrupados em classe Tratando-se de dados agrupados em classe, a moda não é percebida tão facilmente como nos casos anteriores. Para tal, utilizamos diversos processos na sua obtenção. Mas qualquer que seja o processo adotado, o primeiro passo é identificar a classe que contém a maior frequência. A esta classe denominamos classe-modal. Aprenderemos a determinar a moda da distribuição de frequências pelo método da moda bruta, pelo Método de Czuber e pelo Método de King. Se a questão não especificar qual das fórmulas a ser empregada, pedindo apenas que se calcule a moda, usaremos a fórmula de Czuber. Consequentemente, só empregaremos a fórmula de King quando assim for solicitado expressamente. Moda Bruta De todos os processos, este é o mais elementar, bastando, para isso, tomar o ponto médio da classe modal (aquela que contém a maior frequência). Na próxima tabela, verificamos, de imediato, que a distribuição possui apenas uma Moda e, que ela está contida na classe 4 ˫ 6 chamada Classe Modal. Logo, o ponto médio da classe modal o caso, Nota 5, é conhecida como Moda Bruta. Prof. Guilherme Neves www.pontodosconcursos.com.br 32 RACIOCÍNIO LÓGICO QUANTITATIVO PARA AFRFB PROFESSOR: GUILHERME NEVES Notas Classe 0˫2 2˫4 4˫6 6˫8 8 ˫10 fi ∑ 27 16 34 17 16 fi = 110 Processo de Czuber O processo utilizado por Czuber leva em consideração as frequências anterior e posterior à Classe Modal. Moc = Moda (Processos de Czuber) ∆1 = f máx − f ant ∆ 2 = f m áx − f post h = amplitude do intervalo de classe li = Limite inferior da classe modal Assim, a moda de Czuber é dada por ∆1 MoC = li + ⋅h ∆1 + ∆ 2 Observação: A demonstração desta fórmula foi colocada por mim no site do Ponto dos Concursos no link http://www.pontodosconcursos.com.br/artigos3.asp?prof=249&art=5103&idpa g=4 No nosso exemplo, ∆1 = 34 − 16 = 18 ∆ 2 = 34 − 17 = 17 h=2 li = 4 Logo, 18 MoC = 4 + ⋅ 2 = 5, 0285 18 + 17 ∴ MoC = 5, 0285 Processo de King No processo proposto por King, é considerada a influência sobre a classe modal das freqüências das classes anterior e posterior. A inconveniência deste processo é justamente não levar em consideração a frequência da classe modal. Prof. Guilherme Neves www.pontodosconcursos.com.br 33 RACIOCÍNIO LÓGICO QUANTITATIVO PARA AFRFB PROFESSOR: GUILHERME NEVES f post MoK = li + ⋅h f ant + f post No nosso exemplo, f post = 17 f ant = 16 h=2 li = 4 Logo, 17 MoK = 4 + ⋅ 2 = 5,0303 17 + 16 ∴ MoK = 5, 0303 Propriedades da Moda Somando-se (ou subtraindo-se) uma constante c de todos os valores de uma variável, a moda do conjunto fica aumentada (ou diminuída) dessa constante. Multiplicando-se (ou dividindo-se) todos os valores de uma variável por uma constante c , a moda do conjunto fica multiplicada (ou dividida) por essa constante. 11. (AFRFB 2009 ESAF) Considere a seguinte amostra aleatória das idades em anos completos dos alunos em um curso preparatório. Com relação a essa amostra, marque a única opção correta: 29, 27, 25, 39, 29, 27, 41, 31, 25, 33, 27, 25, 25, 23, 27, 27, 32, 26, 24, 36, 32, 26, 28, 24, 28, 27, 24, 26, 30, 26, 35, 26, 28, 34, 29, 23, 28. a) A média e a mediana das idades são iguais a 27. b) A moda e a média das idades são iguais a 27. c) A mediana das idades é 27 e a média é 26,08. d) A média das idades é 27 e o desvio-padrão é 1,074. e) A moda e a mediana das idades são iguais a 27. Resolução Média aritmética: x= ∑x i n 1052 x= ≅ 28, 43 37 Rol: 23, 23, 24, 24, 24, 25, 25, 25, 25, 26, 26, 26, 26, 26, 27, 27, 27, 27, 27, 27, 28, 28, 28, 28, 29, 29, 29, 30, 31, 32, 32, 33, 34, 35, 36, 39, 41. 37 + 1 A mediana será o termo de ordem = 19º . Logo, a mediana é 27. 2 A moda é definida como sendo aquele valor ou valores que ocorrem com maior frequência em um rol. Prof. Guilherme Neves www.pontodosconcursos.com.br 34 RACIOCÍNIO LÓGICO QUANTITATIVO PARA AFRFB PROFESSOR: GUILHERME NEVES A moda é 27. Letra E 12. (AFRF 1998) Os dados seguintes, ordenados do menor para o maior, foram obtidos de uma amostra aleatória, de 50 preços (Xi) de ações, tomadas numa bolsa de valores internacional. A unidade monetária é o dólar americano. 4,5,5,6,6,6,6,7,7,7,7,7,7,8,8,8,8,8,8,8,8,8,9,9,9,9,9,9,10,10,10,10,10,1 0,10,10,11,11,12,12,13,13,14, 15,15,15,16,16,18,23. Assinale a opção que corresponde ao preço modal. a) 8 b) 23 c) 7 d) 10 e) 9 Resolução Questão muito fácil! Basta verificar o valor de maior frequência. Facilmente verifica-se que a moda é 8, pois ele tem a maior frequência (aparece mais vezes). Letra A 13. (AFRF/ESAF/1996) Para efeito desta questão, c onsidere osseguintes dados. DISTRIBUIÇÃO DE FREQUENCIAS DAS IDADES DOS FUNCIONÁRIOS DA EMPRESA ALFA, EM 01.01.90 Classes de Idades Pontos Médios fi (anos) (PM) 19,5˫24,5 2 22 24,5˫29,5 9 27 29,5˫34,5 23 32 34,5˫39,5 29 37 39,5˫44,5 18 42 44,5˫49,5 12 47 49,5˫54,5 7 52 Total 100 Marque a opção que representa a moda das idades dos funcionários em 1º/01/90. a) 35,97 b) 36,26 c) 36,76 d) 37,03 e) 37,31 Resolução Prof. Guilherme Neves www.pontodosconcursos.com.br 35 RACIOCÍNIO LÓGICO QUANTITATIVO PARA AFRFB PROFESSOR: GUILHERME NEVES O primeiro passo é determinar a classe modal (maior frequência). A classe modal é a quarta classe 34,5˫39,5, cuja frequência é 29. A frequência anterior à classe modal é 23, e temos que ∆1=29 – 23 = 6. A frequência posterior à classe modal é 18 e temos que ∆2=29 – 18 = 11. O limite inferior da classe modal é 34,5 e a amplitude da classe modal é 5. Assim, a moda de Czuber será Letra B ∆1 MoC = li + ⋅h ∆ + ∆ 1 2 6 MoC = 34,5 + ⋅ 5 = 36, 26 6 + 11 Medidas de dispersão ou variabilidade Discutimos diversas maneiras de obter um valor que fosse representativo para os demais em um dado conjunto. Muitas vezes apenas os cálculos ou apresentações de um valor específico para um conjunto qualquer não são suficientes para caracterizar uma distribuição ou um conjunto de valores. O grau ao qual os dados numéricos tendem a dispersar-se (afastar-se) em torno de um valor chama-se variação ou dispersão dos dados. Dispõe-se de várias medidas de dispersão. Estudaremos as mais importantes. Desvio Absoluto Médio (Dm) Aprendemos que a soma algébrica dos desvios tomados em relação à média é nula. Assim, não nos importaria “criar” uma medida de dispersão que utilize a soma algébrica dos desvios, pois essa, como sabemos, é sempre zero. Temos duas alternativas a tomar: trocar o sinal dos desvios negativos (calcular o módulo dos desvios) ou elevar os desvios negativos ao quadrado (pois todo número elevado ao quadrado não é negativo). Ao tomar a primeira posição, damos origem ao desvio absoluto médio e ao tomar a segunda posição damos origem à variância. O desvio absoluto médio também é chamado apenas de desvio médio ou desvio absoluto. Desvio médio é a média aritmética dos valores absolutos dos desvios da distribuição, em relação a uma medida de tendência central: média ou mediana. Na presente aula limitar-nos-emos apenas em relação à média aritmética. n Dm = ∑X i −X i =1 n Quando os dados se apresentarem ordenados em uma tabela de frequência com dados agrupados em classe ou dados isolados ponderados, utilizaremos a seguinte fórmula: Prof. Guilherme Neves www.pontodosconcursos.com.br 36 RACIOCÍNIO LÓGICO QUANTITATIVO PARA AFRFB PROFESSOR: GUILHERME NEVES n Dm = ∑X i − X ⋅ fi i =1 n Denominamos desvio em relação à média a diferença entre cada elemento de um conjunto de valores e a média aritmética. (2,4,6,8,10,10,12,12) A média aritmética dessa lista de números é igual a 8. Por exemplo, o desvio em relação à média do primeiro número é 2 – 8 = - 6. d1 = x1 − x = −6 d5 = x5 − x = 2 d 2 = x2 − x = −4 d 6 = x6 − x = 2 d3 = x3 − x = −2 d 7 = x7 − x = 4 d 4 = x4 − x = 0 d8 = x8 − x = 4 Para calcular o desvio absoluto médio, devemos considerar o valor absoluto (módulo) dos valores acima obtidos. d1 = 6 d5 = 2 d2 = 4 d6 = 2 d3 = 2 d7 = 4 d4 = 0 d8 = 4 Dam = ∑d i n Onde di é a diferença entre cada valor e a média aritmética. Dam = 6+4+2+0+2+2+4+4 8 Dam = 3 Vejamos um exemplo do cálculo do desvio absoluto médio em uma distribuição de frequências. O primeiro passo é calcular a média aritmética da distribuição (se possível utilizando o método simplificado). Em seguida, devemos calcular cada desvio em relação à média, tomar seus valores absolutos, multiplicar cada resultado pela frequência da classe, somar todos os valores e dividir por n. Prof. Guilherme Neves www.pontodosconcursos.com.br 37 RACIOCÍNIO LÓGICO QUANTITATIVO PARA AFRFB PROFESSOR: GUILHERME NEVES Quando os dados se apresentarem ordenados em uma tabela de frequência com dados agrupados em classe ou dados isolados ponderados, utilizaremos a seguinte fórmula: n Dam = ∑X i − X ⋅ fi i =1 n 14. (AFRF 2002.2/ESAF) O atributo do tipo contínuo X, observado como um inteiro, numa amostra de tamanho 100, obtida de uma população de 1000 indivíduos, produziu a tabela de freqüências seguinte: Classes 29,5-39,5 39,5-49,5 49,5-59,5 59,5-69,5 69,5-79,5 79,5-89,5 89,5-99,5 Frequência (f) 4 8 14 20 26 18 10 Assinale a opção que c orresponde ao desvio absoluto médio do atributo X. a) 16,0 b) 17,0 c) 16,6 d) 18,1 e) 13,0 Resolução O primeiro passo, como foi dito, é calcular a média aritmética da distribuição. Já que as amplitudes são constantes (iguais a 10), então poderemos utilizar o método breve. Lembrando que devemos abrir uma coluna para a variável transformada y, que é formada pela sequência dos números naturais. Classes (f) yi 29,5-39,5 4 0 39,5-49,5 8 1 49,5-59,5 14 2 59,5-69,5 20 3 69,5-79,5 26 4 79,5-89,5 18 5 89,5-99,5 10 6 Prof. Guilherme Neves www.pontodosconcursos.com.br 38 RACIOCÍNIO LÓGICO QUANTITATIVO PARA AFRFB PROFESSOR: GUILHERME NEVES Para calcular a média aritmética, devemos multiplicar os valores da variável transformada pelas suas respectivas frequências. Somar os valores e dividir por “n”. Classes 29,5-39,5 39,5-49,5 49,5-59,5 59,5-69,5 69,5-79,5 79,5-89,5 89,5-99,5 y= (f) 4 8 14 20 26 18 10 yi 0 1 2 3 4 5 6 yi.f 0 8 28 60 104 90 60 350 = 3,5 100 Essa é a média da variável transformada. Para calcular a média da variável original, devemos multiplicar a média aritmética encontrada pela amplitude e somar o ponto médio da primeira classe. x = y ⋅ h + x1 x = 3,5 ⋅10 + 34,5 x = 69,5 Para calcular o desvio absoluto médio, devemos calcular o módulo da diferença entre cada ponto médio e a média aritmética. Calculamos o primeiro ponto médio, que é a média aritmética entre 29,5 e 39,5. Logo, o primeiro ponto médio é igual a 34,5. Para calcular os próximos pontos médios, basta adicionar a amplitude das classes. Ou seja, o próximo ponto médio é igual a 34,5 + 10 = 44,5. Classes 29,5-39,5 39,5-49,5 49,5-59,5 59,5-69,5 69,5-79,5 79,5-89,5 89,5-99,5 Prof. Guilherme Neves (f) 4 8 14 20 26 18 10 Xi 34,5 44,5 54,5 64,5 74,5 84,5 94,5 www.pontodosconcursos.com.br 39 RACIOCÍNIO LÓGICO QUANTITATIVO PARA AFRFB PROFESSOR: GUILHERME NEVES A média aritmética é igual a 69,5. O desvio da primeira classe é 34,5 – 69,5 = - 35. O módulo desse desvio é 35. Faremos da mesma maneira o cálculo nas próximas classes. Classes 29,5-39,5 39,5-49,5 49,5-59,5 59,5-69,5 69,5-79,5 79,5-89,5 89,5-99,5 (f) 4 8 14 20 26 18 10 Xi 34,5 44,5 54,5 64,5 74,5 84,5 94,5 │Xi-X│ 35 25 15 5 5 15 25 O próximo passo é multiplicar cada desvio pela sua respectiva frequência. Classes (f) Xi │Xi-X│ │Xi-X│.f 29,5-39,5 4 34,5 35 140 39,5-49,5 8 44,5 25 200 49,5-59,5 14 54,5 15 210 59,5-69,5 20 64,5 5 100 69,5-79,5 26 74,5 5 130 79,5-89,5 18 84,5 15 270 89,5-99,5 10 94,5 25 250 Estamos prontos para calcular o desvio absoluto médio. Basta somar os valores da última coluna e dividir por n. Dam = Letra E 1300 = 13 100 Desvio padrão e Variância De todas as medidas de dispersão apresentadas até aqui, o Desvio Padrão é o mais utilizado, e cuja definição nada mais é do que a raiz quadrada da média aritmética dos quadrados dos desvios. O c onceito de desvio padrão está intimamente ligado ao estudo da variância. Essas duas medidas de dispersão apresentam uma peculiaridade: teremos que prestar atenção se questão será c om amostras ou com a população. Suponhamos que desejamos conhecer alguma coisa sobre determinada população – por exemplo, a média salarial, o desvio padrão das alturas, o Prof. Guilherme Neves www.pontodosconcursos.com.br 40 RACIOCÍNIO LÓGICO QUANTITATIVO PARA AFRFB PROFESSOR: GUILHERME NEVES percentual de intenções de voto para um determinado candidato - e essa população é composta de milhares (talvez milhões) de elementos, de tal modo que seria muito difícil pesquisar o valor correto, pois seria inviável pesquisar todos os elementos. Nesse caso, temo de recorrer aos valores encontrados em uma amostra!! Seja qual for o caso, o fato é que, em muitas situações, precisamos obter as informações de uma amostra. O valor da população, chamado de parâmetro populacional, é desconhecido. O que é possível de se obter é um valor da amostra, que supostamente nos dá uma ideia do valor correto (populacional) do parâmetro. Esse valor amostral é chamado de estimador do parâmetro populacional. Por exemplo, queremos saber a média de idade dos estudantes do Ponto dos Concursos. Como há muitos estudantes, recorremos a uma amostra de, digamos 150 alunos. A média da amostra encontrada foi de 24 anos. Essa é a nossa estimativa! Mas a média de idade dos estudantes do Ponto dos Concursos é realmente 24 anos? Não dá para saber, a não ser que todos os estudantes do Ponto fossem pesquisados. Portanto, são coisas diferentes o parâmetro populacional e o estimador e, portanto, devem ser representados de maneiras diferentes, por exemplo: X = média amostral (estimador ) µ = média populacional (parâmetro populacional ) E não é só uma diferença de valores!! O parâmetro populacional é, em geral, um valor fixo. O estimador depende da amostra. A principal propriedade desejável de um estimador é a de que esse estimador, na média, acerte o valor correto. Ou seja, se pudéssemos repetir a experiência infinitas vezes, o valor médio das estimativas encontradas em cada experimento seria o valor correto do parâmetro populacional. A esperança (trataremos a esperança c om detalhes neste c urso) do estimador deve ser o parâmetro populacional. Se isso ocorre, dizemos que o estimador é não viesado (não viciado). Se, entretanto, o estimador erra, em média, dizemos que ele é viesado (viciado). Pois bem, o desvio padrão é a raiz quadrada da média aritmética dos quadrados dos desvios. No caso do rol (população), aplicaremos a seguinte fórmula: '=( Prof. Guilherme Neves ∑)* − *,- www.pontodosconcursos.com.br 41 RACIOCÍNIO LÓGICO QUANTITATIVO PARA AFRFB PROFESSOR: GUILHERME NEVES Quando os dados se apresentarem ordenados em uma tabela de frequência com dados agrupados em classe ou dados isolados ponderados, utilizaremos a seguinte fórmula: ∑)* − *,- ∙ '=( São fórmulas muito parecidas com a do desvio absoluto médio. A diferença é que no lugar de tomar os valores absolutos dos desvios, devemos elevar os desvios ao quadrado. E do resultado final, extrair a raiz quadrada. E se estivermos trabalhando com amostras. A única diferença é que o denominador da fórmula não será “n”! Será “n-1”!! ∑)01 20,- =/ 52 3 ∙4 1 é um estimador não viciado (não viesado) da variância. Utilizaremos a seguinte notação: se estivermos trabalhando com população, a letra indicadora do desvio padrão será a letra grega sigma σ. O desvio padrão amostral será designado pela letra latina s. Lembrando mais uma vez: se estivermos trabalhando com amostras, na fórmula do desvio padrão (e também da variância que veremos adiante) o denominador deverá ser trocado por n-1. E quanto às fórmulas da variância?? Se você sabe como calcular o desvio padrão, automaticamente já sabe calcular a variância. Basta não extrair a raiz quadrada. Variância populacional ∑)* − *,- ∙ ' = Variância Amostral ∑)* −−1*,- ∙ = Em suma, a variância é o quadrado do desvio padrão e o desvio padrão é a raiz quadrada da variância!!! Vejamos alguns exemplos. 15. (Auditor IBGE - CESGRANRIO 2010) No último mês, Alípio fez apenas 8 ligações de seu telefone celular cujas durações, em minutos, estão apresentadas no rol abaixo. 5 2 11 8 3 8 7 4 O valor aproximado do desvio padrão desse conjunto de tempos, em minutos, é (A) 3,1 (B) 2,8 (C) 2,5 Prof. Guilherme Neves www.pontodosconcursos.com.br 42 RACIOCÍNIO LÓGICO QUANTITATIVO PARA AFRFB PROFESSOR: GUILHERME NEVES (D) 2,2 (E) 2,0 Resolução Nesse caso, não estamos trabalhando com uma amostra. Pois Alípio fez apenas 8 ligações de seu telefone celular. Então, na fórmula do desvio-padrão o denominador será o próprio n (o número de elementos da população). Estamos trabalhando com um parâmetro populacional. σ = 2 ∑ ( x − x) 2 i n Devemos, portanto, calcular a média aritmética dos elementos da população e finalmente aplicarmos a fórmula do desvio-padrão populacional. µ= 5 + 2 + 11 + 8 + 3 + 8 + 7 + 4 =6 8 xi xi − x ( x − x) 5 2 5 – 6 = -1 2 – 6 = -4 11 8 3 8 7 4 11 – 6 = 5 8–6=2 3 – 6 = -3 8–6=2 7–6=1 4 – 6 = -2 (-1)2 = 1 (-4)2 = 16 2 5 = 25 22 = 4 (-3)2 = 9 22 = 4 12 = 1 (-2)2 = 4 E o desvio-padrão será σ2 = 2 i 1 + 16 + 25 + 4 + 9 + 4 + 1 + 4 64 = = 8. 8 8 Podemos calcular o valor aproximado da 8 utilizando o método de NewtonRaphson. Para aprender com detalhes o método de Newton-Raphson basta acessar o link que disponibilizei no site do Ponto: http://www.pontodosconcursos.com.br/artigos3.asp?prof=249&art=4951&idpa g=4. Em resumo, o método de Newton-Raphson diz que toda raiz quadrada pode ser aproximada por uma fração em que o numerador é formado por uma soma de dois números: o próprio número e o quadrado perfeito mais próximo. Já no denominador, você vai multiplicar a raiz quadrada do quadrado perfeito por 2. No nosso caso, o quadrado perfeito mais próximo de 8 é 9 (32). Então o numerador será 8+9. E no denominador sempre devemos multiplicar a raiz quadrada do quadrado perfeito por 2. Prof. Guilherme Neves www.pontodosconcursos.com.br 43 RACIOCÍNIO LÓGICO QUANTITATIVO PARA AFRFB PROFESSOR: GUILHERME NEVES σ2 = 8 ≅ 8 + 9 17 = ≅ 2,83 2⋅3 6 Letra B 16. (PETROBRAS 2008 – Administrador Júnior – CESGRANRIO) Do total de funcionários de uma empresa, foi retirada uma amostra de seis indivíduos. A tabela abaixo apresenta o tempo trabalhado na empresa, em anos completos, por cada um deles. X1 X2 X3 X4 X5 X6 3 7 2 2 3 1 A variância dessa amostra é (A) 3,7 (B) 4,0 (C) 4,4 (D) 5,0 (E) 5,5 Resolução s 2 ∑ ( x − x) = i n −1 2 é um estimador não viciado (não viesado) da variância. Lembre-se que quando trabalhamos com amostras (desvio padrão e variância) o denominador das fórmulas serão sempre n-1. Voltemos agora à nossa questão. X1 X2 X3 X4 X5 X6 3 7 2 2 3 1 Queremos calcular a variância dessa amostra. Primeiramente calculemos a média dessa amostra. x= 3 + 7 + 2 + 2 + 3 +1 =3 6 Calculemos agora os quadrados dos desvios dos valores da amostra em relação à média. 2 xi xi − x xi − x ( 3 7 2 2 3 1 3-3=0 7-3=4 2 - 3 = -1 2 - 3 = -1 3-3=0 1 – 3 = -2 ) 02 = 0 42 = 16 (-1)2 = 1 (-1)2 = 1 02 = 0 (-2)2 = 4 Assim, a variância amostral é dada por: Prof. Guilherme Neves www.pontodosconcursos.com.br 44 RACIOCÍNIO LÓGICO QUANTITATIVO PARA AFRFB PROFESSOR: GUILHERME NEVES s 2 ∑ ( x − x) = 2 i n −1 = 0 + 16 + 1 + 1 + 0 + 4 22 = = 4, 4 6 −1 5 Letra C Está lembrado da nossa pesquisa com uma amostra de 40 alunos do Ponto, em que pesquisamos a estatura deles? Vamos calcular o desvio padrão e a variância dessa amostra. Estaturas de 40 alunos do Ponto Estaturas fi xi (cm) 150 - 154 4 152 154 - 158 9 156 158 - 162 11 160 162 - 166 8 164 166 - 170 5 168 170 - 174 3 172 Total 40 Já tivemos a oportunidade de calcular a média aritmética x = 161 cm . Para calcular o desvio padrão e a variância, devemos calcular o quadrado dos desvios em relação a média. Por exemplo: o primeiro ponto médio é igual a 152, portanto seu desvio é igual a 152 – 161 = 9. Devemos calcular (-9)2 = 81. Em seguida devemos multiplicar esses valores pelas suas respectivas frequências. Obtemos a seguinte tabela: (x − X ) (x − X ) 2 fi xi 4 9 11 8 5 3 40 152 156 160 164 168 172 i i 81 25 1 9 49 121 2 ⋅ fi 324 225 11 72 245 363 ∑ =1240 Lembrando que no cálculo dessas duas medidas de dispersão, ao trabalhar com amostras, devemos colocar n-1 no denominador. ∑( X n S = 2 i =1 i −X ) 2 ⋅ fi 1240 = 31, 79 40 − 1 n −1 S = 31, 79 = 5, 638 = (Tente calcular um valor aproximado do desvio padrão utilizando o método de Newton-Raphson). Prof. Guilherme Neves www.pontodosconcursos.com.br 45 RACIOCÍNIO LÓGICO QUANTITATIVO PARA AFRFB PROFESSOR: GUILHERME NEVES Esse exemplo foi um pouco trabalhoso!! Por isso, aprenderemos algumas propriedades do desvio padrão e da variância e um método simplificado para o cálculo dessas medidas. O desvio padrão goza de algumas propriedades parecidas com as da média aritmética. Propriedades da Variância i) Somando-se ou subtraindo-se uma c onstante qualquer a c ada elemento de um conjunto de valores, a variância não se altera. ii) Se multiplicarmos ou dividirmos uma c onstante qualquer a c ada elemento de um conjunto de valores, a variância ficará multiplicada ou dividida pelo quadrado dessa constante. Por exemplo, se os valores triplicam, a variância é multiplicada por 9 (32). Se os valores são quadruplicados, a variância é multiplicada por 16 (42). Em relação à adição e à subtração, tem-se que a variância não é influenciada. Isso porque a variância é uma medida de dispersão – se somarmos o mesmo valor a todos os valores de X, eles continuarão dispersos, espalhados da mesma forma, apenas mudarão de posição. É válida, portanto, a seguinte relação: var(aX + b) = a 2 ⋅ var( X ) Temos propriedades muito parecidas o desvio padrão. Propriedades do Desvio-padrão i) Somando-se ou subtraindo-se uma constante qualquer a cada elemento de um conjunto de valores, o desvio padrão não se altera. ii) Se multiplicarmos ou dividirmos uma constante qualquer a cada elemento de um conjunto de valores, o desvio padrão ficará multiplicado ou dividido por essa constante. Isso porque o desvio-padrão, da mesma forma que a variância, é uma medida de dispersão. Por exemplo, imagine que a média aritmética das idades de 100 pessoas é igual a 20 anos. Daqui a 5 anos, todas as pessoas ficarão 5 anos mais velhas. Ou seja, nós adicionamos 5 às idades de todas as 100 pessoas. Dessa forma, a média aritmética que hoje é igual a 20 anos, daqui a 5 anos será 20+5=25 anos. Da mesma maneira, se triplicarmos as idades de todas as 100 pessoas, ou seja, se multiplicamos todas as idades por 3, a média aritmética também será Prof. Guilherme Neves www.pontodosconcursos.com.br 46 RACIOCÍNIO LÓGICO QUANTITATIVO PARA AFRFB PROFESSOR: GUILHERME NEVES multiplicada por 3. A média que originalmente era igual a 20 anos será igual a 20x3=60 anos. Nesse exemplo das 100 pessoas, daqui a 5 anos as idades estarão igualmente espalhadas. Por exemplo, se seu irmão é 4 anos mais velho do que você, ele sempre será 4 anos mais velho do que você. Suas idades estarão sempre com o mesmo grau de afastamento. Assim, a adição e a subtração não alteram o desvio-padrão e a variância. É válida, portanto, a seguinte relação: i) dp ( aX + b ) = a ⋅ dp ( X ) 17. (PETROBRAS 2006 – Administrador Pleno – CESGRANRIO) Se Y = 2X+1 e a variância de X vale 2, a variância de Y é igual a: (A) 2 (B) 4 (C) 5 (D) 8 (E) 9 Resolução É importantíssimo conhecermos algumas propriedades da variância: i) Somando-se ou subtraindo-se uma c onstante qualquer a c ada elemento de um conjunto de valores, a variância não se altera. ii) Se multiplicarmos ou dividirmos uma c onstante qualquer a c ada elemento de um conjunto de valores, a variância ficará multiplicada ou dividida pelo quadrado dessa constante. Por exemplo, se os valores triplicam, a variância é multiplicada por 9 (32). Se os valores são quadruplicados, a variância é multiplicada por 16 (42). Em relação à adição e à subtração, tem-se que a variância não é influenciada. Isso porque a variância é uma medida de dispersão – se somarmos o mesmo valor a todos os valores de X, eles continuarão dispersos, espalhados da mesma forma, apenas mudarão de posição. É válida, portanto, a seguinte relação: var(aX + b) = a 2 ⋅ var( X ) Assim, var(2 X + 1) = 2 ⋅ var( X ) = 4 ⋅ 2 = 8 . Poderíamos raciocinar da seguinte maneira: 2 Como chegamos à variável Y a partir da variável X? Multiplicamos os valores de X por 2 e em seguida adicionamos 1 ao resultado encontrado. Prof. Guilherme Neves www.pontodosconcursos.com.br 47 RACIOCÍNIO LÓGICO QUANTITATIVO PARA AFRFB PROFESSOR: GUILHERME NEVES Assim, a variância (que é igual a 2) multiplicada por 4 é igual a 8. Letra D Método simplificado para o desvio padrão e variância Há c asos em que é muito trabalhoso c alcular a média aritmética, em seguida c alcular os desvios em relação à média, elevar esses valores ao quadrado, etc. Ufa! Cansou só de ler... Por isso, existe um método simplificado para o c álculos dessas medidas de dispersão. Esse método dispensa o cálculo dos desvios!! O método é descrito a partir das seguintes fórmulas: Fórmula Desenvolvida do desvio padrão para distribuição de freqüências No caso de estarmos trabalhando com os elementos uma população: 1 ' =( ∙6 * ∙ − )∑ * ∙ - 7 No caso de estarmos trabalhando com os elementos de uma amostra: 2 X i ⋅ fi ) ( 1 ∑ 2 S= ∑ X i ⋅ fi − n −1 n Simplificado????? Este método está parecendo muito complicado!!!! Calma... Se não fosse simplificado eu nem falaria nele... ☺ Para começar: qual a diferença entre ∑ * ∙ Prof. Guilherme Neves e )∑ * ∙ - ? www.pontodosconcursos.com.br 48 RACIOCÍNIO LÓGICO QUANTITATIVO PARA AFRFB PROFESSOR: GUILHERME NEVES ∑* ∙ Você deve elevar o ponto médio (valor da variável) ao quadrado, multiplicar pela frequência e em seguida somar os valores. )∑ * ∙ Você deve multiplicar o ponto médio (valor da variável) pela frequência, somar esses valores e elevar o resultado ao quadrado. Como é que vamos utilizar essas fórmulas? No lugar de trabalhar com a variável original, trabalharemos com a variável transformada. Sim, aquela mesma da média aritmética, que é formada pela sucessão dos números naturais. Então, na fórmula, no lugar de trabalhar com a variável X, trabalharemos com a variável transformada Y (0,1,2,3,4...). Calculamos o desvio padrão e a variância da variável transformada. Na média aritmética, para fazer o caminho da volta, nós multiplicávamos a média da variável transformada pela amplitude da classe e depois adicionávamos o primeiro ponto médio. Aqui é bem mais fácil!! O caminho da volta: Desvio padrão: basta multiplicar pela amplitude. Variância: basta multiplicar pelo quadrado da amplitude. Vamos calcular novamente o desvio padrão e a variância dos 40 alunos do ponto com o método simplificado. Utilizaremos a fórmula desenvolvida juntamente com a variável transformada: 2 ⋅ X f ( ) 1 ∑ i i 2 S= ∑Xi ⋅ fi − n n −1 No lugar da variável X, utilizaremos a variável Y formada pela sucessão dos números naturais. Estaturas de 40 alunos do Ponto fi xi Estaturas (cm) 150⊢ ⊢154 4 152 154 158 9 156 158⊢ ⊢162 11 160 162 166 8 164 166 170 5 168 170⊢ ⊢174 3 172 Total 40 Prof. Guilherme Neves www.pontodosconcursos.com.br 49 RACIOCÍNIO LÓGICO QUANTITATIVO PARA AFRFB PROFESSOR: GUILHERME NEVES fi xi yi yi ⋅ f i yi 2 yi 2 ⋅ f i 4 9 11 8 5 3 40 152 156 160 164 168 172 0 1 2 3 4 5 0 9 22 24 20 15 ∑ =90 0 1 4 9 16 25 0 9 44 72 80 75 ∑ =280 Qual o significado de cada uma das colunas desta tabela? Dê uma olhada na fórmula: 2 X i ⋅ fi ) ( 1 ∑ 2 S= ∑ X i ⋅ fi − n −1 n ∑* ∙ Você deve elevar o ponto médio (valor da variável) ao quadrado, multiplicar pela frequência e em seguida somar os valores. )∑ * ∙ Você deve multiplicar o ponto médio (valor da variável) pela frequência, somar esses valores e elevar o resultado ao quadrado. Já que estamos trabalhando com a variável transformada: ∑8 ∙ Você deve elevar Y ao quadrado (coluna 5), multiplicar pela frequência (coluna 6) e em seguida somar os valores (coluna 6 – última linha). )∑ 8 ∙ Você deve multiplicar Y pela frequência (coluna 4), somar esses valores (coluna 4 – última linha) e elevar o resultado ao quadrado. Cálculo da Variância da Variável Transformada y 2 y f ⋅ ( ) 1 ∑ i i ∑ yi2 ⋅ f i − Sy2 = n −1 n 1 S y 2 = [ 280 − 202,5] = 1,9871 39 O valor 202,5 foi obtido elevando 90 ao quadrado e dividindo o resultado por 40. O caminho da volta: Variância: basta multiplicar pelo quadrado da amplitude. Assim, S 2 = 1, 9871× 42 = 31, 79 E o desvio padrão é a raiz quadrada da variância. S = 31, 79 = 5, 638 Prof. Guilherme Neves www.pontodosconcursos.com.br 50 RACIOCÍNIO LÓGICO QUANTITATIVO PARA AFRFB PROFESSOR: GUILHERME NEVES 18. (Auditor do Governo do Estado do Amapá – FGV/ 2010) Os dados a seguir são as quantidades de empregados de cinco pequenas empresas: 6, 5, 8, 5, 6. A variância da quantidade de empregados dessas cinco empresas é igual a: (A) 0,8. (B) 1,2. (C) 1,6. (D) 2,0. (E) 2,4. Resolução Podemos calcular a variância dessa população pelo método tradicional ou pelo método simplificado. Método Simplificado )∑ * ∙ 1 ' = ∙6 * ∙ − 7 ∑* ∙ Você deve elevar o ponto médio (valor da variável) ao quadrado, multiplicar pela frequência e em seguida somar os valores. )∑ * ∙ Você deve multiplicar o ponto médio (valor da variável) pela frequência, somar esses valores e elevar o resultado ao quadrado. Nesse caso, as frequências são todas iguais a 1. Logo, a fórmula fica assim: ' = 1 ∙6 * − )∑ * - 7 ∑* Você deve elevar o ponto médio (valor da variável) ao quadrado, em seguida somar os valores. )∑ *- Você deve somar os valores e elevar o resultado ao quadrado. Assim, 9 * = 6 + 5 + 8 + 5 + 6 = 186 * : = )6 + 5 + 8 + 5 + 6- = 900 ' = 1 1 900 < = ∙ 6 = 1,2 ∙ ;186 − 5 5 5 Letra B Prof. Guilherme Neves www.pontodosconcursos.com.br 51 RACIOCÍNIO LÓGICO QUANTITATIVO PARA AFRFB PROFESSOR: GUILHERME NEVES 19. (AFRF 1998/ESAF) Os dados seguintes, ordenados do menor para o maior, foram obtidos de uma amostra aleatória, de 50 preços (Xi) de ações, tomadas numa bolsa de valores internacional. A unidade monetária é o dólar americano. 4,5,5,6,6,6,6,7,7,7,7,7,7,8,8,8,8,8,8,8,8,8,9,9,9,9,9,9,10,10,10,10,10,10,10,1 0, 11,11,12,12, 13,13,14, 15,15,15,16,16,18,23. Os valores seguintes foram calculados para a amostra: ∑X = 490 e ∑X (∑ X ) − 2 i = 668 . 50 Assinale a opção que c orresponde à mediana e à variância amostral, respectivamente (com aproximação de uma casa decimal). a) 9,0 e 14,0 b) 9,5 e 14,0 c) 9,0 e 13,6 d) 8,0 e 13,6 e) 8,0 e 15,0 i 2 i Resolução Quanto à mediana não há problema: são 50 preços (número par). Assim, a mediana será a média aritmética entre o 25º e o 26º termos. A mediana é igual a 9. E quanto à variância amostral? A ESAF foi muito generosa!! Privilegiou quem sabia a fórmula desenvolvida. Quem não sabia... Sinto muito! Pois calcular os desvios, elevá-los ao quadrado, depois somar...Acabou o tempo da prova! ∑X 2 i (∑ X ) − i 50 2 = 668 Esse foi o presente da ESAF!! 2 X ( ) 1 ∑ i 2 2 S = ∑ X i − n n −1 Agora, lembre-se que tratando de amostras o denominador deve ser n-1. S2 = 1 ⋅ 668 50 − 1 S 2 = 13, 6 Letra C Prof. Guilherme Neves www.pontodosconcursos.com.br 52 RACIOCÍNIO LÓGICO QUANTITATIVO PARA AFRFB PROFESSOR: GUILHERME NEVES Uma observação importante: já que a variância é o quadrado do desvio padrão, então a sua unidade de medida será o quadrado da medida do desvio padrão. Logo, se estamos trabalhando c om alturas em metros, então a unidade da variância será m2; se estamos trabalhando c om massas em kg, a unidade da variância será kg2,... 20. (Companhia Catarinense de Águas e Saneamento – Economista – 2006 – FEPESE) Sobre medidas de dispersão, é correto afirmar: a) O desvio padrão é medido em quadrados da unidade da variável original. b) O desvio padrão é a raiz quadrada da covariância entre duas variáveis. c) A variância tem relação linear com os afastamentos da média. d) Maior variância significa que a média da amostra é mais elevada. e) A variância não é expressa em unidades da variável original. Resolução a) O desvio padrão é medido na mesma unidade da variável. Falso. b) O desvio padrão é a raiz quadrada da variância da variável original. Falso. c) A variância não tem relação linear com os afastamentos (desvios) da média, pois elevamos os desvios ao quadrado. Falso. d) Maior variância significa maior afastamento em relação à média. Falso. e) Verdadeiro. Letra E 21. (Técnico Administrativo BNDES 2008/CESGRANRIO) Em uma amostra de cinco residências de uma determinada rua, registram-se os seguintes números de moradores em cada uma: A variância amostral é (A) 5,8 (B) 5,5 (C) 5,1 (D) 4,8 (E) 4,4 Resolução X1 X2 X3 X4 X5 3 6 2 7 2 Queremos calcular a variância dessa amostra. Prof. Guilherme Neves www.pontodosconcursos.com.br 53 RACIOCÍNIO LÓGICO QUANTITATIVO PARA AFRFB PROFESSOR: GUILHERME NEVES Primeiramente calculemos a média dessa amostra. 3+6+2+7+2 =4 5 Calculemos agora os quadrados dos desvios dos valores da amostra em relação à média. 2 xi xi − x x −x ?= 3 6 2 7 2 3 − 4 = −1 6 − 4 = 2 2 − 4 = −2 7 − 4 = 3 2 − 4 = −2 ( ) )−1- = 1 2 =4 )−2- = 4 3 =9 )−2- = 4 i Assim, a variância amostral é dada por: 1 + 4 + 4 + 9 + 4 22 = 5,5 = = ∑)? − ?4 5−1 = Letra B −1 Leia a tabela a seguir para responder às questões de nos 22 a 24. 22. (Técnico Administrativo BNDES 2008/CESGRANRIO) Considerando-se que uma pessoa será escolhida ao acaso, qual a probabilidade de que a sua idade esteja entre 28 e 36 anos, dado que a pessoa escolhida terá 24 anos ou mais? (A) 11/40 (B) 13/32 (C) 19/40 (D) 19/32 (E) 29/40 Resolução O primeiro passo é calcular a coluna de frequências absolutas. Para isto, repetimos a primeira frequência acumulada e calculamos as diferenças entre as frequências acumuladas consecutivas. Prof. Guilherme Neves www.pontodosconcursos.com.br 54 RACIOCÍNIO LÓGICO QUANTITATIVO PARA AFRFB PROFESSOR: GUILHERME NEVES Idades (anos) 20⊢ ⊢24 24 28 28⊢ ⊢32 32 36 36⊢40 Frequência Acumulada 20 52 78 90 100 Frequência Absoluta 20 52 − 20 = 32 78 52 26 90 − 78 = 12 100 − 90 = 10 A tabela ficará assim: Idades (anos) 20⊢ ⊢24 24 28 28⊢ ⊢32 32 36 36⊢40 Frequência Absoluta 20 32 26 12 10 O total de pessoas com idade entre 28 e 36 anos é igual a 26 + 12 = 38 (basta somar as frequências da terceira e da quarta classe). Como a pessoa escolhida tem 24 anos ou mais, então estamos considerando um universo de 32 + 26 + 12 + 10 = 80 pessoas. A probabilidade de que a sua idade esteja entre 28 e 36 anos, dado que a pessoa escolhida terá 24 anos ou mais é igual a: 38 19 = 80 40 Letra C 23. (Técnico Administrativo BNDES 2008/CESGRANRIO) Sejam A e md, respectivamente, a média e a mediana das idades. O valor de A – md é (A) 0,80 (B) 0,75 (C) 0,70 (D) 0,65 (E) 0,60 Resolução Na questão 22, construímos a seguinte tabela. Idades (anos) 20⊢24 Prof. Guilherme Neves Frequência Absoluta 20 www.pontodosconcursos.com.br 55 RACIOCÍNIO LÓGICO QUANTITATIVO PARA AFRFB PROFESSOR: GUILHERME NEVES 24⊢ ⊢28 28 32 32⊢ ⊢36 36 40 32 26 12 10 Para calcular a média aritmética de uma distribuição de frequências, convencionamos que todos os valores incluídos em um determinado intervalo de classe coincidem com o seu ponto médio. Abriremos inicialmente uma coluna para os pontos médios das classes (xi) e em seguida multiplicaremos esses valores pelas suas respectivas frequências. O ponto médio é a média aritmética dos extremos da classe. Por exemplo, o BC ponto médio da primeira classe é = 22. Idades (anos) Frequência Absoluta 20 32 26 12 10 20⊢ ⊢24 24 28 28⊢ ⊢32 32 36 36⊢40 ? ⋅ ? 22 26 30 34 38 20 32 26 12 10 x x x x x 22 26 30 34 38 = = = = = 440 832 780 408 380 Basta-nos agora somar os valores da coluna xi f i e dividir pela quantidade de observações (o somatório das frequências absolutas é igual a 100). A= 440 + 832 + 780 + 408 + 380 = 28,40 100 A mediana é outra medida de posição definida como número que se encontra no centro de uma série de números, estando estes dispostos segundo uma ordem. Em outras palavras, a mediana de um conjunto de valores, ordenados segundo uma ordem de grandeza, é o valor situado de tal forma no conjunto que o separa em dois subconjuntos de mesmo número de elementos. No cálculo da mediana em uma distribuição de frequência não teremos a preocupação de determinarmos se o número de elementos é par ou ímpar. Os passos básicos para determinar a mediana de uma distribuição serão: i) Descobrir a classe mediana. ii) Aplicar a fórmula da mediana para distribuição de frequências. n . Em Para determinarmos a classe mediana, deveremos calcular o valor 2 seguida comparamos esse valor com os valores da frequência absoluta acumulada crescente. Procuraremos a classe cuja frequência acumulada seja n maior ou igual ao valor de . 2 Como são 100 pessoas, então /2 = 50. Prof. Guilherme Neves www.pontodosconcursos.com.br 56 RACIOCÍNIO LÓGICO QUANTITATIVO PARA AFRFB PROFESSOR: GUILHERME NEVES Para determinar a classe mediana, devemos comparar cada uma das frequências acumuladas com o valor 50. Quando encontrarmos o primeiro valor que for maior ou igual a 50 teremos determinado a classe mediana. Classe mediana (52 > 50) Estamos prontos para aplicarmos a fórmula da mediana. n 2 − fac ANT Md = linf + ⋅h fi Precisaremos dos seguintes valores: Limite inferior da classe mediana (F 54 = 24). /2 = 50 Frequência acumulada da classe anterior à classe mediana ( Frequência absoluta da classe mediana ( = 52 − 20 = 32) Amplitude da classe mediana (J = 28 − 24 = 4) A mediana é dada por: − K = F 54 + L 2 K = 24 + ; K = 24 + ; Prof. Guilherme Neves GHI GHI = 20). M∙J 50 − 20 <∙4 32 30 < ∙ 4 = 27,75 32 www.pontodosconcursos.com.br 57 RACIOCÍNIO LÓGICO QUANTITATIVO PARA AFRFB PROFESSOR: GUILHERME NEVES Desta forma: A − K = 28,40 − 27,75 = 0,65 Letra D 24. (Técnico Administrativo BNDES 2008/CESGRANRIO) A distância interquartil é, aproximadamente, (A) 6,3 (B) 6,5 (C) 6,7 (D) 6,9 (E) 7,1 Resolução A distância interquartil é igual à diferença entre o terceiro quartil e o primeiro quartil. O método para calcular os quartis (e as outras medidas separatrizes como decis, percentis) é muito parecido com o da mediana. n 5 Diferença: ao invés de calcularmos o valor calcularemos (se for o primeiro 2 3n quartil) ou (se for o terceiro quartil). O denominador é igual a 4 porque 4 trata-se de um quartil (dividimos a distribuição em quatros partes). O numerador é 1n porque estamos calculando o primeiro quartil ou 3n porque estamos calculando o terceiro quartil. Para calcular a classe do primeiro quartil deveremos procurar a frequência acumulada que é maior ou igual n/4. A fórmula do primeiro quartil ficará − N = F 54 + L 4 GHI M∙J E para calcular a classe do terceiro quartil deveremos procurar a frequência 3n acumulada que é maior ou igual a . A fórmula do terceiro quartil ficará 4 3n 4 − fac ANT Q3 = linf + ⋅h f i i) Cálculo do primeiro quartil Como são 100 pessoas, então n/4 = 25. Prof. Guilherme Neves www.pontodosconcursos.com.br 58 RACIOCÍNIO LÓGICO QUANTITATIVO PARA AFRFB PROFESSOR: GUILHERME NEVES Devemos comparar cada uma das frequências acumuladas com o valor 25. Quando encontrarmos o primeiro valor que for maior ou igual a 25 teremos determinado a classe do primeiro quartil. Classe do primeiro quartil (52 >25) Estamos prontos para aplicarmos a fórmula do primeiro quartil. − N = F 54 + L 4 GHI M∙J Precisaremos dos seguintes valores: Limite inferior da classe do primeiro quartil (F 54 = 24). /4 = 25 Frequência acumulada da classe anterior à classe do primeiro quartil ( GHI = 20). Frequência absoluta da classe do primeiro quartil ( = 52 − 20 = 32) Amplitude da classe do primeiro quartil (J = 28 − 24 = 4) O primeiro quartil é dado por: − N = F 54 + L 4 GHI M∙J 25 − 20 N = 24 + ; <∙4 32 ii) 5 N = 24 + ; < ∙ 4 = 24,625 32 Cálculo do terceiro quartil Como são 100 pessoas, então 3n/4 = 75. Devemos comparar cada uma das frequências acumuladas com o valor 75. Quando encontrarmos o primeiro valor que for maior ou igual a 75 teremos determinado a classe do terceiro quartil. Prof. Guilherme Neves www.pontodosconcursos.com.br 59 RACIOCÍNIO LÓGICO QUANTITATIVO PARA AFRFB PROFESSOR: GUILHERME NEVES Classe do primeiro quartil (78 >75) Estamos prontos para aplicarmos a fórmula do terceiro quartil. 3 − GHI M∙J N =F +L 4 54 Precisaremos dos seguintes valores: Limite inferior da classe do terceiro quartil (F 54 = 28). 3 /4 = 75 Frequência acumulada da classe anterior à classe do terceiro quartil ( 52). Frequência absoluta da classe do terceiro quartil ( = 78 − 52 = 26) Amplitude da classe do terceiro quartil (J = 28 − 24 = 4) O terceiro quartil é dado por: 3 − GHI N =F +L 4 M∙J GHI = 54 75 − 52 N = 28 + ; <∙4 26 23 N = 28 + ; < ∙ 4 ≅ 31,538 26 Desta forma, a distância interquartil é aproximadamente: N − N ≅ 31,538 − 24,625 N − N ≅ 6,913 Letra D Prof. Guilherme Neves www.pontodosconcursos.com.br 60 RACIOCÍNIO LÓGICO QUANTITATIVO PARA AFRFB PROFESSOR: GUILHERME NEVES Relação das questões comentadas 01. (Economista - Instituto de Previdência do Estado de Santa Catarina – FEPESE/2006) Verifique os conjuntos A, B, C e D abaixo, no formato de rol e assinale a alternativa correta. a) A amplitude total do conjunto C é igual a 0,28. b) Não é possível calcular a amplitude total do conjunto D, pois estamos diante de um rol decrescente. c) A amplitude de todos os conjuntos é igual a 7. d) A amplitude total do conjunto A é 2,1. e) A amplitude total do conjunto B é o dobro da amplitude total do conjunto A. 02. (Auditor Interno do Poder Executivo- Secretarias de Estado da Fazenda e da Administração – 2005 – FEPESE) Os pesos de 80 pacientes internados em um hospital estão relacionados na tabela abaixo. Com referência a essa tabela, determine a amplitude total. Assinale a única alternativa correta. a) 49 b) 53 c) 79 d) 80 e) 97 Prof. Guilherme Neves www.pontodosconcursos.com.br 61 RACIOCÍNIO LÓGICO QUANTITATIVO PARA AFRFB PROFESSOR: GUILHERME NEVES 03. (PETROBRAS 2008 – Administrador Júnior – CESGRANRIO) A tabela abaixo apresenta os pesos de um grupo de pessoas e suas respectivas frequências. Não há observações coincidentes com os extremos das classes. Classes (em kgf) 40 – 50 50 – 60 60 – 70 70 – 80 80 – 90 Frequências 2 5 7 8 3 O peso médio do conjunto de pessoas, em kgf, é (A) 60 (B) 65 (C) 67 (D) 70 (E) 75 04. (Auditor IBGE – CESGRANRIO 2010) A tabela abaixo apresenta a distribuição de frequências das idades de um grupo de crianças. Classes (em anos) 0 ˫- 2 2 ˫- 4 4 ˫- 6 6 ˫- 8 8 ˫- 10 fi 5 2 4 2 7 A média das idades dessas crianças, em anos, é (A) 5,0 (B) 5,2 (C) 5,4 (D) 5,6 (E) 5,8 05. (Estatístico – Pref. Manaus 2004 CESGRANRIO) Analise as afirmativas a seguir, a respeito da média aritmética. I - a soma dos resíduos em relação à média aritmética é sempre igual a zero; II - é em relação à média aritmética que a soma dos valores absolutos dos resíduos é mínima; III - é em relação à média aritmética que a soma dos quadrados dos resíduos é mínima. Está(ão) correta(s) a(s) afirmativa(s): (A) II, somente. (B) I e II somente. Prof. Guilherme Neves www.pontodosconcursos.com.br 62 RACIOCÍNIO LÓGICO QUANTITATIVO PARA AFRFB PROFESSOR: GUILHERME NEVES (C) I e III somente. (D) II e III somente. (E) I, II e III. 06. (MPE-RO CESGRANRIO 2005) A tabela apresenta uma distribuição de frequência dos salários dos 200 empregados de certa empresa. Salário (R$) 260 – 520 520 – 1040 1040 – 1560 1560 - 2600 Frequência 50 100 30 20 O salário médio, aproximadamente, vale: (A) R$ 600,00 (B) R$ 780,00 (C) R$ 890,50 (D) R$ 1 040,00 (E) R$ 1430,00 07. (PETROBRAS 2008 – Administrador Júnior – CESGRANRIO) A tabela abaixo apresenta os pesos de um grupo de pessoas e suas respectivas frequências. Não há observações coincidentes com os extremos das classes. Classes (em kgf) 40 – 50 50 – 60 60 – 70 70 – 80 80 – 90 Frequências 2 5 7 8 3 O valor aproximado, em kgf, do peso mediano do conjunto de pessoas é (A) 67 (B) 68 (C) 69 (D) 70 (E) 71 Prof. Guilherme Neves www.pontodosconcursos.com.br 63 RACIOCÍNIO LÓGICO QUANTITATIVO PARA AFRFB PROFESSOR: GUILHERME NEVES 08. (Auditor IBGE – CESGRANRIO 2010) A tabela abaixo apresenta a distribuição de frequências das idades de um grupo de crianças. Classes (em anos) 0 ˫- 2 2 ˫- 4 4 ˫- 6 6 ˫- 8 8 ˫- 10 fi 5 2 4 2 7 A mediana da distribuição de frequências apresentada é (A) 5,5 (B) 5,6 (C) 5,7 (D) 5,8 (E) 5,9 (MPE-RO CESGRANRIO 2005) O enunciado a seguir refere-se às questões de números 09 e 10. A tabela apresenta uma distribuição de frequência dos salários dos 200 empregados de certa empresa. Salário (R$) 260 – 520 520 – 1040 1040 – 1560 1560 - 2600 Frequência 50 100 30 20 09. O salário mediano vale, aproximadamente: (A) R$ 600,00 (B) R$ 780,00 (C) R$ 890,50 (D) R$ 1 040,00 (E) R$ 1 430,00 10. O terceiro quartil, aproximadamente, vale: (A) R$ 600,00 (B) R$ 780,00 (C) R$ 890,50 (D) R$ 1 040,00 (E) R$ 1 430,00 11. (AFRFB 2009 ESAF) Considere a seguinte amostra aleatória das idades em anos completos dos alunos em um curso preparatório. Com relação a essa amostra, marque a única opção correta: 29, 27, 25, 39, 29, 27, 41, 31, 25, 33, 27, 25, 25, 23, 27, 27, 32, 26, 24, 36, 32, 26, 28, 24, 28, 27, 24, 26, 30, 26, 35, 26, 28, 34, 29, 23, 28. Prof. Guilherme Neves www.pontodosconcursos.com.br 64 RACIOCÍNIO LÓGICO QUANTITATIVO PARA AFRFB PROFESSOR: GUILHERME NEVES a) A média e a mediana das idades são iguais a 27. b) A moda e a média das idades são iguais a 27. c) A mediana das idades é 27 e a média é 26,08. d) A média das idades é 27 e o desvio-padrão é 1,074. e) A moda e a mediana das idades são iguais a 27. 12. (AFRF 1998) Os dados seguintes, ordenados do menor para o maior, foram obtidos de uma amostra aleatória, de 50 preços (Xi) de ações, tomadas numa bolsa de valores internacional. A unidade monetária é o dólar americano. 4,5,5,6,6,6,6,7,7,7,7,7,7,8,8,8,8,8,8,8,8,8,9,9,9,9,9,9,10,10,10,10,10,10,10,1 0,11,11,12,12,13,13,14, 15,15,15,16,16,18,23. Assinale a opção que corresponde ao preço modal. a) 8 b) 23 c) 7 d) 10 e) 9 13. (AFRF/ESAF/1996) Para efeito desta questão, considere os seguintes dados. DISTRIBUIÇÃO DE FREQUENCIAS DAS IDADES DOS FUNCIONÁRIOS DA EMPRESA ALFA, EM 01.01.90 Pontos Médios fi (PM) Classes de Idades (anos) 19,5˫24,5 2 22 24,5˫29,5 9 27 29,5˫34,5 23 32 34,5˫39,5 29 37 39,5˫44,5 18 42 44,5˫49,5 12 47 49,5˫54,5 7 52 Total 100 Marque a opção que representa a moda das idades dos funcionários em 1º/01/90. a) 35,97 b) 36,26 c) 36,76 d) 37,03 e) 37,31 Prof. Guilherme Neves www.pontodosconcursos.com.br 65 RACIOCÍNIO LÓGICO QUANTITATIVO PARA AFRFB PROFESSOR: GUILHERME NEVES 14. (AFRF 2002.2/ESAF) O atributo do tipo contínuo X, observado como um inteiro, numa amostra de tamanho 100, obtida de uma população de 1000 indivíduos, produziu a tabela de freqüências seguinte: Classes Frequência (f) 29,5-39,5 4 39,5-49,5 8 49,5-59,5 14 59,5-69,5 20 69,5-79,5 26 79,5-89,5 18 89,5-99,5 10 Assinale a opção que c orresponde ao desvio absoluto médio do atributo X. a) 16,0 b) 17,0 c) 16,6 d) 18,1 e) 13,0 15. (Auditor IBGE - CESGRANRIO 2010) No último mês, Alípio fez apenas 8 ligações de seu telefone celular cujas durações, em minutos, estão apresentadas no rol abaixo. 5 2 11 8 3 8 7 4 O valor aproximado do desvio padrão desse conjunto de tempos, em minutos, é (A) 3,1 (B) 2,8 (C) 2,5 (D) 2,2 (E) 2,0 Prof. Guilherme Neves www.pontodosconcursos.com.br 66 RACIOCÍNIO LÓGICO QUANTITATIVO PARA AFRFB PROFESSOR: GUILHERME NEVES 16. (PETROBRAS 2008 – Administrador Júnior – CESGRANRIO) Do total de funcionários de uma empresa, foi retirada uma amostra de seis indivíduos. A tabela abaixo apresenta o tempo trabalhado na empresa, em anos completos, por cada um deles. X1 X2 X3 X4 X5 X6 3 7 2 2 3 1 A variância dessa amostra é (A) 3,7 (B) 4,0 (C) 4,4 (D) 5,0 (E) 5,5 17. (PETROBRAS 2006 – Administrador Pleno – CESGRANRIO) Se Y = 2X+1 e a variância de X vale 2, a variância de Y é igual a: (A) 2 (B) 4 (C) 5 (D) 8 (E) 9 18. (Auditor do Governo do Estado do Amapá – FGV/ 2010) Os dados a seguir são as quantidades de empregados de cinco pequenas empresas: 6, 5, 8, 5, 6. A variância da quantidade de empregados dessas cinco empresas é igual a: (A) 0,8. (B) 1,2. (C) 1,6. (D) 2,0. (E) 2,4 19. (AFRF 1998/ESAF) Os dados seguintes, ordenados do menor para o maior, foram obtidos de uma amostra aleatória, de 50 preços (Xi) de ações, tomadas numa bolsa de valores internacional. A unidade monetária é o dólar americano. 4,5,5,6,6,6,6,7,7,7,7,7,7,8,8,8,8,8,8,8,8,8,9,9,9,9,9,9,10,10,10,10,10,10,10,1 0, 11,11,12,12, 13,13,14, 15,15,15,16,16,18,23. Os valores seguintes foram calculados para a amostra: ∑X = 490 e ∑X (∑ X ) − 2 i = 668 . 50 Assinale a opção que c orresponde à mediana e à variância amostral, respectivamente (com aproximação de uma casa decimal). a) 9,0 e 14,0 b) 9,5 e 14,0 c) 9,0 e 13,6 d) 8,0 e 13,6 e) 8,0 e 15,0 Prof. Guilherme Neves i 2 i www.pontodosconcursos.com.br 67 RACIOCÍNIO LÓGICO QUANTITATIVO PARA AFRFB PROFESSOR: GUILHERME NEVES 20. (Companhia Catarinense de Águas e Saneamento – Economista – 2006 – FEPESE) Sobre medidas de dispersão, é correto afirmar: a) O desvio padrão é medido em quadrados da unidade da variável original. b) O desvio padrão é a raiz quadrada da covariância entre duas variáveis. c) A variância tem relação linear com os afastamentos da média. d) Maior variância significa que a média da amostra é mais elevada. e) A variância não é expressa em unidades da variável original. 21. (Técnico Administrativo BNDES 2008/CESGRANRIO) Em uma amostra de cinco residências de uma determinada rua, registram-se os seguintes números de moradores em cada uma: A variância amostral é (A) 5,8 (B) 5,5 (C) 5,1 (D) 4,8 (E) 4,4 22. (Técnico Administrativo BNDES 2008/CESGRANRIO) Considerando-se que uma pessoa será escolhida ao acaso, qual a probabilidade de que a sua idade esteja entre 28 e 36 anos, dado que a pessoa escolhida terá 24 anos ou mais? (A) 11/40 (B) 13/32 (C) 19/40 (D) 19/32 (E) 29/40 23. (Técnico Administrativo BNDES 2008/CESGRANRIO) Sejam A e md, respectivamente, a média e a mediana das idades. O valor de A – md é (A) 0,80 (B) 0,75 (C) 0,70 (D) 0,65 (E) 0,60 24. (Técnico Administrativo BNDES 2008/CESGRANRIO) A distância interquartil é, aproximadamente, (A) 6,3 (B) 6,5 (C) 6,7 (D) 6,9 (E) 7,1 Prof. Guilherme Neves www.pontodosconcursos.com.br 68 RACIOCÍNIO LÓGICO QUANTITATIVO PARA AFRFB PROFESSOR: GUILHERME NEVES Gabaritos 01. 02. 03. 04. 05. 06. 07. 08. 09. 10. 11. 12. 13. 14. 15. 16. 17. 18. 19. 20. 21. 22. 23. 24. E A C C C C B A B D E A B E B C D B C E B C D D Prof. Guilherme Neves www.pontodosconcursos.com.br 69