ESTATÍSTICA DESCRITIVA Medidas de Tendência Central 3 MEDIDAS DE TENDÊNCIA CENTRAL 3.1 Média Aritmética Uma das mais importantes medidas estatísticas utilizadas é a média. Ela é, por exemplo, utilizada no cálculo de nossa média escolar. A média caracteriza o centro da distribuição de freqüências; ela é considerada o ponto de equilíbrio de uma distribuição. 5 Cálculo da média aritmética para dados isolados A média aritmética representada por x , é dada pela soma x1 + x2 + ... + xn , dividida por n (número total da amostra), ou x seja: x = 10 ∑ xi i=1 n . Veja o exemplo a seguir: Um administrador deseja calcular o tempo médio de espera do lanche “X TUDO” em sua lanchonete. Para isso, analisa uma amostra de 10 pedidos, cujo tempo de espera está listado a seguir: Tabela 1. Tempo, em minutos, de espera do lanche “X tudo” na Lanchonete. 20 16 15 20 25 15 19 10 18 12 29 Medidas de Tendência Central A média é calculada da seguinte maneira: x= 20 + 15 + 25 + 19 + 18 + 16 + 20 + 15 + 10 + 12 = 17 min 10 Cálculo da média aritmética para o caso de distribuição de freqüências. 5 Exemplo: Em uma amostra de 40 parafusos produzidos por uma metalúrgica, foram medidos os diâmetros, em milímetros, conforme a tabela abaixo. Qual é a medida média do diâmetro? Tabela 2. Freqüências. Diâmetro do parafuso, em milímetros. xi Nº de parafusos (fi) 1,1 5 1,2 10 1,3 15 1,4 4 1,5 6 Total ∑ fi = 40 x Neste caso utilizamos a fórmula: x = ∑ xi .fi i=1 n , pois a tabela 10 mostra que existem 5 parafusos com diâmetro igual a 1,1mm, 10 parafusos com diâmetro 1,2 mm e assim por diante. Tabela 3. 30 Diâmetro do parafuso, em milímetros. xi nº de parafusos (fi) xi.fi 1,1 5 5,5 1,2 10 12 1,3 15 19,5 1,4 4 5,6 1,5 6 9 Total ∑ fi = 40 ∑xi.fi = 51,6 ESTATÍSTICA DESCRITIVA 516 , = 129 , mm 40 x= Veja o outro exemplo a seguir: x ∑ xi .fi i=1 x= n classe. 5 , onde xi é representado pelo ponto médio da Tabela 4. Classes de salários. Classes de salários (em reais) Ponto Médio fi xi.fi 500 |— 1000 750 8 6000 1000|— 1500 1250 4 5000 1500 |— 2000 1750 9 15750 2000 |— 2500 2250 7 15750 2500 |— 3000 2750 10 27500 3000 |— 3500 3250 5 16250 3500 |— 4000 3750 7 26250 ∑fi = 50 ∑xi.fi = 112.500 x= 112.500 = 2250 reais. 50 3.2 Mediana (Me) A mediana é uma medida de tendência central. Ela divide um conjunto ordenado de dados em duas partes com igual número de elementos. 10 No caso de dados isolados temos: Se a amostra é constituída por um número ímpar de elementos, a mediana é o valor que fica no centro dos dados ordenados. 31 Medidas de Tendência Central Exemplo: 20, 20, 24, 25, 30. A mediana é 24. Se a amostra é constituída por um número par de elementos, a mediana é a média aritmética dos dois valores centrais dos 5 dados ordenados. Exemplo: 20, 20, 24, 26, 30 e 36 A mediana é 24 + 26 = 25 . 2 Curiosidade: Para os dados agrupados, a mediana é n 2 − ( ∑ fai) calculada através da fórmula: Me = Li + .c , fme onde: Li: limite inferior da classe que contém a mediana. n: freqüência total. ∑ fai: soma de todas as freqüências das classes anteriores à mediana. fme: freqüência da classe que contém a mediana. c: amplitude do intervalo da classe da mediana. Qual é a diferença entre média e mediana? Embora sejam duas medidas de tendência central, a média 10 e a mediana possuem conceitos diferentes. Observe o conjunto de dados abaixo: 2, 3, 4, 5, 9, 15, 35, 98. Calculando a média obtemos: x= 32 2 + 3 + 4 + 5 + 9 + 15 + 35 + 98 = 21, 375 8 ESTATÍSTICA DESCRITIVA Calculando a mediana obtemos: me = 5+9 = 7. 2 O que podemos perceber nesse caso é que o cálculo da média levou em consideração todos os valores do conjunto de dados 5 numéricos, sendo assim influenciada pelos maiores valores. A mediana levou apenas em consideração os seus dois valores centrais. Embora a média aritmética seja bastante utilizada, há casos em que a mediana descreve melhor a situação. Cabe ao 10 pesquisador procurar a medida mais conveniente. 3.3 Moda A moda de um conjunto de dados é o valor que ocorre com maior freqüência. Exemplo. Para o conjunto de dados: 10, 12, 12, 23, 12, 25, 20, a moda 15 é 12. Curiosidade: Para os dados agrupados, a moda é d1 .c , onde: d1 + d2 calculada através da fórmula: Mo = Li + Li: limite inferior da classe modal. d1: diferença entre a freqüência classe modal e a classe imediatamente anterior. d2: diferença entre a freqüência classe modal e a classe imediatamente seguinte. c: amplitude do intervalo da classe modal. 33 Medidas de Tendência Central Um conjunto de dados pode ser: Amodal: quando nenhum dado se repete. Exemplo. 2, 3, 5, 9, 10 e 12. Modal: quando um valor se repete. 5 Exemplo: 3, 4, 4, 4, 5, 6, 7 e 9. Moda: 4. Bimodal: quando dois valores se repetem. Exemplo. 3, 4, 4, 5, 6, 6, 7 e 10. Moda: 4 e 6. 10 Trimodal: quando três valores se repetem. Exemplo. 1, 2, 2, 3, 4, 4, 5, 6, 6 e 8. Moda: 2, 4 e 6. Polimodal: mais do que três valores se repetem. 15 Exemplo. 1, 1, 1, 2, 3, 3, 3, 4, 5, 5, 5, 6, 7, 7, 7, 8, 9, 10. Moda: 1, 3, 5 e 7. 3.4 Medidas de Posição (Quartis, decis e percentis) Para o conjunto de dados ordenados temos que os valores que dividem o conjunto em quatro partes iguais são denominados quartis. Esses valores que podem ser representados por Q1, Q2 e Q3 denominam-se primeiro, segundo e terceiros quartis, 20 respectivamente. Os valores que dividem o conjunto ordenado em dez partes iguais denominam-se decis e os valores que dividem os dados em cem partes iguais percentis. 34 ESTATÍSTICA DESCRITIVA 3.5 Exercícios Resolvidos 1. Uma amostra com dez preços de álcool foi extraída em diversos postos no dia 02/01/2007. Os preços em reais são: 1,00 1,25 1,35 1,09 1,19 1,25 1,12 1,45 1,39 1,19 Para a tabela acima determine: a) a mediana. 5 Para o calculo da mediana devemos necessariamente colocar os dados em ordem. (Rol) 1,00 1,09 1,12 1,19 1,19 1,25 1,25 1,35 1,39 1,45 Temos aqui um conjunto com uma quantidade par de elementos (10 elementos). Devemos então fazer a média aritmética dos dois elementos 10 centrais: Me = 119 , + 125 , = 122 , reais. 2 b) a moda. Para o cálculo da moda não há necessidade de colocar os dados em ordem, porém a visualização dos valores que se 15 repetem fica mais clara. O conjunto de dados é bimodal, pois há no conjunto dois valores que se repetem: 1,19 e 1,25. c) a média. 1, 00 + 1, 09 + 112 , + 119 , + 119 , + 125 , + 125 , + 135 , + 139 , + 145 , = 10 12,228 = 1228 , . 20 = 10 x= 35 Medidas de Tendência Central O preço médio do álcool é de R$1,23 (arredondamento de duas casas decimais). 2. O peso em quilogramas de 50 alunos de uma academia está listado na tabela abaixo. 5 Tabela 5. Freqüências. Pesos, em kg. nº de alunos (fi) 54 2 58 4 62 12 66 5 70 7 74 16 78 4 Total ∑fi=50 Determine a média. Devemos lembrar que essa tabela mostra que existem 2 alunos com peso igual a 54 kg, 4 alunos com 58 kg e assim por diante. O número total de alunos é igual a 50. 10 Neste caso, para o cálculo da média utilizamos a fórmula: ∑ xi.fi . x= n Vamos fazer este cálculo utilizando a tabela. Tabela 5. Cálculo da Média. Pesos, em kg. Xi nº de alunos (fi) xi.fi 54 2 54.2=108 58 4 58.4=232 62 12 62.12=744 66 5 66.5=330 70 7 70.7=490 74 16 74.16=1184 78 4 78.4=312 Total ∑fi=50 ∑xi.fi=3400* * ∑ xi.fi = 128 + 232 + 744 + 330 + 490 + 1184 + 312 = 3400 . 36 ESTATÍSTICA DESCRITIVA x= 3400 = 68 kg. 50 O peso médio dos alunos da academia é de 68 kg. b) Moda. A moda é 74 (16 alunos pesam 74 kg). 5 3. A seguir estão listadas as mensalidades, em reais, do curso de línguas (2 horas semanais) em diversas escolas de um bairro. 240 350 250 300 320 285 450 600 198 Determine: a) Mediana. Para o calculo da mediana devemos necessariamente colocar 10 os dados em ordem. (Rol) 198 240 250 285 300 320 350 450 600 Temos aqui um conjunto com uma quantidade ímpar de elementos (9 elementos). A mediana é o termo central. Me=300. 15 Podemos dizer que 50% dos preços são maiores ou iguais a R$ 300,00 e 50% dos preços são menores ou iguais a R$ 300,00. b) Moda. O conjunto de dados é amodal (nenhum valor se repete). c) Média. 20 198 + 240 + 250 + 285 + 300 + 320 + 350 + 450 + 600 = 9 2993 = = 332, 56. 9 x= O valor médio é de R$332,56. 37 Medidas de Tendência Central 4. Um nutricionista indicou dietas diferentes para três grupos de pacientes. A tabela indica a perda de peso (em kg) por paciente. Tabela 7. Perda de Peso. 5 Grupo 1 Grupo 2 Grupo 3 2 3 4 4 5 6 8 10 2 2 2 3 3 5 8 9 3 4 4 4 5 6 6 6 Calcule a média, a mediana e a moda para cada um dos grupos. Grupo 1. Média: x = 2 + 3 + 4 + 4 + 5 + 6 + 8 + 10 42 = = 5, 25 kg. 8 8 A moda é igual a 4 kg. 10 Mediana: Me = 4 +5 = 4, 5 kg. 2 Grupo 2. Média: x = 2 + 2 + 2 + 3 + 3 + 5 + 8 + 9 34 = = 4, 25 kg. 8 8 A moda é igual a 2 kg. Mediana: Me = 15 Grupo 3. Média: x = 38 3+3 = 3 kg. 2 3 + 4 + 4 + 4 + 5 + 6 + 6 + 6 38 = = 4, 75 kg. 8 8 ESTATÍSTICA DESCRITIVA Bimodal: 4kg e 6 kg. Mediana: Me = 4 +5 = 4, 5 kg. 2 Os resultados estão na tabela a seguir: Tabela 8. Resumo. 5 Grupo 1 Grupo 2 Grupo 3 2 3 4 4 5 6 8 10 2 2 2 3 3 5 8 9 3 4 4 4 5 6 6 6 ∑xi = 42 ∑xi = 34 ∑xi = 38 x 1 = 5,25 kg x2 = 4,25kg x 3 = 4,75kg Me(1)=4,5kg Me(2)=3kg Me(3)=4,5kg Levando em consideração a média, podemos dizer que a dieta do grupo 1 foi a que teve mais efeito. A mediana para os grupos 1 e 3 foi a mesma, significando que 50% do peso perdido é maior ou igual a 4,5 kg e 50% menor ou igual a 4,5 kg. 10 5. Considere o histograma abaixo, para calcular a idade média dos alunos em um curso de Inglês. Gráfico 1. Histograma. 39 Medidas de Tendência Central Para calcular a média, primeiramente vamos transportar os dados do gráfico para uma tabela. Tabela 9. Freqüências. Classes de Idades nº de alunos 10 |–12 30 12 |–14 20 14 |–16 25 16 |–18 15 18 |–20 10 Total: 100 Agora vamos calcular a média: 5 Tabela 10. Cálculo da Média. Classes de Idades Ponto Médio xi xi nº de alunos fi xi.fi 10 |–12 11 30 11.30=330 12 |–14 13 20 13.20=260 14 |–16 15 25 15.25=375 16 |–18 17 15 17.15=255 18 |–20 19 10 19.10=190 100 ∑xi.fi = 1410 Total: x= 1410 = 14,10 anos 100 A idade média é 14,10 anos. 4 MEDIDAS DE DISPERSÃO. Quando descrevemos nossos dados através das medidas de tendência central, necessitamos muitas vezes de complementos, 10 denominados medidas de dispersão. As medidas de dispersão utilizadas são a amplitude, a variância, o desvio-padrão e o coeficiente de variação. 40 ESTATÍSTICA DESCRITIVA As medidas de dispersão indicam o quanto os dados variam em torno da região central. 4.1 Amplitude A amplitude é a diferença entre o maior e o menor dado observado. 5 Por utilizar apenas os extremos, a amplitude não é uma boa medida de dispersão. No exemplo 2 (capítulo 1) a amplitude é: 39000 - 520 - 3380. 4.2 Variância (s2) A variância é definida como a soma dos quadrados dos desvios dividida pelo tamanho da amostra menos 1. 10 s 2 ( xi − x )2 ∑ = n −1 O desvio em relação à média é a diferença entre cada dado (xi) e a média do conjunto ( x ). Exemplo: Calcular a variância para o caso abaixo. Tabela 1. Tempo, em minutos. Tempo, em minutos, de espera do lanche “X tudo” na Lanchonete. 20 16 15 15 20 25 15 19 10 18 12 x = 17 min (20 − 17)2 + (15 − 17)2 + (25 − 17)2 + ... + (12 − 17)2 s = = 10 − 1 170 = = 18, 89 min2 9 2 41 Medidas de Tendência Central No caso de uma distribuição de freqüências usamos a fórmula: s 2 ( xi − x )2 .fi ∑ , onde xi é o ponto médio do intervalo de = n −1 classe e fi é a freqüência de cada classe. 5 Tabela 2. Classes de salários. Classes de salários (em reais) Ponto Médio fi (xi - x)2.fi 500 |— 1000 750 8 18.000.000 1000|— 1500 1250 4 4.000.000 1500 |— 2000 1750 9 2.250.000 2000 |— 2500 2250 7 0 2500 |— 3000 2750 10 2.500.000 3000 |— 3500 3250 5 5.000.000 3500 |— 4000 3750 7 15.750.000 ∑ fi = 50 ∑ (xi - x)2.fi = 47.500.000 x = 2.250 reais. s2 = 47500000 = 969.387, 76 reais2. 49 4.3 Desvio-padrão (s) O desvio-padrão é a raiz quadrada positiva da variância. Para dados isolados: s = 10 ∑ (xi − x)2 . Para dados agrupados: s = n −1 ∑ (xi − x)2 .fi . n −1 O desvio-padrão é uma das medidas de dispersão de maior interesse nas pesquisas em geral, pois ela é expressa na mesma unidade da variável em estudo. 42 ESTATÍSTICA DESCRITIVA Verifique o exemplo abaixo: Vamos considerar as alturas, em centímetros, de 2 grupos de alunos de uma universidade. Tabela 3. Alturas. 5 Grupo 1 Grupo 2 150 150 151 151 151 152 152 152 153 153 148 150 155 160 165 170 180 190 195 200 Total: 1515 Total: 1713 x1 = 151,5 cm x2 = 171,3 cm s1 = 1,08 cm s2 = 18,98 cm Devemos observar que, quanto maior o desvio-padrão, maior será a variação entre os dados analisados, e, quanto menor for o desvio-padrão, menor é a variação entre os dados analisados. No grupo 2, a variação entre as alturas é maior (desviopadrão 18,98 cm), e no grupo 1 (desvio-padrão 1,08 cm), a 10 variação é menor. 4.4 Coeficiente de Variação (CV) O coeficiente de variação é o quociente entre o desvio-padrão e a média. CV = s . x Podemos expressar o coeficiente de variação na forma de 15 porcentagem. s CV = .100% . x No exemplo acima temos: Grupo 1, com CV=0,71%, e Grupo 2, com CV=11,08%. 43 Medidas de Tendência Central 4.5 Exercícios Resolvidos 1. A variação do preço, em reais, da lata de óleo de soja em diversos mercados. Preços referentes a 03/01/2008. 2,50 2,70 2,30 2,45 2,60 2,10 2,65 2,15 2,35 2,70 Para os dados acima encontre: a) a média. 5 2, 50 + 2, 70 + 2, 30 + 2, 45 + 2, 60 + 2,10 + 2, 65 + 2,15 + 2, 35 + 2, 70 = 10 24,55 = = 2, 45 10 x= O preço médio é de R$2,45. b) desvio-padrão. Para facilitar os cálculos, vamos construir uma tabela; veja a seguir: 10 Preços (em reais) s= (xi - x)2 2,10 (2,10 - 2,45)2 = 0,1225 2,15 (2,15 - 2,45)2 = 0,09 2,30 (2,30 - 2,45)2 = 0,0225 2,35 (2,35 - 2,45)2 = 0,01 2,45 (2,45 - 2,45)2 = 0 2,50 (2,50 - 2,45)2 = 0,0025 2,60 (2,60 - 2,45)2 = 0,0225 2,65 (2,65 - 2,45)2 = 0,04 2,70 (2,70 - 2,45)2 = 0,0625 2,70 (2,70 - 2,45)2 = 0,0625 ∑ xi = 2,45 ∑ (xi - x)2 = 0,435 0,1225 + 0, 09 + 0, 0225 + 0, 01 + 0 + 0, 0025 + 0, 0255 + 0, 04 + 0, 0625 + 0, 0625 0, 435 = = 0, 22 * 10 − 1 9 * arredondamento para duas casas decimais. c) CV = 44 0, 22 .100% = 8, 98%. 2, 45 ESTATÍSTICA DESCRITIVA 2. Para a tabela a seguir, determine: Tabela 4. Produção de Biodiesel. Produção de Biodiesel no estado de São Paulo – Biodiesel Puro por produtor – 2006 – 2007 (m³). 2006 2007 Janeiro - 1063 Fevereiro - 1683 Março - 1743 Abril - 1916 Maio - 2336 Junho 3761 959 Julho 35 3871 Agosto 2354 5793 Setembro 4007 4473 Outubro 4895 7287 Novembro 4863 - Dezembro 1236 - Fonte: ANP/SRP, conforme a portaria ANP nº 54/01. Determine: a) a média e o desvio-padrão da produção de Biodiesel de 5 junho a dezembro de 2006. 3761 + 35 + 2354 + 4007 + 4895 + 4863 + 1236 = 7 21151 = = 3021, 57 m3 7 x= Mês Xi (xi - x)2 Junho 3761 (3761 - 3021,57)2 = 546756,72 Julho 35 (35 - 3021,57)2 = 8919600,36 Agosto 2354 (2354 - 3021,57)2 = 445649,70 Setembro 4007 (4007 - 3021,57)2 = 971072,28 Outubro 4895 (4895 - 3021,57)2 = 3509739,96 Novembro 4863 (4863 - 3021,57)2 = 3390864,44 Dezembro 1236 (1236 - 3021,57)2 = 3188260,22 ∑ xi = 21151 ∑ (xi - x)2 = 20971943,68 s= 20971943, 68 = 1869, 58 6 45 Medidas de Tendência Central b) a média e o desvio-padrão da produção de Biodiesel de janeiro a outubro de 2007. Média:1063 + 1683 + 1743 + 1916 + 2336 + 959 + 3871 + 5793 + 4473 + 7287 31124 x= = = 3112, 4 m3 10 10 Desvio-Padrão: 5 Mês Xi (xi - x)2 Janeiro 1063 (1063 - 3112,4)2 = 4200040,36 Fevereiro 1683 (1683 - 3112,4)2 = 2043184,36 Março 1743 (1743 - 3112,4)2 = 1875256,36 Abril 1916 (1916 - 3112,4)2 = 1431372,96 Maio 2336 (2336 - 3112,4)2 = 602796,96 Junho 959 (959 - 3112,4)2 = 4637131,56 Julho 3871 (3871 - 3112,4)2 = 575473,96 Agosto 5793 (5793 - 3112,4)2 = 7185616,36 Setembro 4473 (4473 - 3112,4)2 = 1851232,36 Outubro 7287 (7287 - 3112,4)2 = 17427285,16 ∑ xi = 31124 ∑ (xi - x)2 = 41829390,4 s= 41829390, 4 = 2155, 85 m3 9 O valor médio da produção de biodiesel, em 2006, foi de 3021,57 m³ e, em 2007, foi de 3112,4 m³. A variação da produção foi maior em 2007. 46 ESTATÍSTICA DESCRITIVA 3. A tabela a seguir mostra os preços de venda no mercado atacadista de 3 produtos. Preços mensais de venda no mercado atacadista – janeiro a outubro de 2007. Feijão Carioquinha tipo 1 Preço em reais por saca de 60 kg. Feijão Carioquinha tipo 2 Preço em reais por saca de 60 kg. Feijão Preto tipo 1 Preço em reais por saca de 60 kg. Janeiro 74,64 67,05 62,31 Fevereiro 78,56 68,62 62,09 Março 72,80 66,02 59,61 Abril 75,29 66,66 59,84 Maio 89,86 76,66 61,55 Junho 93,61 82,16 67,29 Julho 93,29 82,93 66,93 Agosto 100,26 93,70 70,13 Setembro 112,84 108,58 77,05 Outubro 146,50 141,34 86,66 Fonte: IAE – Instituto de Economia Agrícola. a) calcule o preço médio de cada produto nos meses de janeiro a outubro de 2007. 5 b) calcule o desvio-padrão e o coeficiente de variação de cada produto nos meses de janeiro a outubro de 2007. c) analise os resultados do item b. 47 Medidas de Tendência Central Feijão Carioquinha – Tipo 1 x1 = 74, 64 + 78, 56 + 72, 80 + 75, 29 + 89, 86 + 93, 61+ 93, 29 + 100, 26 + 112, 84 + 146, 50 937, 65 = = 93, 765 reais 10 10 Feijão Carioquinha tipo 1 Preço em reais por saca de 60 kg. (xi) 74,64 (74,64 - 93,765)2 = 365,765625 78,56 (78,56 - 93,765)2 = 231,192025 72,80 (72,80 - 93,765)2 = 439,531225 75,29 (75,29 - 93,765)2 = 341,325625 89,86 (89,86 - 93,765)2 = 15,249025 93,61 (93,61 - 93,765)2 = 0,024025 93,29 (93,29 - 93,765)2 = 0,225625 100,26 (100,26 - 93,765)2 = 42,185025 112,84 (112,84 - 93,765)2 = 363,855625 146,50 (146,50 - 93,765)2 = 2780,980225 ∑ xi = 937,65 s1 = (xi - x)2 ∑ (xi - x)2 = 4580,33405 4580, 33405 = 22, 56 reais. 9 Feijão Carioquinha – Tipo 2 5 x2 = 67, 05 + 68, 62 + 66, 66 + 76, 66 + 82,16 + 82, 93 + 93, 70 + 108, 58 + 14134 , 853, 72 = = 85, 372 reais. 10 10 Feijão Carioquinha tipo 2 Preço em reais por saca de 60 kg. (xi) 67,05 (67,05 - 85,372)2 = 335,6957 68,62 (68,62 - 85,372)2 = 280,6295 66,02 (66,02 - 85,372)2 = 374,4999 66,66 (66,66 - 85,372)2 = 350,1389 76,66 (76,66 - 85,372)2 = 75,8989 82,16 (82,16 - 85,372)2 = 10,3169 82,93 (82,93 - 85,372)2 = 5,9634 93,70 (93,70 - 85,372)2 = 69,3556 108,58 (108,58 - 85,372)2 = 538,6113 141,34 (141,34 - 85,372)2 = 3132,4170 ∑ xi = 853,72 s2 = 48 (xi - x)2 ∑ (xi - x)2 = 5173,5271 5173, 5271 = 23, 98 reais. 9 ESTATÍSTICA DESCRITIVA Feijão Preto – Tipo 1. x3 = 62, 31 + 62, 09 + 59, 61 + 59, 84 + 6155 , + 67, 29 + 66, 93 + 70,13 + 77, 05 + 86, 66 673, 46 = = 67, 346 reais 10 10 Feijão Preto tipo 1 Preço em reais por saca de 60 kg. (xi) (xi - x)2 62,31 (62,31 - 67,346)2 = 25,361296 62,09 (62,09 - 67,346)2 = 27,625536 59,61 (59,61 - 67,346)2 = 59,845696 59,84 (59,84 - 67,346)2 = 56,340036 61,55 (61,55 - 67,346)2 = 33,593616 67,29 (67,29 - 67,346)2 = 0,003136 66,93 (66,93 - 67,346)2 = 0,173056 70,13 (70,13 - 67,346)2 = 7,750656 77,05 (77,05 - 67,346)2 = 94,167616 86,66 (86,66 - 67,346)2 = 373,030596 ∑ xi = 673,46 ∑ (xi - x)2 = 677,89124 s2 = 677, 89124 = 8, 68 reais. 9 Resumindo os nossos dados temos: 5 Feijão Carioquinha – Tipo 1 Feijão Carioquinha – Tipo 2 Feijão Preto – Tipo 1 Média R$ 93,765 R$ 85,372 R$ 67,346 Desvio-padrão R$ 22,56 R$ 23,98 R$ 8,68 Após a análise, podemos concluir que o feijão preto tipo 1 possui menor preço médio e também a menor variação de preço. Entre o feijão carioquinha tipos 1 e 2, o menor preço médio é o do tipo 2; a variação do tipo 1 é de aproximadamente 3% e 10 a do tipo 2 é de 2,8%. 49 Medidas de Tendência Central 4. A tabela de freqüências abaixo mostra o número de professores agrupados por classes; de idade de uma Universidade. Classes de idades (em anos) nº de professores (fi) 20 |— 30 5 30 |— 40 10 40 |— 50 15 50 |— 60 12 60 |— 70 3 ∑ fi = 45 Calcule a média, a variância e o coeficiente de variação. 5 Para o cálculo da média devemos primeiramente encontrar os pontos médios dos intervalos de classe; veja a seguir: Classes de idades (em anos) nº de professores (fi) Ponto Médio 20|— 30 5 20 + 30 = 25 2 30|— 40 10 30 + 40 = 35 2 40 |— 50 15 40 + 50 = 45 2 50 |— 60 12 50 + 60 = 55 2 60 |— 70 3 60 + 70 = 65 2 ∑ fi = 45 50 ESTATÍSTICA DESCRITIVA Para o cálculo da média, fazemos: Classes de idades (em anos) nº de professores (fi) 20|— 30 5 20 + 30 = 25 2 25.5=125 30|— 40 10 30 + 40 = 35 2 35.10=350 40 |— 50 15 40 + 50 = 45 2 45.15=675 50 |— 60 12 50 + 60 = 55 2 55.12=660 60 |— 70 3 60 + 70 = 65 2 65.3=195 Ponto Médio (xi) ∑ fi = 45 x= xi.fi ∑ xi.fi = 2005 2005 = 44, 56 * anos 45 *aproximação de duas casas decimais. Para o cálculo da variância temos: Classes de idades (em anos) Ponto Médio (xi) nº de professores (fi) (xi - x)2..fi 20|— 30 25 5 (25 - 44,56)2. 5 = 1912,968 30|— 40 35 10 (35 - 44,56)2. 10 = 913,936 40 |— 50 45 15 (45 - 44,56)2. 15 = 2,904 50 |— 60 55 12 (55 - 44,56)2. 12 = 1307,9232 60 |— 70 65 3 (65 - 44,56)2. 3 = 1253,3808 ∑ fi = 45 ∑ (xi - x)2 .fi = 5391,112 1912,968 + 913,936 + 2,904 + 1307,9232 + 1253,3808 = 45 − 1 5391112 , = 122, 53 anos2 . 44 2 5 s = 51 Medidas de Tendência Central Para o cálculo do coeficiente de variação temos: s = 122, 53 = 11, 07 anos. CV = 11, 07 .100% = 24, 84% . 44, 56 5. Considere a tabela abaixo. Salários recebidos pelos funcionários da Empresa “X”. 5 Salários nº de funcionários 800 5 900 6 1000 12 1100 4 1200 8 1300 10 1400 15 Total: 60 Calcule a média, o desvio-padrão e o coeficiente de variação. Para o cálculo da média, temos: Salários xi nº de funcionários fi xi.fi 800 5 800.5=4000 900 6 900.6=5400 1000 12 1000.12=12000 1100 4 1100.4=4400 1200 8 1200.8=9600 1300 10 1300.10=13000 1400 15 1400.15=21000 Total: x= 52 69400 = 1156, 67 reais. 60 ∑ xi.fi = 69400 ESTATÍSTICA DESCRITIVA Para o desvio-padrão temos: Salários xi nº de funcionários fi xi.fi 800 5 (800 - 1156,56)2 .5 = 636067,4445 900 6 (900 - 1156,56)2 .6 = 395276,9334 1000 12 (1000 - 1156,56)2 .12 = 294545,8668 1100 4 (1100 - 1156,56)2 .4 = 12845,9556 1200 8 (1200 - 1156,56)2 .8 = 15019,9112 1300 10 (1300 - 1156,56)2 .10 = 205434,889 1400 15 (1400 - 1156,56)2 . 15 = 888142,3335 ∑ fi = 60 ∑ (xi - x)2 .fi= 2447333,334 s= 2447333, 334 = 203, 67 reais. 59 Para o coeficiente de variação temos: CV = 5 203, 67 .100% = 17, 6% 1156, 67 A média dos salários é de R$1156,67 com um coeficiente de variação de 17,6%. 6. Considere o histograma abaixo e calcule a variância e o coeficiente de variação. 53 Medidas de Tendência Central A idade média dos alunos já foi calculada no capítulo anterior, basta agora calcularmos o desvio-padrão e o coeficiente de variação. x= 1410 = 14,10 anos. 100 Classes de idades Ponto Médio xi nº de alunos fi (xi - x)2..fi 10|— 12 11 30 (11 - 14,10)2. 30 = 288,3 12|— 14 13 20 (13 - 14,10)2. 20 = 24,2 14 |— 16 15 25 (15 - 14,10)2. 25 = 20,25 16 |— 18 17 15 (17 - 14,10)2. 15 = 126,15 18 |— 20 19 10 (19 - 14,10)2. 10 = 240,1 100 ∑ (xi - x)2 .fi = 699 Total: 5 s= 699 = 2, 66 anos. 99 CV = 2, 66 .100% = 18, 87% 14,10 A variação das idades dos alunos do curso de Inglês é de 18,87%. Referências Bibliográficas LARSON e FARBER. Estatística Aplicada. São Paulo: Prentice Hall, 2004. LEVIN, J. e FOX, J.A. Estatística para ciências humanas. São Paulo: Prentice Hall, 2004. MOORE, D. A Estatística Básica e sua prática. Rio d Janeiro: LTC, 2000. NEUFELD, J. L. Estatística aplicada à Administração usando excel. São Paulo: Pearson Prentice Hall, 2003. PEREIRA, P. H. Noções de Estatística. São Paulo: Papirus, 2004. SPIEGEL, M. R. Estatística. São Paulo: Makron Books, 1993. VIEIRA, S. Introdução a Bioestatística. Rio de Janeiro: Campus, 1980. 54