ESTATÍSTICA DESCRITIVA MÓDULO 1 - INTRODUÇÃO À ESTATÍSTICA DESCRITIVA A Estatística, um ramo da Matemática, é aplicada em diferentes áreas, como Administração, Engenharia, Medicina, Psicologia, Ciências Sociais etc. Mas, para que serve a Estatística? Antes de reportagens chegarem aos nossos lares, são elaboradas pesquisas em que se utilizam amplamente os conceitos de Estatística, comprovando que essa disciplina, que será estudada a partir de agora, é freqüentemente presente em nosso cotidiano. Veja os exemplos a seguir. “Mais da metade da população brasileira (51%) está acima de seu peso ideal. Uma pesquisa da Sociedade Brasileira de Cirurgia Bariátrica e Metabólica (SBCBM) - realizada em todas as regiões do País com 2.179 pessoas - revela um dado ainda mais preocupante: entre as pessoas de 18 a 25 anos, esse índice é de 66%.” Emilio Sant’Anna (estadão.com.br 05/01/2008). “Um balanço feito para avaliar o desempenho orçamentário do governo federal mostra que, dos 337 programas inscritos que tinham verba prevista em orçamento para ser gasta em 2007, mais de 200 aplicaram menos de 80% dos recursos autorizados. Isto é, cerca de 62% do total dos programas tiveram gastos insatisfatórios. Apenas 37% deles, ou seja, 126, apresentaram execução acima de 80%, índice considerado razoável, já que também foram incluídas as despesas de anos anteriores, os chamados restos a pagar, quitados em 2007. No entanto, em valores absolutos, os gastos em 2007 foram os maiores dos últimos seis anos.” Cecília Melo e Leandro Kleber (www.uol.com.br folhas abertas em 04/01/2008). “Levantamento mostra que, apesar de mais alunos entrarem nas universidades públicas, quantidade de formandos caiu 9,5% em 2 anos. Resultado revela perda de eficiência das instituições, que são financiadas com verba pública; evasão é tida como uma das causas.” Fábio Takahashi (Folha de São Paulo, Cotidiano em 30/12/2007) 1.1 Estatística Estatística é uma ciência que tem como finalidade coletar, organizar, descrever, analisar e interpretar dados experimentais. A Estatística pode ser classificada em: 1 Estatística Descritiva: Coleta, organização e descrição dos dados experimentais. Estatística Indutiva: Análise e interpretação dos dados experimentais. 1.2 População e amostra População é um conjunto de elementos que possuem, em comum, determinada característica. As populações podem ser finitas, como o conjunto constituído pelo número de peças produzidas por uma máquina em um determinado dia, ou infinitas, como o número de vezes que podemos lançar um dado. Muitas vezes se torna difícil, ou até mesmo impossível, observar todo um grupo, especialmente se esse for muito grande. Nesses casos, podemos utilizar apenas uma parte desse, denominado amostra. A amostra deve ser representativa da população, retratando com fidelidade suas características, ja que por meio dessa amostra serão tiradas as conclusões para toda a população. Após ser definida a população, precisamos estabelecer uma técnica de amostragem, ou seja, um procedimento para a escolha da amostra, entre as quais destacamos: amostragem casual simples, amostragem sistemática, amostragem estratificada, amostragem de conveniência. 1.3 Técnicas de amostragem 1.3.1 Amostragem casual simples É um procedimento em que os elementos para as amostras são retirados ao acaso. Assim, todo elemento da população tem igual probabilidade de pertencer à amostra. A amostragem casual simples é equivalente a um sorteio numérico. 1.3.2 Amostragem sistemática Neste procedimento os elementos que compõem a amostra, não são escolhidos por acaso; pelo contrário, estes elementos devem ser ordenados e a retirada deve ser feita através de um sistema. Exemplo: Na produção de parafusos de uma máquina podemos retirar um a cada dez parafusos produzidos. 1.3.3 Amostragem estratificada É um procedimento por meio do qual retiramos elementos para amostra de diversos estratos da população. 2 Para obtermos uma boa amostra, o processo deve ser tal que o número de elementos retirados seja proporcional ao número de elementos de cada estrato. Exemplo: Para obtermos uma amostra estratificada da cidade de São Paulo, devemos obter uma amostra de cada um dos bairros da cidade. 1.3.4 Amostragem por conveniência A amostra de conveniência é formada por elementos que estão disponíveis para o pesquisador. Por exemplo, um médico que quer realizar uma pesquisa sobre determinado medicamento, para sua conveniência, realiza a pesquisa com pacientes do hospital em que trabalha. 3 MÓDULO II - DADOS Os dados são as informações obtidas através de observações, medidas, respostas de pesquisas ou contagens em geral. 2.1 Classificação dos dados Os dados podem ser classificados em: Dados qualitativos: classificação por tipos ou atributos. Exemplos: A cor dos olhos (azuis, castanhos, verdes etc.) das modelos de uma determinada agência. Qualidade (defeituosa ou não defeituosa) de peças produzidas por uma máquina. Grupo sanguíneo (A, B, AB ou O) dos alunos doadores de sangue da Universidade. Dados quantitativos: quando seus valores são expressos em números. Exemplos: O peso líquido de cada um dos sabonetes produzidos por uma empresa. A altura dos alunos do 1º ano do Ensino Médio. O diâmetro de parafusos produzidos por uma máquina. 2.2 Representação de dados em tabelas Os dados podem ser apresentados através de uma tabela. Dados isolados No caso de dados qualitativos, a descrição através de uma tabela é muito simples. 4 A tabela acima mostra o número de pessoas matriculadas em cada modalidade de ensino; este número é denominado freqüência (fi). Podemos também encontrar a freqüência relativa para cada modalidade; para isso basta dividir a freqüência de cada modalidade pelo total de freqüências (n). Veja o exemplo: * arredondamento de duas casas decimais. 2.3 Distribuições de freqüências 5 Uma distribuição de freqüência é uma tabela de intervalos de classes com o número total de entradas de dados em cada classe. A freqüência (fi) de uma classe é o número de entrada de dados na classe. Veja o exemplo. A seguir, estão listados os salários, em reais, de cinqüenta funcionários de um determinado setor de uma empresa automobilística: 2500 1800 2200 680 700 950 1050 980 1090 2100 600 750 1800 1200 520 2450 1490 1600 1800 2000 3000 2800 2100 1900 1880 2300 2750 3200 3800 3700 3500 900 1980 2900 2650 2700 2900 2600 2650 2800 3800 3900 3100 3250 1550 1800 2100 3700 3800 3100 Para organizar a tabela de salários, em reais, devemos construir uma tabela de freqüências. Podemos observar que o menor salário é o de 520 e o maior é de 3900; definimos então intervalos de classes iguais de 500 reais, ou seja, de 500 a 1000, 1000 a 1500 e assim por diante. Observação: Uma fórmula utilizada para o cálculo do número de classes é: K=1+3,222. log n, onde k é o número de classes, n é o número de elementos do conjunto. No exemplo acima temos: K=1+3,222. log 50 6,47. Embora exista uma fórmula para o número de intervalos de classe, muitos pesquisadores determinam o número de intervalos dependendo da situação. Um número de classes pequeno não é aconselhável, pois há perda de informação. Um número de classes grande é desnecessário na maioria dos casos. A freqüência (fi) neste caso é o número de funcionários que estão incluídos na classe de salários. Temos que fi n , onde n é o número total de elementos da amostra. 6 Usamos a notação 500 |—1000, onde o intervalo é fechado à esquerda (pertencem à classe os valores iguais ao extremo inferior) e aberto à direita (não pertencem à classe os valores iguais ao extremo superior). Amplitude do intervalo de uma classe é a diferença entre o limite superior e o inferior. Temos no exemplo 1000-500=500; logo, a amplitude do intervalo de classe é de 500 reais. O Ponto médio de um intervalo de classe é a metade da soma do limite inferior e o limite superior. Veja o exemplo: A freqüência relativa (fr) de uma classe é a freqüência (fi) desta classe dividida pelo total de elementos da amostra(n). 7 A Freqüência Acumulada (fa) de uma classe é a soma da freqüência daquela classe com a de todas as classes anteriores. Veja o exemplo: 8 MÓDULO III - REPRESENTAÇÃO DE DADOS EM GRÁFICOS A representação dos dados através de gráficos possibilita uma rápida visualização. Gráfico de barras Para construção do gráfico de barras utilizamos o sistema de eixos cartesianos. No eixo das abscissas (x) ou ordenadas (y) representamos as variáveis em estudo; no outro eixo (abscissas ou ordenadas) ainda não utilizado, representamos as freqüências. Podemos representar a tabela 1 através de um gráfico de barras. Gráfico 1. Número de matrículas de Educação Básica no Brasil. Diagrama de Pareto Um gráfico de barras em que as categorias estão dispostas em ordem decrescente em relação as freqüências relativas é denominado diagrama de Pareto. A tabela, a seguir, mostra as reclamações mais freqüentes em relação aos Bancos. 9 Fonte: Banco Central do Brasil (http://www3.bcb.gov.br/ ranking/idxrc.do) Gráfico 2. Diagrama de Pareto. A linha que aparece no gráfico 2 representa as freqüências relativas 5 elativas acumuladas. Gráfico de setores O gráfico de setores é construído da seguinte maneira: construímos uma circunferência (360º) e fazemos a divisão dos setores utilizando as freqüências relativas. Usamos a regra de três para saber o valor de cada ângulo do setor. O gráfico de setores a seguir refere-se à tabela 1. 10 Gráfico 3. Setores. Também podemos construir os gráficos utilizando as freqüências relativas. Fonte: Revista Quatro Rodas Veja o gráfico de barras que representa os dados da tabela 8. Gráfico 4. Diagrama de Barras. 11 Veja o gráfico de setores que representa a tabela 8. Gráfico 5. Setores. Histograma O histograma é um gráfico composto por retângulos justapostos em que a base de cada um deles corresponde ao intervalo de classe, e a sua altura, à respectiva freqüência. No exemplo abaixo, usamos o ponto médio de cada classe para construir o histograma. O gráfico a seguir representa os dados da tabela 3. Gráfico 6. Histograma. 12 Polígono de freqüências Os dados apresentados em tabelas de distribuição de freqüências, também podem ser representados em um polígono de freqüências. A construção de um polígono de freqüências é bastante simples: a partir do histograma, basta ligarmos os pontos médios de cada classe. Para fechar o polígono, unimos os extremos da figura com o eixo horizontal, no ponto médio da classe anterior à primeira e no ponto médio da posterior à última classe. Veja o exemplo a seguir referente à tabela 3. Gráfico 7. Histograma e Polígono de freqüências. Ou ainda, Gráfico 8. Polígono de Freqüências. 13 Podemos também transportar os dados de um gráfico para uma tabela de distribuição de freqüências. Uma amostra de peças produzidas por certa máquina forneceu a distribuição de comprimentos das peças dada através do histograma abaixo. Gráfico 9. Histograma. 14 MÓDULO IV - Exercícios resolvidos 1. A videolocadora “ALUGUE JÁ” anotou as locações do dia 24/12/2007, obtendo os dados da tabela a seguir: Para a tabela, pedem-se: a) as freqüências relativas. b) construir um gráfico de barras. 15 c) construir o gráfico de setores. Usamos a regra de três para calcularmos o valor do ângulo de cada um dos setores. Drama Comédia Ficção 16 Suspense Outros 3. A seguir, estão listados os rendimentos mensais de 30 famílias. 17 Para a tabela acima, pedem-se: a) Agrupar os dados em uma tabela de distribuição de freqüências. (Use intervalos iguais de 500 reais, iniciando com o intervalo 500 |—1000). Para agruparmos os dados entre 500|—1000, contamos os valores entre 500(incluir) e 1000(não incluir). Esses valores estão pintados na tabela de azul piscina. Para agruparmos os dados entre 1000|—1500, contamos os valores entre 1000(incluir) e 1500(não incluir). Esses valores estão pintados na tabela de amarelo. Para agruparmos os dados entre 1500|—2000, contamos os valores entre 1500(incluir) e 2000(não incluir). Esses valores estão pintados na tabela de cinza. Para agruparmos os dados entre 2000|—2500, contamos os valores entre 2000(incluir) e 2500(não incluir). Esses valores estão pintados na tabela de verde. Para agruparmos os dados entre 2500|—3000, contamos os valores entre 2500(incluir) e 3000(não incluir). Esses valores estão pintados na tabela de rosa. Para agruparmos os dados entre 3000|—3500, contamos os valores entre 3000(incluir) e 3500(não incluir). Esses valores estão pintados na tabela de Laranja. Veja como ficou o resultado: 18 b) Encontre os pontos médios dos intervalos de classe. c) Encontre as freqüências relativas. Devemos lembrar que a soma de todas as freqüências relativas deve ser igual a 1 ou 100%. 19 d) Encontre as freqüências acumuladas. A freqüência acumulada da última classe deverá ser igual à freqüência total. e) Desenhe um histograma e o polígono de freqüências para a tabela. 20 MÓDULO V - Outros Exercícios resolvidos 1. Analise o gráfico e responda às questões abaixo. Gráfico 14. Gráfico de Barras. a) Qual é a freqüência relativa do intervalo de classe de ponto médio igual a 4? Neste caso, qual é o significado desta freqüência? Freqüência total=6+5+8+2+3=24 pessoas. A freqüência relativa é igual 6 0,25 ou 25%. 24 Podemos dizer que no dia 02/01/2008, 25% dos clientes demoraram 4 minutos no caixa. b) Qual dos intervalos possui maior freqüência? A maior freqüência é de 8 pessoas, elas demoraram 12 minutos no caixa. c) Qual dos intervalos possui menor freqüência? A menor freqüência é de 2 pessoas, elas demoraram 16 minutos no caixa. 2. Observe o histograma abaixo, onde as notas foram dadas através dos pontos médios das classes e complete a tabela. Gráfico 15. Histograma. 21 O intervalo de cada classe é de 2. Podemos calcular os extremos inferiores e superiores de cada classe através do ponto médio e do intervalo de classe, lembrando que: Para o primeiro intervalo de classe temos: Extremo inferior: x Extremo superior: x+2 Ponto médio: 1 e As freqüências são facilmente visíveis no gráfico abaixo: As freqüências relativas e acumuladas são calculadas abaixo: 22 3. Uma empresa de aviação recebeu em determinado período algumas reclamações de passageiros, que estão relacionadas na tabela a seguir. Para tal situação, construir um diagrama de pareto. Primeiramente, vamos calcular as freqüências relativas e freqüências relativas acumuladas. 23 O gráfico acima é composto da seguinte maneira: o gráfico de barras refere-se às reclamações x freqüências relativas e o gráfico de linha refere-se às reclamações x freqüências relativas acumuladas. 24 MÓDULO VI - MEDIDAS DE TENDÊNCIA CENTRAL 6.1 Média aritmética Uma das mais importantes medidas estatísticas utilizadas é a média. Ela é, por exemplo, utilizada no cálculo de nossa média escolar. A média caracteriza o centro da distribuição de freqüências; ela é considerada o ponto de equilíbrio de uma distribuição. Cálculo da média aritmética para dados isolados A média aritmética representada por x , é dada pela soma x 1 x 2 ... x n , dividida por n (número total da amostra), ou seja: Veja o exemplo a seguir: Um administrador deseja calcular o tempo médio de espera do lanche “X TUDO” em sua lanchonete. Para isso, analisa uma amostra de 10 pedidos, cujo tempo de espera está listado a seguir: Tabela 1. A média é calculada da seguinte maneira: Cálculo da média aritmética para o caso de distribuição de freqüências. Exemplo: Em uma amostra de 40 parafusos produzidos por uma metalúrgica, foram medidos os diâmetros, em milímetros, conforme a tabela abaixo. Qual é a medida média do diâmetro? Tabela 2. Freqüências. 25 Neste caso utilizamos a fórmula: ,pois a tabela mostra que existem 5 parafusos com diâmetro igual a 1,1mm, 10 parafusos com diâmetro 1,2 mm e assim por diante. Tabela 3. Veja o outro exemplo a seguir: onde xi é representado pelo ponto médio da classe. 26 Tabela 4. Classes de salários. 6.2 Mediana (Me) A mediana é uma medida de tendência central. Ela divide um conjunto ordenado de dados em duas partes com igual número de elementos. No caso de dados isolados temos: Se a amostra é constituída por um número ímpar de elementos, a mediana é o valor que fica no centro dos dados ordenados. Exemplo: 20, 20, 24, 25, 30. A mediana é 24. Se a amostra é constituída por um número par de elementos, a mediana é a média aritmética dos dois valores centrais dos dados ordenados. Exemplo: 20, 20, 24, 26, 30 e 36 A mediana é 27 Curiosidade: Para os dados agrupados, a mediana é calculada através da fórmula: onde: Li: limite inferior da classe que contém a mediana. n: freqüência total. fai: soma de todas as freqüências das classes anteriores à mediana. fme: freqüência da classe que contém a mediana. c: amplitude do intervalo da classe da mediana. Qual é a diferença entre média e mediana? Embora sejam duas medidas de tendência central, a média e a mediana possuem conceitos diferentes. Observe o conjunto de dados abaixo: 2, 3, 4, 5, 9, 15, 35, 98. Calculando a média obtemos: Calculando a mediana obtemos: O que podemos perceber nesse caso é que o cálculo da média levou em consideração todos os valores do conjunto de dados numéricos, sendo assim infl uenciada pelos maiores valores. A mediana levou apenas em consideração os seus dois valores centrais. Embora a média aritmética seja bastante utilizada, há casos em que a mediana descreve melhor a situação. Cabe ao pesquisador procurar a medida mais conveniente. 6.3 Moda 28 A moda de um conjunto de dados é o valor que ocorre com maior freqüência. Exemplo. Para o conjunto de dados: 10, 12, 12, 23, 12, 25, 20, a moda é 12. Curiosidade: Para os dados agrupados, a moda é calculada através da fórmula: , onde: Li: limite inferior da classe modal. d1: diferença entre a freqüência classe modal e a classe imediatamente anterior. d2: diferença entre a freqüência classe modal e a classe imediatamente seguinte. c: amplitude do intervalo da classe modal. Um conjunto de dados pode ser: Amodal: quando nenhum dado se repete. Exemplo. 2, 3, 5, 9, 10 e 12. Modal: quando um valor se repete. Exemplo: 3, 4, 4, 4, 5, 6, 7 e 9. Moda: 4. Bimodal: quando dois valores se repetem. Exemplo. 3, 4, 4, 5, 6, 6, 7 e 10. Moda: 4 e 6. Trimodal: quando três valores se repetem. Exemplo. 1, 2, 2, 3, 4, 4, 5, 6, 6 e 8. Moda: 2, 4 e 6. Polimodal: mais do que três valores se repetem. Exemplo. 1, 1, 1, 2, 3, 3, 3, 4, 5, 5, 5, 6, 7, 7, 7, 8, 9, 10. Moda: 1, 3, 5 e 7. 6.4 Medidas de posição (quartis, decis e percentis) Para o conjunto de dados ordenados temos que os valores que dividem o conjunto em quatro partes iguais são denominados quartis. Esses valores que podem ser 29 representados por Q1, Q2 e Q3 denominam-se primeiro, segundo e terceiros quartis, respectivamente. Os valores que dividem o conjunto ordenado em dez partes iguais denominam-se decis e os valores que dividem os dados em cem partes iguais percentis. 30 MÓDULO VII - EXERCÍCIOS RESOLVIDOS 1. Uma amostra com dez preços de álcool foi extraída em diversos postos no dia 02/01/2007. Os preços em reais são: 1,00 1,25 1,35 1,09 1,19 1,25 1,12 1,45 1,39 1,19 Para a tabela acima determine: a) a mediana. Para o calculo da mediana devemos necessariamente colocar os dados em ordem. (Rol) 1,00 1,09 1,12 1,19 1,19 1,25 1,25 1,35 1,39 1,45 Temos aqui um conjunto com uma quantidade par de elementos (10 elementos). Devemos então fazer a média aritmética dos dois elementos centrais: b) a moda. Para o cálculo da moda não há necessidade de colocar os dados em ordem, porém a visualização dos valores que se repetem fica mais clara. O conjunto de dados é bimodal, pois há no conjunto dois valores que se repetem: 1,19 e 1,25. c) a média. O preço médio do álcool é de R$1,23 (arredondamento de duas casas decimais). 2. O peso em quilogramas de 50 alunos de uma academia está listado na tabela abaixo. 31 Tabela 5. Freqüências. Determine a média. Devemos lembrar que essa tabela mostra que existem 2 alunos com peso igual a 54 kg, 4 alunos com 58 kg e assim por diante. O número total de alunos é igual a 50. Neste caso, para o cálculo da média utilizamos a fórmula: Vamos fazer este cálculo utilizando a tabela. Tabela 5. Cálculo da Média. 32 O peso médio dos alunos da academia é de 68 kg. b) Moda. A moda é 74 (16 alunos pesam 74 kg). 3. A seguir estão listadas as mensalidades, em reais, do curso de línguas (2 horas semanais) em diversas escolas de um bairro. 240 350 250 300 320 285 450 600 198 Determine: a) Mediana. Para o calculo da mediana devemos necessariamente colocar os dados em ordem. (Rol) 198 240 250 285 300 320 350 450 600 Temos aqui um conjunto com uma quantidade ímpar de elementos (9 elementos). A mediana é o termo central. Me=300. Podemos dizer que 50% dos preços são maiores ou iguais a R$ 300,00 e 50% dos preços são menores ou iguais a R$ 300,00. b) Moda. O conjunto de dados é amodal (nenhum valor se repete). c) Média. 33 O valor médio é de R$332,56. 4. Um nutricionista indicou dietas diferentes para três grupos de pacientes. A tabela indica a perda de peso (em kg) por paciente. Tabela 7. Perda de Peso. Calcule a média, a mediana e a moda para cada um dos grupos. Grupo 1. A moda é igual a 4 kg. Grupo 2. A moda é igual a 2 kg. Grupo 3. 34 Bimodal: 4kg e 6 kg. Os resultados estão na tabela a seguir: Tabela 8. Resumo. Levando em consideração a média, podemos dizer que a dieta do grupo 1 foi a que teve mais efeito. A mediana para os grupos 1 e 3 foi a mesma, significando que 50% do peso perdido é maior ou igual a 4,5 kg e 50% menor ou igual a 4,5 kg. 5. Considere o histograma abaixo, para calcular a idade média dos alunos em um curso de Inglês. Gráfico 1. Histograma. 35 Para calcular a média, primeiramente vamos transportar os dados do gráfico para uma tabela. Tabela 9. Freqüências. Agora vamos calcular a média: Tabela 10. Cálculo da Média. 36 A idade média é 14,10 anos. 37 MÓDULO VIII - MEDIDAS DE DISPERSÃO Quando descrevemos nossos dados através das medidas de tendência central, necessitamos muitas vezes de complementos, denominados medidas de dispersão. As medidas de dispersão utilizadas são a amplitude, a variância, o desvio-padrão e o coeficiente de variação. As medidas de dispersão indicam o quanto os dados variam em torno da região central. 8.1 Amplitude A amplitude é a diferença entre o maior e o menor dado observado. Por utilizar apenas os extremos, a amplitude não é uma boa medida de dispersão. No exemplo 2 (capítulo 1) a amplitude é: 39000 - 520 - 3380. 8.2 Variância (s2) A variância é definida como a soma dos quadrados dos desvios dividida pelo tamanho da amostra menos 1. O desvio em relação à média é a diferença entre cada dado (xi) e a média do conjunto . Exemplo: Calcular a variância para o caso abaixo. Tabela 1. Tempo, em minutos. 38 No caso de uma distribuição de freqüências usamos a fórmula: onde xi é o ponto médio do intervalo de classe e fié a freqüência de cada classe. Tabela 2. Classes de salários. 8.3 Desvio-padrão (s) O desvio-padrão é a raiz quadrada positiva da variância. Para dados isolados: 39 Para dados agrupados: O desvio-padrão é uma das medidas de dispersão de maior interesse nas pesquisas em geral, pois ela é expressa na mesma unidade da variável em estudo. Verifique o exemplo abaixo: Vamos considerar as alturas, em centímetros, de 2 grupos de alunos de uma universidade. Tabela 3. Alturas. Devemos observar que, quanto maior o desvio-padrão, maior será a variação entre os dados analisados, e, quanto menor for o desvio-padrão, menor é a variação entre os dados analisados. No grupo 2, a variação entre as alturas é maior (desviopadrão 18,98 cm), e no grupo 1 (desvio-padrão 1,08 cm), a variação é menor. 8.4 Coeficiente de Variação (CV) O coeficiente de variação é o quociente entre o desvio-padrão e a média. 40 Podemos expressar o coeficiente de variação na forma de porcentagem. No exemplo acima temos: Grupo 1, com CV=0,71%, e Grupo 2, com CV=11,08%. 41 MÓDULO IX - Exercícios resolvidos 1. A variação do preço, em reais, da lata de óleo de soja em diversos mercados. Preços referentes a 03/01/2008. 2,50 2,70 2,30 2,45 2,60 2,10 2,65 2,15 2,35 2,70 Para os dados acima encontre: a) a média. O preço médio é de R$2,45. b) desvio-padrão. Para facilitar os cálculos, vamos construir uma tabela; veja a seguir: * arredondamento para duas casas decimais. 42 2. Para a tabela a seguir, determine: Tabela 4. Produção de Biodiesel. Determine: a) a média e o desvio-padrão da produção de Biodiesel de junho a dezembro de 2006. 43 b) a média e o desvio-padrão da produção de Biodiesel de janeiro a outubro de 2007. Desvio-Padrão: 44 O valor médio da produção de biodiesel, em 2006, foi de 3021,57 m³ e, em 2007, foi de 3112,4 m³. A variação da produção foi maior em 2007. 3. A tabela a seguir mostra os preços de venda no mercado atacadista de 3 produtos. 45 a) calcule o preço médio de cada produto nos meses de janeiro a outubro de 2007. b) calcule o desvio-padrão e o coeficiente de variação de cada produto nos meses de janeiro a outubro de 2007. c) analise os resultados do item b. Feijão Carioquinha – Tipo 1 46 Feijão Carioquinha – Tipo 2 47 Feijão Preto – Tipo 1. Resumindo os nossos dados temos: Após a análise, podemos concluir que o feijão preto tipo 1 possui menor preço médio e também a menor variação de preço. 48 Entre o feijão carioquinha tipos 1 e 2, o menor preço médio é o do tipo 2; a variação do tipo 1 é de aproximadamente 3% e a do tipo 2 é de 2,8%. 4. A tabela de freqüências abaixo mostra o número de professores agrupados por classes; de idade de uma Universidade. Calcule a média, a variância e o coeficiente de variação. Para o cálculo da média devemos primeiramente encontrar os pontos médios dos intervalos de classe; veja a seguir: Para o cálculo da média, fazemos: 49 *aproximação de duas casas decimais. Para o cálculo da variância temos: 50 Para o cálculo do coeficiente de variação temos: 5. Considere a tabela abaixo. Calcule a média, o desvio-padrão e o coeficiente de variação. Para o cálculo da média, temos: Para o desvio-padrão temos: 51 Para o coeficiente de variação temos: A média dos salários é de R$1156,67 com um coeficiente de variação de 17,6%. 6. Considere o histograma abaixo e calcule a variância e o coeficiente de variação. A idade média dos alunos já foi calculada no capítulo anterior, basta agora calcularmos o desvio-padrão e o coeficiente de variação. 52 A variação das idades dos alunos do curso de Inglês é de 18,87%. 53 Referências Bibliográficas LARSON e FARBER. Estatística Aplicada. São Paulo: Prentice Hall, 2004. LEVIN, J. e FOX, J.A. Estatística para ciências humanas. São Paulo: Prentice Hall, 2004. MOORE, D. A Estatística Básica e sua prática. Rio d Janeiro: LTC, 2000. NEUFELD, J. L. Estatística aplicada à Administração usando excel. São Paulo: Pearson Prentice Hall, 2003. PEREIRA, P. H. Noções de Estatística. São Paulo: Papirus, 2004. SPIEGEL, M. R. Estatística. São Paulo: Makron Books, 1993. VIEIRA, S. Introdução a Bioestatística. Rio de Janeiro: Campus, 1980. 54