1 introdução à estatística descritiva

Propaganda
ESTATÍSTICA DESCRITIVA
MÓDULO 1 - INTRODUÇÃO À ESTATÍSTICA DESCRITIVA
A Estatística, um ramo da Matemática, é aplicada em diferentes áreas, como
Administração, Engenharia, Medicina, Psicologia, Ciências Sociais etc.
Mas, para que serve a Estatística?
Antes de reportagens chegarem aos nossos lares, são elaboradas pesquisas em
que se utilizam amplamente os conceitos de Estatística, comprovando que essa
disciplina, que será estudada a partir de agora, é freqüentemente presente em
nosso cotidiano.
Veja os exemplos a seguir.
“Mais da metade da população brasileira (51%) está acima de seu peso ideal.
Uma pesquisa da Sociedade Brasileira de Cirurgia Bariátrica e Metabólica
(SBCBM) - realizada em todas as regiões do País com 2.179 pessoas - revela um
dado ainda mais preocupante: entre as pessoas de 18 a 25 anos, esse índice é de
66%.” Emilio Sant’Anna (estadão.com.br 05/01/2008).
“Um balanço feito para avaliar o desempenho orçamentário do governo federal
mostra que, dos 337 programas inscritos que tinham verba prevista em orçamento
para ser gasta em 2007, mais de 200 aplicaram menos de 80% dos recursos
autorizados. Isto é, cerca de 62% do total dos programas tiveram gastos
insatisfatórios. Apenas 37% deles, ou seja, 126, apresentaram execução acima de
80%, índice considerado razoável, já que também foram incluídas as despesas de
anos anteriores, os chamados restos a pagar, quitados em 2007. No entanto, em
valores absolutos, os gastos em 2007 foram os maiores dos últimos seis anos.”
Cecília Melo e Leandro Kleber (www.uol.com.br folhas abertas em 04/01/2008).
“Levantamento mostra que, apesar de mais alunos entrarem nas universidades
públicas, quantidade de formandos caiu 9,5% em 2 anos. Resultado revela perda
de eficiência das instituições, que são financiadas com verba pública; evasão é
tida como uma das causas.”
Fábio Takahashi (Folha de São Paulo, Cotidiano em 30/12/2007)
1.1 Estatística
Estatística é uma ciência que tem como finalidade coletar, organizar, descrever,
analisar e interpretar dados experimentais.
A Estatística pode ser classificada em:
1
Estatística Descritiva: Coleta, organização e descrição dos dados experimentais.
Estatística Indutiva: Análise e interpretação dos dados experimentais.
1.2 População e amostra
População é um conjunto de elementos que possuem, em comum, determinada
característica. As populações podem ser finitas, como o conjunto constituído pelo
número de peças produzidas por uma máquina em um determinado dia, ou
infinitas, como o número de vezes que podemos lançar um dado.
Muitas vezes se torna difícil, ou até mesmo impossível, observar todo um grupo,
especialmente se esse for muito grande. Nesses casos, podemos utilizar apenas
uma parte desse, denominado amostra.
A amostra deve ser representativa da população, retratando com fidelidade suas
características, ja que por meio dessa amostra serão tiradas as conclusões para
toda a população.
Após ser definida a população, precisamos estabelecer uma técnica de
amostragem, ou seja, um procedimento para a escolha da amostra, entre as quais
destacamos: amostragem casual simples, amostragem sistemática, amostragem
estratificada, amostragem de conveniência.
1.3 Técnicas de amostragem
1.3.1 Amostragem casual simples
É um procedimento em que os elementos para as amostras são retirados ao
acaso. Assim, todo elemento da população tem igual probabilidade de pertencer à
amostra.
A amostragem casual simples é equivalente a um sorteio numérico.
1.3.2 Amostragem sistemática
Neste procedimento os elementos que compõem a amostra, não são escolhidos
por acaso; pelo contrário, estes elementos devem ser ordenados e a retirada deve
ser feita através de um sistema.
Exemplo: Na produção de parafusos de uma máquina podemos retirar um a cada
dez parafusos produzidos.
1.3.3 Amostragem estratificada
É um procedimento por meio do qual retiramos elementos para amostra de
diversos estratos da população.
2
Para obtermos uma boa amostra, o processo deve ser tal que o número de
elementos retirados seja proporcional ao número de elementos de cada estrato.
Exemplo: Para obtermos uma amostra estratificada da cidade de São Paulo,
devemos obter uma amostra de cada um dos bairros da cidade.
1.3.4 Amostragem por conveniência
A amostra de conveniência é formada por elementos que estão disponíveis para o
pesquisador.
Por exemplo, um médico que quer realizar uma pesquisa sobre determinado
medicamento, para sua conveniência, realiza a pesquisa com pacientes do
hospital em que trabalha.
3
MÓDULO II - DADOS
Os dados são as informações obtidas através de observações, medidas,
respostas de pesquisas ou contagens em geral.
2.1 Classificação dos dados
Os dados podem ser classificados em:
Dados qualitativos: classificação por tipos ou atributos.
Exemplos:
A cor dos olhos (azuis, castanhos, verdes etc.) das modelos de uma determinada
agência.
Qualidade (defeituosa ou não defeituosa) de peças produzidas por uma máquina.
Grupo sanguíneo (A, B, AB ou O) dos alunos doadores de sangue da
Universidade.
Dados quantitativos: quando seus valores são expressos em números.
Exemplos:
O peso líquido de cada um dos sabonetes produzidos por uma empresa.
A altura dos alunos do 1º ano do Ensino Médio.
O diâmetro de parafusos produzidos por uma máquina.
2.2 Representação de dados em tabelas
Os dados podem ser apresentados através de uma tabela.
Dados isolados
No caso de dados qualitativos, a descrição através de uma tabela é muito simples.
4
A tabela acima mostra o número de pessoas matriculadas em cada modalidade de
ensino; este número é denominado freqüência (fi).
Podemos também encontrar a freqüência relativa para cada modalidade; para
isso basta dividir a freqüência de cada modalidade pelo total de freqüências (n).
Veja o exemplo:
* arredondamento de duas casas decimais.
2.3 Distribuições de freqüências
5
Uma distribuição de freqüência é uma tabela de intervalos de classes com o
número total de entradas de dados em cada classe.
A freqüência (fi) de uma classe é o número de entrada de dados na classe.
Veja o exemplo.
A seguir, estão listados os salários, em reais, de cinqüenta funcionários de um
determinado setor de uma empresa automobilística:
2500
1800
2200
680
700
950
1050
980
1090
2100
600
750
1800
1200
520
2450
1490
1600
1800
2000
3000
2800
2100
1900
1880
2300
2750
3200
3800
3700
3500
900
1980
2900
2650
2700
2900
2600
2650
2800
3800
3900
3100
3250
1550
1800
2100
3700
3800
3100
Para organizar a tabela de salários, em reais, devemos construir uma tabela de
freqüências. Podemos observar que o menor salário é o de 520 e o maior é de
3900; definimos então intervalos de classes iguais de 500 reais, ou seja, de 500 a
1000, 1000 a 1500 e assim por diante.
Observação: Uma fórmula utilizada para o cálculo do número de classes é:
K=1+3,222. log n, onde k é o número de classes, n é o número de elementos do
conjunto.
No exemplo acima temos: K=1+3,222. log 50 6,47.
Embora exista uma fórmula para o número de intervalos de classe, muitos
pesquisadores determinam o número de intervalos dependendo da situação. Um
número de classes pequeno não é aconselhável, pois há perda de informação. Um
número de classes grande é desnecessário na maioria dos casos.
A freqüência (fi) neste caso é o número de funcionários que estão incluídos na
classe de salários.
Temos que fi n , onde n é o número total de elementos da amostra.
6
Usamos a notação 500 |—1000, onde o intervalo é fechado à esquerda
(pertencem à classe os valores iguais ao extremo inferior) e aberto à direita (não
pertencem à classe os valores iguais ao extremo superior).
Amplitude do intervalo de uma classe é a diferença entre o limite superior e o
inferior.
Temos no exemplo 1000-500=500; logo, a amplitude do intervalo de classe é de
500 reais.
O Ponto médio de um intervalo de classe é a metade da soma do limite inferior e
o limite superior.
Veja o exemplo:
A freqüência relativa (fr) de uma classe é a freqüência (fi) desta classe dividida
pelo total de elementos da amostra(n).
7
A Freqüência Acumulada (fa) de uma classe é a soma da freqüência daquela
classe com a de todas as classes anteriores.
Veja o exemplo:
8
MÓDULO III - REPRESENTAÇÃO DE DADOS EM GRÁFICOS
A representação dos dados através de gráficos possibilita uma rápida
visualização.
Gráfico de barras
Para construção do gráfico de barras utilizamos o sistema de eixos cartesianos.
No eixo das abscissas (x) ou ordenadas (y) representamos as variáveis em
estudo; no outro eixo (abscissas ou ordenadas) ainda não utilizado,
representamos as freqüências.
Podemos representar a tabela 1 através de um gráfico de barras.
Gráfico 1. Número de matrículas de Educação Básica no Brasil.
Diagrama de Pareto
Um gráfico de barras em que as categorias estão dispostas em ordem
decrescente em relação as freqüências relativas é denominado diagrama de
Pareto.
A tabela, a seguir, mostra as reclamações mais freqüentes em relação aos
Bancos.
9
Fonte: Banco Central do Brasil (http://www3.bcb.gov.br/ ranking/idxrc.do)
Gráfico 2. Diagrama de Pareto.
A linha que aparece no gráfico 2 representa as freqüências relativas 5 elativas
acumuladas.
Gráfico de setores
O gráfico de setores é construído da seguinte maneira: construímos uma
circunferência (360º) e fazemos a divisão dos setores utilizando as freqüências
relativas.
Usamos a regra de três para saber o valor de cada ângulo do setor.
O gráfico de setores a seguir refere-se à tabela 1.
10
Gráfico 3. Setores.
Também podemos construir os gráficos utilizando as freqüências relativas.
Fonte: Revista Quatro Rodas
Veja o gráfico de barras que representa os dados da tabela 8.
Gráfico 4. Diagrama de Barras.
11
Veja o gráfico de setores que representa a tabela 8.
Gráfico 5. Setores.
Histograma
O histograma é um gráfico composto por retângulos justapostos em que a base de
cada um deles corresponde ao intervalo de classe, e a sua altura, à respectiva
freqüência. No exemplo abaixo, usamos o ponto médio de cada classe para
construir o histograma.
O gráfico a seguir representa os dados da tabela 3.
Gráfico 6. Histograma.
12
Polígono de freqüências
Os dados apresentados em tabelas de distribuição de freqüências, também
podem ser representados em um polígono de freqüências.
A construção de um polígono de freqüências é bastante simples: a partir do
histograma, basta ligarmos os pontos médios de cada classe. Para fechar o
polígono, unimos os extremos da figura com o eixo horizontal, no ponto médio da
classe anterior à primeira e no ponto médio da posterior à última classe.
Veja o exemplo a seguir referente à tabela 3.
Gráfico 7. Histograma e Polígono de freqüências.
Ou ainda,
Gráfico 8. Polígono de Freqüências.
13
Podemos também transportar os dados de um gráfico para uma tabela de
distribuição de freqüências.
Uma amostra de peças produzidas por certa máquina forneceu a distribuição de
comprimentos das peças dada através do histograma abaixo.
Gráfico 9. Histograma.
14
MÓDULO IV - Exercícios resolvidos
1. A videolocadora “ALUGUE JÁ” anotou as locações do dia 24/12/2007, obtendo
os dados da tabela a seguir:
Para a tabela, pedem-se:
a) as freqüências relativas.
b) construir um gráfico de barras.
15
c) construir o gráfico de setores.
Usamos a regra de três para calcularmos o valor do ângulo de cada um dos
setores.
Drama
Comédia
Ficção
16
Suspense
Outros
3. A seguir, estão listados os rendimentos mensais de 30 famílias.
17
Para a tabela acima, pedem-se:
a) Agrupar os dados em uma tabela de distribuição de freqüências. (Use intervalos
iguais de 500 reais, iniciando com o intervalo 500 |—1000).
Para agruparmos os dados entre 500|—1000, contamos os valores entre
500(incluir) e 1000(não incluir). Esses valores estão pintados na tabela de azul
piscina.
Para agruparmos os dados entre 1000|—1500, contamos os valores entre
1000(incluir) e 1500(não incluir). Esses valores estão pintados na tabela de
amarelo.
Para agruparmos os dados entre 1500|—2000, contamos os valores entre
1500(incluir) e 2000(não incluir). Esses valores estão pintados na tabela de cinza.
Para agruparmos os dados entre 2000|—2500, contamos os valores entre
2000(incluir) e 2500(não incluir). Esses valores estão pintados na tabela de verde.
Para agruparmos os dados entre 2500|—3000, contamos os valores entre
2500(incluir) e 3000(não incluir). Esses valores estão pintados na tabela de rosa.
Para agruparmos os dados entre 3000|—3500, contamos os valores entre
3000(incluir) e 3500(não incluir). Esses valores estão pintados na tabela de
Laranja.
Veja como ficou o resultado:
18
b) Encontre os pontos médios dos intervalos de classe.
c) Encontre as freqüências relativas.
Devemos lembrar que a soma de todas as freqüências relativas deve ser igual a 1
ou 100%.
19
d) Encontre as freqüências acumuladas.
A freqüência acumulada da última classe deverá ser igual à freqüência total.
e) Desenhe um histograma e o polígono de freqüências para a tabela.
20
MÓDULO V - Outros Exercícios resolvidos
1. Analise o gráfico e responda às questões abaixo.
Gráfico 14. Gráfico de Barras.
a) Qual é a freqüência relativa do intervalo de classe de ponto médio igual a 4?
Neste caso, qual é o significado desta freqüência?
Freqüência total=6+5+8+2+3=24 pessoas.
A freqüência relativa é igual
6
 0,25 ou 25%.
24
Podemos dizer que no dia 02/01/2008, 25% dos clientes demoraram 4 minutos no
caixa.
b) Qual dos intervalos possui maior freqüência?
A maior freqüência é de 8 pessoas, elas demoraram 12 minutos no caixa.
c) Qual dos intervalos possui menor freqüência?
A menor freqüência é de 2 pessoas, elas demoraram 16 minutos no caixa.
2. Observe o histograma abaixo, onde as notas foram dadas através dos pontos
médios das classes e complete a tabela.
Gráfico 15. Histograma.
21
O intervalo de cada classe é de 2. Podemos calcular os extremos inferiores e
superiores de cada classe através do ponto médio e do intervalo de classe,
lembrando que:
Para o primeiro intervalo de classe temos:
Extremo inferior: x
Extremo superior: x+2
Ponto médio: 1
e
As freqüências são facilmente visíveis no gráfico abaixo:
As freqüências relativas e acumuladas são calculadas abaixo:
22
3. Uma empresa de aviação recebeu em determinado período algumas
reclamações de passageiros, que estão relacionadas na tabela a seguir.
Para tal situação, construir um diagrama de pareto.
Primeiramente, vamos calcular as freqüências relativas e freqüências relativas
acumuladas.
23
O gráfico acima é composto da seguinte maneira: o gráfico de barras refere-se às
reclamações x freqüências relativas e o gráfico de linha refere-se às reclamações
x freqüências relativas acumuladas.
24
MÓDULO VI - MEDIDAS DE TENDÊNCIA CENTRAL
6.1 Média aritmética
Uma das mais importantes medidas estatísticas utilizadas é a média. Ela é, por
exemplo, utilizada no cálculo de nossa média escolar.
A média caracteriza o centro da distribuição de freqüências; ela é considerada o
ponto de equilíbrio de uma distribuição.
Cálculo da média aritmética para dados isolados
A média aritmética representada por x , é dada pela soma x 1 x 2 ... x n , dividida por
n (número total da amostra), ou seja:
Veja o exemplo a seguir:
Um administrador deseja calcular o tempo médio de espera do lanche “X TUDO”
em sua lanchonete. Para isso, analisa uma amostra de 10 pedidos, cujo tempo de
espera está listado a seguir:
Tabela 1.
A média é calculada da seguinte maneira:
Cálculo da média aritmética para o caso de distribuição de freqüências.
Exemplo: Em uma amostra de 40 parafusos produzidos por uma metalúrgica,
foram medidos os diâmetros, em milímetros, conforme a tabela abaixo. Qual é a
medida média do diâmetro?
Tabela 2. Freqüências.
25
Neste caso utilizamos a fórmula:
,pois a tabela mostra que existem 5 parafusos com diâmetro igual a 1,1mm, 10
parafusos com diâmetro 1,2 mm e assim por diante.
Tabela 3.
Veja o outro exemplo a seguir:
onde xi é representado pelo ponto médio da classe.
26
Tabela 4. Classes de salários.
6.2 Mediana (Me)
A mediana é uma medida de tendência central. Ela divide um conjunto ordenado
de dados em duas partes com igual número de elementos.
No caso de dados isolados temos:
Se a amostra é constituída por um número ímpar de elementos, a mediana é o
valor que fica no centro dos dados ordenados.
Exemplo: 20, 20, 24, 25, 30.
A mediana é 24.
Se a amostra é constituída por um número par de elementos, a mediana é a
média aritmética dos dois valores centrais dos dados ordenados.
Exemplo: 20, 20, 24, 26, 30 e 36
A mediana é
27
Curiosidade: Para os dados agrupados, a mediana é calculada através da fórmula:
onde:
Li: limite inferior da classe que contém a mediana.
n: freqüência total.
fai: soma de todas as freqüências das classes anteriores à mediana.
fme: freqüência da classe que contém a mediana.
c: amplitude do intervalo da classe da mediana.
Qual é a diferença entre média e mediana?
Embora sejam duas medidas de tendência central, a média e a mediana
possuem conceitos diferentes. Observe o conjunto de dados abaixo:
2, 3, 4, 5, 9, 15, 35, 98.
Calculando a média obtemos:
Calculando a mediana obtemos:
O que podemos perceber nesse caso é que o cálculo da média levou em
consideração todos os valores do conjunto de dados numéricos, sendo assim infl
uenciada pelos maiores valores. A mediana levou apenas em consideração os
seus dois valores centrais.
Embora a média aritmética seja bastante utilizada, há casos em que a mediana
descreve melhor a situação. Cabe ao pesquisador procurar a medida mais
conveniente.
6.3 Moda
28
A moda de um conjunto de dados é o valor que ocorre com maior freqüência.
Exemplo.
Para o conjunto de dados: 10, 12, 12, 23, 12, 25, 20, a moda é 12.
Curiosidade: Para os dados agrupados, a moda é calculada através da fórmula:
, onde:
Li: limite inferior da classe modal.
d1: diferença entre a freqüência classe modal e a classe imediatamente anterior.
d2: diferença entre a freqüência classe modal e a classe imediatamente seguinte.
c: amplitude do intervalo da classe modal.
Um conjunto de dados pode ser:
Amodal: quando nenhum dado se repete.
Exemplo. 2, 3, 5, 9, 10 e 12.
Modal: quando um valor se repete.
Exemplo: 3, 4, 4, 4, 5, 6, 7 e 9.
Moda: 4.
Bimodal: quando dois valores se repetem.
Exemplo. 3, 4, 4, 5, 6, 6, 7 e 10.
Moda: 4 e 6.
Trimodal: quando três valores se repetem.
Exemplo. 1, 2, 2, 3, 4, 4, 5, 6, 6 e 8.
Moda: 2, 4 e 6.
Polimodal: mais do que três valores se repetem.
Exemplo. 1, 1, 1, 2, 3, 3, 3, 4, 5, 5, 5, 6, 7, 7, 7, 8, 9, 10.
Moda: 1, 3, 5 e 7.
6.4 Medidas de posição (quartis, decis e percentis)
Para o conjunto de dados ordenados temos que os valores que dividem o conjunto
em quatro partes iguais são denominados quartis. Esses valores que podem ser
29
representados por Q1, Q2 e Q3 denominam-se primeiro, segundo e terceiros
quartis, respectivamente.
Os valores que dividem o conjunto ordenado em dez partes iguais denominam-se
decis e os valores que dividem os dados em cem partes iguais percentis.
30
MÓDULO VII - EXERCÍCIOS RESOLVIDOS
1. Uma amostra com dez preços de álcool foi extraída em diversos postos no dia
02/01/2007. Os preços em reais são:
1,00
1,25
1,35
1,09
1,19
1,25
1,12
1,45
1,39
1,19
Para a tabela acima determine:
a) a mediana.
Para o calculo da mediana devemos necessariamente colocar os dados em
ordem. (Rol)
1,00
1,09
1,12
1,19
1,19
1,25
1,25
1,35
1,39
1,45
Temos aqui um conjunto com uma quantidade par de elementos (10 elementos).
Devemos então fazer a média aritmética dos dois elementos centrais:
b) a moda.
Para o cálculo da moda não há necessidade de colocar os dados em ordem,
porém a visualização dos valores que se repetem fica mais clara.
O conjunto de dados é bimodal, pois há no conjunto dois valores que se repetem:
1,19 e 1,25.
c) a média.
O preço médio do álcool é de R$1,23 (arredondamento de duas casas decimais).
2. O peso em quilogramas de 50 alunos de uma academia está listado na tabela
abaixo.
31
Tabela 5. Freqüências.
Determine a média.
Devemos lembrar que essa tabela mostra que existem 2 alunos com peso igual a
54 kg, 4 alunos com 58 kg e assim por diante. O número total de alunos é igual a
50.
Neste caso, para o cálculo da média utilizamos a fórmula:
Vamos fazer este cálculo utilizando a tabela.
Tabela 5. Cálculo da Média.
32
O peso médio dos alunos da academia é de 68 kg.
b) Moda.
A moda é 74 (16 alunos pesam 74 kg).
3. A seguir estão listadas as mensalidades, em reais, do curso de línguas (2 horas
semanais) em diversas escolas de um bairro.
240
350
250
300
320
285
450
600
198
Determine:
a) Mediana.
Para o calculo da mediana devemos necessariamente colocar os dados em
ordem. (Rol)
198
240
250
285
300
320
350
450
600
Temos aqui um conjunto com uma quantidade ímpar de elementos (9 elementos).
A mediana é o termo central.
Me=300.
Podemos dizer que 50% dos preços são maiores ou iguais a R$ 300,00 e 50% dos
preços são menores ou iguais a R$ 300,00.
b) Moda.
O conjunto de dados é amodal (nenhum valor se repete).
c) Média.
33
O valor médio é de R$332,56.
4. Um nutricionista indicou dietas diferentes para três grupos de pacientes. A
tabela indica a perda de peso (em kg) por paciente.
Tabela 7. Perda de Peso.
Calcule a média, a mediana e a moda para cada um dos grupos.
Grupo 1.
A moda é igual a 4 kg.
Grupo 2.
A moda é igual a 2 kg.
Grupo 3.
34
Bimodal: 4kg e 6 kg.
Os resultados estão na tabela a seguir:
Tabela 8. Resumo.
Levando em consideração a média, podemos dizer que a dieta do grupo 1 foi a
que teve mais efeito.
A mediana para os grupos 1 e 3 foi a mesma, significando que 50% do peso
perdido é maior ou igual a 4,5 kg e 50% menor ou igual a 4,5 kg.
5. Considere o histograma abaixo, para calcular a idade média dos alunos em um
curso de Inglês.
Gráfico 1. Histograma.
35
Para calcular a média, primeiramente vamos transportar os dados do gráfico para
uma tabela.
Tabela 9. Freqüências.
Agora vamos calcular a média:
Tabela 10. Cálculo da Média.
36
A idade média é 14,10 anos.
37
MÓDULO VIII - MEDIDAS DE DISPERSÃO
Quando descrevemos nossos dados através das medidas de tendência central,
necessitamos muitas vezes de complementos, denominados medidas de
dispersão. As medidas de dispersão utilizadas são a amplitude, a variância, o
desvio-padrão e o coeficiente de variação.
As medidas de dispersão indicam o quanto os dados variam
em torno da região central.
8.1 Amplitude
A amplitude é a diferença entre o maior e o menor dado observado.
Por utilizar apenas os extremos, a amplitude não é uma boa medida de dispersão.
No exemplo 2 (capítulo 1) a amplitude é: 39000 - 520 - 3380.
8.2 Variância (s2)
A variância é definida como a soma dos quadrados dos desvios dividida pelo
tamanho da amostra menos 1.
O desvio em relação à média é a diferença entre cada dado (xi) e a média do
conjunto .
Exemplo: Calcular a variância para o caso abaixo.
Tabela 1. Tempo, em minutos.
38
No caso de uma distribuição de freqüências usamos a fórmula:
onde xi é o ponto médio do intervalo de classe e fié a freqüência de cada classe.
Tabela 2. Classes de salários.
8.3 Desvio-padrão (s)
O desvio-padrão é a raiz quadrada positiva da variância.
Para dados isolados:
39
Para dados agrupados:
O desvio-padrão é uma das medidas de dispersão de maior interesse nas
pesquisas em geral, pois ela é expressa na mesma unidade da variável em
estudo.
Verifique o exemplo abaixo:
Vamos considerar as alturas, em centímetros, de 2 grupos de alunos de uma
universidade.
Tabela 3. Alturas.
Devemos observar que, quanto maior o desvio-padrão, maior será a variação
entre os dados analisados, e, quanto menor for o desvio-padrão, menor é a
variação entre os dados analisados.
No grupo 2, a variação entre as alturas é maior (desviopadrão 18,98 cm), e no
grupo 1 (desvio-padrão 1,08 cm), a variação é menor.
8.4 Coeficiente de Variação (CV)
O coeficiente de variação é o quociente entre o desvio-padrão e a média.
40
Podemos expressar o coeficiente de variação na forma de porcentagem.
No exemplo acima temos: Grupo 1, com CV=0,71%, e Grupo 2, com CV=11,08%.
41
MÓDULO IX - Exercícios resolvidos
1. A variação do preço, em reais, da lata de óleo de soja em diversos mercados.
Preços referentes a 03/01/2008.
2,50
2,70
2,30
2,45
2,60
2,10
2,65
2,15
2,35
2,70
Para os dados acima encontre:
a) a média.
O preço médio é de R$2,45.
b) desvio-padrão.
Para facilitar os cálculos, vamos construir uma tabela; veja a seguir:
* arredondamento para duas casas decimais.
42
2. Para a tabela a seguir, determine:
Tabela 4. Produção de Biodiesel.
Determine:
a) a média e o desvio-padrão da produção de Biodiesel de junho a dezembro de
2006.
43
b) a média e o desvio-padrão da produção de Biodiesel de janeiro a outubro de
2007.
Desvio-Padrão:
44
O valor médio da produção de biodiesel, em 2006, foi de 3021,57 m³ e, em 2007,
foi de 3112,4 m³. A variação da produção foi maior em 2007.
3. A tabela a seguir mostra os preços de venda no mercado atacadista de 3
produtos.
45
a) calcule o preço médio de cada produto nos meses de janeiro a outubro de
2007.
b) calcule o desvio-padrão e o coeficiente de variação de cada produto nos meses
de janeiro a outubro de 2007.
c) analise os resultados do item b.
Feijão Carioquinha – Tipo 1
46
Feijão Carioquinha – Tipo 2
47
Feijão Preto – Tipo 1.
Resumindo os nossos dados temos:
Após a análise, podemos concluir que o feijão preto tipo 1 possui menor preço
médio e também a menor variação de preço.
48
Entre o feijão carioquinha tipos 1 e 2, o menor preço médio é o do tipo 2; a
variação do tipo 1 é de aproximadamente 3% e a do tipo 2 é de 2,8%.
4. A tabela de freqüências abaixo mostra o número de professores agrupados por
classes; de idade de uma Universidade.
Calcule a média, a variância e o coeficiente de variação.
Para o cálculo da média devemos primeiramente encontrar os pontos médios dos
intervalos de classe; veja a seguir:
Para o cálculo da média, fazemos:
49
*aproximação de duas casas decimais.
Para o cálculo da variância temos:
50
Para o cálculo do coeficiente de variação temos:
5. Considere a tabela abaixo.
Calcule a média, o desvio-padrão e o coeficiente de variação.
Para o cálculo da média, temos:
Para o desvio-padrão temos:
51
Para o coeficiente de variação temos:
A média dos salários é de R$1156,67 com um coeficiente de variação de 17,6%.
6. Considere o histograma abaixo e calcule a variância e o coeficiente de variação.
A idade média dos alunos já foi calculada no capítulo anterior, basta agora
calcularmos o desvio-padrão e o coeficiente de variação.
52
A variação das idades dos alunos do curso de Inglês é de 18,87%.
53
Referências Bibliográficas
LARSON e FARBER. Estatística Aplicada. São Paulo: Prentice Hall, 2004.
LEVIN, J. e FOX, J.A. Estatística para ciências humanas. São Paulo: Prentice Hall,
2004.
MOORE, D. A Estatística Básica e sua prática. Rio d Janeiro: LTC, 2000.
NEUFELD, J. L. Estatística aplicada à Administração usando excel. São Paulo:
Pearson Prentice Hall, 2003.
PEREIRA, P. H. Noções de Estatística. São Paulo: Papirus, 2004.
SPIEGEL, M. R. Estatística. São Paulo: Makron Books, 1993.
VIEIRA, S. Introdução a Bioestatística. Rio de Janeiro: Campus, 1980.
54
Download