Unidade 5

Propaganda
Universidade Federal do Pará
Instituto de Ciências Exatas e Naturais
Faculdade de Estatística
Estatística
Prof.ª Marina Yassuko Toma
Belém - Pará
2014
5 - MEDIDAS DE TENDÊNCIA CENTRAL
São medidas representativas das características avaliadas pelos seus valores
centrais, em torno dos quais tendem a concentrar-se os dados. Tais medidas
possibilitam comparações de séries de dados pelo confronto de seus valores. As
medidas de tendência centrais mais utilizadas são: média aritmética, moda e
mediana.
5.1. MÉDIA ARITMÉTICA: X
A média aritmética é obtida pela soma de todos os valores de uma variável X
dividida pelo número total de observações (n):
n
 Xi
X  X 2  ...  Xn i 1
.
X 1

n
n
Exemplo: Sabendo-se que o atendimento diário em uma empresa de arquitetura,
durante uma semana foi de 10, 14, 13, 15, 16, 18 e 12 pessoas, temos para
atendimento médio diário na semana de:
X
10  14  13  15  16  18  12
 14 pessoas.
7
Se os dados estão agrupados em uma distribuição de frequência, devem ser
consideradas duas possibilidades:
a) Sem intervalos de classe: Consideremos a distribuição relativa a 34 famílias de
quatro filhos, tomando para variável o número de filhos do gênero masculino.
Calcularemos a quantidade média de meninos por família:
Nº de meninos
0
1
2
3
4
Total
Nº de famílias ( f i )
2
6
10
12
4
34
Como as frequências são números indicadores da intensidade de cada valor
da variável, elas funcionam como fatores de ponderação, o que nos leva a calcular a
média aritmética ponderada, dada pela fórmula:
k
 ( fi  Xi )
f X  f2 X 2  ...  fk Xk
X 1 1
 i 1
k
f1  f2  ...  fk
k
em que
f
i 1
 fi
i
n
i 1
Que na prática pode ser determinado como:
xi
0
1
2
3
4
Total
fi
2
6
10
12
4
34
xi.fi
0
6
20
36
16
78
k
Logo X 
 X i  fi 
i 1
k
 78/34 = 2,3  2
 fi
i 1
b) Com intervalos de classe: Neste caso, convencionamos que todos os valores
incluídos em um determinado intervalo de classe coincidem com o seu ponto médio,
e determinamos a média aritmética ponderada por meio da fórmula com
X i agora
sendo o ponto médio da classe.
Exemplo: Calcular a estatura média de bebês conforme a tabela abaixo.
Estaturas (cm) Frequência ( f i )
50 |─ 54
4
54 |─ 58
9
58 |─ 62
11
62 |─ 66
8
66 |─ 70
5
70 |─ 74
3
Total
40
Aplicando a fórmula acima temos: X 
Ponto médio ( X i )
X i fi
52
56
60
64
68
72
208
504
660
512
340
216
2.440
 ( Xi  fi )  2440  61. Logo:
40
 fi
X  61 cm
5.2. MEDIANA ( Md )
Colocados os valores em ordem crescente de grandeza (rol), a mediana
( M d ) será o valor que ocupa a posição central da série de dados, ou seja, é o valor
que divide a série em duas partes com números iguais de elementos. A mediana é
preferível à média quando se está interessado em conhecer exatamente o centro da
distribuição dos dados, ou ainda, quando os valores extremos podem afetar
sensivelmente a média. O cálculo da mediana é feito sob duas condições:
5.2.1. A MEDIANA EM DADOS NÃO-AGRUPADOS
Dada uma série de valores como, por exemplo: {5, 2, 6, 13, 9, 15, 10}.
De acordo com a definição de mediana, o primeiro passo a ser dado é o da
ordenação (crescente ou decrescente) dos valores: {2, 5, 6, 9, 10, 13, 15}.
O valor que divide a série acima em duas partes iguais é igual a 9, logo M d = 9.
i) Método prático para o cálculo da Mediana:
a) Se a série de dados tiver número ímpar de termos: O valor mediano será o
termo que ocupa a posição central do rol, ou seja, o termo cuja posição é dada pela
fórmula: (n + 1)/2
Ex: Calcule a mediana da série {1, 3, 0, 0, 2, 4, 1, 2, 5}
1º - ordenar a série {0, 0, 1, 1, 2, 2, 3, 4, 5}
2º - calcular a posição: n = 9 logo (n + 1)/2 é dado por (9+1) / 2 = 5, ou seja, o 5º
elemento da série ordenada será a mediana.
Portanto, a mediana será o 5º elemento, então M d = 2
b) Se a série dada tiver número par de termos: O valor mediano será a média
aritmética dos valores centrais do rol, ou seja, os termos que ocupam a posição n/2
e n/2+1
Ex: Calcule a mediana da série {1, 3, 0, 0, 2, 4, 1, 3, 5, 6}
1º - ordenar a série {0, 0, 1, 1, 2, 3, 3, 4, 5, 6}
2º - calcular a posição: n = 10 logo a mediana será a média aritmética do termo que
ocupa a posição n/2 = 10/2 =5, ou seja, o 5º termo e do termo que ocupa a posição
n/2+1 = 10/2+1 = 6, ou seja, o 6º termo. No rol: 5º termo = 2 e 6º termo = 3
A mediana será a média aritmética do 5º e 6º termos da série, ou seja = (2+3) / 2 ou
seja, M d = 2,5.
5.2.2. A MEDIANA EM DADOS AGRUPADOS
a) Sem intervalos de classe: Neste caso, é o bastante identificar a frequência
acumulada ( FAc ) imediatamente superior à metade da soma das frequências. A
mediana será aquele valor da variável que corresponde a tal Frequência
acumulada.
Exemplo: conforme distribuição de frequências abaixo:
Variável ( X i )
0
1
2
3
4
Total
Frequência ( f i ) Frequência acumulada ( FAc(i ) )
2
6
9
13
5
35
2
8
17
30
35
-
Quando o somatório das frequências for ímpar o valor mediano será o termo que
ocupa a posição dada pela fórmula:
f
i
1
2
Como o somatório das frequências = 35 a fórmula ficará: (35+1)/2 = 18º termo.
Localizando na coluna da variável (Xi), M d = 3.
Quando o somatório das frequências for par o valor mediano será a média aritmética
dos valores centrais da distribuição, ou seja, os termos que ocupam a posição
e
f
2
i
f
i
2
1
Exemplo: Calcule a Mediana da distribuição de frequências abaixo:
Variável ( X i ) Frequência ( f i ) Frequência acumulada ( FAc(i ) )
12
14
15
16
17
20
Total
1
2
1
2
1
1
8
1
3
4
6
7
8
-
Localizando a posição da mediana na frequência acumulada teremos: 8/2 = 4º termo
e 8/2+1 = 5º termo. Localizando na coluna da variável (Xi), o 4º termo = 15 e o 5º
termo = 16. Logo M d = (15 + 16) / 2 = 15,5
b) Com intervalos de classe: Devemos seguir os seguintes passos:
1º) Determinamos as frequências acumuladas;
2º) Calculamos
f
2
i
para localizar a classe mediana;
3º) Marcamos a classe correspondente à frequência acumulada imediatamente
superior à
f
2
i
. Tal classe será a classe mediana;
4º) Calculamos a Mediana pela fórmula:
  fi

n

 FAc(ant ) 
 FAc(ant ) 


  h  li   2
Md  li   2
 h
fi
fi








onde: li = Limite inferior da classe da mediana (aquela que contém o elemento n/2);
FAc(ant) = Frequência acumulada anterior da classe da Md ;
f i = Frequência simples da classe da mediana;
h = Intervalo de classe.
Exemplo:
Classes Frequência ( f i ) Frequência acumulada ( FAc( i ) )
50 |─ 54
54 |─ 58
58 |─ 62
62 |─ 66
66 |─ 70
70 |─ 74
Total
4
9
11
8
5
3
40
1º Localizar a classe mediana:
4
13
24
32
37
40
 fi
2

n 40

 20 . A frequência acumulada que
2 2
contém a 20ª unidade é a 3ª classe (classe mediana será 58 |─ 62)
2º Identificar os elementos da fórmula na classe mediana:
l i = 58; FAc(ant) = 13; h = 4 e fi = 11;
3º Substituindo esses valores na fórmula, obtemos: Md  58 
20  13.  4  60,54
11
Obs: Esta mediana é estimada, pois não temos os 40 valores da distribuição.
5.3. MODA ( Mo )
A moda ( Mo ) é o valor que ocorre com maior frequência ou o valor que mais
se repete. Quando a série de dados é tal que as frequências são maiores nos
extremos, ou quando se quer destacar um valor de alta frequência ou quando se
pretende obter uma medida rápida e aproximada da tendência central, a moda pode
então, ser considerada para a interpretação dos dados. Com relação à moda, uma
série de dados pode ser classificada em amodal (não possui moda), unimodal
(possui apenas uma moda), bimodal (possui duas modas) ou multimodal (possui
mais de duas modas).
5.3.1. A Moda quando os dados não estão agrupados
A moda é facilmente reconhecida: basta, de acordo com definição, procurar o valor
que mais se repete.
Ex: Na série {7, 8, 9, 10, 10, 10, 11, 12} a moda é igual a 10.
Há séries nas quais não exista valor modal, isto é, nas quais nenhum valor apareça
mais vezes que outros.
Ex: {3, 5, 8, 10, 12} não apresenta moda. A série é amodal.
Em outros casos, pode haver dois ou mais valores de concentração. Dizemos,
então, que a série tem dois ou mais valores modais.
Ex: {2, 3, 4, 4, 4, 5, 6, 7, 7, 7, 8, 9 } apresenta duas modas: 4 e 7. A série é bimodal.
5.3.2. A Moda quando os dados estão agrupados
a) Sem intervalos de classe: Uma vez agrupados os dados, é possível determinar
imediatamente a moda: basta localizar o valor da variável de maior frequência.
Ex: Qual a temperatura mais comum medida no mês abaixo:
Temperatura
0º C
1º C
2º C
3º C
Frequência
3
9
12
6
Resp: 2º C é a temperatura modal, pois é a de maior Frequência .
b) Com intervalos de classe: A classe que apresenta a maior Frequência é
denominada classe modal. Pela definição, podemos afirmar que a moda, neste
caso, é o valor dominante que está compreendido entre os limites da classe
modal. O método mais simples para o cálculo da moda consiste em tomar o ponto
médio da classe modal. Damos a esse valor a denominação de moda bruta.
M o  (li  ls ) / 2
onde li = limite inferior da classe modal e l s = limite superior da classe modal.
Exemplo: Calcule a estatura modal conforme a tabela abaixo.
Classes (em cm) Frequência
54 |─ 58
9
58 |─ 62
11
62 |─ 66
8
66 |─ 70
5
Resposta: a classe modal é 58|─ 62, pois é a de maior frequência. li = 58 e l s = 62
M o = (58+62) / 2 = 60 cm (este valor é estimado, pois não conhecemos o valor real
da moda).
Método mais elaborado pela fórmula de CZUBER:




(fMo  fant )
( fMo  fant )
M

l

Mo  li  

h
ou
 h

o
i 
(
f

f
)

(
f

f
)
2
f

(
f

f
)

Mo
post 
ant
post 
 Mo ant
 Mo
onde: li = Limite inferior da classe modal;
f Mo = Frequência modal;
f ant = Frequência simples anterior à classe modal;
f post = Frequência simples posterior à classe modal;
h = Intervalo de classe.
Exemplo: Calcule a Moda da tabela do exemplo anterior pelo processo de CZUBER


11  9
Mo  58  
  4  59,6
 2  11  9  8
Obs.: A moda é utilizada quando desejamos obter uma medida rápida e
aproximada de posição ou quando a medida de posição deva ser o valor mais típico
da distribuição. Já a média aritmética é a medida de posição que possui a maior
estabilidade e a mediana é a medida mais central.
5.4. MEDIDAS SEPARATRIZES
Além das medidas de posição que estudamos, há outras que, consideradas
individualmente, não são medidas de tendência central, mas estão ligadas à
mediana relativamente à sua característica de separar a série em partes que
apresentam o mesmo número de valores.
Essas medidas - os quartis, os decis e os percentis - são conhecidas pelo
nome genérico de separatrizes.
5.4.1. QUARTIS ( Q q )
Denominamos quartis os valores de uma série que a dividem em quatro
partes iguais. Precisamos portanto de 3 quartis (Q1 , Q2 e Q3) para dividir a série em
quatro partes iguais.
Obs: O quartil 2 (Q2) SEMPRE SERÁ IGUAL A MEDIANA DA SÉRIE.
i) QUARTIS EM DADOS NÃO AGRUPADOS
O método mais prático é utilizar o princípio do cálculo da mediana para os 3
quartis. Na realidade serão calculadas “3 medianas” em uma mesma série.
Exemplo 1: Calcule os quartis da série: {5, 2, 6, 9, 10, 13, 15}
- O primeiro passo a ser dado é o da ordenação (crescente ou decrescente) dos
valores: {2, 5, 6, 9, 10, 13, 15}
- O valor que divide a série acima em duas partes iguais é igual a 9, logo a Md = 9
que será = Q2 = 9.
- Temos agora {2, 5, 6} e {10, 13, 15} como sendo os dois grupos de valores iguais
proporcionados pela mediana (quartil 2). Para o cálculo do quartil 1 e 3 basta
calcular as medianas das partes iguais provenientes da verdadeira Mediana da série
(quartil 2).
Logo em {2, 5, 6} a mediana é = 5. Ou seja: será o Quartil 2 = Q2 = 5
Em {10, 13, 15} a mediana é =13. Ou seja: será o Quartil 2 = Q2 = 13
Exemplo 2: Calcule os quartis da série: {1, 1, 2, 3, 5, 5, 6, 7, 9, 9, 10, 13}
A série já está ordenada, então calcularemos o Quartil 2 = Md = (5+6)/2 = 5,5
O quartil 1 será a mediana da série à esquerda de Md: {1, 1, 2, 3, 5, 5}
Q1 = (2+3)/2 = 2,5
O quartil 3 será a mediana da série à direita de Md: {6, 7, 9, 9, 10, 13}
Q3 = (9+9)/2 = 9
ii) QUARTIS PARA DADOS AGRUPADOS EM CLASSES
A fórmula para determinação dos quartis para dados agrupados é semelhante
à usada para o cálculo da mediana.
Passos para Determinação do Quartil ( Q q ):
k
q   fi
1º passo: calcula-se a posição do quartil: p 
2º passo: identifica-se a classe
i 1
4

n
;
4
Qq pela coluna das Frequências Acumuladas;
3º passo: Aplica-se a fórmula:
Q q  li  [
q
 fi  F
Ac(ant )
4
fi
]  h , para q = 1, 2, 3
onde: l i = Limite inferior da classe do Quartil;
FAc (ant ) = Frequência acumulada anterior a classe do Quartil;
fi = Frequência simples da classe do Quartil;
h = Intervalo de classe.
Exemplo 3 - Calcule os quartis da tabela abaixo:
Classes Frequência (fi) Frequência acumulada
50 |─ 54
4
4
54 |─ 58
9
13
58 |─ 62
11
24
62 |─ 66
8
32
66 |─ 70
5
37
70 |─ 74
3
40
Total
40
O quartil 2 = M d , logo: p  2  40  20 . Logo.a classe mediana será 58 |─ 62
4
li = 58........... FAc (ant ) = 13........... fi = 11........... hi = 4
Substituindo esses valores na fórmula, obtemos:
 20  13 
Q2  58  
 4  60,54  Md
 11 
10  4 
 4  56,66
O quartil 1: p  1  40  10  Q1  54  
4
 9 
 30  24 
 4  65
O quartil 3: 3. fi / 4 = 30  Q3  62  
 8 
5.4.2. DECIS ( Dd )
A definição dos decis obedece ao mesmo princípio dos quartis, com a
modificação da porcentagem de valores que ficam aquém e além do decil que se
pretende calcular. A fórmula básica será: d×fi /10 onde d é o número de ordem do
decil a ser calculado. Indicam-se os decis: D1, D2,... , D9. Deste modo precisa-se de 9
decis para se dividir uma série em 10 partes iguais.
D d  li  [
d
 fi  F
Ac(ant )
10
fi
]  h , para d = 1, 2,... , 9.
De especial interesse é o quinto decil, que divide o conjunto em duas partes iguais.
O quinto decil é igual ao segundo quartil, que por sua vez é igual à mediana.
5.4.3. PERCENTIL ( Pp ) ou CENTIL
Denomina-se percentis ou centis como sendo os noventa e nove valores
que separam uma série em 100 partes iguais. Indicamos: P 1, P2,... , P99. É evidente
que P50 = Md; P25 = Q1 e P75 = Q3.
O cálculo de um percentil segue a mesma técnica do cálculo da mediana, porém
a fórmula será: p×fi / 100, onde p é o número de ordem do percentil a ser
p
 fi  F
calculado. Pp  li  [ 100
Ac(ant )
fi
]  h , para p = 1, 2,..., 99.
Relação entre as Medidas Separatrizes:
Uma relação importante entre as quatro Medidas Separatrizes é na verdade
uma relação até visual, que não precisamos fazer esforço para percebê-la, basta
traçar uma reta horizontal (que representará o conjunto de dados), e depois fazer as
divisões, exatamente como mostramos nas seções anteriores, como pode ser visto a
seguir:
|-------------------|-------------------|
1
Md
100
|---------|---------|---------|---------|
Q1
Q2
Q3
|---|---|---|---|---|---|---|---|---|---|
D1 D2 D3 D4 D5 D6 D7 D8 D9
|---|---|---|---|---|---|---|---|---|---|
P10 P20 P30 P40 P50 P60 P70 P80 P90
6 - MEDIDAS DE DISPERSÃO
6.1. MEDIDAS DE DISPERSÃO ABSOLUTA
6.1.1. AMPLITUDE TOTAL: É a única medida de dispersão que não tem na média o
ponto de referência.
Quando os dados não estão agrupados a Amplitude Total é a diferença entre o
maior e o menor valor observado:
AT  X Máx  X Mín .
Exemplo: Para os valores 40, 45, 48, 62 e 70 a amplitude total será:
AT = 70 – 40 =30
Quando os dados estão agrupados sem intervalos de classe ainda temos:
AT  X Máx  X Mín .
Exemplo:
Xi
0
1
3
4
fi
2
6
5
3
AT = 4 - 0 = 4
Com intervalos de classe a Amplitude Total é a diferença entre o limite superior da
última classe e o limite inferior da primeira classe. Então:
AT  LMáx  LMín
Exemplo:
Classes
4 |─ 6
6 |─ 8
8 |─10
fi
6
2
3
AT = 10 – 4 = 6
A amplitude total tem o inconveniente de só levar em conta os dois valores
extremos da série, descuidando do conjunto de valores intermediários. Faz-se uso
da amplitude total quando se quer determinar a amplitude da temperatura em um
dia, no controle de qualidade ou como uma medida de cálculo rápido sem muita
exatidão.
6.1.2. DESVIO QUARTIL: Também chamado de amplitude semi-interquatílica e é
baseada nos quartis: Dq  (Q3  Q1 ) / 2
Observações:
1) O desvio quartil apresenta como vantagem o fato de ser uma medida fácil de
calcular e de interpretar. Além do mais, não é afetado pelos valores extremos,
grandes ou pequenos, sendo recomendado, por conseguinte, quando entre os
dados figurem valores extremos que não se consideram representativos.
2) O desvio quartil deverá ser usado preferencialmente quando a medida de
tendência central for a mediana.
3) Trata-se de uma medida insensível à distribuição dos itens menores que Q 1, entre
Q1 e Q3 e maiores que Q3.
Exemplo: Para os valores: 40, 45, 48, 62 e 70 o desvio quartil será:
Q1 = (45+40)/2 = 42,5
Q3 = (70+62)/2 = 66
Dq = (66 - 42,5) / 2 = 11,75
6.1.3 DESVIO MÉDIO ABSOLUTO ( DM )
i) Para dados brutos: É a média aritmética dos valores absolutos dos desvios
tomados em relação a uma das seguintes medidas de tendência central: média ou
mediana.
a) para a Média = DM 
 ( xi  x )
b) para a Mediana: DM 
n
 ( xi  Md)
n
(tomados os valores absolutos)
Exemplo: Calcular o desvio médio do conjunto de números {- 4, - 3, - 2, 3, 5}
X = - 0, 2 e M d = - 2
Tabela auxiliar para cálculo do desvio médio
Xi
-4
-3
-2
3
5
𝑋𝑖 − 𝑋̅
|𝑋𝑖 − 𝑋̅|
𝑋𝑖 − 𝑀𝑑
|𝑋𝑖 − 𝑀𝑑|
(- 4) - (-0,2) = -3,8
(- 3) - (-0,2) = -2,8
(- 2) - (-0,2) = -1,8
3 - (-0,2) = 3,2
5 - (-0,2) = 5,2
=
3,8
2,8
1,8
3,2
5,2
16,8
(- 4) - (-2) = - 2
(- 3) - (-2) = - 1
(- 2) - (-2) = 0
3 - (-2) = 5
5 - (-2) = 7
=
2
1
0
5
7
15
Pela Média: DM = 16,8 / 5 = 3,36
Pela Mediana: DM = 15 / 5 = 3
6.1.4. DESVIO PADRÃO ( S )
É a medida de dispersão mais empregada, pois leva em consideração a
totalidade dos valores da variável em estudo. É um indicador de variabilidade
bastante estável. O desvio padrão baseia-se nos desvios em torno da média
aritmética e a sua fórmula básica pode ser traduzida como: a raiz quadrada da
média aritmética dos quadrados dos desvios e é representada por:
S
n
2
 ( Xi  X )
i 1
quando tratamos de uma população de dados não-agrupados.
n
Exemplo: Calcular o desvio padrão da população representada por {-4, -3, -2, 3, 5}.
Como X = - 0,2, então:
𝑋𝑖
𝑋𝑖 − 𝑋̅
(𝑋𝑖 − 𝑋̅)2
-4
-3
-2
3
5
- 3,8
- 2,8
- 1,8
3,2
5,2
=
14,44
7,84
3,24
10,24
27,04
62,8
Sabe-se que n = 5 e 62,8/5 = 12,56  S 
2
62,8
(Xi  X )

 12,56  3,54
n
5
Obs: Quando nosso interesse não se restringe à descrição dos dados, mas partindo
da amostra, visamos tirar inferências válidas para a respectiva população, convém
efetuar uma modificação, que consiste em usar o divisor n - 1 em lugar de n. A
fórmula ficará então: S 
(X
i
 X )2
n 1
Se os dados {- 4 , -3 , -2 , 3 , 5} representassem uma amostra o desvio padrão
amostral será a raiz quadrada de 62,8 / (5 -1) = 3,96.
O desvio padrão detém algumas propriedades, dentre as quais destacamos:
1ª: Somando-se (ou subtraindo-se) uma constante a todos os valores de uma
variável, o desvio padrão não se altera.
2ª: Multiplicando-se (ou dividindo-se) todos os valores de uma variável por uma
constante (diferente de zero), o desvio padrão fica multiplicado (ou dividido) por essa
constante.
Quando os dados estão agrupados (temos a presença de Frequência s) a fórmula
do desvio padrão será:
(X i  X )2 fi

S
 fi
ou
(X i  X )2 fi

S
 f i 1
quando se trata de uma amostra.
Ex: Calcule o desvio padrão populacional da tabela abaixo:
Xi
f i Xi . f i
0
2
0
1
6
6
2
12 24
3
7
21
4
3
12
Total 30 63

Sabe-se que
̅
𝑿𝒊 − 𝑿
̅ )𝟐
(𝑿𝒊 − 𝑿
̅ )𝟐 . 𝒇𝒊
(𝑿𝒊 − 𝑿
-2,1
-1,1
-0,1
0,9
1,9
4,41
1,21
0,01
0,81
3,61
8,82
7,26
0,12
5,67
10,83
32,70
f i  30 e 32,7 / 30 = 1,09.
A raiz quadrada de 1,09 é o desvio padrão = 1,044
Se considerar os dados como sendo de uma amostra o desvio padrão será a raiz
quadrada de 32,7 / (30 -1) = 1,062.
O desvio padrão pode ser calculado usando a seguinte fórmula prática:
S
(  X i fi ) 2
n
ou S 
 fi
2
 X i fi 
(  X i fi ) 2
n
quando se trata de uma amostra.
 fi  1
 X i fi 
2
Ex: Calcule o desvio padrão populacional do exemplo anterior:
𝑿𝒊
𝒇𝒊
0
2
1
6
2
12
3
7
4
3
Total 30
S
(63)2
30 
30
165 
𝑿𝒊 .𝒇𝒊
(𝑿𝒊 )𝟐
( 𝑿 𝒊 ) 𝟐 . 𝒇𝒊
0
6
24
21
12
63
0
1
4
9
16
0
6
48
63
48
165
1,09  1,044
Se os dados forem de uma amostra, o resultado será:
S
(63)2
30 
30  1
165 
1,128  1,062
Obs.: Nas tabelas de distribuições de frequências com intervalos de classe a fórmula
a ser utilizada é a mesma do exemplo anterior, sendo X i o ponto médio da classe i.
Ex: Calcule o desvio padrão populacional da tabela abaixo:
Pontos
2├ 4
4├ 6
6├ 8
𝒇𝒊
8
7
13
𝑿𝒊
3
5
7
𝑿𝒊 .𝒇𝒊
24
35
91
(𝑿𝒊 )𝟐
9
25
49
(𝑿𝒊 )𝟐 . 𝒇𝒊
72
175
637
8├ 10
Total ()
2
30
9
18
168
81
162
1046
Usando a fórmula prática:
S
 Xi 2 fi 
(  Xi fi ) 2
 fi
n
(168) 2
30

30
1046 

3,507  1,873
Se os dados forem uma amostra, o resultado será:
S
 Xi
2
fi 
(  Xi fi ) 2
 fi  1
n

(168) 2
30

30  1
1046 
3,628  1,905
2
6.1.5. VARIÂNCIA ( S )
É o desvio padrão elevado ao quadrado. A variância é uma medida que tem
pouca utilidade como estatística descritiva, porém é extremamente importante na
inferência estatística e em combinações de amostras.
6.2. MEDIDA DE DISPERSÃO RELATIVA
6.2.1 Coeficiente de Variação (CV)
É uma medida adimensional, útil para comparar variabilidades de diferentes
amostras, onde as médias são muito desiguais ou as unidades de medidas são
diferentes. O coeficiente de variação é o desvio padrão expresso em porcentagem
da média, isto é, magnitude relativa do desvio padrão quando comparado com a
média da distribuição das medidas. É dado por: CV( X) 
S
 100%
X
Exemplo: Considere os resultados das estaturas e dos pesos de um mesmo grupo
de indivíduos:
Discriminação
Estaturas
Pesos
Média
175 cm
68 kg
Desvio Padrão
5,0 cm
2,0 kg
Qual das medidas (Estatura ou Peso) possui maior homogeneidade?
Resposta: Teremos que calcular o CV da Estatura e o CV do Peso. O resultado
menor será o de maior homogeneidade (menor dispersão ou variabilidade).
CV estatura = (5 /175) x 100 = 2,85%; CV peso = (2 / 68) x 100 = 2,94%.
Logo, nesse grupo de indivíduos, as estaturas apresentam menor grau de dispersão
que os pesos.
Download