Medidas de tendência central e de dispersão

Propaganda
Medidas de tendência central e de dispersão
•Média aritmética
•Mediana
Valores mínimo e máximo
•Amplitude de variação
•Variância
•Desvio padrão
•Coeficiente de variação de Pearson
•Quartis
•Percentis
•Box plot
•Exercícios
Aulas 3 e 4 - Medidas de
tendência central e de dispersão
1
Medidas de tendência central e de dispersão
•Média aritmética
Valores individuais
Valores em distribuição de freqüência
Valores em intervalos de classe
Aulas 3 e 4 - Medidas de
tendência central e de dispersão
2
Medidas de tendência central e de dispersão
Notação:
X  variável
N  tamanho da população
n  tamanho da amostra
  média populacional (parâmetro, geralmente desconhecido)
X  Estatística (fórmula)
x  média amostral (estimativa, valor calculado na amostra)
Aulas 3 e 4 - Medidas de
tendência central e de dispersão
3
Medidas de tendência central e de dispersão
•Média aritmética
Definição: Média aritmética é o valor que indica o centro de equilíbrio de
uma distribuição de freqüências de uma variável quantitativa.
Média aritmética - é a soma dos valores de uma variável, dividida pelo
número de valores.
Supor a idade (anos) de 5 pessoas: 3, 5, 8, 12, 12
Média =
3  5  8  12  12
 8 anos
5
Desvios em torno da média:
3 – 8 =-5 anos
5 – 8 =-3 anos
8 – 8 = 0 anos
2 – 8 = 4 anos
12 – 8 = 4 anos
soma = 0 anos
Aulas 3 e 4 - Medidas de
tendência central e de dispersão
4
Medidas de tendência central e de dispersão
•Média aritmética
•
só existe para variáveis quantitativas e seu valor é único;
•
é da mesma natureza da variável considerada (média = 8 anos); e
•
sofre influência dos valores aberrantes (3, 5, 8, 12, 42; média = 14 anos)
Valores individuais
X: idade (anos) 3, 5, 8, 12, 12
x1 = 3; x2 = 5; x3=8; x4=12; x5= 12
n
x1  x 2  ... x n
x

n
x
i 1
Aulas 3 e 4 - Medidas de
tendência central e de dispersão
i
n
5
Medidas de tendência central e de dispersão
•Média aritmética
Os dados a seguir são provenientes do grupo Western Collaborative
Group Study, Califórnia (1960-61). Foram estudados 3154 homens de
meia idade para investigar a relação entre padrões de comportamento e
risco de doença coronariana.
Os dados apresentados são de 40 homens para os quais foram medidos
os níveis de colesterol (mg por 100ml) e realizada uma categorização
segundo comportamento.
O comportamento de tipo A é caracterizado pela urgência, agressividade
e ambição. O de tipo B é relaxado, não competitivo e menos preocupado.
Tipo A: nível de colesterol
233
291
312
250
254
276
234
181
xA 
246
248
197
252
268
202
224
218
239
212
239
325
233  291  ...  212  325
 245,05mg / 100ml
20
Aulas 3 e 4 - Medidas de
tendência central e de dispersão
6
Medidas de tendência central e de dispersão
•Média aritmética
Tipo B: nível de colesterol
344
185
263
246
226
175
242
252
224
153
212
183
188
137
250
202
148
194
169
213
344  226  ...  169  213
xB 
 210 ,3mg / 100 ml
20
Aulas 3 e 4 - Medidas de
tendência central e de dispersão
7
Medidas de tendência central e de dispersão
•Média aritmética - Valores em distribuição de freqüências
grupo A
Colesterol (X)
181
197
202
212
218
224
233
234
239
246
248
250
252
254
268
276
291
312
325
soma
fi
1
1
1
1
1
1
1
1
2
1
1
1
1
1
1
1
1
1
1
20
x i fi
181
197
202
212
218
224
233
234
478
246
248
250
252
254
268
276
291
312
325
4901
4901
x
 245 ,05
20

mg/100ml
k
x
xi f i
i 1
n
i representa o i-ésimo valor da variável
Aulas 3 e 4 - Medidas de
tendência central e de dispersão
8
Medidas de tendência central e de dispersão
•Média aritmética - valores em intervalos de classe
fi
concentração
180,0|--200,0
200,0|--220,0
220,0|--240,0
240,0|--260,0
260,0|--280,0
280,0|--300,0
300,0|--320,0
320,0|--340,0
total
x
2
3
5
5
2
1
1
1
20
ponto médio (xipm)
190
210
230
250
270
290
310
330
xipmfi
380
630
1150
1250
540
290
310
330
4880
4880
 244 ,0mg / 100 ml
20

X
i representa o i-ésimo intervalo
k
xipm f i
x ipm representa o ponto médio do intervalo,
n
fi é a freqüência de indivíduos no intervalo i,
k é o número de intervalos e
n o número de observações
i 1
Aulas 3 e 4 - Medidas de
tendência central e de dispersão
9
Medidas de tendência central e de dispersão
Mediana (Med)
É o valor que ocupa a posição central de uma série de n observações, quando estas
estão ordenadas de forma crescente ou decrescente.
a) valores individuais
Quando número de observações (n) for ímpar:
n1
a mediana é o valor da variável que ocupa o posto
2
Quando o número de observações (n) for par:
a mediana é a média aritmética dos valores da variável que ocupam os
postos
n2
n
e
2
2
Aulas 3 e 4 - Medidas de
tendência central e de dispersão
10
Medidas de tendência central e de dispersão
Mediana (Med)
Exemplo:
Tipo A: nível de colesterol
233
254
291
276
312
234
250
181
246
248
197
252
268
202
224
218
239
212
239
325
Ordenando-se os valores:
181
197
202
212
218
224
233
234
239
239
246
248
250
252
254
268
276
291
312
325
239  246
Mediana =
 242,5mg / 100ml
2
Aulas 3 e 4 - Medidas de
tendência central e de dispersão
11
Medidas de tendência central e de dispersão
Mediana (Med)
Valores em distribuição de freqüência pontual
Colesterol (X)
fi
facumulada
181
1
1
197
1
2
202
1
3
212
1
4
218
1
5
224
1
6
233
1
7
234
1
8
239
2
10
246
1
11
248
1
250
1
252
1
254
1
268
1
276
1
291
1
312
1
325
1
Total
20
Mediana =
239  246
 242,5mg / 100ml
2
Aulas 3 e 4 - Medidas de
tendência central e de dispersão
12
Medidas de tendência central e de dispersão
Mediana (Med)
Valores em intervalos de classe
Nível de Colesterol (mg/100ml) (xi)
180|--200
200|--250
250|--300
300|--350
Total
fi
2
10
6
2
20
facumulada
2
12
Como são 20 observações, a mediana estará na posição 10 (20/2), a mediana
está na classe de 200|-- 250 mg/100ml
Descobrindo o valor da variável que está na posição 10:
10 observações -------50 mg/100ml
8 observações ------x
8 x50
x
 40
10
Mediana = valor inicial do intervalo + 40 = 240 mg/100ml
Aulas 3 e 4 - Medidas de
tendência central e de dispersão
13
Medidas de tendência central e de dispersão
Mediana (Med) Valores em intervalos de classe
n
 f acumanterior
Med  Li  a 2
f classemediana
Li é o limite inferior da classe que contém a mediana
a é a amplitude da classe que contém a mediana
f acumanterior
f classemediana
é a freqüência acumulada até a classe anterior à classe que
contém a mediana
é a freqüência da classe que contém a mediana
20
2
2
Med  200  50
 200  40  240mg / 100ml
10
Aulas 3 e 4 - Medidas de
tendência central e de dispersão
14
Medidas de tendência central e de dispersão
Mediana (Med)
OBS:
 existe para variável quantitativa e qualitativa ordinal;

é da mesma natureza da variável considerada;

torna-se inadequada quando há muitos valores repetidos;

não sofre influência de valores aberrantes;
EX: 4,3 4,6
5,2
5,2
6,6
7,2
8,4
9,0
10,4
Média aritmética: 8,43 pmol/l; Mediana: 7,2 pmol/l
4,6
5,2
5,2
6,6
7,2
8,4
9,0
10,4 14,0
Média aritmética: 10,25 pmol/l; Mediana: 7,2 pmol/l

14,0
17,8
37,8
pode ser calculada mesmo quando os dados estão agrupados em intervalos
de classe e os extremos de algum intervalo não esteja definido (a não ser
que a mediana caia neste intervalo).
Aulas 3 e 4 - Medidas de
tendência central e de dispersão
15
Medidas de tendência central e de dispersão
Medidas de dispersão
Valores mínimo e máximo: valores extremos da distribuição
Amplitude de variação: é a diferença entre os 2 valores extremos da
distribuição
Idade (grupo 1): 2, 4, 3, 5, 6, 4, 17
amplitude de variação = 17-2 = 15
Idade (grupo 2): 2, 2, 2, 2, 2, 2, 17
amplitude de variação = 15
Aulas 3 e 4 - Medidas de
tendência central e de dispersão
16
Medidas de tendência central e de dispersão
Variância e desvio padrão
Supor a idade (anos) de 5 pessoas: 3, 5, 8, 12, 12
Média =
3  5  8  12  12
 8 anos
5
Desvios em torno da média:
3 – 8 =-5 anos
5 – 8 =-3 anos
8 – 8 = 0 anos
12 – 8 = 4 anos
12 – 8 = 4 anos
soma = 0 anos
Desvios quadráticos em torno da média:
(3 – 8)2
=(-5 anos)2 = 25 anos2
(5 – 8)2
=(-3 anos)2 = 9 anos2
(8 – 8)2
= (0 anos)2= 0 anos2
(12 – 8)2= (4 anos)2= 16 anos2
(12 – 8)2= (4 anos)2 = 16anos2
soma dos desvios quadráticos em torno da média
Aulas 3 e 4 - Medidas de
tendência central e de dispersão
= 66 anos2
17
Medidas de tendência central e de dispersão
Variância e desvio padrão
Variância = soma dos desvios quadráticos em torno da média/número de
observações
Variância =
66
 13,2 anos2
5
Desvio padrão: é a raiz quadrada da variância , ou seja
  2
S  S2
Desvio padrão = 13,2anos2  3,63 anos
Aulas 3 e 4 - Medidas de
tendência central e de dispersão
18
Medidas de tendência central e de dispersão
Valores individuais:
N
Variância populacional:
2 
2
(
X

X
)
 i
i 1
N
n
2
S

Variância amostral:
2
(
x

x
)
 i
i 1
n 1
Aulas 3 e 4 - Medidas de
tendência central e de dispersão
19
Medidas de tendência central e de dispersão
Exemplo:
Tipo A: nível de colesterol
233
291
312
254
276
234
250
181
246
248
197
252
268
202
224
218
239
212
239
325
(233  245,05) 2  ...  (325  245,05) 2
 1342,37(mg / 100ml) 2
Variância: s 
19
2
Desvio padrão s  1342,37  36,64mg / 100ml
Tipo B: nível de colesterol
344
185
263
246
224
212
188
250
226
175
242
252
153
183
137
202
(344  210,3) 2  ...  (213  210,3) 2
2
 2336,747(mg / 100ml) 2
Variância: s 
19
Desvio padrão s  2336,747  48,34mg / 100ml
Aulas 3 e 4 - Medidas de
tendência central e de dispersão
148
194
20
16
21
Medidas de tendência central e de dispersão
Valores em distribuição de freqüências
n
S2 
Variância amostral:
 (x
i 1
s A2 
 x)2 fi
n 1
Tipo A:
Nível de Colesterol
(mg/100ml)
(xi)
181
197
202
212
218
224
233
234
239
246
248
250
252
254
268
276
291
312
325
Total
i
fi
xifi
( xi  x ) 2
( xi  x ) 2 f i
1
1
1
1
1
1
1
1
2
1
1
1
1
1
1
1
1
1
1
20
181
197
202
212
218
224
233
234
478
246
248
250
252
254
268
276
291
312
325
4901
4102,40
2308,80
1853,30
1092,30
731,70
443,10
145,20
122,10
36,60
0,90
8,70
24,50
48,30
80,10
526,70
957,90
2111,40
4482,30
6392,00
4102,40
2308,80
1853,30
1092,30
731,70
443,10
145,20
122,10
73,21
0,90
8,70
24,50
48,30
80,10
526,70
957,90
2111,40
4482,30
6392,00
25504,95
25504,95
 1342,37(mg / 100ml) 2 ;
19
s A  1342,37  36,64mg / 100ml
Aulas 3 e 4 - Medidas de
tendência central e de dispersão
21
Medidas de tendência central e de dispersão
Tipo B:
Nível de Colesterol (mg/100ml) (xi)
fi
xifi
( xi  x ) 2
( x i  x ) 2 xfi
137
148
153
169
175
183
185
188
194
202
212
213
224
226
242
246
250
252
263
344
Total
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
20
137
148
153
169
175
183
185
188
194
202
212
213
224
226
242
246
250
252
263
344
4206
5372,89
3881,29
3283,29
1705,69
1246,09
745,29
640,09
497,29
265,69
68,89
2,89
7,29
187,69
246,49
1004,89
1274,49
1576,09
1738,89
2777,29
17875,69
5372,89
3881,29
3283,29
1705,69
1246,09
745,29
640,09
497,29
265,69
68,89
2,89
7,29
187,69
246,49
1004,89
1274,49
1576,09
1738,89
2777,29
17875,69
44398,2
s B2 
44398,2
 2336,747(mg / 100ml ) 2 ;
19
s B  2336,747  48,34mg / 100ml
Aulas 3 e 4 - Medidas de
tendência central e de dispersão
22
Medidas de tendência central e de dispersão
Valores em intervalos de classe
n
Variância amostral:
Nível de Colesterol
(mg/100ml) (xi)
180|--200
200|--250
250|--300
300|--350
Total
fi
2
10
6
2
20
S2 
( x
ipm
 x )2 fi
i 1
n 1
xi ponto
xipmfi
médio (xipm)
190
380
225
2250
275
1650
325
650
4930
( xipm  x ) 2
( xipm  x ) 2 f i
3192,25
462,25
812,25
6162,25
6384,5
4622,5
4873,5
12324,5
28205,0
155 x0  ...  325 x 2 4930

 246,5mg / 100ml
20
20
28205,0
s A2 
 1484,47(mg / 100ml) 2 ;
s A  1484,47  38,53mg / 100ml
19
xA 
Aulas 3 e 4 - Medidas de
tendência central e de dispersão
23
Medidas de tendência central e de dispersão
Tipo B
Nível de
Colesterol
(mg/100ml) (xi)
130|--180
180|--200
200|--250
250|--300
300|--350
Total
fi
xi ponto
médio (xipm)
xipmfi
( xipm  x ) 2
( xipm  x ) 2 f i
5
4
7
3
1
20
155
190
225
275
325
775
760
1575
825
325
4260
3364
529
144
3844
12544
16820
2116
1008
11532
12544
44020
xB 
155 x5  ...  325 x1 4260

 213,0mg / 100ml
20
20
s A2 
44020
 2316,84(mg / 100ml) 2 ;
19
s A  2316,84  48,13mg / 100ml
Aulas 3 e 4 - Medidas de
tendência central e de dispersão
24
Medidas de tendência central e de dispersão
Coeficiente de Variação de Pearson (CV):
é o quociente entre o desvio padrão e a média, ou seja CV =
S
x100
x
36,64
48,34
x100  15,0% ; CVtipoB:
x100  23,0% ;
210,3
245,05
CVtipo A:
Questão 13
São fornecidos valores de nível de triglicérides (mg/dL) de 9 pessoas
166
158
202
166
135
86
150
86
121
Calcule, apresentando o desenvolvimento da fórmula:
a)
b)
c)
d)
o
o
o
o
nível médio de triglicérides;
nível mediano de triglicérides;
desvio padrão do nível de triglicérides e
coeficiente de variação do nível de triglicérides.
Aulas 3 e 4 - Medidas de
tendência central e de dispersão
25
Medidas de tendência central e de dispersão
Questão 14
A tabela abaixo foi extraída do artigo: Diagnóstico de sobrepeso em
adolescentes: estudo do desempenho de diferentes critérios para o Índice de
Massa Corporal de MONTEIRO POA et al. (Rev. Saúde Pública, 2000;.34(5):50613).
Discuta os resultados obtidos ignorando a coluna do valor de p (este tópico será abordado na
disciplina Bioestatística II).
Aulas 3 e 4 - Medidas de
tendência central e de dispersão
26
Medidas de tendência central e de dispersão
A tabela abaixo foi extraída do artigo: Avaliação da capacidade preditiva da
circunferência da cintura para obesidade global e hipertensão arterial em
mulheres residentes na Região Metropolitana de Belo Horizonte, Brasil de
VELASQUEZ-MELENDEZ G et al. (Cad. Saúde Pública, 2002; 18(3): 765-771).
Calcule e interprete os coeficientes de variação de Pearson para cada uma das
variáveis apresentadas.
Aulas 3 e 4 - Medidas de
tendência central e de dispersão
27
Medidas de tendência central e de dispersão
Quartil
Valores da variável que dividem a distribuição em quatro partes iguais.
¼
½
¾
25%
25%
25%
25%
25%
Q1: deixa abaixo 25% das observações
75%
Q2: deixa abaixo 50% das observações
50%
50%
Q3: deixa abaixo 75% das
observações
75%
25%
Primeiro quartil: Q1  x ( 1 ( n 1))
; Terceiro quartil:
Q3  x
4
3
( ( n 1))
4
1
3
onde x é o valor da variável e ( (n  1)) e ( (n  1)) são índices que
4
4
representam as posições ocupadas por x.
Aulas 3 e 4 - Medidas de
tendência central e de dispersão
28
Medidas de tendência central e de dispersão
1.030*
1.050*
1.100*
1.175*
1.185*
1.225*
1.230*
1.262*
1.295*
1.300*
1.310*
1.500*
1.550*
1.600*
1.720*
1.750*
1.770*
1.820*
1.890*
1.940*
2.200*
2.270*
2.275*
2.440*
2.500*
2.560*
2.730*
1.130
1.410
1.575
1.680
1.715
1.720
1.760
1.930
2.015
2.040
2.090
2.200
2.400
2.550
2.570
2.600
2.700
2.830
2.950
3.005
3.160
3.400
3.640
Entre os recém-nascidos que sobreviveram:
Q1  x 1
 x6  1720 g
( ( 231))
4
Q3  x
3
( ( 231))
4
 x18  2830 g
Observe que Q 2  x 1
( ( 231))
2
 x12  2200 g
Entre os recém-nascidos que foram a óbito
Q1  x
Q3  x
1
( ( 271))
4
3
( ( 271))
4
 x7  1230 g
 x 21  2200 g e Q 2  x
1
( ( 271))
2
 x14  1600 g
Aulas 3 e 4 - Medidas de
tendência central e de dispersão
29
Medidas de tendência central e de dispersão
Supor o exemplo com 22 observações:
n=22
Q1  x
1
( ( 221))
4
x
(
23
)
4
x
3
(5 )
4
que é ¾ do caminho entre x5=1715 e x6=1720
3
Q1  1715  (1720  1715)  1718,8 g
4
Q3  x
3
( ( 221))
4
x
1
(17 )
4
que é ¼ do caminho entre x17=2700 e x18=2830
1
Q3  2700  (2830  2700)  2732,5 g
4
Aulas 3 e 4 - Medidas de
tendência central e de dispersão
30
Medidas de tendência central e de dispersão
Percentil
Valores da variável que dividem a distribuição em cem partes iguais.
Entre os recém-nascidos que sobreviveram
Percentil 5:
P5  x
(
5
( 231))
100
 x 120  x
(
100
)
1
(1 )
5
1
P5  1130  (1410  1130)  1186 g
5
que é 1/5 do caminho entre x1=1130 e x2=1410
Percentil 10:
P10  x
10
(
( 231))
100
 x 240  x
(
100
)
2 ;
(2 )
5
2
P10  1410  (1575  1410)  1476 g
5
Percentil 50:
P50  x
(
50
( 231))
100
 x 1200  x(12) ; P50  2200 g
(
)
100
Percentil 75:
P75  x
(
75
( 231))
100
 x 1800  x(18) ; P75  2830 g
(
)
100
Percentil 90:
P90  x
90
(
( 231))
100
 x 2160  x
(
100
)
3
( 21 )
5
3
; P90  3160  (3400  3160)  3304 g
5
Aulas 3 e 4 - Medidas de
tendência central e de dispersão
31
Medidas de tendência central e de dispersão
Box plot e identificação de valores aberrantes (outliers)
O Box plot representa graficamente dados de forma resumida em um retângulo onde as linhas
da base e do topo são o primeiro e o terceiro quartis, respectivamente. A linha entre estas é a
mediana. Linhas verticais que iniciam no meio da base e do topo do retângulo, terminam em
valores denominados adjacentes inferior e superior (Chambers et al., 1983, pag 60).
O valor adjacente superior é o maior valor das observações que é menor ou igual a Q3+1,5(Q3Q1) e o valor adjacente inferior é definido como o menor valor que é maior ou igual a Q11,5(Q3-Q1), sendo a diferença Q3-Q1 denominada intervalo inter-quartil (IIQ).
Valores outliers (discrepantes ou aberrantes) são valores que “fogem” da distribuição dos
dados. O box plot além de apresentar a dispersão dos dados torna-se útil também para
identificar a ocorrência destes valores como sendo os que caem fora dos limites estabelecidos
pelos valores adjacentes superior e inferior.
colesterol
380
360
340
320
300
280
260
240
220
200
180
160
140
120
A
Aulas 3 e 4 - Medidas de
tendência central e de dispersão
B
32
Box plot
Tipo A: nível de colesterol
181
197
202
212
218
224
233
234
239
239
246
248
250
252
254
268
276
291
312
325
Tipo A:
n=20;
Q1  x 1
4
Q3  x 3
4
( n 1)
( n 1)
 x 21  x
4
 x3
4
5
1
4
x
( 21)
15
3
4
1
 218  (224  218)  218  1,5  219,5
4
3
 254  (268  254)  254  10,5  264,5
4
Intervalo Inter-Quartil (IIQ): Q3-Q1 = 45
325 é o valor adjacente superior. Este é o maior valor da distribuição, igual ou abaixo de 332,
onde 332 é dado por: 264,5  1,5 x 45  332 .
181 é o valor adjacente inferior. É o menor valor da distribuição, igual ou acima de 152, onde
152 é dado por: 219,5  1,5 x 45  152 .
Aulas 3 e 4 - Medidas de
tendência central e de dispersão
33
Box plot
Tipo B
n=20
Q1  x 1
4
( n 1)
Q3  x 3
4
( n 1)
1

175

(183  175)  175  2  177
1
5
4
4
3
 x 3  242  (246  242)  242  3  245
15
4
4
 x 21  x
4
 x3
4
( 21)
Intervalo Inter-Quartil (IIQ): Q3-Q1 = 68
344 é o valor adjacente superior. Este é o maior valor da distribuição, igual ou abaixo de 347,
onde 347 é dado por: 245  1,5 x68  347 .
137 é o valor adjacente inferior. É o menor valor da distribuição, igual ou acima de 75, onde 75
é dado por: 177  1,5 x68  75 .
Aulas 3 e 4 - Medidas de
tendência central e de dispersão
34
Box plot
Tipo A:
n=20;
Q1  x 1
4
Q3  x 3
4
( n 1)
( n 1)
 x 21  x
4
 x3
4
1
5
4
x
( 21)
3
15
4
1
 218  (224  218)  218  1,5  219,5
4
3
 254  (268  254)  254  10,5  264,5
4
Intervalo Inter-Quartil (IIQ): Q3-Q1 = 45
325 é o valor adjacente superior. Este é o maior valor da distribuição, igual ou abaixo de 332,
onde 332 é dado por: 264,5  1,5 x 45  332 .
181 é o valor adjacente inferior. É o menor valor da distribuição, igual ou acima de 152, onde
152 é dado por: 219,5  1,5 x 45  152 .
Tipo B
n=20
1
 x 21  x 1  175  (183  175)  175  2  177
( n 1)
5
4
4
4
4
3
Q3  x 3
 x 3  x 3  242  (246  242)  242  3  245
( n 1)
( 21)
15
4
4
4
4
Q1  x 1
Intervalo Inter-Quartil (IIQ): Q3-Q1 = 68
344 é o valor adjacente superior. Este é o maior valor da distribuição, igual ou abaixo de 347,
onde 347 é dado por: 245  1,5 x68  347 .
137 é o valor adjacente inferior. É o menor valor da distribuição, igual ou acima de 75, onde 75
é dado por: 177  1,5 x68  75 .
Aulas 3 e 4 - Medidas de
tendência central e de dispersão
35
Validade de Curso de capacitação em medida da Altura uterina para enfermeiros e graduandos de
Enfermagem. Camila C A Paiva; Djacyr MC Freire. Ver Bras Enferm, Brasilia 2012, set-out;65(5):775-9
Aulas 3 e 4 - Medidas de
tendência central e de dispersão
36
Box plot
Questão 16
Os dados a seguir são de uma pesquisa que investigou as concentrações de
minerais no leite materno, no período de 1984 a 1985. Foram coletadas
amostras de leite materno de 55 mulheres que tiveram seus filhos no Hospital
Maternidade Odete Valadares, em Belo Horizonte. As mães foram divididas em
período de lactação: colostro e leite maduro.
cálcio (g/mL
113
163
167
cálcio (g/mL
159
238
277
de leite) – grupo colostro
181
254
311
225
275
313
241
303
325
de leite) – grupo maduro
175
181
188
238
242
244
279
281
293
334
372
375
145
163
437
221
231
256
296
312
323
344
375
200
256
302
206
259
303
213
260
314
214
263
344
217
264
394
231
275
a) Calcule a quantidade média de cálcio (g/mL de leite) em cada grupo.
b) Calcule a quantidade mediana de cálcio (g/mL de leite) em cada grupo.
c) Desenhe o box plot da concentração de cálcio (g/mL de leite) representando os dois grupos
em um só gráfico.
d) Comente o gráfico box plot quanto a dispersão dos dados, existência de valores aberrantes e
igualdade de medianas.
Aulas 3 e 4 - Medidas de
tendência central e de dispersão
37
Questão 16
26
Grupo colostro: x 
x
i 1
i
n

7055
 271,35g / mL
26
26
Grupo maduro: x 
x
i 1
n
i

7310
 252,07g / mL
29
Grupo colostro: n=26 (par) Mediana é a media dos valores que ocupam os postos 13 e
14. Med 
275  296
 285,5g / mL
2
Grupo maduro: n=29 (ímpar); a mediana é o valor da variável que ocupa o posto 15.
Med= 256 g/mL
Aulas 3 e 4 - Medidas de
tendência central e de dispersão
38
Questão 16
Medida
Grupo colostro
Q1
211
Q2
285,5
Q3
327,25
Valor adjacente inferior
113
Valor adjacente superior
437
valor adjacente superior: maior valor abaixo de Q3+1,5x(IIQ)
Valor adjacente inferior: Menor valor acima de Q1-1,5x(IIQ)
Grupo maduro
213,5
256
280
159
344
var1
500
450
400
350
300
250
200
150
100
grupo colostro
grupo maduro
“Box plot” da variável concentração de cálcio (g/mL) segundo grupo de leite (colostro e
maduro)
Aulas 3 e 4 - Medidas de
tendência central e de dispersão
39
Download