Medidas de tendência central e de dispersão •Média aritmética •Mediana Valores mínimo e máximo •Amplitude de variação •Variância •Desvio padrão •Coeficiente de variação de Pearson •Quartis •Percentis •Box plot •Exercícios Aulas 3 e 4 - Medidas de tendência central e de dispersão 1 Medidas de tendência central e de dispersão •Média aritmética Valores individuais Valores em distribuição de freqüência Valores em intervalos de classe Aulas 3 e 4 - Medidas de tendência central e de dispersão 2 Medidas de tendência central e de dispersão Notação: X variável N tamanho da população n tamanho da amostra média populacional (parâmetro, geralmente desconhecido) X Estatística (fórmula) x média amostral (estimativa, valor calculado na amostra) Aulas 3 e 4 - Medidas de tendência central e de dispersão 3 Medidas de tendência central e de dispersão •Média aritmética Definição: Média aritmética é o valor que indica o centro de equilíbrio de uma distribuição de freqüências de uma variável quantitativa. Média aritmética - é a soma dos valores de uma variável, dividida pelo número de valores. Supor a idade (anos) de 5 pessoas: 3, 5, 8, 12, 12 Média = 3 5 8 12 12 8 anos 5 Desvios em torno da média: 3 – 8 =-5 anos 5 – 8 =-3 anos 8 – 8 = 0 anos 2 – 8 = 4 anos 12 – 8 = 4 anos soma = 0 anos Aulas 3 e 4 - Medidas de tendência central e de dispersão 4 Medidas de tendência central e de dispersão •Média aritmética • só existe para variáveis quantitativas e seu valor é único; • é da mesma natureza da variável considerada (média = 8 anos); e • sofre influência dos valores aberrantes (3, 5, 8, 12, 42; média = 14 anos) Valores individuais X: idade (anos) 3, 5, 8, 12, 12 x1 = 3; x2 = 5; x3=8; x4=12; x5= 12 n x1 x 2 ... x n x n x i 1 Aulas 3 e 4 - Medidas de tendência central e de dispersão i n 5 Medidas de tendência central e de dispersão •Média aritmética Os dados a seguir são provenientes do grupo Western Collaborative Group Study, Califórnia (1960-61). Foram estudados 3154 homens de meia idade para investigar a relação entre padrões de comportamento e risco de doença coronariana. Os dados apresentados são de 40 homens para os quais foram medidos os níveis de colesterol (mg por 100ml) e realizada uma categorização segundo comportamento. O comportamento de tipo A é caracterizado pela urgência, agressividade e ambição. O de tipo B é relaxado, não competitivo e menos preocupado. Tipo A: nível de colesterol 233 291 312 250 254 276 234 181 xA 246 248 197 252 268 202 224 218 239 212 239 325 233 291 ... 212 325 245,05mg / 100ml 20 Aulas 3 e 4 - Medidas de tendência central e de dispersão 6 Medidas de tendência central e de dispersão •Média aritmética Tipo B: nível de colesterol 344 185 263 246 226 175 242 252 224 153 212 183 188 137 250 202 148 194 169 213 344 226 ... 169 213 xB 210 ,3mg / 100 ml 20 Aulas 3 e 4 - Medidas de tendência central e de dispersão 7 Medidas de tendência central e de dispersão •Média aritmética - Valores em distribuição de freqüências grupo A Colesterol (X) 181 197 202 212 218 224 233 234 239 246 248 250 252 254 268 276 291 312 325 soma fi 1 1 1 1 1 1 1 1 2 1 1 1 1 1 1 1 1 1 1 20 x i fi 181 197 202 212 218 224 233 234 478 246 248 250 252 254 268 276 291 312 325 4901 4901 x 245 ,05 20 mg/100ml k x xi f i i 1 n i representa o i-ésimo valor da variável Aulas 3 e 4 - Medidas de tendência central e de dispersão 8 Medidas de tendência central e de dispersão •Média aritmética - valores em intervalos de classe fi concentração 180,0|--200,0 200,0|--220,0 220,0|--240,0 240,0|--260,0 260,0|--280,0 280,0|--300,0 300,0|--320,0 320,0|--340,0 total x 2 3 5 5 2 1 1 1 20 ponto médio (xipm) 190 210 230 250 270 290 310 330 xipmfi 380 630 1150 1250 540 290 310 330 4880 4880 244 ,0mg / 100 ml 20 X i representa o i-ésimo intervalo k xipm f i x ipm representa o ponto médio do intervalo, n fi é a freqüência de indivíduos no intervalo i, k é o número de intervalos e n o número de observações i 1 Aulas 3 e 4 - Medidas de tendência central e de dispersão 9 Medidas de tendência central e de dispersão Mediana (Med) É o valor que ocupa a posição central de uma série de n observações, quando estas estão ordenadas de forma crescente ou decrescente. a) valores individuais Quando número de observações (n) for ímpar: n1 a mediana é o valor da variável que ocupa o posto 2 Quando o número de observações (n) for par: a mediana é a média aritmética dos valores da variável que ocupam os postos n2 n e 2 2 Aulas 3 e 4 - Medidas de tendência central e de dispersão 10 Medidas de tendência central e de dispersão Mediana (Med) Exemplo: Tipo A: nível de colesterol 233 254 291 276 312 234 250 181 246 248 197 252 268 202 224 218 239 212 239 325 Ordenando-se os valores: 181 197 202 212 218 224 233 234 239 239 246 248 250 252 254 268 276 291 312 325 239 246 Mediana = 242,5mg / 100ml 2 Aulas 3 e 4 - Medidas de tendência central e de dispersão 11 Medidas de tendência central e de dispersão Mediana (Med) Valores em distribuição de freqüência pontual Colesterol (X) fi facumulada 181 1 1 197 1 2 202 1 3 212 1 4 218 1 5 224 1 6 233 1 7 234 1 8 239 2 10 246 1 11 248 1 250 1 252 1 254 1 268 1 276 1 291 1 312 1 325 1 Total 20 Mediana = 239 246 242,5mg / 100ml 2 Aulas 3 e 4 - Medidas de tendência central e de dispersão 12 Medidas de tendência central e de dispersão Mediana (Med) Valores em intervalos de classe Nível de Colesterol (mg/100ml) (xi) 180|--200 200|--250 250|--300 300|--350 Total fi 2 10 6 2 20 facumulada 2 12 Como são 20 observações, a mediana estará na posição 10 (20/2), a mediana está na classe de 200|-- 250 mg/100ml Descobrindo o valor da variável que está na posição 10: 10 observações -------50 mg/100ml 8 observações ------x 8 x50 x 40 10 Mediana = valor inicial do intervalo + 40 = 240 mg/100ml Aulas 3 e 4 - Medidas de tendência central e de dispersão 13 Medidas de tendência central e de dispersão Mediana (Med) Valores em intervalos de classe n f acumanterior Med Li a 2 f classemediana Li é o limite inferior da classe que contém a mediana a é a amplitude da classe que contém a mediana f acumanterior f classemediana é a freqüência acumulada até a classe anterior à classe que contém a mediana é a freqüência da classe que contém a mediana 20 2 2 Med 200 50 200 40 240mg / 100ml 10 Aulas 3 e 4 - Medidas de tendência central e de dispersão 14 Medidas de tendência central e de dispersão Mediana (Med) OBS: existe para variável quantitativa e qualitativa ordinal; é da mesma natureza da variável considerada; torna-se inadequada quando há muitos valores repetidos; não sofre influência de valores aberrantes; EX: 4,3 4,6 5,2 5,2 6,6 7,2 8,4 9,0 10,4 Média aritmética: 8,43 pmol/l; Mediana: 7,2 pmol/l 4,6 5,2 5,2 6,6 7,2 8,4 9,0 10,4 14,0 Média aritmética: 10,25 pmol/l; Mediana: 7,2 pmol/l 14,0 17,8 37,8 pode ser calculada mesmo quando os dados estão agrupados em intervalos de classe e os extremos de algum intervalo não esteja definido (a não ser que a mediana caia neste intervalo). Aulas 3 e 4 - Medidas de tendência central e de dispersão 15 Medidas de tendência central e de dispersão Medidas de dispersão Valores mínimo e máximo: valores extremos da distribuição Amplitude de variação: é a diferença entre os 2 valores extremos da distribuição Idade (grupo 1): 2, 4, 3, 5, 6, 4, 17 amplitude de variação = 17-2 = 15 Idade (grupo 2): 2, 2, 2, 2, 2, 2, 17 amplitude de variação = 15 Aulas 3 e 4 - Medidas de tendência central e de dispersão 16 Medidas de tendência central e de dispersão Variância e desvio padrão Supor a idade (anos) de 5 pessoas: 3, 5, 8, 12, 12 Média = 3 5 8 12 12 8 anos 5 Desvios em torno da média: 3 – 8 =-5 anos 5 – 8 =-3 anos 8 – 8 = 0 anos 12 – 8 = 4 anos 12 – 8 = 4 anos soma = 0 anos Desvios quadráticos em torno da média: (3 – 8)2 =(-5 anos)2 = 25 anos2 (5 – 8)2 =(-3 anos)2 = 9 anos2 (8 – 8)2 = (0 anos)2= 0 anos2 (12 – 8)2= (4 anos)2= 16 anos2 (12 – 8)2= (4 anos)2 = 16anos2 soma dos desvios quadráticos em torno da média Aulas 3 e 4 - Medidas de tendência central e de dispersão = 66 anos2 17 Medidas de tendência central e de dispersão Variância e desvio padrão Variância = soma dos desvios quadráticos em torno da média/número de observações Variância = 66 13,2 anos2 5 Desvio padrão: é a raiz quadrada da variância , ou seja 2 S S2 Desvio padrão = 13,2anos2 3,63 anos Aulas 3 e 4 - Medidas de tendência central e de dispersão 18 Medidas de tendência central e de dispersão Valores individuais: N Variância populacional: 2 2 ( X X ) i i 1 N n 2 S Variância amostral: 2 ( x x ) i i 1 n 1 Aulas 3 e 4 - Medidas de tendência central e de dispersão 19 Medidas de tendência central e de dispersão Exemplo: Tipo A: nível de colesterol 233 291 312 254 276 234 250 181 246 248 197 252 268 202 224 218 239 212 239 325 (233 245,05) 2 ... (325 245,05) 2 1342,37(mg / 100ml) 2 Variância: s 19 2 Desvio padrão s 1342,37 36,64mg / 100ml Tipo B: nível de colesterol 344 185 263 246 224 212 188 250 226 175 242 252 153 183 137 202 (344 210,3) 2 ... (213 210,3) 2 2 2336,747(mg / 100ml) 2 Variância: s 19 Desvio padrão s 2336,747 48,34mg / 100ml Aulas 3 e 4 - Medidas de tendência central e de dispersão 148 194 20 16 21 Medidas de tendência central e de dispersão Valores em distribuição de freqüências n S2 Variância amostral: (x i 1 s A2 x)2 fi n 1 Tipo A: Nível de Colesterol (mg/100ml) (xi) 181 197 202 212 218 224 233 234 239 246 248 250 252 254 268 276 291 312 325 Total i fi xifi ( xi x ) 2 ( xi x ) 2 f i 1 1 1 1 1 1 1 1 2 1 1 1 1 1 1 1 1 1 1 20 181 197 202 212 218 224 233 234 478 246 248 250 252 254 268 276 291 312 325 4901 4102,40 2308,80 1853,30 1092,30 731,70 443,10 145,20 122,10 36,60 0,90 8,70 24,50 48,30 80,10 526,70 957,90 2111,40 4482,30 6392,00 4102,40 2308,80 1853,30 1092,30 731,70 443,10 145,20 122,10 73,21 0,90 8,70 24,50 48,30 80,10 526,70 957,90 2111,40 4482,30 6392,00 25504,95 25504,95 1342,37(mg / 100ml) 2 ; 19 s A 1342,37 36,64mg / 100ml Aulas 3 e 4 - Medidas de tendência central e de dispersão 21 Medidas de tendência central e de dispersão Tipo B: Nível de Colesterol (mg/100ml) (xi) fi xifi ( xi x ) 2 ( x i x ) 2 xfi 137 148 153 169 175 183 185 188 194 202 212 213 224 226 242 246 250 252 263 344 Total 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 20 137 148 153 169 175 183 185 188 194 202 212 213 224 226 242 246 250 252 263 344 4206 5372,89 3881,29 3283,29 1705,69 1246,09 745,29 640,09 497,29 265,69 68,89 2,89 7,29 187,69 246,49 1004,89 1274,49 1576,09 1738,89 2777,29 17875,69 5372,89 3881,29 3283,29 1705,69 1246,09 745,29 640,09 497,29 265,69 68,89 2,89 7,29 187,69 246,49 1004,89 1274,49 1576,09 1738,89 2777,29 17875,69 44398,2 s B2 44398,2 2336,747(mg / 100ml ) 2 ; 19 s B 2336,747 48,34mg / 100ml Aulas 3 e 4 - Medidas de tendência central e de dispersão 22 Medidas de tendência central e de dispersão Valores em intervalos de classe n Variância amostral: Nível de Colesterol (mg/100ml) (xi) 180|--200 200|--250 250|--300 300|--350 Total fi 2 10 6 2 20 S2 ( x ipm x )2 fi i 1 n 1 xi ponto xipmfi médio (xipm) 190 380 225 2250 275 1650 325 650 4930 ( xipm x ) 2 ( xipm x ) 2 f i 3192,25 462,25 812,25 6162,25 6384,5 4622,5 4873,5 12324,5 28205,0 155 x0 ... 325 x 2 4930 246,5mg / 100ml 20 20 28205,0 s A2 1484,47(mg / 100ml) 2 ; s A 1484,47 38,53mg / 100ml 19 xA Aulas 3 e 4 - Medidas de tendência central e de dispersão 23 Medidas de tendência central e de dispersão Tipo B Nível de Colesterol (mg/100ml) (xi) 130|--180 180|--200 200|--250 250|--300 300|--350 Total fi xi ponto médio (xipm) xipmfi ( xipm x ) 2 ( xipm x ) 2 f i 5 4 7 3 1 20 155 190 225 275 325 775 760 1575 825 325 4260 3364 529 144 3844 12544 16820 2116 1008 11532 12544 44020 xB 155 x5 ... 325 x1 4260 213,0mg / 100ml 20 20 s A2 44020 2316,84(mg / 100ml) 2 ; 19 s A 2316,84 48,13mg / 100ml Aulas 3 e 4 - Medidas de tendência central e de dispersão 24 Medidas de tendência central e de dispersão Coeficiente de Variação de Pearson (CV): é o quociente entre o desvio padrão e a média, ou seja CV = S x100 x 36,64 48,34 x100 15,0% ; CVtipoB: x100 23,0% ; 210,3 245,05 CVtipo A: Questão 13 São fornecidos valores de nível de triglicérides (mg/dL) de 9 pessoas 166 158 202 166 135 86 150 86 121 Calcule, apresentando o desenvolvimento da fórmula: a) b) c) d) o o o o nível médio de triglicérides; nível mediano de triglicérides; desvio padrão do nível de triglicérides e coeficiente de variação do nível de triglicérides. Aulas 3 e 4 - Medidas de tendência central e de dispersão 25 Medidas de tendência central e de dispersão Questão 14 A tabela abaixo foi extraída do artigo: Diagnóstico de sobrepeso em adolescentes: estudo do desempenho de diferentes critérios para o Índice de Massa Corporal de MONTEIRO POA et al. (Rev. Saúde Pública, 2000;.34(5):50613). Discuta os resultados obtidos ignorando a coluna do valor de p (este tópico será abordado na disciplina Bioestatística II). Aulas 3 e 4 - Medidas de tendência central e de dispersão 26 Medidas de tendência central e de dispersão A tabela abaixo foi extraída do artigo: Avaliação da capacidade preditiva da circunferência da cintura para obesidade global e hipertensão arterial em mulheres residentes na Região Metropolitana de Belo Horizonte, Brasil de VELASQUEZ-MELENDEZ G et al. (Cad. Saúde Pública, 2002; 18(3): 765-771). Calcule e interprete os coeficientes de variação de Pearson para cada uma das variáveis apresentadas. Aulas 3 e 4 - Medidas de tendência central e de dispersão 27 Medidas de tendência central e de dispersão Quartil Valores da variável que dividem a distribuição em quatro partes iguais. ¼ ½ ¾ 25% 25% 25% 25% 25% Q1: deixa abaixo 25% das observações 75% Q2: deixa abaixo 50% das observações 50% 50% Q3: deixa abaixo 75% das observações 75% 25% Primeiro quartil: Q1 x ( 1 ( n 1)) ; Terceiro quartil: Q3 x 4 3 ( ( n 1)) 4 1 3 onde x é o valor da variável e ( (n 1)) e ( (n 1)) são índices que 4 4 representam as posições ocupadas por x. Aulas 3 e 4 - Medidas de tendência central e de dispersão 28 Medidas de tendência central e de dispersão 1.030* 1.050* 1.100* 1.175* 1.185* 1.225* 1.230* 1.262* 1.295* 1.300* 1.310* 1.500* 1.550* 1.600* 1.720* 1.750* 1.770* 1.820* 1.890* 1.940* 2.200* 2.270* 2.275* 2.440* 2.500* 2.560* 2.730* 1.130 1.410 1.575 1.680 1.715 1.720 1.760 1.930 2.015 2.040 2.090 2.200 2.400 2.550 2.570 2.600 2.700 2.830 2.950 3.005 3.160 3.400 3.640 Entre os recém-nascidos que sobreviveram: Q1 x 1 x6 1720 g ( ( 231)) 4 Q3 x 3 ( ( 231)) 4 x18 2830 g Observe que Q 2 x 1 ( ( 231)) 2 x12 2200 g Entre os recém-nascidos que foram a óbito Q1 x Q3 x 1 ( ( 271)) 4 3 ( ( 271)) 4 x7 1230 g x 21 2200 g e Q 2 x 1 ( ( 271)) 2 x14 1600 g Aulas 3 e 4 - Medidas de tendência central e de dispersão 29 Medidas de tendência central e de dispersão Supor o exemplo com 22 observações: n=22 Q1 x 1 ( ( 221)) 4 x ( 23 ) 4 x 3 (5 ) 4 que é ¾ do caminho entre x5=1715 e x6=1720 3 Q1 1715 (1720 1715) 1718,8 g 4 Q3 x 3 ( ( 221)) 4 x 1 (17 ) 4 que é ¼ do caminho entre x17=2700 e x18=2830 1 Q3 2700 (2830 2700) 2732,5 g 4 Aulas 3 e 4 - Medidas de tendência central e de dispersão 30 Medidas de tendência central e de dispersão Percentil Valores da variável que dividem a distribuição em cem partes iguais. Entre os recém-nascidos que sobreviveram Percentil 5: P5 x ( 5 ( 231)) 100 x 120 x ( 100 ) 1 (1 ) 5 1 P5 1130 (1410 1130) 1186 g 5 que é 1/5 do caminho entre x1=1130 e x2=1410 Percentil 10: P10 x 10 ( ( 231)) 100 x 240 x ( 100 ) 2 ; (2 ) 5 2 P10 1410 (1575 1410) 1476 g 5 Percentil 50: P50 x ( 50 ( 231)) 100 x 1200 x(12) ; P50 2200 g ( ) 100 Percentil 75: P75 x ( 75 ( 231)) 100 x 1800 x(18) ; P75 2830 g ( ) 100 Percentil 90: P90 x 90 ( ( 231)) 100 x 2160 x ( 100 ) 3 ( 21 ) 5 3 ; P90 3160 (3400 3160) 3304 g 5 Aulas 3 e 4 - Medidas de tendência central e de dispersão 31 Medidas de tendência central e de dispersão Box plot e identificação de valores aberrantes (outliers) O Box plot representa graficamente dados de forma resumida em um retângulo onde as linhas da base e do topo são o primeiro e o terceiro quartis, respectivamente. A linha entre estas é a mediana. Linhas verticais que iniciam no meio da base e do topo do retângulo, terminam em valores denominados adjacentes inferior e superior (Chambers et al., 1983, pag 60). O valor adjacente superior é o maior valor das observações que é menor ou igual a Q3+1,5(Q3Q1) e o valor adjacente inferior é definido como o menor valor que é maior ou igual a Q11,5(Q3-Q1), sendo a diferença Q3-Q1 denominada intervalo inter-quartil (IIQ). Valores outliers (discrepantes ou aberrantes) são valores que “fogem” da distribuição dos dados. O box plot além de apresentar a dispersão dos dados torna-se útil também para identificar a ocorrência destes valores como sendo os que caem fora dos limites estabelecidos pelos valores adjacentes superior e inferior. colesterol 380 360 340 320 300 280 260 240 220 200 180 160 140 120 A Aulas 3 e 4 - Medidas de tendência central e de dispersão B 32 Box plot Tipo A: nível de colesterol 181 197 202 212 218 224 233 234 239 239 246 248 250 252 254 268 276 291 312 325 Tipo A: n=20; Q1 x 1 4 Q3 x 3 4 ( n 1) ( n 1) x 21 x 4 x3 4 5 1 4 x ( 21) 15 3 4 1 218 (224 218) 218 1,5 219,5 4 3 254 (268 254) 254 10,5 264,5 4 Intervalo Inter-Quartil (IIQ): Q3-Q1 = 45 325 é o valor adjacente superior. Este é o maior valor da distribuição, igual ou abaixo de 332, onde 332 é dado por: 264,5 1,5 x 45 332 . 181 é o valor adjacente inferior. É o menor valor da distribuição, igual ou acima de 152, onde 152 é dado por: 219,5 1,5 x 45 152 . Aulas 3 e 4 - Medidas de tendência central e de dispersão 33 Box plot Tipo B n=20 Q1 x 1 4 ( n 1) Q3 x 3 4 ( n 1) 1 175 (183 175) 175 2 177 1 5 4 4 3 x 3 242 (246 242) 242 3 245 15 4 4 x 21 x 4 x3 4 ( 21) Intervalo Inter-Quartil (IIQ): Q3-Q1 = 68 344 é o valor adjacente superior. Este é o maior valor da distribuição, igual ou abaixo de 347, onde 347 é dado por: 245 1,5 x68 347 . 137 é o valor adjacente inferior. É o menor valor da distribuição, igual ou acima de 75, onde 75 é dado por: 177 1,5 x68 75 . Aulas 3 e 4 - Medidas de tendência central e de dispersão 34 Box plot Tipo A: n=20; Q1 x 1 4 Q3 x 3 4 ( n 1) ( n 1) x 21 x 4 x3 4 1 5 4 x ( 21) 3 15 4 1 218 (224 218) 218 1,5 219,5 4 3 254 (268 254) 254 10,5 264,5 4 Intervalo Inter-Quartil (IIQ): Q3-Q1 = 45 325 é o valor adjacente superior. Este é o maior valor da distribuição, igual ou abaixo de 332, onde 332 é dado por: 264,5 1,5 x 45 332 . 181 é o valor adjacente inferior. É o menor valor da distribuição, igual ou acima de 152, onde 152 é dado por: 219,5 1,5 x 45 152 . Tipo B n=20 1 x 21 x 1 175 (183 175) 175 2 177 ( n 1) 5 4 4 4 4 3 Q3 x 3 x 3 x 3 242 (246 242) 242 3 245 ( n 1) ( 21) 15 4 4 4 4 Q1 x 1 Intervalo Inter-Quartil (IIQ): Q3-Q1 = 68 344 é o valor adjacente superior. Este é o maior valor da distribuição, igual ou abaixo de 347, onde 347 é dado por: 245 1,5 x68 347 . 137 é o valor adjacente inferior. É o menor valor da distribuição, igual ou acima de 75, onde 75 é dado por: 177 1,5 x68 75 . Aulas 3 e 4 - Medidas de tendência central e de dispersão 35 Validade de Curso de capacitação em medida da Altura uterina para enfermeiros e graduandos de Enfermagem. Camila C A Paiva; Djacyr MC Freire. Ver Bras Enferm, Brasilia 2012, set-out;65(5):775-9 Aulas 3 e 4 - Medidas de tendência central e de dispersão 36 Box plot Questão 16 Os dados a seguir são de uma pesquisa que investigou as concentrações de minerais no leite materno, no período de 1984 a 1985. Foram coletadas amostras de leite materno de 55 mulheres que tiveram seus filhos no Hospital Maternidade Odete Valadares, em Belo Horizonte. As mães foram divididas em período de lactação: colostro e leite maduro. cálcio (g/mL 113 163 167 cálcio (g/mL 159 238 277 de leite) – grupo colostro 181 254 311 225 275 313 241 303 325 de leite) – grupo maduro 175 181 188 238 242 244 279 281 293 334 372 375 145 163 437 221 231 256 296 312 323 344 375 200 256 302 206 259 303 213 260 314 214 263 344 217 264 394 231 275 a) Calcule a quantidade média de cálcio (g/mL de leite) em cada grupo. b) Calcule a quantidade mediana de cálcio (g/mL de leite) em cada grupo. c) Desenhe o box plot da concentração de cálcio (g/mL de leite) representando os dois grupos em um só gráfico. d) Comente o gráfico box plot quanto a dispersão dos dados, existência de valores aberrantes e igualdade de medianas. Aulas 3 e 4 - Medidas de tendência central e de dispersão 37 Questão 16 26 Grupo colostro: x x i 1 i n 7055 271,35g / mL 26 26 Grupo maduro: x x i 1 n i 7310 252,07g / mL 29 Grupo colostro: n=26 (par) Mediana é a media dos valores que ocupam os postos 13 e 14. Med 275 296 285,5g / mL 2 Grupo maduro: n=29 (ímpar); a mediana é o valor da variável que ocupa o posto 15. Med= 256 g/mL Aulas 3 e 4 - Medidas de tendência central e de dispersão 38 Questão 16 Medida Grupo colostro Q1 211 Q2 285,5 Q3 327,25 Valor adjacente inferior 113 Valor adjacente superior 437 valor adjacente superior: maior valor abaixo de Q3+1,5x(IIQ) Valor adjacente inferior: Menor valor acima de Q1-1,5x(IIQ) Grupo maduro 213,5 256 280 159 344 var1 500 450 400 350 300 250 200 150 100 grupo colostro grupo maduro “Box plot” da variável concentração de cálcio (g/mL) segundo grupo de leite (colostro e maduro) Aulas 3 e 4 - Medidas de tendência central e de dispersão 39