Estatística - As Separatrizes Prof. Antonio Sales Antes de estudarmos sobre as separatrizes vejamos um pouco mais sobre Medidas de DISPERSÃO OU VARIABILIDADE Já vimos que o desvio em relação à média, o desvio padrão e o coeficiente de variação são medidas de dispersão ou variabilidade. A amplitude total também é uma medida de dispersão. Existem ainda o chamado desvio quartílico e o desvio médio (DM) ou afastamento médio (AM). O desvio quartílico (DQ) consiste na metade da diferença entre o Q Q1 primeiro e o terceiro quartis ( DQ 3 ), e o afastamento médio que é a soma do 2 módulo dos afastamentos dividido pelo número deles, isto é, é a média aritmética do fi | di | . soma dos módulos dos afastamentos. Em símbolos: DM= n a) Por que usar módulo para o cálculo de DM ou AM? b) O que acontecerá se não usarmos módulo? c) O que é o módulo de um número? MEDIDAS DE POSIÇÂO Outras medidas estatísticas são as chamadas medidas de posição. Entre essas temos as de tendência central e as separatrizes. Média, Moda e Mediana são medidas de tendência central e os quartis, decis e percentis são as separatrizes, embora a mediana também seja uma separatriz. A mediana coincide com o segundo quartil, quinto decil e qüinquagésimo percentil. Exemplo: Seja a seqüência 4 ,6, 8, 9, 10, 11, 12, 14, 15, é fácil perceber que a mediana é o número 10 e que ela divide a seqüência em dois grupos: o grupo dos valores superiores a ela e o grupo dos valores inferiores a ela. Os grupos são: {4, 6, 8, 9} e {11, 12, 14, 15}. No entanto, esses dois grupos também têm suas medianas, que são os quartis. A mediana do primeiro grupo é o primeiro quartil e a mediana do segundo grupo será o terceiro quartil. Assim, na seqüência 4, 6, 8, 9, 10, 11, 12, 14, 15, temos: a) 1º quartil = 7 b) 2º quartil=10 (a própria mediana) c) 3º quartil = 13 25% dos dados são inferiores ao primeiro quartil, 25% estão entre o primeiro e o segundo quartis, 25% entre o segundo e o terceiro quartis e 25% estão acima do terceiro quartil. Nessa porcentagem usa-se incluir a separatriz. Exemplo: 25 está até o 1º quartil. Como uma seqüência sempre terá apenas quatro quartis a fórmula para obtê-los será k fi Qk= , onde k é o número de ordem do quartil, quando os dados são agrupados 4 k fi F (ant ) h * 4 , mas não estiverem dispostos em intervalos de classe e Qk = * f* para dados agrupados e com intervalos de classe. Nesse caso, F(ant) é a freqüência acumulada até à classe anterior, h*, f* e * são a freqüência simples, a amplitude e o limite inferior da classe onde o quartil estiver localizado. Essa fórmula é obtida por uma interpolação partindo do pressuposto de que os valores procurados se encontram equidistribuídos na classe, de forma linear. 1. Exemplo: As notas de Bioestatística de uma turma de acadêmicos foram i 1 2 3 4 5 6 Notas 0 I---2 2 I--- 4 4 I--- 6 6 I--- 8 8 I--- 10 10I---12 xi 1 3 5 7 9 11 fi 2 10 21 21 8 1 63 Fi 2 12 33 54 62 63 A classe onde está localizado o primeiro quartil é: Q1=63/4=15,75, portanto, é o 15,75º elemento, isto é, está na 3ª classe ( pois até à segunda só tem 12 elementos)i Quem é o primeiro quartil, então? Vamos à fórmula: F(ant) =12; h*=2; f*=21(freqüência da 3ª classe) e *=4 ( limite inferior da 3ª classe) 15,75 12.2 84 3,75.2 84 7,5 91,5 4,3 Q1= 4 21 21 21 21 Agora determine a mediana e o terceiro quartil. (5,8 e 7,3) Por que não se falou em quarto quartil? As separatrizes servem para auxiliar a comparação e favorecer a análise. Para determinar os decis e percentis usamos a mesma fórmula dos quartis substituindo o 4 por 10 ou 100. 6.63 Para D6 temos =37,8 e 37,8 está na 4ª classe, pois antes dessa classe só há 33 10 (37,8 33).2 4,8 x 2 9,6 elementos. Dessa forma, D6= 6 6+ =6+ =6+0,4=6,4 21' 21 21 O sexto decil é 6,4. Agora determine o segundo decil. Observe que a mediana corresponde ao 5º decil. Para o cálculo dos percentis usa-se o mesmo critério substituindo o denominador 10 por 100 e a mediana corresponde o 50º percentil. i Quando há intervalo de classe se valor encontrado coincidir com um dos valores da coluna de Fi então o quartil, decil ou percentil será o limite superior daquela classe. Se, por exemplo, ao determinarmos a classe de um percentil encontrarmos diretamente o valor 33(F3), definiremos aquele percentil como sendo o número 6 (limite superior da 3ª classe). Quando não há intervalo de classe e o valor encontrado coincidir com um valor da Fi então toma-se a média aritmética entre o xi daquela classe e o xi da classe seguinte. 29 2. As notas de Bioestatística de uma turma de acadêmicos foram i 1 2 3 4 5 6 7 8 9 10 Notas fi 5,5 6,0 6,5 7,0 7,5 8,0 8,5 9,0 9,5 10,0 1 2 7 9 5 2 5 3 3 2 Fi fixi (xi)2 fi(xi)2 39 a)Nesta distribuição de freqüência os dados estão agrupados? Por quê? b) Complete a tabela e: 1) Calcule o desvio padrão 2) Calcule a mediana e o terceiro quartil. 3) Calcule o 8º decil 4) Qual o desvio médio? 5) Qual a variância? 6) Qual o coeficiente de variação? 7) Qual o desvio quartílico? 3. Na seqüência 3,3,3,4,5,6,7,8,8,8,8,9,10,11,15,16,17,20,23,23,23 os dados estão agrupados? Calcule também: 1) Calcule o desvio padrão 2) Calcule a mediana e o primeiro quartil. 3) Calcule o 7º decil 4) Calcule o 40º percentil 5) Qual o desvio médio? 6) Qual a variância? 7) Qual o coeficiente de variação? 8) Qual o desvio quartílico? Em estudos de Epidemiologia pode-se recorrer à determinação dos níveis endêmicos utilizando a mediana. Nesse caso os percentis são determinados pela n 1 fórmula: Pk= .k 100 n 1 .20 . Os percentis dos gráficos de Por exemplo, o vigésimo percentil será: P20= 100 peso e altura de para crianças são obtidos através da mediana. RESPOSTAS 1)a,b). Sem módulo a soma dos desvios é zero. c)Módulo de um número é o seu valor absoluto (quando se desconsidera o sinal) e indica-se por meio de duas barras. Exemplo:-7=+7=7 2) a) sim porque a indicação da freqüência está separada em outra coluna. Por exemplo, o 6,0 aparece uma única vez na coluna notas e na coluna de freqüência é indicada a sua repetição. b) média =7,63 1)1,18 2)7,5 e 8,5 3) 9,0 4)7,53 5) 1,38 6)15% 7) 1 3) não. O 8, por exemplo, é visto 4 vezes Para resolver é aconselhável fazer a distribuição dos dados 30 fi Fi fixi (xi)2 fi(xi)2 di IdiI fiIdiI 3 3 9 9 27 -8,0 8,0 24,0 1 4 4 16 16 -7,0 7,0 7,0 1 5 5 25 25 -6,0 6,0 6,0 1 6 6 36 36 -5,0 5,0 5,0 1 7 7 49 49 -4,0 4,0 4,0 4 11 32 64 256 -3,0 3,0 12,0 1 12 9 81 81 -2,0 2,0 2,0 1 13 10 100 100 -1,0 1,0 1,0 1 14 11 121 121 0,0 0,0 0,0 1 15 15 225 225 4,0 4,0 4,0 1 16 16 256 256 5,0 5,0 5,0 1 17 17 289 289 6,0 6,0 6,0 1 18 20 400 400 9,0 9,0 9,0 3 21 69 529 1587 12,0 12,0 36,0 =121 =21 =230 =3468 Media 11; 1) s=6,7; 2) a mediana é 8 ( 10,5º elemento) e Q1=6 (5,25 elemento); 3) d7=15 (14,7º elemento); 4) P40=8(8,4º elemento); 5) DM=5,7 (121/21); 6)Var=s2=121; 7) CV=61,4%; 8)DQ=(Q3-Q1)/2=(16-6)/2=5 Bibliografia Consultada CRESPO, Antonio Arnot. Estatística Fácil. 18.ed. São Paulo: Saraiva, 2005 MENEGHEL, Stela Nazareth (org.) Cadernos de exercícios de epidemiologia. Canoas,RS: Ed. ULBRA, 2002. MOREIRA, José dos Santos. Elementos de Estatística. 8.ed. São Paulo: Atlas, 1971. OLIVEIRA, Francisco E. Martins de. Estatística e Probabilidade. 2.ed. São Paulo: Atlas, 1999. REIS, Melchisedech Domiciano. Elementos Básicos de Estatística. 2.ed. São Paulo: Estrutura, 1978. SPIEGEL, Murray R. Estatística: resumo e teoria. São Paulo: McGraw-Hill do Brasil, 1976. TORANZOS, Fausto I. Estatística. São Paulo: Editora Mestre Jou, 1962. TRIOLA, Mario F. Introdução à Estatística. 7. ed. Rio de Janeiro: LTC, 1999. i 1 2 3 4 5 6 7 8 9 10 11 12 13 14 xi 3 4 5 6 7 8 9 10 11 15 16 17 20 23 31