Bioestatística - As Separatrizes

Propaganda
Estatística - As Separatrizes
Prof. Antonio Sales
Antes de estudarmos sobre as separatrizes vejamos um pouco mais sobre Medidas de
DISPERSÃO OU VARIABILIDADE
Já vimos que o desvio em relação à média, o desvio padrão e o coeficiente de variação
são medidas de dispersão ou variabilidade. A amplitude total também é uma medida de
dispersão.
Existem ainda o chamado desvio quartílico e o desvio médio (DM) ou afastamento
médio (AM). O desvio quartílico (DQ) consiste na metade da diferença entre o
Q  Q1
primeiro e o terceiro quartis ( DQ  3
), e o afastamento médio que é a soma do
2
módulo dos afastamentos dividido pelo número deles, isto é, é a média aritmética do
 fi | di | .
soma dos módulos dos afastamentos. Em símbolos: DM=
n
a) Por que usar módulo para o cálculo de DM ou AM?
b) O que acontecerá se não usarmos módulo?
c) O que é o módulo de um número?
MEDIDAS DE POSIÇÂO
Outras medidas estatísticas são as chamadas medidas de posição. Entre essas temos as
de tendência central e as separatrizes. Média, Moda e Mediana são medidas de
tendência central e os quartis, decis e percentis são as separatrizes, embora a mediana
também seja uma separatriz. A mediana coincide com o segundo quartil, quinto decil e
qüinquagésimo percentil.
Exemplo:
Seja a seqüência 4 ,6, 8, 9, 10, 11, 12, 14, 15, é fácil perceber que a mediana é o
número 10 e que ela divide a seqüência em dois grupos: o grupo dos valores superiores
a ela e o grupo dos valores inferiores a ela. Os grupos são: {4, 6, 8, 9} e {11, 12, 14,
15}.
No entanto, esses dois grupos também têm suas medianas, que são os quartis. A
mediana do primeiro grupo é o primeiro quartil e a mediana do segundo grupo será o
terceiro quartil.
Assim, na seqüência 4, 6, 8, 9, 10, 11, 12, 14, 15, temos:
a) 1º quartil = 7
b) 2º quartil=10 (a própria mediana)
c) 3º quartil = 13
25% dos dados são inferiores ao primeiro quartil, 25% estão entre o primeiro e o
segundo quartis, 25% entre o segundo e o terceiro quartis e 25% estão acima do
terceiro quartil. Nessa porcentagem usa-se incluir a separatriz. Exemplo: 25 está até o
1º quartil.
Como uma seqüência sempre terá apenas quatro quartis a fórmula para obtê-los será
k  fi
Qk=
, onde k é o número de ordem do quartil, quando os dados são agrupados
4
 k  fi

 F (ant ) h *

4
 ,
mas não estiverem dispostos em intervalos de classe e Qk =  *  
f*
para dados agrupados e com intervalos de classe. Nesse caso, F(ant) é a freqüência
acumulada até à classe anterior, h*, f* e * são a freqüência simples, a amplitude e o
limite inferior da classe onde o quartil estiver localizado. Essa fórmula é obtida por uma
interpolação partindo do pressuposto de que os valores procurados se encontram
equidistribuídos na classe, de forma linear.
1. Exemplo: As notas de Bioestatística de uma turma de acadêmicos foram
i
1
2
3
4
5
6
Notas
0 I---2
2 I--- 4
4 I--- 6
6 I--- 8
8 I--- 10
10I---12
xi
1
3
5
7
9
11
fi
2
10
21
21
8
1
63
Fi
2
12
33
54
62
63
A classe onde está localizado o primeiro quartil é:
Q1=63/4=15,75, portanto, é o 15,75º elemento, isto é, está na 3ª classe ( pois até à
segunda só tem 12 elementos)i
Quem é o primeiro quartil, então?
Vamos à fórmula:
F(ant) =12; h*=2; f*=21(freqüência da 3ª classe) e *=4 ( limite inferior da 3ª classe)
15,75  12.2  84  3,75.2  84  7,5  91,5  4,3
Q1= 4 
21
21
21
21
Agora determine a mediana e o terceiro quartil. (5,8 e 7,3)
Por que não se falou em quarto quartil?
As separatrizes servem para auxiliar a comparação e favorecer a análise.
Para determinar os decis e percentis usamos a mesma fórmula dos quartis substituindo o
4 por 10 ou 100.
6.63
Para D6 temos
=37,8 e 37,8 está na 4ª classe, pois antes dessa classe só há 33
10
(37,8  33).2
4,8 x 2
9,6
elementos. Dessa forma, D6= 6 
6+
=6+
=6+0,4=6,4
21'
21
21
O sexto decil é 6,4.
Agora determine o segundo decil.
Observe que a mediana corresponde ao 5º decil.
Para o cálculo dos percentis usa-se o mesmo critério substituindo o denominador 10 por
100 e a mediana corresponde o 50º percentil.
i
Quando há intervalo de classe se valor encontrado coincidir com um dos valores da coluna de Fi então o
quartil, decil ou percentil será o limite superior daquela classe. Se, por exemplo, ao determinarmos a
classe de um percentil encontrarmos diretamente o valor 33(F3), definiremos aquele percentil como sendo
o número 6 (limite superior da 3ª classe).
Quando não há intervalo de classe e o valor encontrado coincidir com um valor da Fi então toma-se a
média aritmética entre o xi daquela classe e o xi da classe seguinte.
29
2. As notas de Bioestatística de uma turma de acadêmicos foram
i
1
2
3
4
5
6
7
8
9
10
Notas
fi
5,5
6,0
6,5
7,0
7,5
8,0
8,5
9,0
9,5
10,0
1
2
7
9
5
2
5
3
3
2
Fi
fixi
(xi)2
fi(xi)2
39
a)Nesta distribuição de freqüência os dados estão agrupados? Por quê?
b) Complete a tabela e:
1) Calcule o desvio padrão
2) Calcule a mediana e o terceiro quartil.
3) Calcule o 8º decil
4) Qual o desvio médio?
5) Qual a variância?
6) Qual o coeficiente de variação?
7) Qual o desvio quartílico?
3. Na seqüência 3,3,3,4,5,6,7,8,8,8,8,9,10,11,15,16,17,20,23,23,23 os dados estão
agrupados?
Calcule também:
1) Calcule o desvio padrão
2) Calcule a mediana e o primeiro quartil.
3) Calcule o 7º decil
4) Calcule o 40º percentil
5) Qual o desvio médio?
6) Qual a variância?
7) Qual o coeficiente de variação?
8) Qual o desvio quartílico?
Em estudos de Epidemiologia pode-se recorrer à determinação dos níveis
endêmicos utilizando a mediana. Nesse caso os percentis são determinados pela
n 1
fórmula: Pk=
.k
100
n 1
.20 . Os percentis dos gráficos de
Por exemplo, o vigésimo percentil será: P20=
100
peso e altura de para crianças são obtidos através da mediana.
RESPOSTAS
1)a,b). Sem módulo a soma dos desvios é zero. c)Módulo de um número é o seu valor absoluto (quando se
desconsidera o sinal) e indica-se por meio de duas barras. Exemplo:-7=+7=7
2) a) sim porque a indicação da freqüência está separada em outra coluna. Por exemplo, o 6,0 aparece uma
única vez na coluna notas e na coluna de freqüência é indicada a sua repetição.
b) média =7,63 1)1,18 2)7,5 e 8,5 3) 9,0 4)7,53 5) 1,38 6)15% 7) 1
3) não. O 8, por exemplo, é visto 4 vezes
Para resolver é aconselhável fazer a distribuição dos dados
30
fi
Fi fixi
(xi)2 fi(xi)2 di
IdiI fiIdiI
3
3
9
9
27 -8,0
8,0
24,0
1
4
4
16
16 -7,0
7,0
7,0
1
5
5
25
25 -6,0
6,0
6,0
1
6
6
36
36 -5,0
5,0
5,0
1
7
7
49
49 -4,0
4,0
4,0
4
11
32
64
256 -3,0
3,0
12,0
1
12
9
81
81 -2,0
2,0
2,0
1
13
10 100
100 -1,0
1,0
1,0
1
14
11 121
121
0,0
0,0
0,0
1
15
15 225
225
4,0
4,0
4,0
1
16
16 256
256
5,0
5,0
5,0
1
17
17 289
289
6,0
6,0
6,0
1
18
20 400
400
9,0
9,0
9,0
3
21
69 529
1587 12,0 12,0
36,0
=121
=21
=230
=3468
Media 11; 1) s=6,7; 2) a mediana é 8 ( 10,5º elemento) e Q1=6 (5,25 elemento); 3)
d7=15 (14,7º elemento); 4) P40=8(8,4º elemento); 5) DM=5,7 (121/21);
6)Var=s2=121; 7) CV=61,4%; 8)DQ=(Q3-Q1)/2=(16-6)/2=5
Bibliografia Consultada
CRESPO, Antonio Arnot. Estatística Fácil. 18.ed. São Paulo: Saraiva, 2005
MENEGHEL, Stela Nazareth (org.) Cadernos de exercícios de epidemiologia.
Canoas,RS: Ed. ULBRA, 2002.
MOREIRA, José dos Santos. Elementos de Estatística. 8.ed. São Paulo: Atlas, 1971.
OLIVEIRA, Francisco E. Martins de. Estatística e Probabilidade. 2.ed. São Paulo:
Atlas, 1999.
REIS, Melchisedech Domiciano. Elementos Básicos de Estatística. 2.ed. São Paulo:
Estrutura, 1978.
SPIEGEL, Murray R. Estatística: resumo e teoria. São Paulo: McGraw-Hill do Brasil,
1976.
TORANZOS, Fausto I. Estatística. São Paulo: Editora Mestre Jou, 1962.
TRIOLA, Mario F. Introdução à Estatística. 7. ed. Rio de Janeiro: LTC, 1999.
i
1
2
3
4
5
6
7
8
9
10
11
12
13
14
xi
3
4
5
6
7
8
9
10
11
15
16
17
20
23
31
Download