Universidade Federal do Pará Instituto de Ciências Exatas e Naturais Faculdade de Estatística Estatística Prof.ª Marina Yassuko Toma Belém - Pará 2014 5 - MEDIDAS DE TENDÊNCIA CENTRAL São medidas representativas das características avaliadas pelos seus valores centrais, em torno dos quais tendem a concentrar-se os dados. Tais medidas possibilitam comparações de séries de dados pelo confronto de seus valores. As medidas de tendência centrais mais utilizadas são: média aritmética, moda e mediana. 5.1. MÉDIA ARITMÉTICA: X A média aritmética é obtida pela soma de todos os valores de uma variável X dividida pelo número total de observações (n): n Xi X X 2 ... Xn i 1 . X 1 n n Exemplo: Sabendo-se que o atendimento diário em uma empresa de arquitetura, durante uma semana foi de 10, 14, 13, 15, 16, 18 e 12 pessoas, temos para atendimento médio diário na semana de: X 10 14 13 15 16 18 12 14 pessoas. 7 Se os dados estão agrupados em uma distribuição de frequência, devem ser consideradas duas possibilidades: a) Sem intervalos de classe: Consideremos a distribuição relativa a 34 famílias de quatro filhos, tomando para variável o número de filhos do gênero masculino. Calcularemos a quantidade média de meninos por família: Nº de meninos 0 1 2 3 4 Total Nº de famílias ( f i ) 2 6 10 12 4 34 Como as frequências são números indicadores da intensidade de cada valor da variável, elas funcionam como fatores de ponderação, o que nos leva a calcular a média aritmética ponderada, dada pela fórmula: k ( fi Xi ) f X f2 X 2 ... fk Xk X 1 1 i 1 k f1 f2 ... fk k em que f i 1 fi i n i 1 Que na prática pode ser determinado como: xi 0 1 2 3 4 Total fi 2 6 10 12 4 34 xi.fi 0 6 20 36 16 78 k Logo X X i fi i 1 k 78/34 = 2,3 2 fi i 1 b) Com intervalos de classe: Neste caso, convencionamos que todos os valores incluídos em um determinado intervalo de classe coincidem com o seu ponto médio, e determinamos a média aritmética ponderada por meio da fórmula com X i agora sendo o ponto médio da classe. Exemplo: Calcular a estatura média de bebês conforme a tabela abaixo. Estaturas (cm) Frequência ( f i ) 50 |─ 54 4 54 |─ 58 9 58 |─ 62 11 62 |─ 66 8 66 |─ 70 5 70 |─ 74 3 Total 40 Aplicando a fórmula acima temos: X Ponto médio ( X i ) X i fi 52 56 60 64 68 72 208 504 660 512 340 216 2.440 ( Xi fi ) 2440 61. Logo: 40 fi X 61 cm 5.2. MEDIANA ( Md ) Colocados os valores em ordem crescente de grandeza (rol), a mediana ( M d ) será o valor que ocupa a posição central da série de dados, ou seja, é o valor que divide a série em duas partes com números iguais de elementos. A mediana é preferível à média quando se está interessado em conhecer exatamente o centro da distribuição dos dados, ou ainda, quando os valores extremos podem afetar sensivelmente a média. O cálculo da mediana é feito sob duas condições: 5.2.1. A MEDIANA EM DADOS NÃO-AGRUPADOS Dada uma série de valores como, por exemplo: {5, 2, 6, 13, 9, 15, 10}. De acordo com a definição de mediana, o primeiro passo a ser dado é o da ordenação (crescente ou decrescente) dos valores: {2, 5, 6, 9, 10, 13, 15}. O valor que divide a série acima em duas partes iguais é igual a 9, logo M d = 9. i) Método prático para o cálculo da Mediana: a) Se a série de dados tiver número ímpar de termos: O valor mediano será o termo que ocupa a posição central do rol, ou seja, o termo cuja posição é dada pela fórmula: (n + 1)/2 Ex: Calcule a mediana da série {1, 3, 0, 0, 2, 4, 1, 2, 5} 1º - ordenar a série {0, 0, 1, 1, 2, 2, 3, 4, 5} 2º - calcular a posição: n = 9 logo (n + 1)/2 é dado por (9+1) / 2 = 5, ou seja, o 5º elemento da série ordenada será a mediana. Portanto, a mediana será o 5º elemento, então M d = 2 b) Se a série dada tiver número par de termos: O valor mediano será a média aritmética dos valores centrais do rol, ou seja, os termos que ocupam a posição n/2 e n/2+1 Ex: Calcule a mediana da série {1, 3, 0, 0, 2, 4, 1, 3, 5, 6} 1º - ordenar a série {0, 0, 1, 1, 2, 3, 3, 4, 5, 6} 2º - calcular a posição: n = 10 logo a mediana será a média aritmética do termo que ocupa a posição n/2 = 10/2 =5, ou seja, o 5º termo e do termo que ocupa a posição n/2+1 = 10/2+1 = 6, ou seja, o 6º termo. No rol: 5º termo = 2 e 6º termo = 3 A mediana será a média aritmética do 5º e 6º termos da série, ou seja = (2+3) / 2 ou seja, M d = 2,5. 5.2.2. A MEDIANA EM DADOS AGRUPADOS a) Sem intervalos de classe: Neste caso, é o bastante identificar a frequência acumulada ( FAc ) imediatamente superior à metade da soma das frequências. A mediana será aquele valor da variável que corresponde a tal Frequência acumulada. Exemplo: conforme distribuição de frequências abaixo: Variável ( X i ) 0 1 2 3 4 Total Frequência ( f i ) Frequência acumulada ( FAc(i ) ) 2 6 9 13 5 35 2 8 17 30 35 - Quando o somatório das frequências for ímpar o valor mediano será o termo que ocupa a posição dada pela fórmula: f i 1 2 Como o somatório das frequências = 35 a fórmula ficará: (35+1)/2 = 18º termo. Localizando na coluna da variável (Xi), M d = 3. Quando o somatório das frequências for par o valor mediano será a média aritmética dos valores centrais da distribuição, ou seja, os termos que ocupam a posição e f 2 i f i 2 1 Exemplo: Calcule a Mediana da distribuição de frequências abaixo: Variável ( X i ) Frequência ( f i ) Frequência acumulada ( FAc(i ) ) 12 14 15 16 17 20 Total 1 2 1 2 1 1 8 1 3 4 6 7 8 - Localizando a posição da mediana na frequência acumulada teremos: 8/2 = 4º termo e 8/2+1 = 5º termo. Localizando na coluna da variável (Xi), o 4º termo = 15 e o 5º termo = 16. Logo M d = (15 + 16) / 2 = 15,5 b) Com intervalos de classe: Devemos seguir os seguintes passos: 1º) Determinamos as frequências acumuladas; 2º) Calculamos f 2 i para localizar a classe mediana; 3º) Marcamos a classe correspondente à frequência acumulada imediatamente superior à f 2 i . Tal classe será a classe mediana; 4º) Calculamos a Mediana pela fórmula: fi n FAc(ant ) FAc(ant ) h li 2 Md li 2 h fi fi onde: li = Limite inferior da classe da mediana (aquela que contém o elemento n/2); FAc(ant) = Frequência acumulada anterior da classe da Md ; f i = Frequência simples da classe da mediana; h = Intervalo de classe. Exemplo: Classes Frequência ( f i ) Frequência acumulada ( FAc( i ) ) 50 |─ 54 54 |─ 58 58 |─ 62 62 |─ 66 66 |─ 70 70 |─ 74 Total 4 9 11 8 5 3 40 1º Localizar a classe mediana: 4 13 24 32 37 40 fi 2 n 40 20 . A frequência acumulada que 2 2 contém a 20ª unidade é a 3ª classe (classe mediana será 58 |─ 62) 2º Identificar os elementos da fórmula na classe mediana: l i = 58; FAc(ant) = 13; h = 4 e fi = 11; 3º Substituindo esses valores na fórmula, obtemos: Md 58 20 13. 4 60,54 11 Obs: Esta mediana é estimada, pois não temos os 40 valores da distribuição. 5.3. MODA ( Mo ) A moda ( Mo ) é o valor que ocorre com maior frequência ou o valor que mais se repete. Quando a série de dados é tal que as frequências são maiores nos extremos, ou quando se quer destacar um valor de alta frequência ou quando se pretende obter uma medida rápida e aproximada da tendência central, a moda pode então, ser considerada para a interpretação dos dados. Com relação à moda, uma série de dados pode ser classificada em amodal (não possui moda), unimodal (possui apenas uma moda), bimodal (possui duas modas) ou multimodal (possui mais de duas modas). 5.3.1. A Moda quando os dados não estão agrupados A moda é facilmente reconhecida: basta, de acordo com definição, procurar o valor que mais se repete. Ex: Na série {7, 8, 9, 10, 10, 10, 11, 12} a moda é igual a 10. Há séries nas quais não exista valor modal, isto é, nas quais nenhum valor apareça mais vezes que outros. Ex: {3, 5, 8, 10, 12} não apresenta moda. A série é amodal. Em outros casos, pode haver dois ou mais valores de concentração. Dizemos, então, que a série tem dois ou mais valores modais. Ex: {2, 3, 4, 4, 4, 5, 6, 7, 7, 7, 8, 9 } apresenta duas modas: 4 e 7. A série é bimodal. 5.3.2. A Moda quando os dados estão agrupados a) Sem intervalos de classe: Uma vez agrupados os dados, é possível determinar imediatamente a moda: basta localizar o valor da variável de maior frequência. Ex: Qual a temperatura mais comum medida no mês abaixo: Temperatura 0º C 1º C 2º C 3º C Frequência 3 9 12 6 Resp: 2º C é a temperatura modal, pois é a de maior Frequência . b) Com intervalos de classe: A classe que apresenta a maior Frequência é denominada classe modal. Pela definição, podemos afirmar que a moda, neste caso, é o valor dominante que está compreendido entre os limites da classe modal. O método mais simples para o cálculo da moda consiste em tomar o ponto médio da classe modal. Damos a esse valor a denominação de moda bruta. M o (li ls ) / 2 onde li = limite inferior da classe modal e l s = limite superior da classe modal. Exemplo: Calcule a estatura modal conforme a tabela abaixo. Classes (em cm) Frequência 54 |─ 58 9 58 |─ 62 11 62 |─ 66 8 66 |─ 70 5 Resposta: a classe modal é 58|─ 62, pois é a de maior frequência. li = 58 e l s = 62 M o = (58+62) / 2 = 60 cm (este valor é estimado, pois não conhecemos o valor real da moda). Método mais elaborado pela fórmula de CZUBER: (fMo fant ) ( fMo fant ) M l Mo li h ou h o i ( f f ) ( f f ) 2 f ( f f ) Mo post ant post Mo ant Mo onde: li = Limite inferior da classe modal; f Mo = Frequência modal; f ant = Frequência simples anterior à classe modal; f post = Frequência simples posterior à classe modal; h = Intervalo de classe. Exemplo: Calcule a Moda da tabela do exemplo anterior pelo processo de CZUBER 11 9 Mo 58 4 59,6 2 11 9 8 Obs.: A moda é utilizada quando desejamos obter uma medida rápida e aproximada de posição ou quando a medida de posição deva ser o valor mais típico da distribuição. Já a média aritmética é a medida de posição que possui a maior estabilidade e a mediana é a medida mais central. 5.4. MEDIDAS SEPARATRIZES Além das medidas de posição que estudamos, há outras que, consideradas individualmente, não são medidas de tendência central, mas estão ligadas à mediana relativamente à sua característica de separar a série em partes que apresentam o mesmo número de valores. Essas medidas - os quartis, os decis e os percentis - são conhecidas pelo nome genérico de separatrizes. 5.4.1. QUARTIS ( Q q ) Denominamos quartis os valores de uma série que a dividem em quatro partes iguais. Precisamos portanto de 3 quartis (Q1 , Q2 e Q3) para dividir a série em quatro partes iguais. Obs: O quartil 2 (Q2) SEMPRE SERÁ IGUAL A MEDIANA DA SÉRIE. i) QUARTIS EM DADOS NÃO AGRUPADOS O método mais prático é utilizar o princípio do cálculo da mediana para os 3 quartis. Na realidade serão calculadas “3 medianas” em uma mesma série. Exemplo 1: Calcule os quartis da série: {5, 2, 6, 9, 10, 13, 15} - O primeiro passo a ser dado é o da ordenação (crescente ou decrescente) dos valores: {2, 5, 6, 9, 10, 13, 15} - O valor que divide a série acima em duas partes iguais é igual a 9, logo a Md = 9 que será = Q2 = 9. - Temos agora {2, 5, 6} e {10, 13, 15} como sendo os dois grupos de valores iguais proporcionados pela mediana (quartil 2). Para o cálculo do quartil 1 e 3 basta calcular as medianas das partes iguais provenientes da verdadeira Mediana da série (quartil 2). Logo em {2, 5, 6} a mediana é = 5. Ou seja: será o Quartil 2 = Q2 = 5 Em {10, 13, 15} a mediana é =13. Ou seja: será o Quartil 2 = Q2 = 13 Exemplo 2: Calcule os quartis da série: {1, 1, 2, 3, 5, 5, 6, 7, 9, 9, 10, 13} A série já está ordenada, então calcularemos o Quartil 2 = Md = (5+6)/2 = 5,5 O quartil 1 será a mediana da série à esquerda de Md: {1, 1, 2, 3, 5, 5} Q1 = (2+3)/2 = 2,5 O quartil 3 será a mediana da série à direita de Md: {6, 7, 9, 9, 10, 13} Q3 = (9+9)/2 = 9 ii) QUARTIS PARA DADOS AGRUPADOS EM CLASSES A fórmula para determinação dos quartis para dados agrupados é semelhante à usada para o cálculo da mediana. Passos para Determinação do Quartil ( Q q ): k q fi 1º passo: calcula-se a posição do quartil: p 2º passo: identifica-se a classe i 1 4 n ; 4 Qq pela coluna das Frequências Acumuladas; 3º passo: Aplica-se a fórmula: Q q li [ q fi F Ac(ant ) 4 fi ] h , para q = 1, 2, 3 onde: l i = Limite inferior da classe do Quartil; FAc (ant ) = Frequência acumulada anterior a classe do Quartil; fi = Frequência simples da classe do Quartil; h = Intervalo de classe. Exemplo 3 - Calcule os quartis da tabela abaixo: Classes Frequência (fi) Frequência acumulada 50 |─ 54 4 4 54 |─ 58 9 13 58 |─ 62 11 24 62 |─ 66 8 32 66 |─ 70 5 37 70 |─ 74 3 40 Total 40 O quartil 2 = M d , logo: p 2 40 20 . Logo.a classe mediana será 58 |─ 62 4 li = 58........... FAc (ant ) = 13........... fi = 11........... hi = 4 Substituindo esses valores na fórmula, obtemos: 20 13 Q2 58 4 60,54 Md 11 10 4 4 56,66 O quartil 1: p 1 40 10 Q1 54 4 9 30 24 4 65 O quartil 3: 3. fi / 4 = 30 Q3 62 8 5.4.2. DECIS ( Dd ) A definição dos decis obedece ao mesmo princípio dos quartis, com a modificação da porcentagem de valores que ficam aquém e além do decil que se pretende calcular. A fórmula básica será: d×fi /10 onde d é o número de ordem do decil a ser calculado. Indicam-se os decis: D1, D2,... , D9. Deste modo precisa-se de 9 decis para se dividir uma série em 10 partes iguais. D d li [ d fi F Ac(ant ) 10 fi ] h , para d = 1, 2,... , 9. De especial interesse é o quinto decil, que divide o conjunto em duas partes iguais. O quinto decil é igual ao segundo quartil, que por sua vez é igual à mediana. 5.4.3. PERCENTIL ( Pp ) ou CENTIL Denomina-se percentis ou centis como sendo os noventa e nove valores que separam uma série em 100 partes iguais. Indicamos: P 1, P2,... , P99. É evidente que P50 = Md; P25 = Q1 e P75 = Q3. O cálculo de um percentil segue a mesma técnica do cálculo da mediana, porém a fórmula será: p×fi / 100, onde p é o número de ordem do percentil a ser p fi F calculado. Pp li [ 100 Ac(ant ) fi ] h , para p = 1, 2,..., 99. Relação entre as Medidas Separatrizes: Uma relação importante entre as quatro Medidas Separatrizes é na verdade uma relação até visual, que não precisamos fazer esforço para percebê-la, basta traçar uma reta horizontal (que representará o conjunto de dados), e depois fazer as divisões, exatamente como mostramos nas seções anteriores, como pode ser visto a seguir: |-------------------|-------------------| 1 Md 100 |---------|---------|---------|---------| Q1 Q2 Q3 |---|---|---|---|---|---|---|---|---|---| D1 D2 D3 D4 D5 D6 D7 D8 D9 |---|---|---|---|---|---|---|---|---|---| P10 P20 P30 P40 P50 P60 P70 P80 P90 6 - MEDIDAS DE DISPERSÃO 6.1. MEDIDAS DE DISPERSÃO ABSOLUTA 6.1.1. AMPLITUDE TOTAL: É a única medida de dispersão que não tem na média o ponto de referência. Quando os dados não estão agrupados a Amplitude Total é a diferença entre o maior e o menor valor observado: AT X Máx X Mín . Exemplo: Para os valores 40, 45, 48, 62 e 70 a amplitude total será: AT = 70 – 40 =30 Quando os dados estão agrupados sem intervalos de classe ainda temos: AT X Máx X Mín . Exemplo: Xi 0 1 3 4 fi 2 6 5 3 AT = 4 - 0 = 4 Com intervalos de classe a Amplitude Total é a diferença entre o limite superior da última classe e o limite inferior da primeira classe. Então: AT LMáx LMín Exemplo: Classes 4 |─ 6 6 |─ 8 8 |─10 fi 6 2 3 AT = 10 – 4 = 6 A amplitude total tem o inconveniente de só levar em conta os dois valores extremos da série, descuidando do conjunto de valores intermediários. Faz-se uso da amplitude total quando se quer determinar a amplitude da temperatura em um dia, no controle de qualidade ou como uma medida de cálculo rápido sem muita exatidão. 6.1.2. DESVIO QUARTIL: Também chamado de amplitude semi-interquatílica e é baseada nos quartis: Dq (Q3 Q1 ) / 2 Observações: 1) O desvio quartil apresenta como vantagem o fato de ser uma medida fácil de calcular e de interpretar. Além do mais, não é afetado pelos valores extremos, grandes ou pequenos, sendo recomendado, por conseguinte, quando entre os dados figurem valores extremos que não se consideram representativos. 2) O desvio quartil deverá ser usado preferencialmente quando a medida de tendência central for a mediana. 3) Trata-se de uma medida insensível à distribuição dos itens menores que Q 1, entre Q1 e Q3 e maiores que Q3. Exemplo: Para os valores: 40, 45, 48, 62 e 70 o desvio quartil será: Q1 = (45+40)/2 = 42,5 Q3 = (70+62)/2 = 66 Dq = (66 - 42,5) / 2 = 11,75 6.1.3 DESVIO MÉDIO ABSOLUTO ( DM ) i) Para dados brutos: É a média aritmética dos valores absolutos dos desvios tomados em relação a uma das seguintes medidas de tendência central: média ou mediana. a) para a Média = DM ( xi x ) b) para a Mediana: DM n ( xi Md) n (tomados os valores absolutos) Exemplo: Calcular o desvio médio do conjunto de números {- 4, - 3, - 2, 3, 5} X = - 0, 2 e M d = - 2 Tabela auxiliar para cálculo do desvio médio Xi -4 -3 -2 3 5 𝑋𝑖 − 𝑋̅ |𝑋𝑖 − 𝑋̅| 𝑋𝑖 − 𝑀𝑑 |𝑋𝑖 − 𝑀𝑑| (- 4) - (-0,2) = -3,8 (- 3) - (-0,2) = -2,8 (- 2) - (-0,2) = -1,8 3 - (-0,2) = 3,2 5 - (-0,2) = 5,2 = 3,8 2,8 1,8 3,2 5,2 16,8 (- 4) - (-2) = - 2 (- 3) - (-2) = - 1 (- 2) - (-2) = 0 3 - (-2) = 5 5 - (-2) = 7 = 2 1 0 5 7 15 Pela Média: DM = 16,8 / 5 = 3,36 Pela Mediana: DM = 15 / 5 = 3 6.1.4. DESVIO PADRÃO ( S ) É a medida de dispersão mais empregada, pois leva em consideração a totalidade dos valores da variável em estudo. É um indicador de variabilidade bastante estável. O desvio padrão baseia-se nos desvios em torno da média aritmética e a sua fórmula básica pode ser traduzida como: a raiz quadrada da média aritmética dos quadrados dos desvios e é representada por: S n 2 ( Xi X ) i 1 quando tratamos de uma população de dados não-agrupados. n Exemplo: Calcular o desvio padrão da população representada por {-4, -3, -2, 3, 5}. Como X = - 0,2, então: 𝑋𝑖 𝑋𝑖 − 𝑋̅ (𝑋𝑖 − 𝑋̅)2 -4 -3 -2 3 5 - 3,8 - 2,8 - 1,8 3,2 5,2 = 14,44 7,84 3,24 10,24 27,04 62,8 Sabe-se que n = 5 e 62,8/5 = 12,56 S 2 62,8 (Xi X ) 12,56 3,54 n 5 Obs: Quando nosso interesse não se restringe à descrição dos dados, mas partindo da amostra, visamos tirar inferências válidas para a respectiva população, convém efetuar uma modificação, que consiste em usar o divisor n - 1 em lugar de n. A fórmula ficará então: S (X i X )2 n 1 Se os dados {- 4 , -3 , -2 , 3 , 5} representassem uma amostra o desvio padrão amostral será a raiz quadrada de 62,8 / (5 -1) = 3,96. O desvio padrão detém algumas propriedades, dentre as quais destacamos: 1ª: Somando-se (ou subtraindo-se) uma constante a todos os valores de uma variável, o desvio padrão não se altera. 2ª: Multiplicando-se (ou dividindo-se) todos os valores de uma variável por uma constante (diferente de zero), o desvio padrão fica multiplicado (ou dividido) por essa constante. Quando os dados estão agrupados (temos a presença de Frequência s) a fórmula do desvio padrão será: (X i X )2 fi S fi ou (X i X )2 fi S f i 1 quando se trata de uma amostra. Ex: Calcule o desvio padrão populacional da tabela abaixo: Xi f i Xi . f i 0 2 0 1 6 6 2 12 24 3 7 21 4 3 12 Total 30 63 Sabe-se que ̅ 𝑿𝒊 − 𝑿 ̅ )𝟐 (𝑿𝒊 − 𝑿 ̅ )𝟐 . 𝒇𝒊 (𝑿𝒊 − 𝑿 -2,1 -1,1 -0,1 0,9 1,9 4,41 1,21 0,01 0,81 3,61 8,82 7,26 0,12 5,67 10,83 32,70 f i 30 e 32,7 / 30 = 1,09. A raiz quadrada de 1,09 é o desvio padrão = 1,044 Se considerar os dados como sendo de uma amostra o desvio padrão será a raiz quadrada de 32,7 / (30 -1) = 1,062. O desvio padrão pode ser calculado usando a seguinte fórmula prática: S ( X i fi ) 2 n ou S fi 2 X i fi ( X i fi ) 2 n quando se trata de uma amostra. fi 1 X i fi 2 Ex: Calcule o desvio padrão populacional do exemplo anterior: 𝑿𝒊 𝒇𝒊 0 2 1 6 2 12 3 7 4 3 Total 30 S (63)2 30 30 165 𝑿𝒊 .𝒇𝒊 (𝑿𝒊 )𝟐 ( 𝑿 𝒊 ) 𝟐 . 𝒇𝒊 0 6 24 21 12 63 0 1 4 9 16 0 6 48 63 48 165 1,09 1,044 Se os dados forem de uma amostra, o resultado será: S (63)2 30 30 1 165 1,128 1,062 Obs.: Nas tabelas de distribuições de frequências com intervalos de classe a fórmula a ser utilizada é a mesma do exemplo anterior, sendo X i o ponto médio da classe i. Ex: Calcule o desvio padrão populacional da tabela abaixo: Pontos 2├ 4 4├ 6 6├ 8 𝒇𝒊 8 7 13 𝑿𝒊 3 5 7 𝑿𝒊 .𝒇𝒊 24 35 91 (𝑿𝒊 )𝟐 9 25 49 (𝑿𝒊 )𝟐 . 𝒇𝒊 72 175 637 8├ 10 Total () 2 30 9 18 168 81 162 1046 Usando a fórmula prática: S Xi 2 fi ( Xi fi ) 2 fi n (168) 2 30 30 1046 3,507 1,873 Se os dados forem uma amostra, o resultado será: S Xi 2 fi ( Xi fi ) 2 fi 1 n (168) 2 30 30 1 1046 3,628 1,905 2 6.1.5. VARIÂNCIA ( S ) É o desvio padrão elevado ao quadrado. A variância é uma medida que tem pouca utilidade como estatística descritiva, porém é extremamente importante na inferência estatística e em combinações de amostras. 6.2. MEDIDA DE DISPERSÃO RELATIVA 6.2.1 Coeficiente de Variação (CV) É uma medida adimensional, útil para comparar variabilidades de diferentes amostras, onde as médias são muito desiguais ou as unidades de medidas são diferentes. O coeficiente de variação é o desvio padrão expresso em porcentagem da média, isto é, magnitude relativa do desvio padrão quando comparado com a média da distribuição das medidas. É dado por: CV( X) S 100% X Exemplo: Considere os resultados das estaturas e dos pesos de um mesmo grupo de indivíduos: Discriminação Estaturas Pesos Média 175 cm 68 kg Desvio Padrão 5,0 cm 2,0 kg Qual das medidas (Estatura ou Peso) possui maior homogeneidade? Resposta: Teremos que calcular o CV da Estatura e o CV do Peso. O resultado menor será o de maior homogeneidade (menor dispersão ou variabilidade). CV estatura = (5 /175) x 100 = 2,85%; CV peso = (2 / 68) x 100 = 2,94%. Logo, nesse grupo de indivíduos, as estaturas apresentam menor grau de dispersão que os pesos.