Disciplina: Estatística Profa. Neide Pinheiro MEDIDAS DE DISPERSÃO A utilização de uma medida de tendência central – como representante de um conjunto de dados – não descreve totalmente esse conjunto de dados. Consideremos que duas cidades têm a média de temperatura diária de 24ºC. Embora a temperatura seja, basicamente, a mesma nas duas cidades em uma delas existem melhores condições para esportes aquáticos e para outras atividades ao ar livre. Na primeira cidade a temperatura oscila entre 21ºC e 27ºC durante todo o ano. Na segunda cidade a temperatura, oscila de 4ºC a 38ºC no mesmo período – ou seja, as piscinas nessa cidade não permanecem lotadas o ano todo. Constatado o fato, precisamos de medidas que expressem as diferenças entre os valores desses dados. 1. AMPLITUDE TOTAL A mais simples das medidas de dispersão é a amplitude total. A amplitude total é a diferença entre o maior e o menor valor de um conjunto de dados, ou seja... A T = Max - min Onde... AT = amplitude total Max = maior valor da distribuição Min = menor valor da distribuição EXEMPLO Retornemos ao exemplo das cidades que têm a média de temperatura diária de 24º. A amplitude total da temperatura da primeira cidade é 27 - 21 = 6º. Já a amplitude total da segunda cidade é 38 - 4 = 34º. DESVANTAGENS Como a amplitude total depende de dois valores do conjunto de dados – o maior e o menor valor... Ela é altamente influenciada por valores extremos. Considerando os salários de 50 empregados de uma empresa...Se o maior salário é R$ 2.800,00 e o menor salário, R$ 2.100,00, a amplitude total é... AT = 2.800 - 2.100 = R$ 700,00 Essas são as medidas de dispersão. Se a empresa precisar contratar um especialista sênior, cujo salário deve ser de R$10.000,00, a amplitude passa a ser.. AT= 10.000 - 2.100 = R$ 7.900,00 Logo, o grande valor de amplitude não expressa, adequadamente, a variabilidade dos dados, pois a maioria dos salários está no intervalo R$ 2.100,00 a R$ 2.800,00. VARIÂNCIA A variância é expressa pela letra grega sigma ao quadrado “σ2‟‟ quando tratar-se de população e “S²” quando tratar-se de amostra. A variância – a mais importante das medidas de dispersão – é uma medida de variabilidade que utiliza todos os dados de uma distribuição. Em razão de suas propriedades matemáticas a média de um conjunto de dados é uma informação relevante. A variância é baseada na diferença entre o valor de cada observação e a média do conjunto de dados. Variância da Amostra A fórmula da variância da amostra pode ser representada da seguinte forma... DESVIO-PADRÃO DA AMOSTRA A fórmula do desvio-padrão da amostra pode ser representada da seguinte forma... S = √ S² raiz quadrada da variância Interpretação do desvio padrão Regra Empírica Para qualquer distribuição amostral com X e desvio padrão S, tem-se: O intervalo X ± S contém entre 60% e 80% de todas as observações amostrais. A porcentagem aproxima-se de 70% para distribuições aproximadamente de 70% para distribuições aproximadamente simétricas, chegando a 90% para distribuições fortemente assimétricas. COEFICIENTE DE VARIAÇÃO Em algumas situações, podemos desejar obter uma medida que indique o tamanho do desvio-padrão em relação à média – uma medida relativa. Exemplo: Em uma empresa, o salário médio dos homens é de R$ 4000, com desvio padrão de R$ 1500, e o das mulheres é em média de R$ 3000, com desvio padrão de R$1200. Para os homens C.V = 1500/ 4000 = 0,375 Para as mulheres C.V = 1200 / 3000 = 0,4 Logo, podemos concluir que os salários das mulheres apresentaram maior dispersão relativa que os dos homens. Para obtermos o resultado do C.V em porcentagem multiplicamos o resultado por 100. No caso: C.V = para homens 37,5% C.V = para mulheres 40% Eis algumas regras empíricas para interpretações do coeficiente de variação: Se C.V ≤ 15% tem-se baixa dispersão Se 15% < C.V < 30% tem-se média dispersão Se C.V ≥ 30% tem-se elevada dispersão