Matéria: Matemática Assunto: Variância e desvio padrão Prof. Dudan Matemática VARIÂNCIA Na estatística, a variância de uma variável aleatória é uma medida da sua dispersão estatística, indicando quão longe em geral os seus valores se encontram do valor esperado. •• A variância deve ser calculada através da soma dos quadrados entre a diferença de um valor observado e o valor médio. A diferença serve para mostrar quanto um valor observado se distancia do valor médio. •• Para população a fórmula é a seguinte: VA = ( X1 − Xm)² + ( X2 − Xm)²+ ... ( Xn − Xm) ² n Obs.: a unidade da variância é igual a unidade de medida das observações elevada ao quadrado. Dentro da Estatística, existem diversas formas de analisar um conjunto de dados, a depender da necessidade em cada caso. Imagine que um treinador anote o tempo gasto por cada um de seus atletas a cada treino de corrida e, depois, observe que o tempo de alguns de seus corredores está apresentando considerável variação, o que pode resultar em derrota em uma competição oficial. Nesse caso, é interessante que o treinador tenha algum método para verificar a dispersão entre os tempos de cada atleta. Exemplo: No exemplo citado anteriormente, temos os tempos anotados de cada atleta. Atletas Dia 1 Dia 2 Dia 3 Dia 4 Dia 5 João 63 min 60 min 59 min 55 min 62 min Pedro 54 min 59 min 60 min 57 min 61 min Marcos 60 min 63 min 58 min 62 min 55 min www.enemquiz.com.br 3 Antes de calcular a variância, é necessário encontrar a média aritmética dos tempos de cada atleta. Para tanto, o treinador fez os seguintes cálculos: Agora que o treinador já conhece o tempo médio de cada atleta, ele pode utilizar a variância para obter a distância dos períodos de cada corrida em relação a esse valor médio. Para calcular a variância de cada corredor, pode ser realizado o seguinte cálculo: Para cada atleta, o treinador calculou a variância: 4 www.enemquiz.com.br Matemática – Prof. Dudan De acordo com os cálculos da variância, o atleta que apresenta os tempos mais dispersos da média é o Marcos. Já Pedro apresentou tempos mais próximos de sua média do que os demais corredores. Exemplo: Observe as notas de três competidores em uma prova de manobras radicais com skates. Competidor A: 7,0 – 5,0 – 3,0 Competidor B: 5,0 – 4,0 – 6,0 Competidor C: 4,0 – 4,0 – 7,0 Ao calcular a média das notas dos três competidores iremos obter média cinco para todos, impossibilitando a nossa análise sobre a regularidade dos competidores. Partindo dessa ideia, precisamos adotar uma medida que apresente a variação dessas notas no intuito de não comprometer a análise. Assim calcularemos a variância dos valores apresentados por atleta. (7 – 5)²+ (5 – 5)²+ (3 – 5)² 4 + 0 + 4 VA = = = 2,667 3 3 (5 – 5)²+ (4 – 5)²+ (6 – 5)² 0 + 1 + 1 = = 0,667 3 3 (4 – 5)²+ (4 – 5)²+ (7 – 5)² 1 + 1 + 4 = =2 VC = 3 3 VB = Assim percebemos que o competidor B é o mais regular de todos. Exemplo: O dono de uma microempresa pretende saber, em média, quantos produtos são produzidos por cada funcionário em um dia. O chefe tem conhecimento que nem todos conseguem fazer a mesma quantidade de peças, mas pede que seus funcionários façam um registro de sua produção em uma semana de trabalho. Ao fim desse período, chegou-se à seguinte tabela: www.enemquiz.com.br 5 Funcionários Quantidade de peças produzidas por dia Seg Ter Quar Quin Sext A 10 9 11 12 8 B 15 12 16 10 11 C 11 10 8 11 12 D 8 12 15 9 11 Para saber a produção média de seus funcionários, o chefe faz o cálculo da média aritmética de produção, isto é, a soma do número de peças produzido em cada dia dividida pela quantidade analisada de dias. A partir desse cálculo, temos a produção diária média de cada funcionário. Mas se observarmos bem a tabela, veremos que há valores distantes da média. O funcionário B, por exemplo, produz uma média de 12,8 peças por dia. No entanto, houve um dia em que ele produziu 16 peças e outro dia em que ele confeccionou apenas 10 peças. Será que o processo utilizado pelo dono da empresa é suficiente para o seu propósito? Faremos o cálculo da variância para cada um dos funcionários. Primeiramente calcularemos a média de peças produzidas por cada um deles. Agora a variância: 6 www.enemquiz.com.br Matemática – Prof. Dudan Podemos afirmar que a produção diária do funcionário C é mais uniforme do que a dos demais funcionários, assim como a quantidade de peças diárias de D é a mais desigual. Quanto maior for a variância, mais distantes da média estarão os valores, e quanto menor for a variância, mais próximos os valores estarão da média. •• Para amostra a soma dessas diferenças deve ser dividida por n-1 , onde n é o número de elementos da amostra. ( ( )² )² )² ( VA = X1 − Xm + X2 − Xm + ... Xn − Xm n−1 Exemplo: Calcular a variância amostral do conjunto : 1, 2, 3, 4, 5 n = 5 e Xm (média) = 3 logo: Var = = = = 2,5 www.enemquiz.com.br 7 DESVIO PADRÃO O desvio padrão é calculado extraindo a raiz quadrada da variância. D.P. = VA A unidade do desvio padrão é igual a unidade de medida das observações. Exemplo: O dono de uma microempresa pretende saber, em média, quantos produtos são produzidos por cada funcionário em um dia. O chefe tem conhecimento que nem todos conseguem fazer a mesma quantidade de peças, mas pede que seus funcionários façam um registro de sua produção em uma semana de trabalho. Ao fim desse período, chegou-se à seguinte tabela: Funcionários Quantidade de peças produzidas por dia Seg Ter Quar Quin Sext A 10 9 11 12 8 B 15 12 16 10 11 C 11 10 8 11 12 D 8 12 15 9 11 Faremos o cálculo da variância para cada um dos funcionários. Primeiramente calcularemos a média de peças produzidas por cada um deles. Matemática – Prof. Dudan Agora a variância: www.enemquiz.com.br 9 Calculando o desvio, temos: Exemplo: O serviço de atendimento ao consumidor de uma concessionária de veículos recebe as reclamações dos clientes via telefone. Tendo em vista a melhoria nesse serviço, foram anotados os números de chamadas durante um período de sete dias consecutivos. Os resultados obtidos foram os seguintes: Dia Número de chamadas Domingo 3 Segunda 4 Terça 6 Quarta 9 Quinta 5 Sexta 7 Sábado 8 Sobre as informações contidas nesse quadro, podemos afirmar que: a) b) c) d) e) 10 O número médio de chamadas dos últimos sete dias foi 6,5. A média é menor que a variância. A variância dos dados é 4. O desvio padrão dos dados é √2. O desvio é um número ímpar. www.enemquiz.com.br