Unidade 2 - Medidas estatísticas Prof. Dr. José Cardoso Neto 28 de Abril de 2016 Prof. Dr. José Cardoso Neto Unidade 2 - Medidas estatísticas 28 de Abril de 2016 1 / 13 Unidade 2 - Medidas de posição As medidas de posição, também chamadas de medidas de tendência central, mostram valores em torno do qual os dados se concentram e são usadas para representar o conjunto de dados por um único valor. As Medidas de posição mais utilizadas são: média aritmética, mediana e moda. As outras medidas de posição são as separatrizes, que englobam os quartis, decis e os percentis. Prof. Dr. José Cardoso Neto Unidade 2 - Medidas estatísticas 28 de Abril de 2016 2 / 13 Unidade 2 - Média aritmética A média aritmética é a mais importante medida de posição. Certamente você já calculou várias vezes média aritmética, a nal para ser aprovado numa disciplina você precisa obter mádia maior ou igual a cinco. A média aritmética é denotada por X (lê-se X barra) e é denida pela soma das observações dividida pela quantidade de observações somadas, ou seja, 1 n X = ∑X n =1 i Prof. Dr. José Cardoso Neto i = X1 + X2 + . . . + X n Unidade 2 - Medidas estatísticas n 28 de Abril de 2016 3 / 13 Unidade 2 - Média aritmética - Dados agrupados Quando agrupamos os dados em classes, calculamos a média ponderada onde cada valor Xi tem peso igual sua freqüência fi , ou seja, 1 k X = ∑f X n =1 i i i = f X1 + f2 X2 + . . . + f X n I k k k onde n = ∑ fi e k é o número de classes i =1 Prof. Dr. José Cardoso Neto Unidade 2 - Medidas estatísticas 28 de Abril de 2016 4 / 13 Unidade 2 - Mediana Denotada por Md , é o valor que ocupa a posição central de uma série de n observações ordenadas. A mediana divide um conjunto de dados no meio, deixando 50% dos dados abaixo dela e 50% dos dados acima. O cálculo da mediana depende do número n de observações. Se n é ímpar A mediana é o valor que ocupa a posição central dos dados ordenados. Se n é par A mediana será a média dos dois termos centrais dos dados ordenados. Prof. Dr. José Cardoso Neto Unidade 2 - Medidas estatísticas 28 de Abril de 2016 5 / 13 Unidade 2 - Moda A Moda Mo é o valor que ocorre com maior frequência em um conjunto de dados. Por exemplo, considere que 10 alunos realizaram um teste de estatística obtendo as seguintes notas: 5, 4, 3, 6, 3, 6, 3, 1, 7 e 2. Neste caso, a nota que aparece mais vezes é a nota 3, portanto, para esse conjunto de notas a moda é Mo = 3. Observação: • Existem conjuntos com duas modas, 5, 6, 8, 8, 9, 9, 10. Conjunto bimodal Mo = 8 e Mo = 9. • Existem conjuntos sem moda, 1, 7, 10, 15, 20. Conjunto amodal. • Existem conjuntos com várias modas. Conjunto polimodal. Prof. Dr. José Cardoso Neto Unidade 2 - Medidas estatísticas 28 de Abril de 2016 6 / 13 Unidade 2 - Medidas de Dispersão Para descrição adequada de um fenômeno, não basta saber o valor em torno do qual os dados estão variando, é necessário saber do grau de variabilidade dos dados. Isto é conhecido por meio das medidas de dispersão. As medidas de variabilidade ou medidas de dispersão que vamos calcular são: Variância, Desvio Padrão e Coeciente de Variação. Prof. Dr. José Cardoso Neto Unidade 2 - Medidas estatísticas 28 de Abril de 2016 7 / 13 Unidade 2 - Variância e desvio padrão A variância, assim como o desvio padrão, são medidas que complementam a informação das medidas de posição. Para calcular essas medidas de variabilidade, consideramos os desvios de cada observação em relação à média aritmética, ou seja, Xi − X . Em seguida calculamos a média dos quadrados dos desvios. Assim, para um conjunto de valores X1 , X2 , . . . , X a variância, denotada por S 2 , é calculada como segue: n S2 = 1 n ( Xi − X ) 2 n−1 ∑ =1 i Prof. Dr. José Cardoso Neto Unidade 2 - Medidas estatísticas 28 de Abril de 2016 8 / 13 Unidade 2 - Variância e desvio padrão - dados agrupados Quando os dados estão agrupados em classes, cada valor Xi tem sua freqüência correspondente fi . Neste caso a variância é dada por S2 = 1 k n−1 ∑ =1 f (X i i − X )2 i k onde n = ∑ fi e k é o número de classes i =1 O Desvio padrão é sempre a raiz quadrada positiva da variância, ou seja, √ S = + S2 Prof. Dr. José Cardoso Neto Unidade 2 - Medidas estatísticas 28 de Abril de 2016 9 / 13 Unidade 2 - Coeciente de variação O desvio padrão, quando analisado individualmente, tem limitações. Por exemplo, um desvio padrão S = 2, pode ser considerado pequeno, ou insignicante para uma série de valores cuja média é X = 200, mas se a média for X = 20, esse desvio padrão já é bastante signicativo. Por isso, muitas vezes é conveniente usar uma medida de dispersão relativa para expressar a variabilidade de um conjunto de dados. Nestes casos, usamos o Coeciente de Variação, CV , comparando o desvio padrão com a média, ou seja, calculamos CV Prof. Dr. José Cardoso Neto = S X Unidade 2 - Medidas estatísticas 28 de Abril de 2016 10 / 13 Unidade 2 - Coeciente de variação Como o desvio padrão e a média são expressos na mesma unidade de medida dos dados, o coeciente de variação é uma medida de dispersão relativa adimensional e, portanto, o resultado desta divisão deve ser multiplicado por 100 e expresso em porcentagem, isto é, CV Prof. Dr. José Cardoso Neto = S X × 100 Unidade 2 - Medidas estatísticas 28 de Abril de 2016 11 / 13 Unidade 2 - Quartil, Decil e Percentil A mediana é o valor que ocupa a posição central de uma série de n observações ordenadas, deixando 50% dos dados abaixo dela e 50% dos dados acima. Outras medidas de interesse, obtidas dos dados ordenados, são: •Q1 - primeiro quartil ou quartil inferior; •Q2 - segundo quartil e •Q3 - terceiro quartil ou quartil superior. Que dividem a distribuição (os dados) em quatro partes iguais. Prof. Dr. José Cardoso Neto Unidade 2 - Medidas estatísticas 28 de Abril de 2016 12 / 13 Unidade 2 - O gráco boxplot Variável N Média DP Mín Q1 M PESO 100 64,22 8,61 47,00 59,00 62,50 Prof. Dr. José Cardoso Neto Unidade 2 - Medidas estatísticas d Q3 Máx 70,00 91,00 28 de Abril de 2016 13 / 13