Unidade 2 - Medidas estatísticas

Propaganda
Unidade 2 - Medidas estatísticas
Prof. Dr. José Cardoso Neto
28 de Abril de 2016
Prof. Dr. José Cardoso Neto
Unidade 2 - Medidas estatísticas
28 de Abril de 2016
1 / 13
Unidade 2 - Medidas de posição
As medidas de posição, também chamadas de medidas de tendência
central, mostram valores em torno do qual os dados se concentram e são
usadas para representar o conjunto de dados por um único valor.
As Medidas de posição mais utilizadas são: média aritmética,
mediana e moda. As outras medidas de posição são as separatrizes, que
englobam os quartis, decis e os percentis.
Prof. Dr. José Cardoso Neto
Unidade 2 - Medidas estatísticas
28 de Abril de 2016
2 / 13
Unidade 2 - Média aritmética
A média aritmética é a mais importante medida de posição.
Certamente você já calculou várias vezes média aritmética, a nal para ser
aprovado numa disciplina você precisa obter mádia maior ou igual a cinco.
A média aritmética é denotada por X (lê-se X barra) e é denida
pela soma das observações dividida pela quantidade de observações
somadas, ou seja,
1
n
X = ∑X
n =1
i
Prof. Dr. José Cardoso Neto
i
=
X1 + X2 + . . . + X
n
Unidade 2 - Medidas estatísticas
n
28 de Abril de 2016
3 / 13
Unidade 2 - Média aritmética - Dados agrupados
Quando agrupamos os dados em classes, calculamos a média
ponderada onde cada valor Xi tem peso igual sua freqüência fi , ou seja,
1
k
X = ∑f X
n =1
i
i
i
=
f X1 + f2 X2 + . . . + f X
n
I
k
k
k
onde n = ∑ fi e k é o número de classes
i
=1
Prof. Dr. José Cardoso Neto
Unidade 2 - Medidas estatísticas
28 de Abril de 2016
4 / 13
Unidade 2 - Mediana
Denotada por Md , é o valor que ocupa a posição central de uma
série de n observações ordenadas. A mediana divide um conjunto de dados
no meio, deixando 50% dos dados abaixo dela e 50% dos dados acima. O
cálculo da mediana depende do número n de observações.
Se n é ímpar
A mediana é o valor que ocupa a posição central dos dados
ordenados.
Se n é par
A mediana será a média dos dois termos centrais dos dados
ordenados.
Prof. Dr. José Cardoso Neto
Unidade 2 - Medidas estatísticas
28 de Abril de 2016
5 / 13
Unidade 2 - Moda
A Moda Mo é o valor que ocorre com maior frequência em um
conjunto de dados. Por exemplo, considere que 10 alunos realizaram um
teste de estatística obtendo as seguintes notas: 5, 4, 3, 6, 3, 6, 3, 1, 7 e 2.
Neste caso, a nota que aparece mais vezes é a nota 3, portanto, para esse
conjunto de notas a moda é Mo = 3.
Observação:
•
Existem conjuntos com duas modas, 5, 6, 8, 8, 9, 9, 10. Conjunto bimodal
Mo =
8 e
Mo =
9.
•
Existem conjuntos sem moda, 1, 7, 10, 15, 20. Conjunto amodal.
•
Existem conjuntos com várias modas. Conjunto polimodal.
Prof. Dr. José Cardoso Neto
Unidade 2 - Medidas estatísticas
28 de Abril de 2016
6 / 13
Unidade 2 - Medidas de Dispersão
Para descrição adequada de um fenômeno, não basta saber o valor
em torno do qual os dados estão variando, é necessário saber do grau de
variabilidade dos dados. Isto é conhecido por meio das medidas de
dispersão.
As medidas de variabilidade ou medidas de dispersão que vamos
calcular são: Variância, Desvio Padrão e Coeciente de Variação.
Prof. Dr. José Cardoso Neto
Unidade 2 - Medidas estatísticas
28 de Abril de 2016
7 / 13
Unidade 2 - Variância e desvio padrão
A variância, assim como o desvio padrão, são medidas que
complementam a informação das medidas de posição. Para calcular essas
medidas de variabilidade, consideramos os desvios de cada observação em
relação à média aritmética, ou seja, Xi − X . Em seguida calculamos a
média dos quadrados dos desvios. Assim, para um conjunto de valores
X1 , X2 , . . . , X a variância, denotada por S 2 , é calculada como segue:
n
S2 =
1
n
( Xi − X ) 2
n−1 ∑
=1
i
Prof. Dr. José Cardoso Neto
Unidade 2 - Medidas estatísticas
28 de Abril de 2016
8 / 13
Unidade 2 - Variância e desvio padrão - dados
agrupados
Quando os dados estão agrupados em classes, cada valor Xi tem sua
freqüência correspondente fi . Neste caso a variância é dada por
S2 =
1
k
n−1 ∑
=1
f (X
i
i
− X )2
i
k
onde n = ∑ fi e k é o número de classes
i
=1
O Desvio padrão é sempre a raiz quadrada positiva da variância, ou seja,
√
S = + S2
Prof. Dr. José Cardoso Neto
Unidade 2 - Medidas estatísticas
28 de Abril de 2016
9 / 13
Unidade 2 - Coeciente de variação
O desvio padrão, quando analisado individualmente, tem limitações.
Por exemplo, um desvio padrão S = 2, pode ser considerado pequeno, ou
insignicante para uma série de valores cuja média é X = 200, mas se a
média for X = 20, esse desvio padrão já é bastante signicativo. Por isso,
muitas vezes é conveniente usar uma medida de dispersão relativa para
expressar a variabilidade de um conjunto de dados.
Nestes casos, usamos o Coeciente de Variação, CV , comparando
o desvio padrão com a média, ou seja, calculamos
CV
Prof. Dr. José Cardoso Neto
=
S
X
Unidade 2 - Medidas estatísticas
28 de Abril de 2016
10 / 13
Unidade 2 - Coeciente de variação
Como o desvio padrão e a média são expressos na mesma unidade de
medida dos dados, o coeciente de variação é uma medida de dispersão
relativa adimensional e, portanto, o resultado desta divisão deve ser
multiplicado por 100 e expresso em porcentagem, isto é,
CV
Prof. Dr. José Cardoso Neto
=
S
X
× 100
Unidade 2 - Medidas estatísticas
28 de Abril de 2016
11 / 13
Unidade 2 - Quartil, Decil e Percentil
A mediana é o valor que ocupa a posição central de uma série de n
observações ordenadas, deixando 50% dos dados abaixo dela e 50% dos
dados acima.
Outras medidas de interesse, obtidas dos dados ordenados, são:
•Q1 - primeiro quartil ou quartil inferior;
•Q2 - segundo quartil e
•Q3 - terceiro quartil ou quartil superior.
Que dividem a distribuição (os dados) em quatro partes iguais.
Prof. Dr. José Cardoso Neto
Unidade 2 - Medidas estatísticas
28 de Abril de 2016
12 / 13
Unidade 2 - O gráco boxplot
Variável
N
Média
DP
Mín
Q1
M
PESO
100
64,22
8,61
47,00
59,00
62,50
Prof. Dr. José Cardoso Neto
Unidade 2 - Medidas estatísticas
d
Q3
Máx
70,00
91,00
28 de Abril de 2016
13 / 13
Download