medidas de posição e dispersão posição e dispersão

Propaganda
UNIVERSIDADE FEDERAL
DA PARAÍBA
MEDIDAS DE
POSIÇÃO E DISPERSÃO
Departamento de Estatística
Luiz Medeiros
► Vimos
que é possível sintetizar os dados sob a
forma de distribuições de frequência e gráficos
gráficos..
► Pode
ser de interesse apresentar esses dados
através de medidas descritivas que sintetizam as
características da distribuição
distribuição..
► Para
representar um conjunto de dados de forma
condensada utilizaremos algumas medidas de
posição e de dispersão
dispersão..
MEDIDAS DE POSIÇÃO - MÉDIA
Média Aritmética Simples
Simples:: É a soma das observações dividida
pelo número de observações.
observações. Seus valores tendem a se
localizar em um ponto central dentro de um conjunto de dados.
dados.
É a medida de posição mais utilizada.
utilizada.
A média aritmética de X é dada por:
por:
Para dados agrupados por valor:
MÉDIA ARITMÉTICA PONDERADA
►
Nos cálculos envolvendo média aritmética simples, todas
as ocorrências têm exatamente a mesma importância ou o
mesmo peso
peso..
►
No entanto, existem casos onde as ocorrências têm
importância relativa diferente
diferente.. Nestes casos, o cálculo da
média deve levar em conta esta importância relativa ou
peso relativo
relativo..
MEDIDAS DE POSIÇÃO - MEDIANA
Mediana (Me)
Me): Ocupa a posição central de uma série de observações
ordenadas, ou seja, é o valor que divide os dados em duas partes iguais
(isto é, em duas partes de 50
50%
% cada
cada)).
Para a série de valores ordenados em ordem crescente de grandeza (isto é,
um rol), a mediana é o valor central, isto é
Me = elemento que está na posição (n+1)/2
(n+1)/2;;
11 – 12 – 13 – 16
– 17 – 20 – 25
Me=16
Me=16
Obs: Quando o n é par, a mediana é sempre a média aritmética entre o
Obs:
ponto acima do qual recaem 50
50%
% dos casos e abaixo do qual também
recaem 50
50%
% dos casos.
casos.
11 – 12 – 13 –
16
-
17
– 20 – 25 – 26
Me=(16+17)/2
Me=(16+17)/2 = 16,5
MEDIDAS DE POSIÇÃO - MODA
Moda (MO): É o valor (valores) mais frequente em uma distribuição.
distribuição.
a. Se todos os valores se repetem a mesma quantidade de vezes,
dizemos que não há moda, ou seja, a distribuição é amodal;
amodal;
b. Se um valor ocorre com mais freqüência, dizemos que a distribuição é
unimodal;;
unimodal
c. Se dois valores se repetem a mesma quantidade de vezes e com mais
freqüência, dizemos que a distribuição é bimodal
bimodal..
d. Se mais de dois valores se repetem a mesma quantidade de vezes e
com a mesma freqüência, dizemos que a distribuição é multimodal.
multimodal.
Obs:: Esta medida é a única de que dispomos para variáveis qualitativas.
Obs
►
Exemplo: Kamile participou de um concurso, onde
Exemplo:
foram realizadas provas de Português, Matemática,
Biologia e História.
História. Essas provas tinham peso 3, 3, 2 e
2, respectivamente.
respectivamente. Sabendo que Kamile tirou 8 em
Português, 7,5 em Matemática, 5 em Biologia e 4 em
História, qual foi a média que ele obteve?
Exemplo: Calcular a média, moda e mediana
para os seguintes casos
1)
Idade dos alunos
18 – 25 – 20 – 19 – 22 – 22 – 21 – 19
Altura dos alunos
1,75 – 1,69 – 1,81 – 1,72 – 1,73 – 1,66 – 1,59
2)
MEDIDAS DE POSIÇÃO - QUARTIS, DECIS E
PERCENTIS
Em alguns casos, o pesquisador tem interesse em
conhecer outros aspectos relativos ao conjunto de
dados.. Nessa direção, os quartis
dados
quartis,, decis e percentis
podem fornecer informações relevantes à pesquisa
pesquisa..
►
Quartis: São as observações que dividem o rol em 4 partes
Quartis:
iguais e são denotadas por Q1, Q2 e Q3.
►
Decis: São as observações que dividem o rol em 10 partes
Decis:
iguais e são denotadas por D1,D2, . . . ,D9.
►
Percentis: São as observações que dividem o rol em 100
Percentis:
partes iguais e são denotadas por P1, P2, . . . , P99.
Note ainda que Q2 = D5 = P50 = Me.
ASSIMETRIA
►
Média = mediana = moda -> distribuição simétrica
►
Média > Mediana > Moda -> distribuição assimétrica positiva
►
Média < Mediana < Moda -> distribuição assimétrica negativa
MEDIDAS DE DISPERSÃO
► As
medidas de posição apresentadas fornecem a
informação dos dados apenas a nível pontual,
sem ilustrar outros aspectos referentes à forma
como os dados estão distribuídos na amostra.
amostra.
► As
medidas de dispersão são utilizadas para
avaliar o grau de variabilidade, ou dispersão,
dos valores.
valores.
MEDIDAS DE DISPERSÃO
Exemplo: Notas de três turmas de Estatística da UFPB
Observações importantes
i)
ii)
iii)
iv)
As três turmas possuem a mesma média.
As notas estão distribuídas sob diferentes formas.
A média resume o conjunto de dados apenas posição central.
A média não fornece informações sobre a variabilidade dos dados.
Solução: Apresentar junto da média uma medida que sumarize a
Solução:
variabilidade do conjunto de dados.
dados.
MEDIDAS DE DISPERSÃO – AMPLITUDE TOTAL
►
Amplitude Total:
Total: Uma forma simples de medir a
dispersão em um conjunto de observações é
através da amplitude total:
total:
AT = Maior valor − Menor valor
Verifica-se que a amplitude como medida de
Verificadispersão é limitada
limitada.. Essa medida só depende dos
valores extremos, ou seja, não é afetada pela
dispersão dos valores internos
MEDIDAS DE DISPERSÃO – DESVIO MÉDIO
►
O desvio médio é uma medida de “VARIABILIDADE ABSOLUTA”.
ABSOLUTA”.
Ela mede a variabilidade do conjunto em termos de desvios em
relação à média aritmética.
aritmética. É uma quantidade sempre não
negativa e expressa na mesma unidade de medida da variável.
variável.
Obs:: Essa medida não é tão utilizada como medida de variabilidade.
Obs
variabilidade.
MEDIDAS DE DISPERSÃO - VARIÂNCIA
►
a)
A variância de um conjunto de dados (amostra ou população) é
uma medida de “VARIABILIDADE ABSOLUTA”.
ABSOLUTA”. Ela mede a
variabilidade do conjunto em termos de desvios quadrados em
relação à média aritmética.
aritmética. É uma quantidade sempre não
negativa e expressa em unidades quadradas do conjunto de
dados, sendo de difícil interpretação.
interpretação.
Para dados agrupados por valor:
MEDIDAS DE DISPERSÃO – DESVIO PADRÃO
É uma outra medida de dispersão mais
comumente empregada do que a variância, por
ser expressa na mesma unidade de medida do
conjunto de dados.
dados. Mede a "DISPERSÃO
ABSOLUTA" de um conjunto de valores e é obtida
a partir da variância
variância..
S=
2
S
MEDIDAS DE DISPERSÃO – COEFICIENTE DE VARIAÇÃO
É uma medida de “VARIABILIDADE RELATIVA”, útil para comparar a
variabilidade de observações com diferentes unidades de medida.
medida. É
definida por:
por:
Exemplo:
VALORES
MÉDIA
D.P.
C.V.
1-2-3
2
1
50 %
100 - 200 - 300
200
100
50 %
101 - 102 - 103
102
1
1%
►
É importante expressar a variabilidade em termos relativos porque, por exemplo,
um desviodesvio-padrão igual a 1 pode ser muito pequeno se a magnitude dos dados
é da ordem de 1.000, mas pode ser considerado muito elevado se esta
magnitude for da ordem de 10.
►
Observe também que o coeficiente de variação é adimensional e por este motivo
permite a comparação das variabilidades de diferentes conjuntos de dados.
Boxplot
Curtose
Exemplo: Na tabela abaixo encontraExemplo:
encontra-se a estrutura do
produto interno bruto do Brasil, em bilhões de reais,
segundo as atividades econômicas.
econômicas.
a)
Em qual dos setores ocorre a maior variabilidade?
PERÍODO
AGROPECUÁRIA
INDÚSTRIA
SERVIÇOS
2002
6,6
27,1
66,3
2003
7,4
27,8
64,8
2004
6,9
30,1
63
2005
5,7
29,3
65
2006
5,5
28,8
65,8
2007
5,6
27,8
66,6
Exemplo: Uma certa empresa que fabrica duas linhas de
Exemplo:
produtos (A e B) necessita reestruturar sua produção.
produção. Foi
realizado um estudo para tal finalidade e uma das variáveis
consideradas foi VENDA (quantidade mensal) de cada tipo
de produto (A e B).
B). Para este estudo foi tomado como
referência o primeiro semestre de determinado ano, onde
foram verificados as seguintes VENDAS
VENDAS::
a)
b)
PRODUTO A
13
32
28
25
24
25
PRODUTO B
25
20
29
30
26
20
Em relação a esta variável, qual dos produtos (A ou B)
apresentou maior estabilidade nas VENDAS mensais?
A empresa decide penalizar a equipe que obteve, em
algum mês, um volume de venda inferior a X -1,5S.
Alguma equipe foi penalizada?
Download