Amostra

Propaganda
INSTITUIÇÃO
CURSO
Estatística Aplicada à Administração
Prof. Alessandro Moura costa
2.1 Conceitos
 Estatística Descritiva: trata da coleta, da organização,
classificação, apresentação e descrição dos dados de
observação.
 Amostra: é um subconjunto da população e deve ser
selecionada de acordo com algum critério para que possa
ser representativa da população.
2
2.2. Medidas Descritivas Básicas
Medidas de Posição ou
Tendência central
Média
Mediana
Moda
Medidas de
Dispersão
Desvio
padrão
Variância
Coeficiente
de Variação
3
2.3 Medidas de
Tendência central
Posição
ou
 Quando se trabalha com dados numéricos observa-se
um tendência destes de se agruparem em torno de um
valor central. Isto indica que algum valor central é
característica dos dados e que o mesmo pode ser usado
para descrevê-los e representá-los.
 As medidas de Posição ou Tendência central básicas
são: Média, Mediana e Moda
4
2.3.1 Média Aritmética
 Simbologia:
 µ = população
 X = amostra
 É a mais utilizada das medidas de tendência central para
descrever, resumidamente, um conjunto de dados.
5
 Média (média aritmética)
 Média amostral (x)
x=
Σx
n
tamanho da amostra
Cálculo para dados não agrupados em classes:
consiste na soma de todas as observações, dividida
pelo número “n” de observações do grupo.
6
 Para dados agrupados em Distribuição de Frequência
(agrupados em classes): se os dados estiverem agrupados
em uma tabela de frequências, pode-se obter a média
aritmética da distribuição, calculando-se:
X = Σ (xi.fi)
n
Onde: xi = ponto médio da classe i;
fi = a frequência absoluta da classe i
Σ fi = n
7
2.3.2 Mediana (Md)
 A mediana divide em duas partes o conjunto das
observações ordenadas. Colocando-se os valores em ordem
crescente ou decrescente, a mediana é o elemento que
ocupa o valor central.
50%
Md
50%
Xmín
Xmáx
rol crescente
8
 Mediana para dados não agrupados em classes:
1. Colocam-se os dados em ordem (rol)
2. Se o número de elementos “n” for ímpar, a mediana
será o elemento que ocupa a posição (n + 1) /2
3. Se “n” for par, a mediana será a média aritmética entre
dois elementos centrais
 Mediana para dados agrupados em Distribuição de
Frequência:
Calcula-se a posição da mediana
2. Calcula-se a Fac
1.
9
 Fórmula de cálculo da Mediana para dados
agrupados em Distribuição de Frequência
Md = Li + (PMd- Fac ) . i
Fmd
Posição da
mediana
Pmd =
n
2
Li = limite inferior da classe que
contém a mediana
Pmd = posição da mediana
Fac = frequência acumulada da
classe anterior à classe mediana
i = amplitude da classe
Fmd = frequência absoluta da
classe que contém a mediana
10
Observações:
 Não há regra fixa para se escolher entre a Média e a Mediana.
Entretanto algumas observações podem ser feitas quanto a utilização
das mesmas.
 A Média aritmética é a medida de tendência central mais utilizada,
principalmente quando não há valores aberrantes (muito extremos) no
conjunto de dados.
 A Mediana deve ser usada, sempre que possível, como medida
representativa de distribuições fortemente assimétricas, ou seja,
quando os valores extremos do conjunto são muito distantes dos
outros, pois o seu valor não é afetado por estes.
11
2.3.3 Moda (Mo)
 É o valor que ocorre com maior frequência.
 Um conjunto de dados pode não ter moda (amodal),
ou ter duas modas (bimodal) ou mais modas
(plurimodal).
12
2.4. Medidas de Dispersão
 Visam descrever os dados no sentido de informar o grau de dispersão
ou afastamento dos valores observados em torno de um valor central
(média).
 Elas indicam se um conjunto é homogêneo (pouca ou nenhuma
variabilidade) ou heterogêneo (muita variabilidade).
 A descrição do conjunto de dados é mais completa quando se
considera além de uma medida de tendência central, uma medida de
dispersão ou variação, porque é comum encontrar-se séries que, apesar
de apresentarem a mesma média, são constituidas de maneiras
diferentes, o que mostra que as medidas de tendência central são
insuficientes para descrever adequadamente uma série estatística.
13
2.4.1 Desvio Padrão
 Simbologia:
 σ = população
 S = amostra
 É uma das medidas mais úteis da variação de um grupo
de dados.
 A vantagem do desvio padrão sobre a variância, é que
este permite uma interpretação direta da variação do
grupo, pois o mesmo é expresso na mesma unidade de
medida em que estão expressas as variáveis
amostradas.
14
 Fórmula do Desvio padrão para dados não agrupados em
classe
Desvio padrão da amostra(s):
S =
(Σx)²
Σ(x²) - n
√
n-1
15
 Para dados agrupados em Distribuição de Frequência:
S =
√
Σ (x². F) – (Σx. F)²
ΣF
(ΣF) - 1
X
F
X².F
X.F
14
1
196.1=196
14
15
3
225.3=675
45
16
3
256.3=768
48
17
1
289.1=289
17
Σ
8
1928
124
S=
√
1928 – (124)²
8
7
= 0.92
16
Comparação do Desvio Padrão
Amostra A
●
● ● ●
● ● ●
●
Média = 15,5
S = 3,338
11 12 13 14 15 16 17 18 19 20 21
Amostra B
Média = 15,5
S = 0,9258
● ●
● ●
● ● ● ●
11 12 13 14 15 16 17 18 19 20 21
●
●
● ●
Amostra C
●
●
● ●
11 12 13 14 15 16 17 18 19 20 21
Média = 15,5
S = 4,57
17
2.4.2. Variância
 Simbologia:
 σ² = população
 S² = amostra
 A variância é o desvio padrão elevado ao quadrado,
então, é calculado por:
S² = (S)²
18
2.4.3. Coeficiente de Variação (CV)
 É uma medida de dispersão relativa, utilizada quando
se deseja comparar a variação de conjunto de dados
que apresentem diferentes unidades de medição e ou
tamanhos diferentes, pois o coeficiente de variação
independe da unidade de medida dos dados.
 É expresso sempre em porcentagem (100%)
. 100
X
 Fórmula: CV =
S
19
Comparação do coeficiente de variação
 Ação A:
 Preço médio do último ano = 50 u.m
 Desvio padrão = 5 u.m
 Ação B:
 Preço médio do último ano = 100 u.m
 Desvio padrão = 5 u.m.
 Coeficiente de variação:
 Ação A:
S 100% = 5 100% = 10% - é mais irregular
CV =
x
50
pois o CV é maior
 Ação B:
5 100% = 5% - possui maior
S 100% = 100
CV = x
regularidade, é mais estável
20
Download