Medidas de Tendência Central e de Variação

Propaganda
Est. Apl. Agric.
Medidas de tendência central e variação
2011-2
Variação do acaso
Medidas de variação
Não se deve a causa conhecida
Exemplos
Importantes para complementar as
informações sobre a amostra
Dão uma ideia da “abertura” dos dados
em torno da tendência central
Variação
◦Os tempos gastos por um mesmo motorista,
e carro para um mesmo percurso
◦Os resultados de um mesmo aluno em uma
mesma prova
◦As alturas de vários irmãos criados e
alimentados do mesmo modo
◦A produção de várias plantas de uma mesma
parcela
◦Amplitude
◦Variância (s²)
◦Desvio padrão (s)
◦Corresponde ao valor médio dos desvios
de cada ponto em relação à média
◦Geralmente a maioria dos pontos fica a
um desvio-padrão da média
◦
Ou seja, essencialmente qualquer medida
do mundo real
População x amostra
População
Todo o universo
Após medida, não
muda mais
Qualquer
conclusão só vale
para esta
população
Qualquer medida é
um parâmetro
s² 
Amostra
Uma parte do universo,
que o representa
Outra amostra da
mesma população terá
resultados diferentes
n
i
i
n 1
◦Conseqüência direta de trabalhar com
amostra
◦É o número de pontos completamente
independentes
◦Calculado como o número de pontos da
amostra (n) subtraindo o número de valores
calculados com esta amostra antes deste
ponto
◦Normalmente n-1, já que sempre precisamos
calcular a média
◦Considerar os alunos de uma turma como
população ou amostra
◦Considerar a produção de uma cultivar como
amostra de uma possível população
Tendência central
Sintetiza os dados da amostra
Indica o “miolo” dos dados
Principais medidas
◦Moda
◦Mediana
◦Média
◦Para distribuições assimétricas, usar
mediana e média
Mediana
Média
n 1
Grau de liberdade
Exemplos
Moda
n 1
Coeficiente de variação
s
CV  100
x
Toda medida é uma
estimativa
Simples
Não é sensível a
valores extremos
Adequada para
dados qualitativos
Sempre existe
Reflete os valores no
centro da distribuição
Não é sensível a
valores extremos
Ponto de equilíbrio
para distribuição de
freqüências
Leva todos os valores
em consideração
grau de liberdade
x  x²  x²   x²
  ponto  média ²  

A conclusão com base
na amostra deve
representar a população
Vantagem
soma dos desvios² 
Intervalo de confiança
É uma medida do intervalo em que
provavelmente o valor da população se
encontra
◦Leva em consideração uma margem de erro
(nível de confiança nas conclusões)
◦O valor t0 da equação abaixo é encontrado na
tabela de t, com n-1 graus de liberdade
Desvantagem
Pode existir ou não
Não leva os demais
valores em
consideração
mˆ  to
s
n
Não reflete todos os
valores
Sensível a valores
extremos
Universidade Federal Rural de Pernambuco
Mario
1
Est. Apl. Agric.
Medidas de tendência central e variação
Tabela t
GLB  GLA  tA  tB
Chance de errar
GLB  GLC  tC  tB
0,01
1
6,314
12,706
63,657
2
2,920
4,303
9,925
3
2,353
3,182
5,841
4
2,132
2,776
4,604
5
2,015
2,571
4,032
6
1,943
2,447
3,707
7
1,895
2,365
3,499
8
1,860
2,306
3,355
9
1,833
2,262
3,250
10
1,812
2,228
3,169
15
1,753
2,131
2,947
20
1,725
2,086
2,845
30
1,697
2,042
2,750
40
1,684
2,021
2,704
50
1,676
2,009
2,678
100
1,660
1,984
2,626
1000
1,646
1,962
2,581
 GLB  GLC  tA  tB  
tC  
  tB
GLB  GLA


Exemplo – Queremos o valor de t para 5% de
probabilidade com 75 GL
Quantos mais pontos (maior grau de liberdade) menor a faixa de valores em torno da média
0,05
Graus de liberdade
0,10
100  50  2,009  1,984
100  75  tC  1,984
 25  0,025 
tC  
  1,984  1,9965
50


Usando o Excel
=invt(0,05;75)= 1,992102124
A diferença vem em parte de
arredondamentos, e em parte inerente à
interpolação.
◦
Evitar sempre que possível. Quando
necessário usar o menor intervalo possível
para os GL
Apresentação típica de resultados
4,0
3,5
3,0
2,5
2,0
1,5
Menor chance de erro, maior faixa de
valores em torno da média
1,0
Valores calculados utilizando o Excel.
◦
2011-2
0,5
Qualquer outra planilha tem função
equivalente
0,0
=invt(probabilidade;graus de liberdade)
Interpolação harmônica
◦
Usada quando o GL que você quer não está
em uma tabela
◦
Para GLA e GLB existentes na tabela com tA
e tB, querendo GLC que não está na tabela
◦
Diminuiu a importância com fórmulas
estatísticas nas planilhas
Universidade Federal Rural de Pernambuco
Figura 1 - Matéria seca da parte aérea de diferentes
cultivares de feijoeiro em casa de vegetação. Barras verticais
correspondem ao erro padrão da média
Mario
2
Download