Est. Apl. Agric. Medidas de tendência central e variação 2011-2 Variação do acaso Medidas de variação Não se deve a causa conhecida Exemplos Importantes para complementar as informações sobre a amostra Dão uma ideia da “abertura” dos dados em torno da tendência central Variação ◦Os tempos gastos por um mesmo motorista, e carro para um mesmo percurso ◦Os resultados de um mesmo aluno em uma mesma prova ◦As alturas de vários irmãos criados e alimentados do mesmo modo ◦A produção de várias plantas de uma mesma parcela ◦Amplitude ◦Variância (s²) ◦Desvio padrão (s) ◦Corresponde ao valor médio dos desvios de cada ponto em relação à média ◦Geralmente a maioria dos pontos fica a um desvio-padrão da média ◦ Ou seja, essencialmente qualquer medida do mundo real População x amostra População Todo o universo Após medida, não muda mais Qualquer conclusão só vale para esta população Qualquer medida é um parâmetro s² Amostra Uma parte do universo, que o representa Outra amostra da mesma população terá resultados diferentes n i i n 1 ◦Conseqüência direta de trabalhar com amostra ◦É o número de pontos completamente independentes ◦Calculado como o número de pontos da amostra (n) subtraindo o número de valores calculados com esta amostra antes deste ponto ◦Normalmente n-1, já que sempre precisamos calcular a média ◦Considerar os alunos de uma turma como população ou amostra ◦Considerar a produção de uma cultivar como amostra de uma possível população Tendência central Sintetiza os dados da amostra Indica o “miolo” dos dados Principais medidas ◦Moda ◦Mediana ◦Média ◦Para distribuições assimétricas, usar mediana e média Mediana Média n 1 Grau de liberdade Exemplos Moda n 1 Coeficiente de variação s CV 100 x Toda medida é uma estimativa Simples Não é sensível a valores extremos Adequada para dados qualitativos Sempre existe Reflete os valores no centro da distribuição Não é sensível a valores extremos Ponto de equilíbrio para distribuição de freqüências Leva todos os valores em consideração grau de liberdade x x² x² x² ponto média ² A conclusão com base na amostra deve representar a população Vantagem soma dos desvios² Intervalo de confiança É uma medida do intervalo em que provavelmente o valor da população se encontra ◦Leva em consideração uma margem de erro (nível de confiança nas conclusões) ◦O valor t0 da equação abaixo é encontrado na tabela de t, com n-1 graus de liberdade Desvantagem Pode existir ou não Não leva os demais valores em consideração mˆ to s n Não reflete todos os valores Sensível a valores extremos Universidade Federal Rural de Pernambuco Mario 1 Est. Apl. Agric. Medidas de tendência central e variação Tabela t GLB GLA tA tB Chance de errar GLB GLC tC tB 0,01 1 6,314 12,706 63,657 2 2,920 4,303 9,925 3 2,353 3,182 5,841 4 2,132 2,776 4,604 5 2,015 2,571 4,032 6 1,943 2,447 3,707 7 1,895 2,365 3,499 8 1,860 2,306 3,355 9 1,833 2,262 3,250 10 1,812 2,228 3,169 15 1,753 2,131 2,947 20 1,725 2,086 2,845 30 1,697 2,042 2,750 40 1,684 2,021 2,704 50 1,676 2,009 2,678 100 1,660 1,984 2,626 1000 1,646 1,962 2,581 GLB GLC tA tB tC tB GLB GLA Exemplo – Queremos o valor de t para 5% de probabilidade com 75 GL Quantos mais pontos (maior grau de liberdade) menor a faixa de valores em torno da média 0,05 Graus de liberdade 0,10 100 50 2,009 1,984 100 75 tC 1,984 25 0,025 tC 1,984 1,9965 50 Usando o Excel =invt(0,05;75)= 1,992102124 A diferença vem em parte de arredondamentos, e em parte inerente à interpolação. ◦ Evitar sempre que possível. Quando necessário usar o menor intervalo possível para os GL Apresentação típica de resultados 4,0 3,5 3,0 2,5 2,0 1,5 Menor chance de erro, maior faixa de valores em torno da média 1,0 Valores calculados utilizando o Excel. ◦ 2011-2 0,5 Qualquer outra planilha tem função equivalente 0,0 =invt(probabilidade;graus de liberdade) Interpolação harmônica ◦ Usada quando o GL que você quer não está em uma tabela ◦ Para GLA e GLB existentes na tabela com tA e tB, querendo GLC que não está na tabela ◦ Diminuiu a importância com fórmulas estatísticas nas planilhas Universidade Federal Rural de Pernambuco Figura 1 - Matéria seca da parte aérea de diferentes cultivares de feijoeiro em casa de vegetação. Barras verticais correspondem ao erro padrão da média Mario 2