UNIVERSIDADE FEDERAL DA PARAÍBA MEDIDAS DE POSIÇÃO E DISPERSÃO Departamento de Estatística Luiz Medeiros ► Vimos que é possível sintetizar os dados sob a forma de distribuições de frequência e gráficos gráficos.. ► Pode ser de interesse apresentar esses dados através de medidas descritivas que sintetizam as características da distribuição distribuição.. ► Para representar um conjunto de dados de forma condensada utilizaremos algumas medidas de posição e de dispersão dispersão.. MEDIDAS DE POSIÇÃO - MÉDIA Média Aritmética Simples Simples:: É a soma das observações dividida pelo número de observações. observações. Seus valores tendem a se localizar em um ponto central dentro de um conjunto de dados. dados. É a medida de posição mais utilizada. utilizada. A média aritmética de X é dada por: por: Para dados agrupados por valor: MÉDIA ARITMÉTICA PONDERADA ► Nos cálculos envolvendo média aritmética simples, todas as ocorrências têm exatamente a mesma importância ou o mesmo peso peso.. ► No entanto, existem casos onde as ocorrências têm importância relativa diferente diferente.. Nestes casos, o cálculo da média deve levar em conta esta importância relativa ou peso relativo relativo.. MEDIDAS DE POSIÇÃO - MEDIANA Mediana (Me) Me): Ocupa a posição central de uma série de observações ordenadas, ou seja, é o valor que divide os dados em duas partes iguais (isto é, em duas partes de 50 50% % cada cada)). Para a série de valores ordenados em ordem crescente de grandeza (isto é, um rol), a mediana é o valor central, isto é Me = elemento que está na posição (n+1)/2 (n+1)/2;; 11 – 12 – 13 – 16 – 17 – 20 – 25 Me=16 Me=16 Obs: Quando o n é par, a mediana é sempre a média aritmética entre o Obs: ponto acima do qual recaem 50 50% % dos casos e abaixo do qual também recaem 50 50% % dos casos. casos. 11 – 12 – 13 – 16 - 17 – 20 – 25 – 26 Me=(16+17)/2 Me=(16+17)/2 = 16,5 MEDIDAS DE POSIÇÃO - MODA Moda (MO): É o valor (valores) mais frequente em uma distribuição. distribuição. a. Se todos os valores se repetem a mesma quantidade de vezes, dizemos que não há moda, ou seja, a distribuição é amodal; amodal; b. Se um valor ocorre com mais freqüência, dizemos que a distribuição é unimodal;; unimodal c. Se dois valores se repetem a mesma quantidade de vezes e com mais freqüência, dizemos que a distribuição é bimodal bimodal.. d. Se mais de dois valores se repetem a mesma quantidade de vezes e com a mesma freqüência, dizemos que a distribuição é multimodal. multimodal. Obs:: Esta medida é a única de que dispomos para variáveis qualitativas. Obs ► Exemplo: Kamile participou de um concurso, onde Exemplo: foram realizadas provas de Português, Matemática, Biologia e História. História. Essas provas tinham peso 3, 3, 2 e 2, respectivamente. respectivamente. Sabendo que Kamile tirou 8 em Português, 7,5 em Matemática, 5 em Biologia e 4 em História, qual foi a média que ele obteve? Exemplo: Calcular a média, moda e mediana para os seguintes casos 1) Idade dos alunos 18 – 25 – 20 – 19 – 22 – 22 – 21 – 19 Altura dos alunos 1,75 – 1,69 – 1,81 – 1,72 – 1,73 – 1,66 – 1,59 2) MEDIDAS DE POSIÇÃO - QUARTIS, DECIS E PERCENTIS Em alguns casos, o pesquisador tem interesse em conhecer outros aspectos relativos ao conjunto de dados.. Nessa direção, os quartis dados quartis,, decis e percentis podem fornecer informações relevantes à pesquisa pesquisa.. ► Quartis: São as observações que dividem o rol em 4 partes Quartis: iguais e são denotadas por Q1, Q2 e Q3. ► Decis: São as observações que dividem o rol em 10 partes Decis: iguais e são denotadas por D1,D2, . . . ,D9. ► Percentis: São as observações que dividem o rol em 100 Percentis: partes iguais e são denotadas por P1, P2, . . . , P99. Note ainda que Q2 = D5 = P50 = Me. ASSIMETRIA ► Média = mediana = moda -> distribuição simétrica ► Média > Mediana > Moda -> distribuição assimétrica positiva ► Média < Mediana < Moda -> distribuição assimétrica negativa MEDIDAS DE DISPERSÃO ► As medidas de posição apresentadas fornecem a informação dos dados apenas a nível pontual, sem ilustrar outros aspectos referentes à forma como os dados estão distribuídos na amostra. amostra. ► As medidas de dispersão são utilizadas para avaliar o grau de variabilidade, ou dispersão, dos valores. valores. MEDIDAS DE DISPERSÃO Exemplo: Notas de três turmas de Estatística da UFPB Observações importantes i) ii) iii) iv) As três turmas possuem a mesma média. As notas estão distribuídas sob diferentes formas. A média resume o conjunto de dados apenas posição central. A média não fornece informações sobre a variabilidade dos dados. Solução: Apresentar junto da média uma medida que sumarize a Solução: variabilidade do conjunto de dados. dados. MEDIDAS DE DISPERSÃO – AMPLITUDE TOTAL ► Amplitude Total: Total: Uma forma simples de medir a dispersão em um conjunto de observações é através da amplitude total: total: AT = Maior valor − Menor valor Verifica-se que a amplitude como medida de Verificadispersão é limitada limitada.. Essa medida só depende dos valores extremos, ou seja, não é afetada pela dispersão dos valores internos MEDIDAS DE DISPERSÃO – DESVIO MÉDIO ► O desvio médio é uma medida de “VARIABILIDADE ABSOLUTA”. ABSOLUTA”. Ela mede a variabilidade do conjunto em termos de desvios em relação à média aritmética. aritmética. É uma quantidade sempre não negativa e expressa na mesma unidade de medida da variável. variável. Obs:: Essa medida não é tão utilizada como medida de variabilidade. Obs variabilidade. MEDIDAS DE DISPERSÃO - VARIÂNCIA ► a) A variância de um conjunto de dados (amostra ou população) é uma medida de “VARIABILIDADE ABSOLUTA”. ABSOLUTA”. Ela mede a variabilidade do conjunto em termos de desvios quadrados em relação à média aritmética. aritmética. É uma quantidade sempre não negativa e expressa em unidades quadradas do conjunto de dados, sendo de difícil interpretação. interpretação. Para dados agrupados por valor: MEDIDAS DE DISPERSÃO – DESVIO PADRÃO É uma outra medida de dispersão mais comumente empregada do que a variância, por ser expressa na mesma unidade de medida do conjunto de dados. dados. Mede a "DISPERSÃO ABSOLUTA" de um conjunto de valores e é obtida a partir da variância variância.. S= 2 S MEDIDAS DE DISPERSÃO – COEFICIENTE DE VARIAÇÃO É uma medida de “VARIABILIDADE RELATIVA”, útil para comparar a variabilidade de observações com diferentes unidades de medida. medida. É definida por: por: Exemplo: VALORES MÉDIA D.P. C.V. 1-2-3 2 1 50 % 100 - 200 - 300 200 100 50 % 101 - 102 - 103 102 1 1% ► É importante expressar a variabilidade em termos relativos porque, por exemplo, um desviodesvio-padrão igual a 1 pode ser muito pequeno se a magnitude dos dados é da ordem de 1.000, mas pode ser considerado muito elevado se esta magnitude for da ordem de 10. ► Observe também que o coeficiente de variação é adimensional e por este motivo permite a comparação das variabilidades de diferentes conjuntos de dados. Boxplot Curtose Exemplo: Na tabela abaixo encontraExemplo: encontra-se a estrutura do produto interno bruto do Brasil, em bilhões de reais, segundo as atividades econômicas. econômicas. a) Em qual dos setores ocorre a maior variabilidade? PERÍODO AGROPECUÁRIA INDÚSTRIA SERVIÇOS 2002 6,6 27,1 66,3 2003 7,4 27,8 64,8 2004 6,9 30,1 63 2005 5,7 29,3 65 2006 5,5 28,8 65,8 2007 5,6 27,8 66,6 Exemplo: Uma certa empresa que fabrica duas linhas de Exemplo: produtos (A e B) necessita reestruturar sua produção. produção. Foi realizado um estudo para tal finalidade e uma das variáveis consideradas foi VENDA (quantidade mensal) de cada tipo de produto (A e B). B). Para este estudo foi tomado como referência o primeiro semestre de determinado ano, onde foram verificados as seguintes VENDAS VENDAS:: a) b) PRODUTO A 13 32 28 25 24 25 PRODUTO B 25 20 29 30 26 20 Em relação a esta variável, qual dos produtos (A ou B) apresentou maior estabilidade nas VENDAS mensais? A empresa decide penalizar a equipe que obteve, em algum mês, um volume de venda inferior a X -1,5S. Alguma equipe foi penalizada?