UNIVERSIDADE FEDERAL DA PARAÍBA MEDIDAS DESCRITIVAS Departamento de Estatística Luiz Medeiros http://www.de.ufpb.br/~luiz/ MEDIDAS DESCRITIVAS ► Vimos que é possível sintetizar os dados sob a forma de distribuições de frequências e gráficos gráficos.. ► Pode ser de interesse apresentar esses dados através de medidas descritivas que sintetizam as características da distribuição distribuição.. ► Para representar um conjunto de dados de forma condensada utilizaremos algumas medidas de posição e de dispersão dispersão.. ALGUMAS MEDIDAS DESCRITIVAS ► Mínimo:: O menor valor observado; Mínimo observado; ► Máximo:: O maior valor observado; Máximo observado; ► Média:: É a soma das observações dividido pelo número de observações; Média observações; ► Moda:: É o valor que ocorre com maior frequência; Moda frequência; ► Mediana: É o valor que ocupa a posição central em um conjunto de dados Mediana: ordenado;; ordenado ► Quartil:: Divide o conjunto de dados ordenado em quatro partes iguais Quartil iguais;; ► Decil:: Divide o conjunto de dados ordenado em dez partes iguais Decil iguais;; ► Percentil:: Divide o conjunto de dados ordenado em cem partes iguais Percentil iguais.. MEDIDAS DE POSIÇÃO - MÉDIA Média Aritmética: É a soma das observações dividida pelo número de observações e seus valores tendem a se localizar em um ponto central dentro de um conjunto de dados. Em geral é a medida de tendência central mais comum para um conjunto de dados e é denotada por µ ou X a) Para dados não agrupados agrupados:: Sejam X1,X2, . . . ,XN, um conjunto de valores da variável X. Temos então que a média aritmética de X é dada por:: por Na prática não conhecemos toda a população. Logo, utilizamos a média amostral,dada por: MEDIDAS DE POSIÇÃO - MÉDIA b) Para dados agrupados: agrupados: Uma vez que os valores da variável estão agrupados em tabelas de frequências, temos que onde k é o número de classes e Xmi, para i = 1, . . . , k são os respectivos pontos médios das classes. classes. Na prática não conhecemos toda a população. população. Logo, utilizamos a média amostral,dada por: por: ► PROPRIEDADES DA MÉDIA ARITMÉTICA i) A soma algébrica dos desvios de um conjunto de números em relação a média aritmética é zero zero.. ii) Quando somamos ou subtraímos uma constante aos valores de uma variável, a média fica aumentada ou diminuída dessa constante constante.. iii) Quando multiplicamos ou dividimos todos os valores de uma variável por uma constante, a média fica multiplicada ou dividida por essa constante constante.. Vantagens e Desvantagens da Média MEDIDAS DE POSIÇÃO – MÉDIA GEOMÉTRICA ► Usada em casos em que o crescimento da série é muito grande (MG é mais representativa). ► Importante: logaritmo Para n grande é conveniente uso do MEDIDAS DE POSIÇÃO – MÉDIA HARMÔNICA ► Recomendada para séries de valores que são inversamente proporcionais as frequências ► Relação entre as médias MÉDIA ARITMÉTICA PONDERADA ► Nos cálculos envolvendo média aritmética simples, todas as ocorrências têm exatamente a mesma importância ou o mesmo peso peso.. ► No entanto, existem casos onde as ocorrências têm importância relativa diferente diferente.. Nestes casos, o cálculo da média deve levar em conta esta importância relativa ou peso relativo relativo.. Exemplo: As aplicações mais comuns no mercado financeiro são: Exemplo: são: Poupança, Certificado de Depósito Bancário (CDB), Recibo de Depósito Bancário (RDB) e os Fundos de Investimento. Investimento. Uma multinacional decide aplicar parte do seu lucro em três diferentes aplicações no período de um ano. ano. Segue abaixo o montante aplicado em cada uma das aplicações no período. período. Tipos de Aplicações Valor das Aplicações Rentabilidade (%) Poupança R$ 250.000,00 7% CDB R$ 100.000,00 11% RDB R$ 80.000,00 12% Qual foi a rentabilidade (%) média da empresa com as aplicações no final do período? Justifique sua resposta. resposta. Exemplo: Qual a idade média da população de Recife, em 1993, que possui AIDS. MEDIDAS DE POSIÇÃO - MEDIANA Mediana: Ocupa a posição central de uma série de observações ordenadas, Mediana: ou seja, é o valor que divide os dados em duas partes iguais (isto é, em duas partes de 50 50% % cada) cada).. É denotada por Me. Me. a) Para dados não agrupados: Caso 1 - “n” ímpar ímpar:: Para a série de valores ordenados em ordem crescente de grandeza (isto é, um rol), a mediana é o valor central, isto é Me = elemento que está na posição (n+1)/2; Caso 2 - “n” par par:: Para a série de valores ordenados em ordem crescente de grandeza (isto é, um rol), a mediana é a média aritmética dos valores centrais, isto é Me = média aritmética entre os elementos das posições n/2 e (n/2)+1 MEDIDAS DE POSIÇÃO - MEDIANA b) Para dados agrupados por valor valor:: É necessário construir a frequência acumulada para encontrar o elemento mediano através da sua ordem c) Para dados agrupados por classes: 1º Passo: CalculaCalcula-se o elemento central de ordem n/2 (par) e (n+1/2) (ímpar). 2º Passo: Pela frequência acumulada identificaidentifica-se a classe que contém a mediana. 3º Passo: UtilizaUtiliza-se a fórmula Onde: lme é o limite inferior da classe mediana; n é o tamanho da amostra; FANT é a soma das freqüências anteriores à classe mediana; hme é a amplitude da classe mediana; fme é a frequência da classe mediana. Exemplo: Determinar a mediana dos dados apresentados na tabela abaixo. Vantagens e Desvantagens da Mediana MEDIDAS DE POSIÇÃO - MODA Moda: É o valor (valores) mais frequente no conjunto de dados, e será Moda: denotado por MO. a. Se todos os valores se repetem a mesma quantidade de vezes, dizemos que não há moda, ou seja, a distribuição é amodal; amodal; b. Se um valor ocorre com mais frequência, frequência, dizemos que a distribuição é unimodal;; unimodal c. Se dois valores se repetem a mesma quantidade de vezes e com mais frequência, dizemos que a distribuição é bimodal. bimodal. d. Se mais de dois valores se repetem a mesma quantidade de vezes e com a mesma frequência, dizemos que a distribuição é multimodal. MEDIDAS DE POSIÇÃO – MODA Para dados agrupados em classes: classes: Moda Bruta Moda de King Moda de Czuber Moda de Pearson ► Para os três primeiros processos, o primeiro passo é identificar a classe modal, isto é, a classe que apresenta a maior frequência. frequência. MODA BRUTA MODA DE KING MODA DE CZUBER MODA DE PEARSON RELAÇÕES ENTRE MÉDIA, MEDIANA E MODA ► Média = mediana = moda -> distribuição simétrica ► Média > Mediana > Moda -> distribuição simétrica positiva ► Média < Mediana < Moda -> distribuição assimétrica negativa Exemplo: Determinar a moda através dos 4 processos. Vantagens e Desvantagens da Moda Exemplo: Calcular a média, moda e mediana para os seguintes casos 1) Idade dos alunos 18 – 25 – 20 – 19 – 22 – 22 – 21 – 19 Altura dos alunos 1,75 – 1,69 – 1,81 – 1,72 – 1,73 – 1,66 – 1,59 2) Exemplo: Num estudo sobre rotatividade de mão de obra na Exemplo: indústria, anotouanotou-se o número de empregos nos últimos 3 anos para operários especializados e não especializados. especializados. Calcule a média, moda e mediana e tire suas conclusões conclusões.. MEDIDAS DE POSIÇÃO – QUANTIS OU SEPARATRIZES Em alguns casos, o pesquisador tem interesse em conhecer outros aspectos relativos ao conjunto de dados.. dados Quantis ou Separatrizes são medidas que dividem o rol de um conjunto de dados em partes iguais iguais.. Obs: A mediana é um quantil, Obs: quantil, pois divide o conjunto de dados em duas partes iguais iguais.. MEDIDAS DE POSIÇÃO - QUARTIL ► Quartis: São as observações que dividem o rol em 4 partes Quartis: iguais e são denotadas por Q1, Q2 e Q3. MEDIDAS DE POSIÇÃO - QUARTIL MEDIDAS DE POSIÇÃO - DECIS ► Decis: São as observações que dividem o rol em 10 partes Decis: iguais e são denotadas por D1,D2, . . . ,D9. MEDIDAS DE POSIÇÃO - DECIS MEDIDAS DE POSIÇÃO - PERCENTIS ► Percentis: São as observações que dividem o rol em 100 Percentis: partes iguais e são denotadas por P1, P2, . . . , P99. Note que Q2 = D5 = P50 = Me. MEDIDAS DE POSIÇÃO - PERCENTIS Exemplo: Calcular o primeiro quartil, o oitavo decil e o trigésimo percentil. Exemplo: Num estudo sobre rotatividade de mão de obra na Exemplo: indústria, anotouanotou-se o número de empregos nos últimos 3 anos para operários especializados e não especializados. especializados. Calcule o terceiro quartil, o sexto decil e o vigésimo percentil. percentil.