 
                                PROBABILIDADE E ESTATÍSTICA Profa. Dra. Yara de Souza Tadano [email protected] Aula 3 09/2014 Estatística Descritiva Medidas de Centro Aulas 1 e 2 – Introdução à Estatística Probabilidade e Estatística 3/19 Medidas de Centro  Uma medida de centro é um valor no centro ou meio do conjunto de dados. Aulas 1 e 2 – Introdução à Estatística Probabilidade e Estatística 4/19 Medidas de Centro  As medidas de tendência central (ou medidas de centro) mais comuns são:  Média (aritmética)  Média ponderada  Mediana  Moda  Ponto Médio Aulas 1 e 2 – Introdução à Estatística Probabilidade e Estatística 5/19 Média (Aritmética)  É a medida de centro encontrada pela adição dos valores e divisão do total pelo número de valores. Média Amostral ( X ) Média Populacional () n X X i 1 N i n  X i 1 i N onde n é o número de elementos da amostra e N é o número de elementos da população. Aulas 1 e 2 – Introdução à Estatística Probabilidade e Estatística 6/19 Média (Aritmética)  Uma desvantagem da média é que ela é sensível a qualquer valor, de modo que um valor excepcional pode afetar drasticamente a média.  A mediana supera essa desvantagem. Aulas 1 e 2 – Introdução à Estatística Probabilidade e Estatística 7/19 Mediana  A mediana pode ser considerada como um “valor do meio”.  A centro que é o de um conjunto de dados é a medida de quando os dados originais estão arranjados em ordem crescente (ou decrescente) de magnitude. Aulas 1 e 2 – Introdução à Estatística Probabilidade e Estatística 8/19 Mediana  Para encontrar a mediana, primeiro os valores e depois siga um dos dois passos:  Se o número de valores for , a mediana será o número localizado no meio exato da lista.  Se o número de valores for , a mediana será encontrada pelo cálculo da média dos dois números do meio. Aulas 1 e 2 – Introdução à Estatística Probabilidade e Estatística 9/19 Mediana  A mediana é dada pela seguinte expressão: Mediana Amostral ( Se n for ímpar: ) Mediana Populacional (Me) Se n for ímpar: Me= Xæ N+1ö ç ÷ è 2 ø Se n for par: Se n for par: é ù ê Xæ ö + Xæ ö ú N ç +1÷ ú êë çè N2 ÷ø è 2 øû Me= 2 Aulas 1 e 2 – Introdução à Estatística Probabilidade e Estatística 10/19 Exemplo  Olhando para o diagrama de Ramo e Folha do exemplo sobre a altura (em cm) dos alunos da UTFPR: RAMOS 15 16 17 FOLHAS 012345555666788 0000011112233444567889 023 Aulas 1 e 2 – Introdução à Estatística Probabilidade e Estatística 11/19 Exemplo  Vamos supor agora, que ao invés de dois alunos de 161 cm, um dos alunos tinha 205 cm e o outro 209 cm de altura. O diagrama Ramo e Folha seria: RAMOS 15 16 17 18 19 20 FOLHAS 012345555666788 00000112233444567889 023 59 Aulas 1 e 2 – Introdução à Estatística Probabilidade e Estatística 12/19 Exemplo  Neste caso, a 162,9 cm.  Já a passaria de 160,6 cm para continuaria sendo 160,5 cm Aulas 1 e 2 – Introdução à Estatística Probabilidade e Estatística 13/19 Moda  A de um conjunto de dados é o valor que ocorre mais frequentemente.  : Quando tem duas modas, ou seja, dois valores que ocorrem com a mesma maior frequência.   : Quando tem mais de duas modas. Quando nenhum valor se repete, dizemos que Aulas 1 e 2 – Introdução à Estatística Probabilidade e Estatística . 14/19 Exemplo  Qual a moda das alturas (em cm) dos alunos da UTFPR?  Olhando para o diagrama Ramos e Folhas, podemos verificar que a moda é RAMOS 15 16 17 . FOLHAS 012345555666788 0000011112233444567889 023 Aulas 1 e 2 – Introdução à Estatística Probabilidade e Estatística 15/19 Ponto Médio  O é a media de centro que é exatamente o valor a meio caminho entre o maior valor e o menor valor no conjunto original de dados. valor máximo + valor mínimo Ponto Médio = 2  Raramente é usado como medida de centro. Aulas 1 e 2 – Introdução à Estatística Probabilidade e Estatística 16/19 Média de uma distribuição de frequências  A média de uma distribuição de frequência é dada pela seguinte expressão:  1ª Fórmula: k x   f ri xi f ri  frequência relativa da i  ésima classe. xi  ponto médio da i - ésima classe i 1  2ª Fórmula: x k fx i 1 k i i f i 1 f i  frequência da i - ésima classe k  número de classes i Aulas 1 e 2 – Introdução à Estatística Probabilidade e Estatística 17/19 Média Ponderada  A média ponderada é dada pela seguinte expressão: Média Ponderada Amostral ( X ) Média Ponderada Populacional () n N X w X i 1 n i w i 1 i i  w X i 1 N i i w i 1 i onde wi é o peso. Aulas 1 e 2 – Introdução à Estatística Probabilidade e Estatística 18/19 Pensamento Crítico  Para cada um dos seguintes conjuntos, podemos achar medidas de centro, como média e mediana. Identifique a principal razão pela qual a média e a mediana não são estatísticas que servem precisa e efetivamente como medidas de centro.  1) Códigos Postais: 79950, 85015, 13014  2) Classificação de níveis de estresse para diferentes empregos: 2 3 1 7 9  3) Respondentes de uma sondagem são codificados como: 1 (PT), 2 (PSDB), 3 (PV), 4 (PCdoB) Aulas 1 e 2 – Introdução à Estatística Probabilidade e Estatística 19/19 Pensamento Crítico     1) Os códigos postais são rótulos para . 2) As classificações refletem uma , mas não medem ou contam coisa alguma. Os valores não correspondem à magnitude de estresse, mas apenas qual emprego tem maior nível de estresse. 3) Os resultados são números, porém estes números, simplesmente são uma maneira de expressar os . Portanto, em qualquer dos casos, a média ou mediana são estatísticas sem significado. A seria uma medida de centro que poderia fornecer alguma informação útil. Aulas 1 e 2 – Introdução à Estatística Probabilidade e Estatística 20/19 Qual a melhor medida de centro? Aulas 1 e 2 – Introdução à Estatística Probabilidade e Estatística 21/19  Infelizmente, uma única melhor resposta para esta questão.  As diferentes medidas de centro têm diferentes vantagens e desvantagens.  A média será a mais utilizada, porém deve-se tomar cuidado, pois uma desvantagem importante é que, algumas vezes, a média é drasticamente afetada por alguns valores extremos. Aulas 1 e 2 – Introdução à Estatística Probabilidade e Estatística 22/19 Medidas de centro Média Ache a soma de todos os valores e divida, então pelo número de valores. Mediana Moda Ordene os dados Número impar de valores A mediana é o valor no meio exato. Valor que ocorre mais frequentemente. Número par de valores Faça a média dos dois valores do meio. Aulas 1 e 2 – Introdução à Estatística Probabilidade e Estatística 23/19  A é sensível a valores extremos; tendem a variar menos do que outras medidas de centro;  A é, em geral, uma boa escolha se há alguns valores extremos;  A é boa para dados no nível nominal de mensuração. Aulas 1 e 2 – Introdução à Estatística Probabilidade e Estatística 24/19 Assimétrica positiva (ou à direita) Média > Mediana > Moda ou Mediana > Média > Moda Assimétrica negativa (ou à esquerda) Simétrica Moda Mediana Média IGUAIS Moda > Mediana > Média ou Moda > Média > Mediana Aulas 1 e 2 – Introdução à Estatística Probabilidade e Estatística 25/19 Regra de Arredondamento  Use uma casa decimal a mais que as que são apresentadas no conjunto original de dados.  No caso da , como são valores iguais aos dos dados originais, eles podem ser deixados sem arredondamento. Aulas 1 e 2 – Introdução à Estatística Probabilidade e Estatística 26/19