PROBABILIDADE E ESTATÍSTICA Profa. Dra. Yara de Souza Tadano [email protected] Aula 3 09/2014 Estatística Descritiva Medidas de Centro Aulas 1 e 2 – Introdução à Estatística Probabilidade e Estatística 3/19 Medidas de Centro Uma medida de centro é um valor no centro ou meio do conjunto de dados. Aulas 1 e 2 – Introdução à Estatística Probabilidade e Estatística 4/19 Medidas de Centro As medidas de tendência central (ou medidas de centro) mais comuns são: Média (aritmética) Média ponderada Mediana Moda Ponto Médio Aulas 1 e 2 – Introdução à Estatística Probabilidade e Estatística 5/19 Média (Aritmética) É a medida de centro encontrada pela adição dos valores e divisão do total pelo número de valores. Média Amostral ( X ) Média Populacional () n X X i 1 N i n X i 1 i N onde n é o número de elementos da amostra e N é o número de elementos da população. Aulas 1 e 2 – Introdução à Estatística Probabilidade e Estatística 6/19 Média (Aritmética) Uma desvantagem da média é que ela é sensível a qualquer valor, de modo que um valor excepcional pode afetar drasticamente a média. A mediana supera essa desvantagem. Aulas 1 e 2 – Introdução à Estatística Probabilidade e Estatística 7/19 Mediana A mediana pode ser considerada como um “valor do meio”. A centro que é o de um conjunto de dados é a medida de quando os dados originais estão arranjados em ordem crescente (ou decrescente) de magnitude. Aulas 1 e 2 – Introdução à Estatística Probabilidade e Estatística 8/19 Mediana Para encontrar a mediana, primeiro os valores e depois siga um dos dois passos: Se o número de valores for , a mediana será o número localizado no meio exato da lista. Se o número de valores for , a mediana será encontrada pelo cálculo da média dos dois números do meio. Aulas 1 e 2 – Introdução à Estatística Probabilidade e Estatística 9/19 Mediana A mediana é dada pela seguinte expressão: Mediana Amostral ( Se n for ímpar: ) Mediana Populacional (Me) Se n for ímpar: Me= Xæ N+1ö ç ÷ è 2 ø Se n for par: Se n for par: é ù ê Xæ ö + Xæ ö ú N ç +1÷ ú êë çè N2 ÷ø è 2 øû Me= 2 Aulas 1 e 2 – Introdução à Estatística Probabilidade e Estatística 10/19 Exemplo Olhando para o diagrama de Ramo e Folha do exemplo sobre a altura (em cm) dos alunos da UTFPR: RAMOS 15 16 17 FOLHAS 012345555666788 0000011112233444567889 023 Aulas 1 e 2 – Introdução à Estatística Probabilidade e Estatística 11/19 Exemplo Vamos supor agora, que ao invés de dois alunos de 161 cm, um dos alunos tinha 205 cm e o outro 209 cm de altura. O diagrama Ramo e Folha seria: RAMOS 15 16 17 18 19 20 FOLHAS 012345555666788 00000112233444567889 023 59 Aulas 1 e 2 – Introdução à Estatística Probabilidade e Estatística 12/19 Exemplo Neste caso, a 162,9 cm. Já a passaria de 160,6 cm para continuaria sendo 160,5 cm Aulas 1 e 2 – Introdução à Estatística Probabilidade e Estatística 13/19 Moda A de um conjunto de dados é o valor que ocorre mais frequentemente. : Quando tem duas modas, ou seja, dois valores que ocorrem com a mesma maior frequência. : Quando tem mais de duas modas. Quando nenhum valor se repete, dizemos que Aulas 1 e 2 – Introdução à Estatística Probabilidade e Estatística . 14/19 Exemplo Qual a moda das alturas (em cm) dos alunos da UTFPR? Olhando para o diagrama Ramos e Folhas, podemos verificar que a moda é RAMOS 15 16 17 . FOLHAS 012345555666788 0000011112233444567889 023 Aulas 1 e 2 – Introdução à Estatística Probabilidade e Estatística 15/19 Ponto Médio O é a media de centro que é exatamente o valor a meio caminho entre o maior valor e o menor valor no conjunto original de dados. valor máximo + valor mínimo Ponto Médio = 2 Raramente é usado como medida de centro. Aulas 1 e 2 – Introdução à Estatística Probabilidade e Estatística 16/19 Média de uma distribuição de frequências A média de uma distribuição de frequência é dada pela seguinte expressão: 1ª Fórmula: k x f ri xi f ri frequência relativa da i ésima classe. xi ponto médio da i - ésima classe i 1 2ª Fórmula: x k fx i 1 k i i f i 1 f i frequência da i - ésima classe k número de classes i Aulas 1 e 2 – Introdução à Estatística Probabilidade e Estatística 17/19 Média Ponderada A média ponderada é dada pela seguinte expressão: Média Ponderada Amostral ( X ) Média Ponderada Populacional () n N X w X i 1 n i w i 1 i i w X i 1 N i i w i 1 i onde wi é o peso. Aulas 1 e 2 – Introdução à Estatística Probabilidade e Estatística 18/19 Pensamento Crítico Para cada um dos seguintes conjuntos, podemos achar medidas de centro, como média e mediana. Identifique a principal razão pela qual a média e a mediana não são estatísticas que servem precisa e efetivamente como medidas de centro. 1) Códigos Postais: 79950, 85015, 13014 2) Classificação de níveis de estresse para diferentes empregos: 2 3 1 7 9 3) Respondentes de uma sondagem são codificados como: 1 (PT), 2 (PSDB), 3 (PV), 4 (PCdoB) Aulas 1 e 2 – Introdução à Estatística Probabilidade e Estatística 19/19 Pensamento Crítico 1) Os códigos postais são rótulos para . 2) As classificações refletem uma , mas não medem ou contam coisa alguma. Os valores não correspondem à magnitude de estresse, mas apenas qual emprego tem maior nível de estresse. 3) Os resultados são números, porém estes números, simplesmente são uma maneira de expressar os . Portanto, em qualquer dos casos, a média ou mediana são estatísticas sem significado. A seria uma medida de centro que poderia fornecer alguma informação útil. Aulas 1 e 2 – Introdução à Estatística Probabilidade e Estatística 20/19 Qual a melhor medida de centro? Aulas 1 e 2 – Introdução à Estatística Probabilidade e Estatística 21/19 Infelizmente, uma única melhor resposta para esta questão. As diferentes medidas de centro têm diferentes vantagens e desvantagens. A média será a mais utilizada, porém deve-se tomar cuidado, pois uma desvantagem importante é que, algumas vezes, a média é drasticamente afetada por alguns valores extremos. Aulas 1 e 2 – Introdução à Estatística Probabilidade e Estatística 22/19 Medidas de centro Média Ache a soma de todos os valores e divida, então pelo número de valores. Mediana Moda Ordene os dados Número impar de valores A mediana é o valor no meio exato. Valor que ocorre mais frequentemente. Número par de valores Faça a média dos dois valores do meio. Aulas 1 e 2 – Introdução à Estatística Probabilidade e Estatística 23/19 A é sensível a valores extremos; tendem a variar menos do que outras medidas de centro; A é, em geral, uma boa escolha se há alguns valores extremos; A é boa para dados no nível nominal de mensuração. Aulas 1 e 2 – Introdução à Estatística Probabilidade e Estatística 24/19 Assimétrica positiva (ou à direita) Média > Mediana > Moda ou Mediana > Média > Moda Assimétrica negativa (ou à esquerda) Simétrica Moda Mediana Média IGUAIS Moda > Mediana > Média ou Moda > Média > Mediana Aulas 1 e 2 – Introdução à Estatística Probabilidade e Estatística 25/19 Regra de Arredondamento Use uma casa decimal a mais que as que são apresentadas no conjunto original de dados. No caso da , como são valores iguais aos dos dados originais, eles podem ser deixados sem arredondamento. Aulas 1 e 2 – Introdução à Estatística Probabilidade e Estatística 26/19