UNIVERSIDADE FEDERAL DO PAMPA BACHARELADO EM ADMINISTRAÇÃO DE EMPRESAS Estatística Aplicada à Administração Prof. Alessandro Moura costa 2.1 Conceitos Estatística Descritiva: trata da coleta, da organização, classificação, apresentação e descrição dos dados de observação. Amostra: é um subconjunto da população e deve ser selecionada de acordo com algum critério para que possa ser representativa da população. 2 2.2. Medidas Descritivas Básicas Medidas de Posição ou Tendência central Média Mediana Moda Medidas de Dispersão Desvio padrão Variância Coeficiente de Variação 3 2.3 Medidas de Tendência central Posição ou Quando se trabalha com dados numéricos observa-se um tendência destes de se agruparem em torno de um valor central. Isto indica que algum valor central é característica dos dados e que o mesmo pode ser usado para descrevê-los e representá-los. As medidas de Posição ou Tendência central básicas são: Média, Mediana e Moda 4 2.3.1 Média Aritmética Simbologia: µ = população X = amostra É a mais utilizada das medidas de tendência central para descrever, resumidamente, um conjunto de dados. 5 Média (média aritmética) Média amostral (x) x= Σx n tamanho da amostra Cálculo para dados não agrupados em classes: consiste na soma de todas as observações, dividida pelo número “n” de observações do grupo. 6 Para dados agrupados em Distribuição de Frequência (agrupados em classes): se os dados estiverem agrupados em uma tabela de frequências, pode-se obter a média aritmética da distribuição, calculando-se: X = Σ (xi.fi) n Onde: xi = ponto médio da classe i; fi = a frequência absoluta da classe i Σ fi = n 7 2.3.2 Mediana (Md) A mediana divide em duas partes o conjunto das observações ordenadas. Colocando-se os valores em ordem crescente ou decrescente, a mediana é o elemento que ocupa o valor central. 50% Md 50% Xmín Xmáx rol crescente 8 Mediana para dados não agrupados em classes: 1. Colocam-se os dados em ordem (rol) 2. Se o número de elementos “n” for ímpar, a mediana será o elemento que ocupa a posição (n + 1) /2 3. Se “n” for par, a mediana será a média aritmética entre dois elementos centrais Mediana para dados agrupados em Distribuição de Frequência: Calcula-se a posição da mediana 2. Calcula-se a Fac 1. 9 Fórmula de cálculo da Mediana para dados agrupados em Distribuição de Frequência Md = Li + (PMd- Fac ) . i Fmd Posição da mediana Pmd = n 2 Li = limite inferior da classe que contém a mediana Pmd = posição da mediana Fac = frequência acumulada da classe anterior à classe mediana i = amplitude da classe Fmd = frequência absoluta da classe que contém a mediana 10 Observações: Não há regra fixa para se escolher entre a Média e a Mediana. Entretanto algumas observações podem ser feitas quanto a utilização das mesmas. A Média aritmética é a medida de tendência central mais utilizada, principalmente quando não há valores aberrantes (muito extremos) no conjunto de dados. A Mediana deve ser usada, sempre que possível, como medida representativa de distribuições fortemente assimétricas, ou seja, quando os valores extremos do conjunto são muito distantes dos outros, pois o seu valor não é afetado por estes. 11 2.3.3 Moda (Mo) É o valor que ocorre com maior frequência. Um conjunto de dados pode não ter moda (amodal), ou ter duas modas (bimodal) ou mais modas (plurimodal). 12 2.4. Medidas de Dispersão Visam descrever os dados no sentido de informar o grau de dispersão ou afastamento dos valores observados em torno de um valor central (média). Elas indicam se um conjunto é homogêneo (pouca ou nenhuma variabilidade) ou heterogêneo (muita variabilidade). A descrição do conjunto de dados é mais completa quando se considera além de uma medida de tendência central, uma medida de dispersão ou variação, porque é comum encontrar-se séries que, apesar de apresentarem a mesma média, são constituidas de maneiras diferentes, o que mostra que as medidas de tendência central são insuficientes para descrever adequadamente uma série estatística. 13 2.4.1 Desvio Padrão Simbologia: σ = população S = amostra É uma das medidas mais úteis da variação de um grupo de dados. A vantagem do desvio padrão sobre a variância, é que este permite uma interpretação direta da variação do grupo, pois o mesmo é expresso na mesma unidade de medida em que estão expressas as variáveis amostradas. 14 Fórmula do Desvio padrão para dados não agrupados em classe Desvio padrão da amostra(s): S = (Σx)² Σ(x²) - n √ n-1 15 Para dados agrupados em Distribuição de Frequência: S = √ Σ (x². F) – (Σx. F)² ΣF (ΣF) - 1 X F X².F X.F 14 1 196.1=196 14 15 3 225.3=675 45 16 3 256.3=768 48 17 1 289.1=289 17 Σ 8 1928 124 S= √ 1928 – (124)² 8 7 = 0.92 16 Comparação do Desvio Padrão Amostra A ● ● ● ● ● ● ● ● Média = 15,5 S = 3,338 11 12 13 14 15 16 17 18 19 20 21 Amostra B Média = 15,5 S = 0,9258 ● ● ● ● ● ● ● ● 11 12 13 14 15 16 17 18 19 20 21 ● ● ● ● Amostra C ● ● ● ● 11 12 13 14 15 16 17 18 19 20 21 Média = 15,5 S = 4,57 17 2.4.2. Variância Simbologia: σ² = população S² = amostra A variância é o desvio padrão elevado ao quadrado, então, é calculado por: S² = (S)² 18 2.4.3. Coeficiente de Variação (CV) É uma medida de dispersão relativa, utilizada quando se deseja comparar a variação de conjunto de dados que apresentem diferentes unidades de medição e ou tamanhos diferentes, pois o coeficiente de variação independe da unidade de medida dos dados. É expresso sempre em porcentagem (100%) . 100 X Fórmula: CV = S 19 Comparação do coeficiente de variação Ação A: Preço médio do último ano = 50 u.m Desvio padrão = 5 u.m Ação B: Preço médio do último ano = 100 u.m Desvio padrão = 5 u.m. Coeficiente de variação: Ação A: S 100% = 5 100% = 10% - é mais irregular CV = x 50 pois o CV é maior Ação B: 5 100% = 5% - possui maior S 100% = 100 CV = x regularidade, é mais estável 20