MÉTODOS QUANTITATIVOS APLICADOS ÀS CIÊNCIAS CONTÁBEIS CONTABILIDADE ESTRATÉGICA 2º MÓDULO Prof. Josenildo dos Santos POPULAÇÃO: Conjunto de todos os indivíduos que possuem uma característica de interesse. AMOSTRA: Subconjunto de uma População extraído ao acaso. Prof. Josenildo dos Santos ATENÇÃO: Quem estabelece uma População é a característica de interesse. Prof. Josenildo dos Santos VARIÁVEL: É a característica de interesse de uma População podendo ser Qualitativa ou Quantitativa. Prof. Josenildo dos Santos VARIÁVEL QUALITATIVA Quando seu atributo é classificável. Exemplo: Sexo: Masculino ou Feminino, Nacionalidade, etc. Prof. Josenildo dos Santos VARIÁVEL QUANTITATIVA Quando é mensurável, isto é, uma variável é Quantitativa, quando a característica de interesse for expressa em forma numérica, quer por contagem ou não. Prof. Josenildo dos Santos QUADRO GERAL DAS VARIÁVEIS Qualitativa Tipo de Variável Categórica Escala Nominal Escala Ordinal Prof. Josenildo dos Santos Quantitativa Numérica Escala de Intervalo Escala de Proporcionalidade Discreta Contínua VARIÁVEL CATEGORIZADA A variável aleatória categorizada produz resposta categorizada. Prof. Josenildo dos Santos EXEMPLOS PRÁTICOS DE VARIÁVEIS Variáveis Categorizadas Na sua família existem diabéticos? SIM NÃO Você possui catarata? A resposta da pergunta acima é categorizada Os humanos subdividem quanto ao sexo em: MASCULINO Prof. Josenildo dos Santos FEMININO Em resumo, VARIÁVEL QUALITATIVA (categorizada) quando o atributo é classificável. Exemplo: Sexo, Nacionalidade ... VARIÁVEL QUANTITATIVA produz resposta numérica Prof. Josenildo dos Santos VARIÁVEIS NUMÉRICAS DISCRETA Quantos pacientes o HC atende por dia ? ... Número CONTÍNUA Qual a altura de cada paciente do HC ? ... metros Prof. Josenildo dos Santos EXERCÍCIO: A variável pequenas numérica: empresas Quantidade da de Região Metropolitana do Recife é discreta ou contínua? Porquê? Prof. Josenildo dos Santos QUADRO GERAL DO TRABALHO CIENTÍFICO FONTE DE DADOS Utilizar dados já publicados Projetar uma Experiência Realizar uma Pesquisa Tipo de amostra Probabilística Prof. Josenildo dos Santos Considerações éticas Não Probabilística Medidas de Tendência Central Para avaliar uma série de observações (uma amostra de dados) existem, com base na estatística descritiva, duas medidas de tendência central:as de posição e as de dispersão. Prof. Josenildo dos Santos 1. Medidas de Posição São os valores pontuais ou centrais em torno dos quais se acumulam os dados observados. Exemplos: mediana, moda e média aritmética percentis e quartis Prof. Josenildo dos Santos 2. Medidas de dispersão Em grau numérico, evidenciam o quanto os dados se distanciam de um valor médio. Prof. Josenildo dos Santos Medidas de posição 1. Mediana Mediana – é uma medida de tendência central, denotada por Md , e igual ao valor da série ordenada que está numa posição eqüidistante dos extremos dos elementos da série. Prof. Josenildo dos Santos Assim, podemos concluir: Numa série de n observações ordenadas de forma crescente, a mediana é o valor da observação, em duas metades iguais, numa delas com valores inferiores ao valor da mediana e a outra com valores superiores. Portanto, para calcular a mediana podemos seguir as etapas: Prof. Josenildo dos Santos 1. Situação Ímpar Se a série de dados tiver um numero ímpar de observações, então o valor da mediana é o próprio elemento que está no meio da série, o elemento de ordem igual a (n+1)/2. a1 a2 a3 a4 a5 Mediana ordem= (5+1)/2=3 Prof. Josenildo dos Santos 2. Situação Par Se a série de dados tiver um numero par de observações não existirá um valor no centro da série, portanto, para calcular o valor da mediana devemos dividir por dois a soma dos valores das observações com ordem n/2 e n/2 +1. a1 a2 a3 Md Prof. Josenildo dos Santos a4 Alem disso, podemos observar as principais vantagens e desvantagens da mediana Vantagens: 1. Fácil de determinar; 2. Não é afetada pelos valores extremos; 3. Parece ser uma medida correta, pois divide a série em duas partes iguais a 50%. Desvantagens: 1. Difícil de incluir em equações matemáticas; 2. Não usa todos os dados disponíveis Prof. Josenildo dos Santos ordenar a série de dados acima em ordem crescente e obtenha o máxima e mínimo. Obter média, moda e media aritmética - 2. Moda Moda – é uma medida de tendência central, é igual ao valor da série que mais se repete, isto é, que tem maior freqüência. Podemos, assim, concluir que: 1.a moda é também uma medida resistente, pois está relacionada apenas com a freqüência de um ou mais elementos da série de observações. Por exemplo, a mudança de valor de um elemento da série pode não afetar o valor da moda. 2.comparando à mediana, a moda não tem que representar mais da metade das observações, apenas representa a observação, ou Josenildo dos Santos classe, que tem maior Prof. freqüência. Além disso, podemos resumir as principais vantagens e desvantagens da moda: Vantagens: 1.Fácil de calcular; 2.não é afetada pelos valores extremos. Desvantagens: 1.pode estar afastada do centro das observações; 2.difícil de incluir em equações matemáticas; 3.a distribuição pode ter mais de uma moda; 4.não usa todos os dados disponíveis. Prof. Josenildo dos Santos 3. Média Aritmética Seja X a seqüência de observações, representa uma populacao ou uma amostra. X = (x1, x2,..., xn) onde x1 é o primeiro dado da série, xn é o último dado da seqüência e xi é um elemento qualquer da mesma seqüência. Define-se a) média da população x é o resultado de divisão da soma de todos os elementos da seqüência pelo número de elementos x = (x1+x2...+ xn) /n b) média da amostra, suponhamos que nessa amostra temos m<n, assim _ X = (x1+x2...+ xm) /m Prof. Josenildo dos Santos Exemplos: amostra de hemoglobina obtida de 70 mulheres 10,2 12,0 13,7 12,9 10,4 11,1 14,9 13,3 13,4 12,9 12,1 12,1 10,9 9,4 10,6 11,9 10,5 11,4 13,7 12,5 11,8 12,1 11,2 12,9 15,1 11,4 10,7 12,7 9,3 14,6 13,5 11,1 14,6 13,5 10,9 8,8 11,5 10,2 12,0 11,6 11,0 12,5 11,3 13,5 14,7 10,8 10,8 11,7 13,3 13,0 14,1 11,6 10,3 13,1 13,6 9,7 12,9 10,6 13,4 11,4 12,3 11,9 11,0 10,9 11,7 13,1 10,9 11,8 10,4 12,2 ordenar a série de dados acima em ordem crescente e obtenha o máxima e Prof. mínimo. Josenildo dos Santos Obter média, moda e media aritmética Assim, temos as seguintes conclusões: 1.a medida de posição mais usada é a média aritmética de uma seqüência de observações 2.o valor da média pode ser interpretado de forma geométrica, isto é, podese ver que o valor da média aritmética está posicionado entre os dados de forma equilibrada, isto é, todos os dados se distribuem ao redor da média. 3.a soma dos desvios das observações de uma seqüência é sempre igual a zero. 4.a soma dos quadrados dos desvios das observações de uma seqüência é sempre um valor mínimo. Prof. Josenildo dos Santos MÉTODOS QUANTITATIVOS Prof. Josenildo dos Santos Lembre-se: Os métodos que podem medir os fenômenos devido ao acaso são: Probabilístico » Pelo método probabilístico apriori, podemos ter uma estimativa dos casos favoráveis à realização do fenômeno. Estatístico » Pelo método estatístico ou a posteriori, sabemos com que freqüência, em relação a massa geral, acontecem os casos aparecimento do fenômeno. do fenômeno. Prof. Josenildo dos Santos favoráveis ao Assim definimos: A probabilidade matemática apriori como sendo a relação entre os casos favoráveis de realização de um acontecimento sobre os casos igualmente possíveis. Prof. Josenildo dos Santos p p = = Número de casos favoráveis Número de casos possíveis Número de casos favoráveis Nº de casos favoráveis + Nº de casos contrários Prof. Josenildo dos Santos Por outro lado, a probabilidade contrária é representada por q e definida por q= Número de casos contrários Número de casos possíveis Prof. Josenildo dos Santos Conseqüentemente, p+q = Número de casos possíveis Nº de casos favoráveis + Nº de caos contrários p+q = 1 q = 1-p Prof. Josenildo dos Santos EXEMPLO 2 : Seja uma população formada por cinco bolas numeradas com os números 2, 4, 6, 8 e 10 que estão dentro de uma urna da qual retiramos amostras. Pode-se calcular o valor esperado das medidas amostrais X referentes as amostras de tamanho n=2 retiradas da população. Solução: ... Conclusão: A população tem média µx = 6 O valor esperado das médias amostrais E [ X ] = 6 Em outras palavras o valor esperado das médias amostrais é o próprio valor da média da população. Prof. Josenildo dos Santos HISTOGRAMA DAS MÉDIAS AMOSTRAIS DE TAMANHO N = 2 Probabilidade P 20% 10% 3 4 dos Santos 5Prof. Josenildo 6 7 8 9 X Na prática temos: A distribuição em questão pode ser aproximadamente normal. Qualquer amostra real pode se desviar das características teóricas esperadas. Prof. Josenildo dos Santos DISTRIBUIÇÃO NORMAL Prob.: X ~ N ( µ1 σ2) X tem distribuição normal ( N ) com média µ e variância σ2 . Características da Distribuição Normal Em termos de forma, ela é simétrica e tem o formato de um sino Prof. Josenildo dos Santos Suas medidas de tendência central (média aritmética, mediana, moda, média de intervalo e média das juntas) são todas idênticas (Exercício: Usar o livro texto e o SPSS). Sua dispersão média é igual a 1,33 desvio padrão. Isto significa que o intervalo interquantil está contido dentro de um intervalo de dois terços de desvio padrão, abaixo da média aritmética e dois terços de um desvio padrão acima da média (exerc.) Sua variável aleatória associada possui uma intervalo infinito ( - oo < X < oo ) Prof. Josenildo dos Santos Na verdade, um fenômeno que possa ser aproximado por um modelo de distribuição normal, pode ter as seguintes características: C1 - Seu polígono pode apenas aproximadamente ter formato de um sino e ter aparência simétrica. Prof. Josenildo dos Santos C2 - Suas medidas de tendência central pode divergir ligeiramente uma da outra. C3 - O valor de seu intervalo interquantil pode definir ligeiramente de 1,33 desvio padrão. C4 - Se o intervalo prático não será infinito, não geralmente estará entre 3 (três) desvios padrões acima e abaixo da média aritmética ( isto é intervalo de amplitude ~ 6 desvios padrões) Prof. Josenildo dos Santos MODELANDO: Modelo Funcional da Distribuição Normal. Prof. Josenildo dos Santos O modelo matemático da função de densidade da probabilidade para a distribuição normal é dado por: f(x) = -½ 1 ҽ σ 2π X -µ 2 ( σ) Onde: M N i=1 µ = (média da população) = Xi N 2 σ = (variância da população) = σ = (desvio padrão) = M N ( M N i=1 Xi - µ ) i=1 Prof. Josenildo dos Santos N ( Xi - µ ) N 2 2 TABELA DE FREQÜÊNCIA DE CLASSES Define-se como sendo o arranjo da massa de dados em uma tabela de freqüência, na qual os dados são agrupados em classes de intervalo de comprimento constante. Para estabelecer o intervalo de comprimento das classes que irão representar os dados, pode-se utilizar a seguinte expressão: m = 0,9 n Onde: m - número de classes N - número de observações Prof. Josenildo dos Santos Segundo Sturges() existe, também a proposta m = 1 + log2 n , com o objetivo de estabelecer o número de classes. No entanto, faz-se necessário ressaltar que estas formulações (ver fig.II) não são rígidas, ou seja tenham que ser aplicadas. O critério para se estabelecer o comprimento das classes depende, em muito, do conhecimento do pesquisador sobre o assunto. Prof. Josenildo dos Santos 16 -14 -12 -10 -8 -6 -4 -2 --- -- -- -- -- 0 m = 0,9 n -- Número de classes (m) m 50 100 150 200 250 300 Tamanho da amostra (n) Prof. Josenildo dos Santos n ASSIMETRIA E CURTOSE Ao se representar uma série de observações (ou uma massa de dados) através dos pontos médios das classes, em função da freqüência, percebe-se que o gráfico pode ser simétrico, ou seja, possui a mesma forma à esquerda e à direita da moda ( fig. III), ou pode ser assimétrica (fig.IV). Prof. Josenildo dos Santos Fig. III Ma= 3Md - Mo freqüência Moda = média = mediana classes Fig III - distribuição de freqüência Prof. Josenildo dos Santos 2 freqüência Fig. IV moda mediana mediana média média classes Prof. Josenildo dos Santos moda CÁLCULO DO COEFICIENTE DE ASSIMETRIA Para determinar o coeficiente de assimetria CA utiliza-se a seguinte relação: n w CA3 = i=1 (Xi - X)3 , onde n S3 n w S = i=1 (Xi - X)2 n -1 O desvio padrão da amostra Então: Se CA3 = 0 - a massa de dados tem representação simétrica Se CA3 < 0 - indica uma assimetria negativa Se CA3 > 0 - indica uma assimetria positiva Prof. Josenildo dos Santos CÁLCULO DO COEFICIENTE DE CURTOSE Denomina-se de curtose, o grau de achatamento da curva em torno do eixo máximo (moda). Esta característica é exclusiva para a distribuição simétrica. O coeficiente de curtose CC4 é calculado pela seguinte relação: n w CC4 = i=1 (Xi - X)4 , onde n S4 w n S = Então : i=1 (Xi - X)2 n -1 O desvio padrão da amostra Se CC4 = 3 temos uma mesocurtose Se CC4 > 3 temos uma leptocurtose Se CC4 < 4 temos uma platicurtose Prof. Josenildo dos Santos De fato, existem vários níveis de achatamento da curtose, no entanto freqüência iremos considerar neste trabalho apenas os três citados acima. leptocurtose mesocurtose platicurtose classes Prof. Josenildo dos Santos TABELA DE FREQÜÊNCIA A apresentação de uma série de observações (dados) em uma tabela de freqüência, é o arranjo que se dá ao organizá-los em colunas. Na primeira coluna, normalmente, colocam-se os dados em ordem crescente e sem repetí-los. Nas outras colunas, adicionam-se a freqüência observada (fo) e ou relativa com a probabilidade observada (po). Prof. Josenildo dos Santos A freqüência observada (fo) é o número de vezes que cada elemento se repete, enquanto que a freqüência relativa (fr) - ou probabilidade observada- é a relação percentual da "fo" pelo total de dados (no caso da probabilidade observada é razão entre a freqüência observada e o número total de dados). Por vezes fazse necessário apresentar a probabilidade esperada (pe), a diferença po - pe, Z-Teste ou X2-Teste ou outros testes. Prof. Josenildo dos Santos