21 CURSO DE PÓS-GRADUAÇÃO LATO SENSU EM GESTÃO ESTRATÉGICA ECONÔMICA, FINANCEIRA E CONTÁBIL DISCIPLINA: MÉTODOS QUANTITATIVOS DOCENTE: Emília Satoshi Miyamaru Seo SEGUNDA AULA: DISCUSSÃO DO ARTIGO: “ Estatística é um método de gestão”. SOFTWARES ESTATÍSTICAS. ANÁLISE EXPLORATÓRIA DE DADOS: ORGANIZAÇÃO, DESCRIÇÃO E SUMARIZAÇÃO DOS DADOS COLETADOS EM CAMPO. ALGUNS COMENTÁRIOS SOBRE ELABORAÇÃO DE QUESTIONÁRIO. SOBRE OS SOFTWARES ESTATÍSTICOS Nos últimos anos, houve uma mudança no campo de Estatística com o desenvolvimento de softwares especialmente construídos para análises estatísticas. Atualmente, dispõe-se, dentre outros, do SAS, SPSS, Minitab, Origin, além do Excel. Para familiarizarmos com um destes, utilizaremos o Excel. ORGANIZAÇÃO DE DADOS (ESTATÍSTICA DESCRITIVA) Na análise estatística, a coleta de dados é a primeira etapa de todo o processo com que se deve trabalhar se o objetivo é analisar dados, obter resultados e testar hipóteses acerca da natureza da realidade. Procura transformar seus dados brutos num conjunto de mensurações, organizadas e dotadas de sentido, que possam ser usadas para testar suas primeiras hipóteses iniciais. Que é que se faz para transformar essa massa de dados brutos num conjunto – resumo fácil de entender? O primeiro passo poderia ser construir uma DISTRIBUIÇÃO DE FREQÜÊNCIA sob a forma de tabela. 22 Para elaboração da Tabela de Distribuição de Freqüência deve –se primeiramente identificar o tipo de variável: A) DISTRIBUIÇÃO DE FREQUÊNCIA – VARIÁVEL DISCRETA (DADOS NOMINAIS, ORDINAIS, INTERVALARES) Chamamos: Frequência Absoluta (ou freqüência simples) fi , ao número de vezes que cada resultado aparece no conjunto de dados. Frequência Relativa Absoluta (ou proporção) fri , a proporção de cada realização em relação ao total. Ou seja: frequência relativa = fri= fi n Total de observações: n , é a soma das frequências absolutas. Onde: n= fi i Porcentagem da freq. relativa simples : é a frequência absoluta divida pelo total de observações e multiplicada por 100. Sendo que: Porcentagem = fi . 100 = % n Frequência acumulada FAC, é a soma da frequência simples (absoluta) deste elemento com as frequências simples dos elementos que o antecedem: Fac1 = f1 Fac2 = f1 + f2 Fac3 = f1 + f2 + f3 Facn = f1 + f2 + ...+ fi Frequência Acumulada Relativa FAC, é a divisão acumulada deste elemento, pelo número total de elementos da série: 23 FACRi = F AC n Porcentagem da freq. acumulada relativa : é a frequência acumulada dividida pelo total de observações e multiplicada por 100. Sendo que: Porcentagem = F AC n . 100 = % Exemplo: Tabela 1.1 - Informações sobre estado civil, grau de instrução, número de filhos, salário (expresso como fração do salário mínimo), idade (medida em anos e meses) e procedência de 36 funcionários de um certo Departamento da Empresa Controladora de Lixo Nuclear. Nº 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 Estado Civil Solteiro Casado Casado Solteiro Solteiro Casado Solteiro Solteiro Casado Solteiro Casado Solteiro Solteiro Casado Casado Solteiro Casado Casado Solteiro Solteiro Casado Solteiro Solteiro Casado Casado Casado Solteiro Educação 1º Grau 1º Grau 1º Grau 2º Grau 1º Grau 1º Grau 1º Grau 1º Grau 2º Grau 2º Grau 2º Grau 1º Grau 2º Grau 1º Grau 2º Grau 2º Grau 2º Grau 1º Grau 3º Grau 2º Grau 2º Grau 2º Grau 1º Grau 3º Grau 2º Grau 2º Grau 1º Grau nº de filhos 1 2 0 1 2 3 0 1 2 0 2 2 0 2 2 - Salário (x Sal. Min) 4,00 4,56 5,25 5,73 6,26 6,66 6,86 7,39 7,59 7,44 8,12 8,46 8,74 8,95 9,13 9,35 9,77 9,80 10,53 10,76 11,06 11,59 12,00 12,79 13,23 13,60 13,85 Idade anos 26 32 36 20 40 28 41 43 34 23 33 27 37 44 30 38 31 39 25 37 30 34 41 26 32 35 46 meses 03 10 05 10 07 00 00 04 10 06 06 11 05 02 05 08 07 07 08 04 09 02 00 01 05 00 07 Região de Procedência Interior Capital Capital Outro Outro Interior Interior Capital Capital Outro Interior Capital Outro Outro Interior Outro Capital Outro Interior Interior Outro Capital Outro Outro Interior Outro Outro 24 28 29 30 31 32 33 34 35 36 Casado Casado Casado Solteiro Casado Casado Solteiro Casado Casado 2º Grau 2º Grau 2º Grau 3º Grau 2º Grau 3º Grau 3º Grau 2º Grau 3º Grau 0 5 2 1 3 2 3 14,69 14,71 15,99 16,22 16,61 17,26 18,75 19,40 23,30 29 40 35 31 36 43 33 48 42 08 06 10 05 04 07 07 11 02 Interior Interior Capital Outro Interior Capital Capital Capital Interior 1. Usando os dados da Tabela 1.1 construa a distribuição de frequências da variável:grau de instrução Resolução: Natureza da variável: Grau de instrução → Variável discreta ordinal A distribuição de frequência fica: Grau de instrução Frequência % Freq. Acum. % Freq.ac.Rel. 100.fri FAC FACRi.100 10 grau 12 0,3333 33,33 12 33,33 20 grau 18 0,5000 50,00 30 83,33 30 grau 6 0,1667 16,67 36 100,00 Total 36 1,0000 100,00 fi Freqüência Relativa fri Fonte: Tabela 1.1 Estes valores podem ser interpretados da seguinte forma: 33,33% dos empregados possuem 1o grau; 50,00% dos empregados possuem 2o grau; 16,67% dos empregados possuem 3o grau. 83,33% dos empregados possuem até 2o grau. 25 B) DISTRIBUIÇÃO DE FREQUÊNCIA – VARIÁVEL CONTÍNUA (DADOS AGRUPADOS) Um dos objetivos de construir a distribuição de frequência é resumir o conjunto de dados. No caso de variáveis contínuas não podemos construir a distribuição de frequências listando um a um os resultado, pois não havendo observações iguais não há redução na tabela. Desta forma é interessante agrupar os resultados em classes. Para agrupar os dados de uma variável em classes devemos ter alguns cuidados: 1. Adotar classes de mesma amplitude, sempre que possível; Amplitude total de uma sequência , At, é a diferença entre o maior e o menor elemento de uma sequência. Representa o comprimento total da sequência: At = xmax - xmin Amplitude ou intervalo total de classe, h, é a diferença entre o limite superior e o limite inferior da classe: h = L – l; Por exemplo: 2 4, l (limite inferior) = 2 e L (limite superior) = 4 Ou h= At K , onde K = número de classes 2. Determinar o número de classes adequadamente: muitas classes não reduz os dados e poucas classes pode-se perder as informações. Sugere-se o uso de 5 a 15 classes com a mesma amplitude. Onde K = n (usual) ou K = 1 + 3,3 log n Exemplo: Usando os dados da Tabela 1.1 construa a distribuição de frequências da variável: salários Resolução: Natureza da variável: variável contínua; A distribuição de frequência fica: 26 Da Tabela 1.1, computando as frequências absolutas de cada classe, construímos a variável contínua. Da Tabela 1.1 os salários vão de 4 até 23,30 At = 23,30 – 4,0 = 19,30; K= n = 36 = 6; Logo no de classes pode ser 5, 6 ou 7 h= At K = 19,30 = 3,86 = 4 5 Classe de salários x 4,00 8,00 8,00 12,00 12,00 16,00 16,00 20,00 20,00 24,00 Total Frequência Freq. Acum. % Freq.ac.Rel fi % Porcentagem 100 . fri FAC (FACRi.100) 10 12 8 5 1 27,78 33,33 22,22 13,89 2,78 10 22 30 35 36 27,78 61,11 83,33 97,22 100,00 36 100,00 Estes valores podem ser interpretados da seguinte forma: 35 empregados recebem salários menores que 20; 97,22% empregados recebem salários menores que 20, assim por diante. REPRESENTAÇÕES GRÁFICAS No ítem anterior fez – se referência à utilidade das tabelas como instrumento de análise e de apresentação de dados estatísticos. A apresentação gráfica é um complemento importante da apresentação tabular, ou seja, uma das maneiras mais concisas de interpretar os dados estatísticos de uma tabela é através da interpretação gráfica. A principal vantagem de um gráfico sobre a tabela prende – se ao fato de que ele permite conseguir uma visualização imediata da distribuição dos valores observados. Propiciam os gráficos uma idéia preliminar mais satisfatória da concentração e dispersão de valores, uma vez que através deles os dados estatísticos se apresentam em termos de grandezas visualmente interpretáveis. Por outro lado, os fatos essenciais e as relações que poderiam ser difíceis de reconhecer em massas de dados estatísticos podem ser observados mais claramente através dos gráficos. DIFERENTES TIPOS DE REPRESENTAÇÕES GRÁFICAS DE SÉRIES ESTATÍSTICAS A distribuição de frequências, tanto de variáveis discretas como de variáveis contínuas, pode ser interpretada mais facilmente quando os valores dessas variáveis são apresentados em forma de gráficos. 27 A Estatística utiliza vários tipos de gráficos: de setores, de barras, de colunas, de linhas, histogramas e polígonos de frequência. A) HISTOGRAMAS Representação gráfica da distribuição de freqüência de uma variável discreta São gráficos em colunas que são construídos em eixos cartesianos. No eixo horizontal (abcissas) são colocados os valores da variável e no eixo vertical (ordenadas) estão os respectivos valores de suas frequências. Exemplo: Ocupação = Profissão Frequência Artesanato 52 Trabalho não qualificado 65 Gerencial 29 Serviços burocráticos 34 Fonte: Livro: Hanan, H.S. & Batalha, B.H.L. Amazônia contradições no paraíso ecológico. Cultura ed. Associados. 5a ed. 1999. Então o histograma assume a forma: Bu r. iç os Se rv er en ci al G Q ão b. N Tr a Ar ua l. 70 60 50 40 30 20 10 0 te sa na to Frequência Gráfico de histograma ou de colunas simples de uma Distribuição Ocupacional Representação gráfica da distribuição de freqüência de uma variável contínua É um conjunto de retângulos justapostos, representados em um sistema de coordenadas cartesianas cujas bases são os intervalos de classes e cujas as alturas são valores proporcionais às frequências simples correspondentes (fi ). 28 Exemplo: Consideremos a série: fi Classe fi Int. de classe 1 0 2 3 2 2 4 6 3 4 6 8 4 6 8 5 5 8 10 2 8 6 4 2 0 0 2 4 6 8 10 xi Notar que o zero correspondente ao valor da variável x i está deslocado à direita do eixo vertical, propositadamente, criando uma classe fictícia, para se desenhar o que se chama polígono de freqüências. Também, uma classe fictícia fica marcada à direita do limite superior da última classe ( ver figura seguinte) . Polígono de frequências Unindo com segmentos de reta os pontos médios dos lados superiores de cada coluna de um histograma, obtemos uma linha poligonal. Essa nova figura é chamada de polígono de frequências. fi A união dos pontos médios de todas as 8 classes por uma linha, incluindo as duas classes fictícias, forma o que se chama polígono de freqüências. Observe que a 6 4 área sob o polígono de freqüências é igual a área do histograma. 2 0 0 2 4 6 8 10 xi B) GRÁFICO DE BARRAS SIMPLES São gráficos em colunas que são construídos em eixos cartesianos. No eixo horizontal (abcissas) são colocados os valores de suas frequências e no eixo vertical (ordenadas) estão os respectivos valores da variável. Exemplo: Produção Nacional de madeira por região Região Sudeste Norte Centro - Oeste Sul % (fri . 100) 4 20 7 69 29 Produção Nacional de Madeira por Região Região 5 S 3 CO N 1 SE 0 20 40 60 80 Frequência (%) C) GRÁFICO DE SETORES Sua construção é feita com base em um círculo que é dividido em setores com áreas proporcionais às frequências das diversas categorias. É usado para comparar frequências relativas. Lembrar que a frequência relativa de uma variável xi é a razão entre a frequência fi e o número total de elementos, multiplicada por 100 (%). Exemplo: Distribuição dos alunos do Curso de Gestão Ambiental, segundo a situação em relação às notas Situação Frequência Porcentagem Graus fi 100 . fi Promovido 12 50 1800 Em recuperação 8 33,30 1200 Retido 4 16,70 600 Total 24 100,00 3600 Para determinarmos o ângulo correspondente a cada setor, utilizando uma regra de três: 24 12 3600 x x= 12.360 = 1800 24 Analogamente determinamos os ângulos dos outros setores. Distribuição de alunos do Curso de Gestão Ambiental segundo a relação de notas retido 17% Em recuperação 33% Promovido 50% 30 D) GRÁFICO DE LINHA Constitui uma aplicação do processo de representação das funções num sistema de coordenadas cartesianas. Estetipo de gráfico se utiliza da linha poligonal para representar a série estatística. Exemplo: Produção Brasileira de óleo de dendê 1987 – 1992. Anos 1987 1988 1989 1990 1991 1992 Fonte: Agropalma Quantidade (1000 t) 39,3 39,1 53,9 65,1 69,1 59,5 Vamos tomar os anos como abcissas e as quantidades como ordenadas. Determinados graficamente, todos os pontos da série, usando as coordenadas, ligamos todos esses pontos, dois a dois, por segmentos de reta, o que irá nos dar uma poligonal, que é o gráfico em linha correspondente à série em estudo. E) GRÁFICO DE COLUNAS OU BARRAS MÚLTIPLAS É aquele em que os retângulos são dispostos um sobre o outro, procurando evidenciar suas diferenças, facilitando a comparação entre eles. Exemplo: Quantidade de lixo gerado nos bairros da Cidade de Rio de Janeiro. Anos Bairro A Bairro B 84 8.000 6.000 85 12.000 11.000 86 9.000 10.000 87 11.000 9.500 Fonte: Hipotéticos 31 Quantidade de lixo gerado nos bairros da Cidade de Rio de Janeiro Quantidade (1000 t) 14000 12000 11000 12000 11000 10000 9000 10000 8000 9500 8000 6000 6000 4000 2000 84 85 86 87 0 Anos F) GRÁFICO DE LINHAS MÚLTIPLAS Este gráfico permite representar e comparar duas séries simultaneamente ao longo do tempo. Exemplo: Quantidade de lixo gerado nos bairros da Cidade de Rio de Janeiro. Anos 84 85 86 87 Fonte: Hipotéticos Bairro A 8.000 12.000 9.000 11.000 Bairro B 6.000 11.000 10.000 9.500 32 SUMARIZAÇÃO DOS DADOS COLETADOS EM CAMPO. INTRODUÇÃO Para interpretar os dados corretamente, em geral é preciso primeiro organizar e sumarizar os números, ou seja, um conjunto de números pode reduzir-se a uma ou a algumas medidas numéricas que resume todo o conjunto. Aqui, estamos interessados em calcular alguns valores de uma série, que representam bem e resumidamente, todos os dados dessa série. São posições no eixo horizontal de um gráfico, em torno das quais se concentram a maioria dos valores da variável Usualmente emprega-se as seguintes medidas: Medidas de posição (tendência central) = média (aritmética simples e ponderada), mediana e moda. Podemos resumir as condições que regem a escolha de uma dessas medidas de tendência central da seguinte maneira: MODA (MO): 1. Pode ser aplicada em qualquer escala: nominal, ordinal e intervalar; 2. Permite obter uma medida de tendência central rápida, simples, embora grosseira (pode estar afastada do centro dos valores). 3. Não é afetada pelos valores extremos e não utiliza todos os valores da variável. 4. A variável pode ter mais de uma moda ou não ter nenhuma moda. MEDIANA (Md = x~ ) 1. forma da distribuição: mais adequada para distrib. assimétricas; 2. objetivo: é uma medida de tendência central “confiável”, pode, às vezes ser usada em operações estatísticas mais avançadas ou “quebrar” uma distribuição em duas categorias distintas (por exemplo poluentes x não poluentes). 3. Não é afetada pelos valores extremos e não utiliza todos os valores da variável. MÉDIA ( x) 1 forma da distribuição: mais adequada para distrib. unimodais simétricas; 2. objetivo: é uma medida de tendência central exata, pode frequentemente ser usada em operações estatísticas mais avançadas, tais como os testes para tomada de decisões que aparecerão no final do Curso. 3. Utiliza todos os valores da variável Exemplo 01: Concepções ideais de família numa amostra de 26 respondentes de renda baixa ( Distribuição Bimodal) Tamanho ideal de família fi 10 1 Temos: = 5,58 ~ 9 x =6 2 6 Temos uma com um número 8 7 3 bastante grande de pessoas (MO = 8) e 6 2 5 1 4 2 6 outra com apenas algumas 3 2 2 pessoas (MO = 3) 1 1 n = 26 x 33 Exemplo 02: medidas de tendência central numa distribuição assimétrica de salários anuais Salário anual (R$) 1.700.000,00 = R$ 306.000,00 425.000,00 170.000,00 x~ = 51.000,00 85.000,00 17.000,00 MO = 17.000,00 17.000,00 17.000,00 x No exemplo acima, se trabalhássemos de relações públicas de uma empresa e desejássemos angariar-lhe uma imagem pública favorável, calcularíamos, talvez, a média, a fim de demonstrar que o empregado “típico” ganha R$306.000,00 por ano, e é relativamente bem pago. Por outro lado, se nós fôssemos representantes sindicais e estivéssemos procurando melhorar os níveis salariais, iríamos provavelmente empregar a moda para demonstrar que o salário médio é apenas 17.000,00, o que representa uma quantia bastante reduzida. Se fossemos pesquisadores sociais desejosos de dar uma informação acurada do salário médio dos empregados dessa empresa, empregaríamos, a mediana (R$ 51.000,00), uma vez que esta medida cai entre outras duas, oferece portanto um quadro mais equilibrado da estrutura salarial. A seguir, serão apresentadas algumas considerações sobre as Medidas de dispersão (dispersão de números). O conceito de desvio padrão é o que mostra a maneira como os dados agrupam – se em torno do centro da distribuição. A amplitude total foi definida como um indicador de variabilidade rápido e grosseiro, facilmente calculada a partir da diferença entre o maior e o menor dado da distribuição. O desvio médio não é muito usado em pesquisa, uma vez que ele não se presta a muitas análises estatísticas avançadas. Por outro lado, o cálculo do desvio padrão implica a utilização de um procedimento aceitável do ponto de vista matemático, com vistas de contornar o problema dos sinais de + , - . O desvio padrão é uma medida de variabilidade confiável, que pode ser utilizada em operações estatísticas avançadas, descritivas ou inferenciais. MEDIDAS DE POSIÇÃO (TENDÊNCIA CENTRAL) = MÉDIA ARITMÉTICA SIMPLES E PONDERADA, MEDIANA OU MODA A.) DADOS BRUTOS OU ROL A.1 Média Aritmética Me = x, calcula-se a média aritmética determinando-se a soma das observações dividida pelo número delas. Assim a média aritmética de 3, 4, 7, 8 e 8 é: x = 3 4 7 8 8 30 = =6 5 5 n xi Ou seja: x = i 1 n n Onde: x i = x1 + x2 + x3 + ....+ xn; i 1 n = no de elementos na amostra; 34 N para no de elementos da população. O cálculo de A.2 x é mesmo para dados amostrais como para população. Média Aritmética Ponderada x , consideremos por ex.: a situação em que o professor informe que os pesos da notas bimestres são: 1obimestre: peso 2; 2obimestre: peso 2; 3obimestre: peso 3; 4obimestre: peso 3. O aluno obteve as seguintes notas em Matemática: 6,0; 8,0; 9,0 e 5,0, respectivamente. O cálculo da média ponderada deve levar em conta os pesos desiguais dos bimestres. A fórmula para o n wi xi cálculo é: Média ponderada = x = i 1 n wi onde w i = peso de observação de ordem i. Portanto: i 1 x A.3 2.6 2.8 3.9 3.5 70 = = 7,0 2 233 10 = Mediana Md = x~ . Colocados os dados brutos em ordem crescente ou decrescente (ROL), a mediana é o elemento que ocupa a posição central. x~ Assim, se 05 observações de uma variável forem 8, 7, 4, 8 e 3, a = 7 corresponde à 3a posição (observação). a) Determinar o número n de elementos do Rol; b) Se n é ímpar – O Rol admite um termo central que ocupa a posição No de elementos da amostra = n = 5 (ímpar) n1 ; 2 n1 6 a x~ = = = 3 posição 2 2 c) Se n é par - usa como x~ a média aritmética das duas observações centrais. Assim, 3, 4, 7, 8, 8 e 9, 78 x~ = = 7,5 2 O processo para determinar a mediana é o seguinte: 1. Ordenar os valores (Rol); 2. Verificar se há um número ímpar ou par de observações; 3. Para um número ímpar de observações, a mediana é o valor do meio. Para um número par de observações, a mediana é a média das duas observações do meio. Exemplos: Par 2, 3, 3, 4 Md Ímpar 3 Md 1, 2, 3, 3, 3, 4, 7 3 A.4 Moda Mo É o valor (observação) que ocorre com maior frequência num conjunto. Sejam os dados os números 10, 10, 8, 6, 10, há três 10’s. O valor mais frequente, a moda, é 10. 35 B) VARIÁVEL DISCRETA B.1 Determinação da Média de uma distribuição de frequência, x Se os dados estão apresentados na forma de uma variável discreta, utilizaremos a média aritmética ponderada, considerando as frequências simples fi como sendo as ponderações dos elementos xi correspondentes. Pode-se usar a fórmula da média ponderada para determinar a média de uma distribuição de frequência. Os pesos são substituídos pelas frequências (fi) das classes e a fórmula fica: x = f i xi n Onde: fi é a frequência da i-ésima classe n é o número de observações ( igual a f i ). Exemplo: Sem perda de informação. Determinar a média dos seguintes dados: No acidentes xi 0 5 10 15 20 25 30 Total Solução: B. 2 Frequência fi 2 4 5 10 2 1 1 n = 25 x = f i xi n = fi.xi 0 20 50 150 40 25 30 315 315 = 12,6 25 Determinação da Mediana de uma distribuição de frequência, x~ ( variável discreta) Se os dados estão apresentados na forma de variável discreta, eles já estão naturalmente ordenados. Assim, basta verificar se o número de elementos da série é ímpar ou par. n (número de elementos da amostra) = ímpar a mediana será o elemento central, ordem = n = par a mediana será a média entre os elementos centrais ordem = n 2 e n 2 + 1. n1 ; 2 36 Exemplo: Dada a distribuição: xi 1 2 3 4 ~ n = 11 é ímpar, x = n1 2 fi 1 3 5 2 11 = 11 1 2 Facumulada=Fac=Fi 1 4 0 9 (6 elem.) 11 = 60 elemento. Abre-se a coluna de Fac e através dessas frequências acumuladas encontra-se o valor (xi) correspondente à mediana. Neste exemplo x~ = 3 ( será o xi correspondente à classe que contiver a ordem calculada). Exemplo 02: Dada a distribuição: xi 82 85 87 89 90 fi Facumulada 5 10 15 8 4 42 5 15 30 (210 e 220) 38 42 n= 42 é par, n n x~ será a média entre os elementos de ordem = e + 1 2 2 42 2 42 2 = 210 e + 1 = 220. Observando os elementos 21 e 22 na Fac correspondem a 87. Logo: 87 87 2 = 87 (é a mediana). B. 3. Determinação da Moda de uma distribuição de frequência, Mo (variável discreta) É o valor mais frequente da distribuição. Para distribuições simples (sem agrupamento em classes), a identificação da Moda é facilitada pela simples observação do elemento que apresenta maior frequência. Assim: xi 243 245 248 251 307 fi 7 17 23 20 8 A moda é 248, ou seja, Mo = 248. Esse no aparece mais vezes nesta distribuição. 37 C) VARIÁVEL CONTÍNUA C.1 Determinação da Média de uma distribuição de frequência, x Se os dados estão apresentados na forma de uma variável contínua, utilizaremos a média aritmética ponderada, considerando as frequências simples das classes como sendo as ponderações dos pontos médios destas classes. Exemplo: Com perda de informação. Determinar a média dos seguintes dados: noacidentes classe Ponto médio da classe xi 5 15 25 35 45 Frequência fi.xi fi 2 10 0 10 1 15 10 20 5 125 20 30 8 280 30 40 4 180 40 50 Total n = 20 610 Os pontos médios das classes se determinam tomando-se a média do extremo inferior de cada classe e do extremo inferior imediatamente superior. x Solução: C. 2 = f i xi n = 610 = 30,5 20 ~ (variável contínua): Determinação da Mediana de uma distribuição de frequência, x Procedimento: n , como a variável é contínua, não se preocupe se n é par ou ímpar; 2 ~ ); Pela Fac identifica-se a classe que contém a mediana (classe da x 1. Calcula-se a ordem 2. 3. Utiliza-se a fórmula: x~ = lMd + Onde: n ( f ).h 2 f Md lMd = limite inferior da classe Md (mediana); n = número de elementos; f = soma das frequências anteriores à classe Md; h = amplitude da classe Md; fMd = frequência da classe Md 38 Exemplo: Classes 35 45 fi 5 45 55 12 17 55 65 18 35(classe Md) 65 75 14 49 75 85 6 55 85 95 3 58 10 passo: Calcula-se Fac 5 58 n 58 . Como n = 58, temos 2 2 = 290; 2o passo: Identifica-se a classe Md pela Fac. Neste caso, a classe Md é a 3a; 3o passo: Aplica-se a fórmula x~ = lMd + Neste caso: n ( f ).h 2 f Md lMd = limite inferior da classe Md = 55 n = número de elementos = 58 f = soma das frequências anteriores à classe Md = 17 h = amplitude da classe Md = 10 fMd = frequência da classe Md = 18 x~ = 55 + C. 3 ( 58 17).10 2 = 61,57 18 ~ (variável contínua) Determinação da Moda de uma distribuição de frequência, x Para determinar a moda de uma variável contínua, podemos optar por vários processos ( Moda de Pearson, moda de King, moda de Czuber). Daremos destaque para a moda de Czuber. MODA DE CZUBER CZUBER levou em consideração, em sua fórmula a frequência simples da classe anterior, a frequência simples da classe posterior, além da frequência simples da classe modal. 39 Mo = IMo + f M o f ant .h 2 f M o f ant f post Onde: IMo = limite inferior da classe modal; fMo = frequência simples da classe modal; fant = frequência simples da classe anterior à classe modal; fpost = frequência simples da classe posterior à classe modal; h = amplitude do intervalo de classe. Exemplo: Calcule a moda de Czuber para a distribuição: Int. classe 0 10 10 20 20 30 30 40 fi 1 3 6 2 Solução: A classe modal é a terceira classe, a Mo vale: Mo = 20 + 63 .10 = 24,29 (valor mais frequente nesta distribuição). 2(6) (3 2) Graficamente: É preciso construir o histograma da distribuição, identificar a classe modal (aquela com maior altura) e fazer a construção abaixo: fi Mo classes 40 MEDIDAS DE DISPERSÃO Considere as séries de dados seguintes: X : 10, 10, 10, 10, 10, 10, 10, 10, 10, 10 Y : 7, 8, 9, 9, 10, 10, 11, 11, 12, 13 Z : 3, 4, 5, 6, 10, 10, 14, 15, 16, 17 As três séries têm uma característica comum, que é o valor da média. Essa média é 10 para as três séries. Entretanto elas diferem entre si com relação ao agrupamento dos dados em torno dessa média. Na série X todos os dados são iguais a 10 e portanto a média representa muito bem essa série. Na seqüência Y vê-se que vários dados diferem da média, mas estão próximos dela, ou seja, apresentam grande concentração em torno de 10. A média representa razoavelmente bem a série. Na seqüência seguinte, Z , existem vários valores muito afastados do valor 10 e portanto a média não representa muito bem a série. Em resumo, em X todos os dados estão totalmente concentrados na média 10 e portanto não há dispersão de dados. Em Y existe forte concentração de dados sobre a média e fraca dispersão. Em Z há fraca concentração de valores sobre a média e grande dispersão de dados. É portanto importante construir medidas que avaliem a representatividade da média, como será mostrado. Define-se: Desvio médio simples ( DMS ). É a média aritmética dos desvios de cada elemento da série em relação à média dessa série. O desvio de um elemento para a média é o valor absoluto (módulo) da diferença entre ambos. Cálculo do DMS para variáveis discretas. 7 10 3 , Na série Y do exemplo anterior, os desvios da média são: 10 10 0 , 12 10 2 e 11 10 1 , 8 10 2 , 9 10 1 , 13 10 3 A média aritmética desses valores é 3 2 2 1 2 0 2 1 2 3 14 1,4 . Esse cálculo pode ser melhor visualizado usando uma tabela 10 10 de distribuição de freqüências e aplicando a fórmula para o cálculo do DMS. DMS xi - x fi fi A tabela abaixo representa a série Y : xi fi xi f i xi x 7 8 9 10 11 12 13 1 1 2 2 2 1 1 7 8 18 20 22 12 13 3 2 1 0 1 2 3 f i 10 x i f i 100 Notar que sempre é preciso calcular a média da série para se ter o DMS Lembrar que a média é dada xi x f i 3 2 2 0 2 2 3 x 100 10 10 Substituindo os valores na fórmula tem-se que por: x xi x f i 14 DMS 14 1,4 . 10 xi f i fi 41 A interpretação desse resultado é que , em média, cada elemento da série está distante 1,4 unidades da média 10. Cálculo do DMS para variável contínua. Neste caso usa-se a mesma fórmula da variável discreta, substituindo o valor classe x i DMS xi - x xi pelo ponto médio da fi fi Exemplo: Calcule o DMS da distribuição de freqüências abaixo: Int. Classe Acrescentam-se mais quatro colunas a essa tabela. A primeira é o valor médio de cada classe x i , a segunda é o produto x i f i , a terceira é o desvio do valor médio de cada classe em relação à média da série e a quarta fi classe 1 2 3 4 3 5 7 9 5 7 9 11 Int. Classe 4 8 6 4 coluna é o produto fi xi xi fi xi x 4 8 6 4 4 6 8 10 16 48 48 40 2,9 0,9 1,1 3,1 xi x fi . xi x fi classe 1 2 3 4 3 5 7 9 5 7 9 11 f i 22 Então o DMS será: x 6,9 x i f i 152 DMS xi - x fi fi = 11,6 7,2 6,6 12,4 x i x f i 37,8 37,8 1,7 . 22 Interpretação do resultado: Em média, cada elemento está afastado 1,7 unidades da média 6,9. 42 Variância e Desvio Padrão. O cálculo do desvio médio simples implica no cálculo do módulo dos desvios dos dados em relação à media. Esse módulo é sempre um número positivo, que é associado a uma distância. Uma outra forma de se ter valores positivos para os desvios é considerar o quadrado de ( x i x ) , ou seja, ( x i x ) 2 . Substituindo na fórmula do DMS o módulo x i x por essa expressão obtém-se uma nova medida de dispersão chamada variância V( x ) . Define-se o desvio padrão como sendo a raiz quadrada positiva de V( x ). O desvio padrão é representado simbolicamente pela letra grega sigma minúsculo . Assim, para uma população de n elementos, a variância é dada por: V ( x) 2 ( x) ( xi x ) 2 f i n O desvio padrão é: ( x) V ( x) Obs: Quando os elementos da série representam uma população, a variância será simbolizada por 2 ( x ) e o desvio padrão por (x ) . Se os elementos representam uma amostra, a variância será denotado s 2 ( x ) e o desvio padrão por s 2 ( x ) diferem por s ( x ) . Os valores de 2 ( x ) e numericamente , já que a variância amostral tem como denominador o valor n – 1 e não n, sendo portanto ligeiramente maior que a variância populacional. Dessa forma, temos: ( x) Desvio padrão populacional: ( xi x) 2 f i n ( xi x) 2 f i n 1 As fórmulas acima são usadas para o cálculo de desvio padrão de variáveis discretas. No caso de variáveis contínuas substitui-se o valor da variável xi pelo valor médio da classe x i . s ( x) Desvio padrão amostral : Cálculo da variância e do desvio padrão. 1) Variável discreta. Como exemplo, será calculada a variância e o desvio padrão de uma população representada pela distribuição de freqüências da série Y da página 29. xi 7 8 9 10 11 12 13 Acrescenta-se a coluna que é o produto x i f i para se calcular a média. A soma dos elementos da segunda coluna dá o número total de elementos na série fi 1 1 2 2 2 1 1 xi fi 7 8 9 10 11 12 13 1 1 2 2 2 1 1 xi f i 7 8 18 20 22 12 13 n fi 10 x i f i 100 x xi f i 10 n 43 Desenha-se outra tabela com a coluna dos valores ( x i x ) 2 f i . A soma dos elementos dessa coluna dividida por n dá o valor da variância da população. xi fi 7 8 9 10 11 12 13 1 1 2 2 2 1 1 xi f i 7 8 18 20 22 12 13 ( xi x ) 2 f i 9 4 2 0 2 4 9 ( x i x ) 2 f i 30 Portanto, V ( x ) = 2 ( x ) O desvio padrão é 30 3 10 ( x ) 3 1,7 Se a série representa uma amostra de uma população, então o denominador será igual a 9 e os valores da variância e do desvio padrão serão 3,3 e 1,8 respectivamente. 2) Variável contínua. Neste caso os valores contidos em uma certa classe i não são conhecidos. Calculam-se então os valores médios das classes, denotados por x i . A variância é calculada pela fórmula: V (x) = 2 ( x ) O desvio padrão populacional é portanto: ( x) ( x i x) 2 f i . n ( x i x) 2 f i n Se a variável representa uma amostra, a variância será denotada por s 2 ( x ) , que é calculada pela fórmula: s 2 ( x) ( x i x) f i n 1 ( x i x ) f i n 1 Exemplo: (Ermes M. da Silva) Calcule a variância e o desvio padrão para a distribuição de uma amostra dos valores de 54 notas fiscais emitidas na mesma data, selecionadas em uma loja de departamentos s( x ) O desvio padrão amostral é dado por: Classe Consumo por nota N 0 de notas US$ 1 2 3 4 5 6 0 50 100 150 200 250 50 100 150 200 250 300 10 28 12 2 1 1 44 Acrescentam-se as colunas que mostram os valores médios das classes ( x i ) e o produto desses valores pelas respectivas freqüências. Isso é útil para se calcular o valor médio da distribuição x . Consumo por nota N 0 de notas Classe xi xi fi 25 75 125 175 225 275 250 2.100 1.500 350 225 275 US$ 1 2 3 4 5 6 0 50 100 150 200 250 50 100 150 200 250 300 10 28 12 2 1 1 n f i 54 A média é: x x i f i 4.700 87 n 54 Finalmente acrescenta-se a coluna com os valores de ( x i x ) 2 f i . Classe Consumo por nota N 0 de notas xi xi fi ( xi x )2 fi 25 75 125 175 225 275 250 2.100 1.500 350 225 275 38.440 4.032 17.328 15.488 19.044 35.344 US$ 1 2 3 4 5 6 0 50 100 150 200 250 50 100 150 200 250 300 10 28 12 2 1 1 ( x i x ) 2 f i 129 .676 129.676 Variância = s 2 ( x ) 2.446,72 53 Desvio padrão = s( x ) 2.446,72 49,46 A unidade da variância, neste exemplo, é ( US$ ) 2 e a unidade do desvio padrão é US$. Comentários sobre a variância e o desvio padrão. A unidade em que a variância é expressa é o quadrado da unidade de medida de uma série. Isso leva à conclusão que a variância não admite interpretação. Por exemplo, se os dados são expressos em unidade de área , metro quadrado , por exemplo, a variância seria expressa em metro elevado à quarta potência, o que não tem significado. Entretanto, o desvio padrão tem a mesma unidade de medida dos dados, já que é a raiz quadrada da variância. O desvio padrão admite portanto uma interpretação, como será visto nos exercícios. Em distribuições de freqüências em que os dados são simétricos em relação à média, como na figura abaixo, o intervalo em torno dessa média, desde x até x contém aproximadamente 68 % dos valores da série. Os intervalos x 2 , x 2 e x 3 , x 3 contêm aproximadamente 95% e 99% dos valores da série, respectivamente. 45 2,2 2,0 1,8 1,6 1,4 1,2 1,0 0,8 0,6 0,4 0,2 0,0 x- -2 -1 x x+ 1 2 Se, por exemplo, temos um série de dados que apresenta média x 50 e desvio padrão ( x ) 3 , sendo esses dados distribuídos simetricamente em relação à média, interpretamos esses valores como: 1) 2) 3) 4) Os valores da série estão concentrados em torno de 50; O intervalo 47, 53 contém aproximadamente 68 % dos valores da série; O intervalo 44, 56 contém aproximadamente 95 % dos valores da série; O intervalo 41, 59 contém aproximadamente 99 % dos valores da série. As medidas de desvio padrão são medidas absolutas da dispersão dos dados de uma série. Assim, se uma série X tem média 100m, com desvio padrão 5 e outra série Y tem média 50 com desvio padrão 4, conclui-se que a série X tem uma dispersão absoluta maior. Entretanto pode-se definir uma medida, chamada coeficiente de variação, que dá a dispersão relativa da série. Esse coeficiente, denotado por CV(x), é dado por: ( x) CV ( x ) x O coeficiente de variação é um número puro, ou seja, não tem unidade de medida. Pode portanto ser expresso em porcentagem. Nos exemplos acima calcula-se que para a série X CV(x) = 5% e para a série Y CV(y) = 8%. Nota-se, portanto, que a série X tem uma dispersão relativa menor. Outras fórmulas: Variância, 2 (variância populacional), s2 (variância amostral) Para o cálculo da variância, é mais interessante o uso das fórmulas práticas: 2 2 s = = x i f i 2 1 2 x i f i n n x i f i 2 1 2 x i f i n n1 46 Desvio padrão, ( populacional), s (amostral) Deve-se primeiro calcular variância e em seguida extrair a raiz quadrada desse resultado. = s s= 2 2 é o desvio padrão populacional; é o desvio padrão amostral; Exemplo: Calcular a variância e o desvio padrão xi 2 4 4 6 6 8 8 10 10 12 fi 2 4 7 4 3 Solução: classes xi fi xifi x i .fi 2 4 3 2 6 18 4 6 5 4 20 100 6 8 7 7 49 343 8 10 9 4 36 324 10 12 11 3 33 363 20 144 1.1478 s2 = s= 1 20 1 s 2 2 144 = 5,85 1 . 148 20 , logo s = 5,85 = 2,41 2 47 Exercícios de fixação 1. Os resultados do lançamento de um dado 50 vezes foram os seguintes: 6 5 2 6 4 3 6 2 6 5 1 6 3 3 5 1 3 6 3 4 5 4 3 1 3 5 4 4 2 6 2 2 5 2 5 1 3 6 5 1 5 6 2 4 6 1 5 2 4 3 a) Construa uma distribuição de frequência sem intervalos de classe. b) Construa um gráfico de barras ou de colunas simples. 2. De acordo com a Organização Nielsen de Pesquisa de Mídia, os cinco programas de TV de maior audiência durante a semana de 28 de setembro a 4 de outubro de 1998 foram ER, Frasier, Friends, Jesse e verônica´sCloset. Os dados para uma amostra de 50 telespectadores são apresentados a seguir Jesse ER Verônica ER ER Frasier Verônica Friends Verônica ER ER Frasier ER ER Friends Friends Frasier Frasier Friends ER Friends Verônica Friends Verônica Verônica Verônica ER ER Jesse Friends a) Estes dados são qualitatitvos ou quantitativos? Frasier ER ER Frasier Friends ER Frasier Frasier Frasier Verônica Frasier Frasier Frasier Friends Frasier ER Friends ER Friends ER b) Forneça a tabela de distribuição de freqüência; c) Construa um gráfico de barras e um gráfico de setores para os dados; d) Com base na amostra, qual programa detém a maior participação de mercado? Qual fica em segundo lugar? e) Construa um gráfico de barras/colunas simples. 3. As notas de 32 estudantes de uma classe são dados abaixo: 6.0 0.0 2.0 6.5 5.0 3.5 4.0 7.0 8.0 7.0 8.5 6.0 4.5 0.0 6.5 6.0 2.0 5.0 5.5 5.0 7.0 1.5 5.0 5.0 4.0 4.5 4.0 1.0 5.5 3.5 2.5 4.5 Determinar: a) O rol b) A distribuição de freqüência (começar por 0.0 e usar amplitude de classe igual a 1.5) 48 c) A amplitude total d) A porcentagem de alunos que tiraram nota menor que 4.0 e) A porcentagem de alunos que tiraram nota entre 5.0 e 7.0 inclusive. f) O limite superior da 2ª classe. g) O limite inferior da 4ª classe. h) O ponto médio da 3ª classe i) Construa o histograma para a variável contínua e o polígono de freqüência. A partir destes gráficos qual o valor aproximado da nota da maioria dos alunos? 4. Os dados abaixo fornecem o tempo em dias exigido para se completar auditorias de fim de ano para uma amostra de 20 clientes da Sanderson and Clifford, uma pequena firma de contabilidade. Tabela 1 – Tempo (em dias) de auditorias de fim de ano. 12 14 19 15 15 18 20 27 22 22 21 33 14 18 16 Fonte: dados hipotéticos 18 17 23 28 13 Pede-se: a) Distribuição de freqüência para variável contínua. Sugestão: não esqueça de calcular o intervalo/amplitude de classe. b) Porcentagem e número de clientes que necessitaram os tempos de auditoria entre 15 e 20 dias. c) Porcentagem e número de clientes que necessitaram os tempos de auditoria inferiores a 30 dias. d) Porcentagem de clientes que necessitaram os tempos de auditoria pelo menos de 20 dias. e) Construa dois gráficos: histograma e polígono de freqüência para os dados da Tabela item a) 5. A distribuição abaixo indica o número de acidentes ocorridos com 70 motoristas de uma empresa de ônibus: No de acidentes 0 1 2 3 4 5 6 7 No de motoristas 20 10 16 9 6 5 3 1 Determine: a) O número de motoristas que não sofreram nenhum acidente; b) O número de motoristas que sofreram pelo menos 4 acidentes; c) O número de motoristas que sofreram menos de 3 acidentes; d) O número de motoristas que sofreram no mínimo 3 e no máximo 5 acidentes; e) A porcentagem que sofreram no máximo 2 acidentes. 49 6. Utilizar um gráfico de setores para representar a tabela: Corpo Docente do Ensino de 30 Grau no país XY em 1999. Especificação Quantidade Titular Adjunto Assistente Colaborador Auxiliar Ensino Total 28.079 11.306 28.711 4.377 20.073 92.546 Fonte: Dados hipotéticos 7. Construir um gráfico de colunas múltiplas (ou de barras múltiplas) para representar a tabela: Renda familiar e Saneamento básico Rendimento Mensal familiar em salário População Beneficiada (%) mínimo Água Instalação Sanitária Coleta de lixo 1 52,4 33,7 56,1 >1a2 62,1 43,2 61,7 >2 a 5 77,7 58,3 73,7 > 5 a 10 90,7 76,9 86,6 >10 96,4 90,0 95,6 Oliveira et.al. O traço da desigualdade social no Brasil. Fundação IBGE, Rio de Janeiro. RJ, 1993. 8. Considerando a distribuição abaixo: xi 3 4 5 6 7 8 fi 4 8 11 10 8 3 Calcule: a) a média; b) a mediana c) a moda. 9. O Departamento de Pessoal de uma certa firma fez um levantamento dos salários dos 120 funcionários do setor administrativo, obtendo os seguintes resultados: Faixa salarial N0 de funcionários (em salários mínimos) 02 30 24 48 46 24 6 10 18 a) Esboce o histograma correspondente e calcule a moda; b) Calcule o salário médio dos funcionários do setor administrativo; c) E o salário mediano? d) Calcule a variância do setor administrativo (amostra) e desvio padrão do setor administrativo; 50 BIBLIOGRAFIA CONSULTADA 1. ANDERSON, David R. Estatística aplicada à administração e economia. 2a ed. Trad. PAIVA, Luís Sérgio Castro. São Paulo: Pioneira, 2002. 2. LEVIN, Jack. Estatística aplicada a ciências humanas. 2a.ed. Trad. COSTA, Sérgio Francisco. São Paulo : Harbra, 1987. 3. MARTINS, Gilberto Andrade. Estatística geral e aplicada. 2a ed. São Paulo: Atlas, 2002. 4. FREUND, John E. & SIMON Geray A. Estatística aplicada para economia, administração e ciências contábeis. 9a ed., Trad. FARIA, Alfredo Alves de. Porto Alegre: Bookman, 2000. 5. FONSECA, Jairo Simon da; MARTINS, Gilberto de Andrade. Curso de estatística. 6a.ed. Sao Paulo : Atlas,1996. 6. DOWNING, D. & CLARK, J. Estatística aplicada. São Paulo: Saraiva, 1997. 7. OVALLE, Izidoro Ivo. Estatística básica. 2a ed. São Paulo: Atlas,1995. 8. MARTINS, GILBERTO DE ANDRADE, DONAIRE, DENIS. Princípios de Estatística. 4a ed. São Paulo: Atlas, 1979. 9. SAMARA, BEATRIZ & BARROS, JOSÉ CARLOS. Pesquisa de Marketing. São Paulo: Makron Books, 1997. 10. BUSSAB, W. O. & MORETIN, P. Métodos Quantitativos: Estatística Básica. 4a ed. São Paulo. Atual. 1997. 11. STEVENSON, W. J. Estatística Aplicada à Administração. 2a ed. São Paulo. Harbra. 1986. 12. SILVA da, E. M. e colaboradores. Estatística para os Cursos de Economia, Administração e Ciências Contábeis. V. 01 e 02. 2a ed. São Paulo. Atlas.1997. 51 ALGUNS COMENTÁRIOS SOBRE ELABORAÇÃO DE QUESTIONÁRIO: ELABORAÇÃO DE PERGUNTAS E ESCALAS Perguntas Fechadas Nas perguntas fechadas são fornecidas as possíveis respostas ao entrevistado, sendo que apenas uma alternativa de resposta é possível. Exemplo: Em que bairro o sr.(a) mora? ( ) Higienópolis ( ) Sumaré ( ) Pacaembú ( ) Mooca ( ) Pinheiros ( ) ________ Perguntas Abertas Nesse tipo de pergunta o entrevistado responde livremente o que pensa sobre o assunto. Exemplo: Qual a sua opinião sobre o bairro onde mora? Pergunta Semi-Aberta A pergunta semi-aberta é a junção de uma pergunta fechada a uma aberta em que, num primeiro momento, o entrevistado responde a uma das opções de alternativas e depois justifica ou explica a sua resposta. Exemplo: Em que bairro o sr.(a) mora? ( ) Higienópolis ( ) Sumaré ( ) Pacaembu ( ) Mooca ( ) Pinheiros ( ) ________ Por quê? __________________________________________________________ Pergunta Dicotômica É a pergunta que tem como respostas Sim e Não. Exemplo: O sr.(a) mora em casa própria? ( ) Sim ( ) Não 52 Perguntas Encadeadas A segunda pergunta depende da resposta da primeira. Exemplo: O sr.(a) mora em casa própria financiada? ( ) Sim ( ) Não Caso a resposta seja afirmativa. Qual a entidade financiadora? ( ) BNH ( ) CEF ( ) Construtora ( ) Outros ( ) Banco particular ( ) Banco estatal Pergunta com Matriz de Resposta Nesse caso, monta-se um quadro para facilitar a resposta do entrevistado. Exemplo: Bairro Morou Mora Pretende Morar Higienópolis Perdizes Mooca Pinheiros Bela Vista Tatuapé Perguntas com Ordem de Preferência É dada ao entrevistado a possibilidade de escolha do 1º, 2º e 3º lugares: Exemplo: Caso o sr.(a) fosse mudar de casa, qual bairro escolheria em 1º, 2º e 3º lugares? ( ) Higienópolis ( ) Mooca ( ) Bela Vista ( ) Perdizes ( ) Pinheiros ( ) Tatuapé Escala Ordinal de Preferência Exemplo: Por favor, indique a sua preferência por companhias aéreas, numerando de 1 a 5, sendo 1 para a de maior preferência e 5 para a de menor preferência. (mostrar cartão). 1.____________ 2.____________ 3.____________ 4.____________ 5.____________ Modelo do cartão 53 Escala Ordinal de Ranking Exemplo: Por favor, coloque em ordem de preferência as empresas listadas no cartão (entregar cartão C para o entrevistado), de acordo com as características que estão sendo avaliadas – sendo 1 para a melhor empresa no atributo e até 4 para a pior empresa. Vamos começar com superior tecnologia. Qual empresa você colocaria em primeiro? em segundo .... (até 4). tecnologia Empresa A Empresa B Empresa C Empresa D __________ __________ __________ __________ Cumprimento de prazos _______________ _______________ _______________ _______________ serviços pós-venda __________ __________ __________ __________ Escala de Lembrança de Marca Exemplo: “Quando eu menciono indústria farmacêutica, qual nome lhe vem primeiro à cabeça?” ______________ primeira empresa mencionada Lembra outras? ______________ segunda empresa mencionada ______________ terceira empresa mencionada Já ouviu falar da Empresa “XW”? ( ) sim ( ) não Escala de Diferencial Semântico (Osgood) Exemplo: Com relação ao Iogurte marca “P” com polpa de frutas, qual a sua opinião sobre os seguintes atributos? Puro Saboroso Natural Alta qualidade Embalagem higiênica 7654321 7654321 7654321 7654321 7654321 Impuro Sem sabor Artificial Baixa Qualidade Embalagem não-higiênica Escala de Likert O respondente indica o grau de concordância ou discordância de acordo com as variáveis e atitudes relacionadas ao objeto: 54 CT CP NA DP DT Os tênis importados são melhores que os nacionais XZ é uma marca nacional As melhores marcas de tênis patrocinam times de futebol XZ é um tênis para pessoas jovens e ativas 5 5 4 4 3 3 2 2 1 1 5 5 4 4 3 3 2 2 1 1 CT= concordo totalmente DP= discordo parcialmente CP= concordo parcialmente DT= discordo totalmente NA= não concordo nem discordo Escala Itemizada Exemplo: “Com relação ao grau de satisfação com seu atual plano de saúde, você afirmaria que está: ( ( ( ( ) ) ) ) totalmente satisfeito parcialmente satisfeito parcialmente insatisfeito totalmente insatisfeito Escala de Intenção de Compra Exemplo: Qual a chance de você adquirir a marca “Y” na próxima compra desse tipo de produto? ( ( ( ( ( ) ) ) ) ) certamente comprarei possivelmente comprarei não sei se comprarei possivelmente não comprarei certamente não comprarei BIBLIOGRAFIA CONSULTADA: ELABORAÇÃO DE PERGUNTAS 01. LEVIN, Jack. Estatística aplicada a ciências humanas. 2a.ed. Trad. COSTA, Sérgio Francisco. São Paulo : Harbra, 1987. 02. MARTINS, Gilberto Andrade. Estatística geral e aplicada. 2a ed. São Paulo: Atlas, 2002. 03. SMAILES, Joanne; MC GRANE, Ângela. Estatística aplicada á administração com Excel. 1a ed. Trad. BRITO, Christiane. São Paulo: Atlas, 2000. 04. SAMARA, BEATRIZ & BARROS, JOSÉ CARLOS. Pesquisa de Marketing. São Paulo: Makron Books, 1999.