sobre os softwares estatísticos

Propaganda
21
CURSO DE PÓS-GRADUAÇÃO LATO SENSU EM GESTÃO ESTRATÉGICA
ECONÔMICA, FINANCEIRA E CONTÁBIL
DISCIPLINA: MÉTODOS QUANTITATIVOS
DOCENTE: Emília Satoshi Miyamaru Seo
SEGUNDA AULA:

DISCUSSÃO DO ARTIGO: “ Estatística é um método de gestão”.

SOFTWARES ESTATÍSTICAS.

ANÁLISE EXPLORATÓRIA DE DADOS: ORGANIZAÇÃO, DESCRIÇÃO E
SUMARIZAÇÃO DOS DADOS COLETADOS EM CAMPO.

ALGUNS COMENTÁRIOS SOBRE ELABORAÇÃO DE QUESTIONÁRIO.
SOBRE OS SOFTWARES ESTATÍSTICOS
Nos últimos anos, houve uma mudança no campo de Estatística com o desenvolvimento de
softwares especialmente construídos para análises estatísticas. Atualmente, dispõe-se, dentre outros,
do SAS, SPSS, Minitab, Origin, além do Excel. Para familiarizarmos com um destes, utilizaremos o
Excel.
ORGANIZAÇÃO DE DADOS (ESTATÍSTICA DESCRITIVA)
Na análise estatística, a coleta de dados é a primeira etapa de todo o processo com que se
deve trabalhar se o objetivo é analisar dados, obter resultados e testar hipóteses acerca da natureza
da realidade.
Procura transformar seus dados brutos num conjunto de mensurações, organizadas e dotadas
de sentido, que possam ser usadas para testar suas primeiras hipóteses iniciais.
Que é que se faz para transformar essa massa de dados brutos num conjunto – resumo
fácil de entender?
O primeiro passo poderia ser construir uma DISTRIBUIÇÃO DE FREQÜÊNCIA sob a
forma de tabela.
22
Para elaboração da Tabela de Distribuição de Freqüência deve –se primeiramente
identificar o tipo de variável:
A) DISTRIBUIÇÃO DE FREQUÊNCIA – VARIÁVEL DISCRETA (DADOS NOMINAIS,
ORDINAIS, INTERVALARES)
Chamamos:

Frequência Absoluta (ou freqüência simples)  fi , ao número de vezes que cada resultado
aparece no conjunto de dados.

Frequência Relativa Absoluta (ou proporção)  fri , a proporção de cada realização em
relação ao total.
Ou seja:

frequência relativa = fri=
fi
n
Total de observações: n , é a soma das frequências absolutas.
Onde:
n=  fi
i

Porcentagem da freq. relativa simples : é a frequência absoluta divida pelo total de
observações e multiplicada por 100.
Sendo que:

Porcentagem =
fi
. 100 = %
n
Frequência acumulada  FAC, é a soma da frequência simples (absoluta) deste elemento com
as frequências simples dos elementos que o antecedem:
Fac1 = f1
Fac2 = f1 + f2
Fac3 = f1 + f2 + f3
Facn = f1 + f2 + ...+ fi

Frequência Acumulada Relativa  FAC, é a divisão acumulada deste elemento, pelo número
total de elementos da série:
23
FACRi =

F
AC
n
Porcentagem da freq. acumulada relativa : é a frequência acumulada dividida pelo total
de observações e multiplicada por 100.
Sendo que:
Porcentagem =
F
AC
n
. 100 = %
Exemplo:
Tabela 1.1 - Informações sobre estado civil, grau de instrução, número de filhos, salário (expresso
como fração do salário mínimo), idade (medida em anos e meses) e procedência de 36 funcionários
de um certo Departamento da Empresa Controladora de Lixo Nuclear.
Nº
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
Estado
Civil
Solteiro
Casado
Casado
Solteiro
Solteiro
Casado
Solteiro
Solteiro
Casado
Solteiro
Casado
Solteiro
Solteiro
Casado
Casado
Solteiro
Casado
Casado
Solteiro
Solteiro
Casado
Solteiro
Solteiro
Casado
Casado
Casado
Solteiro
Educação
1º Grau
1º Grau
1º Grau
2º Grau
1º Grau
1º Grau
1º Grau
1º Grau
2º Grau
2º Grau
2º Grau
1º Grau
2º Grau
1º Grau
2º Grau
2º Grau
2º Grau
1º Grau
3º Grau
2º Grau
2º Grau
2º Grau
1º Grau
3º Grau
2º Grau
2º Grau
1º Grau
nº de
filhos
1
2
0
1
2
3
0
1
2
0
2
2
0
2
2
-
Salário
(x Sal.
Min)
4,00
4,56
5,25
5,73
6,26
6,66
6,86
7,39
7,59
7,44
8,12
8,46
8,74
8,95
9,13
9,35
9,77
9,80
10,53
10,76
11,06
11,59
12,00
12,79
13,23
13,60
13,85
Idade
anos
26
32
36
20
40
28
41
43
34
23
33
27
37
44
30
38
31
39
25
37
30
34
41
26
32
35
46
meses
03
10
05
10
07
00
00
04
10
06
06
11
05
02
05
08
07
07
08
04
09
02
00
01
05
00
07
Região de
Procedência
Interior
Capital
Capital
Outro
Outro
Interior
Interior
Capital
Capital
Outro
Interior
Capital
Outro
Outro
Interior
Outro
Capital
Outro
Interior
Interior
Outro
Capital
Outro
Outro
Interior
Outro
Outro
24
28
29
30
31
32
33
34
35
36
Casado
Casado
Casado
Solteiro
Casado
Casado
Solteiro
Casado
Casado
2º Grau
2º Grau
2º Grau
3º Grau
2º Grau
3º Grau
3º Grau
2º Grau
3º Grau
0
5
2
1
3
2
3
14,69
14,71
15,99
16,22
16,61
17,26
18,75
19,40
23,30
29
40
35
31
36
43
33
48
42
08
06
10
05
04
07
07
11
02
Interior
Interior
Capital
Outro
Interior
Capital
Capital
Capital
Interior
1. Usando os dados da Tabela 1.1 construa a distribuição de frequências da variável:grau de
instrução
Resolução:
Natureza da variável: Grau de instrução → Variável discreta ordinal
A distribuição de frequência fica:
Grau de
instrução
Frequência
%
Freq. Acum.
% Freq.ac.Rel.
100.fri
FAC
FACRi.100
10 grau
12
0,3333
33,33
12
33,33
20 grau
18
0,5000
50,00
30
83,33
30 grau
6
0,1667
16,67
36
100,00
Total
36
1,0000
100,00
fi
Freqüência
Relativa fri
Fonte: Tabela 1.1
Estes valores podem ser interpretados da seguinte forma:
33,33% dos empregados possuem 1o grau;
50,00% dos empregados possuem 2o grau;
16,67% dos empregados possuem 3o grau.
83,33% dos empregados possuem até 2o grau.
25
B)
DISTRIBUIÇÃO
DE
FREQUÊNCIA
–
VARIÁVEL
CONTÍNUA
(DADOS
AGRUPADOS)

Um dos objetivos de construir a distribuição de frequência é resumir o conjunto de dados.
No caso de variáveis contínuas não podemos construir a distribuição de frequências listando
um a um os resultado, pois não havendo observações iguais não há redução na tabela. Desta
forma é interessante agrupar os resultados em classes.

Para agrupar os dados de uma variável em classes devemos ter alguns cuidados:
1. Adotar classes de mesma amplitude, sempre que possível;
Amplitude total de uma sequência , At, é a diferença entre o maior e o menor elemento de
uma sequência. Representa o comprimento total da sequência:
At = xmax - xmin
Amplitude ou intervalo total de classe, h, é a diferença entre o limite superior e o limite
inferior da classe:
h = L – l; Por exemplo: 2  4, l (limite inferior) = 2 e L (limite superior) = 4
Ou
h=
At
K
, onde K = número de classes
2. Determinar o número de classes adequadamente: muitas classes não reduz os dados e
poucas classes pode-se perder as informações. Sugere-se o uso de 5 a 15 classes com a
mesma amplitude.
Onde K =
n (usual)
ou
K = 1 + 3,3 log n
Exemplo: Usando os dados da Tabela 1.1 construa a distribuição de frequências da variável:
salários
Resolução:
Natureza da variável: variável contínua;
A distribuição de frequência fica:
26
Da Tabela 1.1, computando as frequências absolutas de cada classe, construímos a variável
contínua.
Da Tabela 1.1 os salários vão de 4 até 23,30
At = 23,30 – 4,0 = 19,30;
K=
n = 36 = 6;
Logo no de classes pode ser 5, 6 ou 7
h=
At
K
=
19,30
= 3,86 = 4
5
Classe de salários
x
4,00  8,00
8,00  12,00
12,00  16,00
16,00  20,00
20,00  24,00
Total
Frequência
Freq. Acum.
% Freq.ac.Rel
fi
%
Porcentagem
100 . fri
FAC
(FACRi.100)
10
12
8
5
1
27,78
33,33
22,22
13,89
2,78
10
22
30
35
36
27,78
61,11
83,33
97,22
100,00
36
100,00
Estes valores podem ser interpretados da seguinte forma:
35 empregados recebem salários menores que 20;
97,22% empregados recebem salários menores que 20, assim por diante.
REPRESENTAÇÕES GRÁFICAS
No ítem anterior fez – se referência à utilidade das tabelas como instrumento de análise e de
apresentação de dados estatísticos.
A apresentação gráfica é um complemento importante da apresentação tabular, ou seja, uma das
maneiras mais concisas de interpretar os dados estatísticos de uma tabela é através da interpretação
gráfica. A principal vantagem de um gráfico sobre a tabela prende – se ao fato de que ele permite
conseguir uma visualização imediata da distribuição dos valores observados. Propiciam os gráficos
uma idéia preliminar mais satisfatória da concentração e dispersão de valores, uma vez que através
deles os dados estatísticos se apresentam em termos de grandezas visualmente interpretáveis. Por
outro lado, os fatos essenciais e as relações que poderiam ser difíceis de reconhecer em massas de
dados estatísticos podem ser observados mais claramente através dos gráficos.
DIFERENTES TIPOS DE REPRESENTAÇÕES GRÁFICAS DE SÉRIES ESTATÍSTICAS
A distribuição de frequências, tanto de variáveis discretas como de variáveis contínuas, pode ser
interpretada mais facilmente quando os valores dessas variáveis são apresentados em forma de
gráficos.
27
A Estatística utiliza vários tipos de gráficos: de setores, de barras, de colunas, de linhas,
histogramas e polígonos de frequência.
A) HISTOGRAMAS

Representação gráfica da distribuição de freqüência de uma variável discreta
São gráficos em colunas que são construídos em eixos cartesianos. No eixo horizontal (abcissas)
são colocados os valores da variável e no eixo vertical (ordenadas) estão os respectivos valores de
suas frequências.
Exemplo:
Ocupação = Profissão
Frequência
Artesanato
52
Trabalho não qualificado
65
Gerencial
29
Serviços burocráticos
34
Fonte: Livro: Hanan, H.S. & Batalha, B.H.L. Amazônia contradições no paraíso ecológico. Cultura ed. Associados. 5a
ed. 1999.
Então o histograma assume a forma:

Bu
r.
iç
os
Se
rv
er
en
ci
al
G
Q
ão
b.
N
Tr
a
Ar
ua
l.
70
60
50
40
30
20
10
0
te
sa
na
to
Frequência
Gráfico de histograma ou de colunas simples de uma
Distribuição Ocupacional
Representação gráfica da distribuição de freqüência de uma variável contínua
É um conjunto de retângulos justapostos, representados em um sistema de coordenadas
cartesianas cujas bases são os intervalos de classes e cujas as alturas são valores proporcionais às
frequências simples correspondentes (fi ).
28
Exemplo: Consideremos a série:
fi
Classe
fi
Int. de classe
1
0
2
3
2
2
4
6
3
4
6
8
4
6
8
5
5
8
10
2
8
6
4
2
0
0
2
4
6
8
10
xi
Notar que o zero correspondente ao valor da variável x i está deslocado à direita do eixo vertical,
propositadamente, criando uma classe fictícia, para se desenhar o que se chama polígono de
freqüências. Também, uma classe fictícia fica marcada à direita do limite superior da última classe (
ver figura seguinte) .

Polígono de frequências
Unindo com segmentos de reta os pontos médios dos lados superiores de cada coluna de um
histograma, obtemos uma linha poligonal. Essa nova figura é chamada de polígono de frequências.
fi
A união dos pontos médios de todas as
8
classes por uma linha, incluindo as duas
classes fictícias, forma o que se chama
polígono de freqüências.
Observe que a
6
4
área sob o polígono de freqüências é igual
a área do histograma.
2
0
0
2
4
6
8
10
xi
B) GRÁFICO DE BARRAS SIMPLES
São gráficos em colunas que são construídos em eixos cartesianos. No eixo horizontal (abcissas)
são colocados os valores de suas frequências e no eixo vertical (ordenadas) estão os respectivos
valores da variável.
Exemplo: Produção Nacional de madeira por região
Região
Sudeste
Norte
Centro - Oeste
Sul
% (fri . 100)
4
20
7
69
29
Produção Nacional de Madeira
por Região
Região
5
S
3
CO
N
1
SE
0
20
40
60
80
Frequência (%)
C) GRÁFICO DE SETORES
Sua construção é feita com base em um círculo que é dividido em setores com áreas
proporcionais às frequências das diversas categorias. É usado para comparar frequências relativas.
Lembrar que a frequência relativa de uma variável xi é a razão entre a frequência fi e o número total
de elementos, multiplicada por 100 (%).
Exemplo: Distribuição dos alunos do Curso de Gestão Ambiental, segundo a situação em relação
às notas
Situação
Frequência
Porcentagem
Graus
fi
100 . fi
Promovido
12
50
1800
Em recuperação
8
33,30
1200
Retido
4
16,70
600
Total
24
100,00
3600
Para determinarmos o ângulo correspondente a cada setor, utilizando uma regra de três:
24
12

3600

x
x=
12.360
= 1800
24
Analogamente determinamos os ângulos dos outros setores.
Distribuição de alunos do Curso de Gestão
Ambiental segundo a relação de notas
retido
17%
Em
recuperação
33%
Promovido
50%
30
D) GRÁFICO DE LINHA
Constitui uma aplicação do processo de representação das funções num sistema de coordenadas
cartesianas. Estetipo de gráfico se utiliza da linha poligonal para representar a série estatística.
Exemplo: Produção Brasileira de óleo de dendê 1987 – 1992.
Anos
1987
1988
1989
1990
1991
1992
Fonte: Agropalma
Quantidade (1000 t)
39,3
39,1
53,9
65,1
69,1
59,5
Vamos tomar os anos como abcissas e as quantidades como ordenadas.
Determinados graficamente, todos os pontos da série, usando as coordenadas, ligamos todos
esses pontos, dois a dois, por segmentos de reta, o que irá nos dar uma poligonal, que é o gráfico
em linha correspondente à série em estudo.
E) GRÁFICO DE COLUNAS OU BARRAS MÚLTIPLAS
É aquele em que os retângulos são dispostos um sobre o outro, procurando evidenciar suas
diferenças, facilitando a comparação entre eles.
Exemplo: Quantidade de lixo gerado nos bairros da Cidade de Rio de Janeiro.
Anos
Bairro A
Bairro B
84
8.000
6.000
85
12.000
11.000
86
9.000
10.000
87
11.000
9.500
Fonte: Hipotéticos
31
Quantidade de lixo gerado nos bairros da Cidade de Rio de
Janeiro
Quantidade (1000 t)
14000
12000
11000
12000
11000
10000
9000
10000
8000
9500
8000
6000
6000
4000
2000
84
85
86
87
0
Anos
F) GRÁFICO DE LINHAS MÚLTIPLAS
Este gráfico permite representar e comparar duas séries simultaneamente ao longo do tempo.
Exemplo: Quantidade de lixo gerado nos bairros da Cidade de Rio de Janeiro.
Anos
84
85
86
87
Fonte: Hipotéticos
Bairro A
8.000
12.000
9.000
11.000
Bairro B
6.000
11.000
10.000
9.500
32
SUMARIZAÇÃO DOS DADOS COLETADOS EM CAMPO.
INTRODUÇÃO
Para interpretar os dados corretamente, em geral é preciso primeiro organizar e sumarizar os números, ou
seja, um conjunto de números pode reduzir-se a uma ou a algumas medidas numéricas que resume todo o
conjunto. Aqui, estamos interessados em calcular alguns valores de uma série, que representam bem e
resumidamente, todos os dados dessa série. São posições no eixo horizontal de um gráfico, em torno das
quais se concentram a maioria dos valores da variável
Usualmente emprega-se as seguintes medidas: Medidas de posição (tendência central) = média
(aritmética simples e ponderada), mediana e moda.
Podemos resumir as condições que regem a escolha de uma dessas medidas de tendência central da
seguinte maneira:
 MODA (MO):
1. Pode ser aplicada em qualquer escala: nominal, ordinal e intervalar;
2. Permite obter uma medida de tendência central rápida, simples, embora
grosseira (pode estar afastada do centro dos valores).
3. Não é afetada pelos valores extremos e não utiliza todos os valores da
variável.
4. A variável pode ter mais de uma moda ou não ter nenhuma moda.
 MEDIANA (Md =
x~ )
1. forma da distribuição: mais adequada para distrib. assimétricas;
2. objetivo: é uma medida de tendência central “confiável”, pode, às vezes ser
usada em operações estatísticas mais avançadas ou “quebrar” uma distribuição
em duas categorias distintas (por exemplo poluentes x não poluentes).
3. Não é afetada pelos valores extremos e não utiliza todos os valores da
variável.

MÉDIA (
x)
1 forma da distribuição: mais adequada para distrib. unimodais simétricas;
2. objetivo: é uma medida de tendência central exata, pode frequentemente ser
usada em operações estatísticas mais avançadas, tais como os testes para tomada
de decisões que aparecerão no final do Curso.
3. Utiliza todos os valores da variável
Exemplo 01: Concepções ideais de família numa amostra de 26 respondentes de renda baixa ( Distribuição
Bimodal)
Tamanho ideal de família
fi
10
1
Temos:
= 5,58
~
9
x =6
2
6
Temos uma com um número
8
7
3
bastante grande de pessoas (MO = 8) e
6
2
5
1
4
2
6
outra com apenas algumas
3
2
2
pessoas (MO = 3)
1
1
n = 26
x
33
Exemplo 02: medidas de tendência central numa distribuição assimétrica de salários anuais
Salário anual (R$)
1.700.000,00
= R$ 306.000,00
425.000,00
170.000,00
x~ = 51.000,00
85.000,00
17.000,00
MO = 17.000,00
17.000,00
17.000,00
x
No exemplo acima, se trabalhássemos de relações públicas de uma empresa e desejássemos angariar-lhe uma
imagem pública favorável, calcularíamos, talvez, a média, a fim de demonstrar que o empregado “típico”
ganha R$306.000,00 por ano, e é relativamente bem pago. Por outro lado, se nós fôssemos representantes
sindicais e estivéssemos procurando melhorar os níveis salariais, iríamos provavelmente empregar a moda
para demonstrar que o salário médio é apenas 17.000,00, o que representa uma quantia bastante reduzida. Se
fossemos pesquisadores sociais desejosos de dar uma informação acurada do salário médio dos empregados
dessa empresa, empregaríamos, a mediana (R$ 51.000,00), uma vez que esta medida cai entre outras duas,
oferece portanto um quadro mais equilibrado da estrutura salarial.
A seguir, serão apresentadas algumas considerações sobre as Medidas de dispersão (dispersão de
números). O conceito de desvio padrão é o que mostra a maneira como os dados agrupam – se em torno do
centro da distribuição.
A amplitude total foi definida como um indicador de variabilidade rápido e grosseiro, facilmente
calculada a partir da diferença entre o maior e o menor dado da distribuição.
O desvio médio não é muito usado em pesquisa, uma vez que ele não se presta a muitas análises
estatísticas avançadas. Por outro lado, o cálculo do desvio padrão implica a utilização de um procedimento
aceitável do ponto de vista matemático, com vistas de contornar o problema dos sinais de + , - . O desvio
padrão é uma medida de variabilidade confiável, que pode ser utilizada em operações estatísticas
avançadas, descritivas ou inferenciais.
MEDIDAS DE POSIÇÃO (TENDÊNCIA CENTRAL) = MÉDIA ARITMÉTICA SIMPLES E
PONDERADA, MEDIANA OU MODA
A.) DADOS BRUTOS OU ROL
A.1
Média Aritmética  Me =
x,
calcula-se a média aritmética determinando-se a soma das
observações dividida pelo número delas. Assim a média aritmética de 3, 4, 7, 8 e 8 é:
x
=
3  4  7  8  8 30
=
=6
5
5
n
 xi
Ou seja:
x
=
i 1
n
n
Onde:  x i = x1 + x2 + x3 + ....+ xn;
i 1
n = no de elementos na amostra;
34
N para no de elementos da população.
O cálculo de
A.2
x
é mesmo para dados amostrais como para população.
Média Aritmética Ponderada 
x , consideremos por ex.: a situação em que o professor informe
que os pesos da notas bimestres são: 1obimestre: peso 2; 2obimestre: peso 2; 3obimestre: peso 3; 4obimestre:
peso 3. O aluno obteve as seguintes notas em Matemática: 6,0; 8,0; 9,0 e 5,0, respectivamente.
O cálculo da média ponderada deve levar em conta os pesos desiguais dos bimestres. A fórmula para o
n
wi xi
cálculo é:
Média ponderada =
x
=
i 1
n
wi
onde w i = peso de observação de ordem i. Portanto:
i 1
x
A.3
2.6  2.8  3.9  3.5 70
=
= 7,0
2 233
10
=
Mediana  Md =
x~ . Colocados os dados brutos em ordem crescente ou decrescente (ROL), a
mediana é o elemento que ocupa a posição central.
x~
Assim, se 05 observações de uma variável forem 8, 7, 4, 8 e 3, a
= 7 corresponde à 3a posição
(observação).
a) Determinar o número n de elementos do Rol;
b) Se n é ímpar – O Rol admite um termo central que ocupa a posição
No de elementos da amostra = n = 5 (ímpar) 
n1
;
2
n1 6 a
x~ =
=
= 3 posição
2
2
c) Se n é par - usa como
x~ a média aritmética das duas observações centrais.
Assim, 3, 4, 7, 8, 8 e 9, 
78
x~ =
= 7,5
2
O processo para determinar a mediana é o seguinte:
1. Ordenar os valores (Rol);
2. Verificar se há um número ímpar ou par de observações;
3. Para um número ímpar de observações, a mediana é o valor do meio. Para um número par de
observações, a mediana é a média das duas observações do meio.
Exemplos:
Par
2, 3, 3, 4
Md
Ímpar
3
Md
1, 2, 3, 3, 3, 4, 7
3
A.4
Moda  Mo É o valor (observação) que ocorre com maior frequência num conjunto. Sejam os
dados os números 10, 10, 8, 6, 10, há três 10’s. O valor mais frequente, a moda, é 10.
35
B) VARIÁVEL DISCRETA
B.1
Determinação da Média de uma distribuição de frequência,
x
Se os dados estão apresentados na forma de uma variável discreta, utilizaremos a média aritmética
ponderada, considerando as frequências simples fi como sendo as ponderações dos elementos xi
correspondentes.
Pode-se usar a fórmula da média ponderada para determinar a média de uma distribuição de
frequência. Os pesos são substituídos pelas frequências (fi) das classes e a fórmula fica:
x
=
 f i xi
n
Onde: fi é a frequência da i-ésima classe
n é o número de observações ( igual a  f i ).
Exemplo: Sem perda de informação. Determinar a média dos seguintes dados:
No acidentes
xi
0
5
10
15
20
25
30
Total
Solução:
B. 2
Frequência
fi
2
4
5
10
2
1
1
n = 25
x
=
 f i xi
n
=
fi.xi
0
20
50
150
40
25
30
315
315
= 12,6
25
Determinação da Mediana de uma distribuição de frequência,
x~ ( variável discreta)
Se os dados estão apresentados na forma de variável discreta, eles já estão naturalmente ordenados.
Assim, basta verificar se o número de elementos da série é ímpar ou par.

n (número de elementos da amostra) = ímpar  a mediana será o elemento central, ordem =

n = par  a mediana será a média entre os elementos centrais ordem =
n
2
e
n
2
+ 1.
n1
;
2
36
Exemplo: Dada a distribuição:
xi
1
2
3
4

~
n = 11 é ímpar, x
=
n1
2
fi
1
3
5
2
11
=
11 1
2
Facumulada=Fac=Fi
1
4
0
9 (6 elem.)
11
= 60 elemento. Abre-se a coluna de Fac e através dessas frequências
acumuladas encontra-se o valor (xi) correspondente à mediana. Neste exemplo
x~ = 3 ( será o xi
correspondente à classe que contiver a ordem calculada).
Exemplo 02: Dada a distribuição:
xi
82
85
87
89
90

fi
Facumulada
5
10
15
8
4
42
5
15
30 (210 e 220)
38
42
n= 42 é par,
n n
x~ será a média entre os elementos de ordem = e + 1
2 2
42
2
42
2
= 210 e
+ 1 = 220. Observando os elementos 21 e 22 na Fac correspondem a 87. Logo:
87  87
2
=
87 (é a mediana).
B. 3. Determinação da Moda de uma distribuição de frequência, Mo
(variável discreta)
É o valor mais frequente da distribuição. Para distribuições simples (sem agrupamento em classes), a
identificação da Moda é facilitada pela simples observação do elemento que apresenta maior frequência.
Assim:
xi
243
245
248
251
307
fi
7
17
23
20
8
A moda é 248, ou seja, Mo = 248. Esse no aparece mais vezes nesta distribuição.
37
C) VARIÁVEL CONTÍNUA
C.1
Determinação da Média de uma distribuição de frequência,
x
Se os dados estão apresentados na forma de uma variável contínua, utilizaremos a média aritmética
ponderada, considerando as frequências simples das classes como sendo as ponderações dos pontos médios
destas classes.
Exemplo: Com perda de informação. Determinar a média dos seguintes dados:
noacidentes
classe
Ponto médio da classe
xi
5
15
25
35
45
Frequência
fi.xi
fi
2
10
0  10
1
15
10  20
5
125
20  30
8
280
30  40
4
180
40  50
Total
n = 20
610
Os pontos médios das classes se determinam tomando-se a média do extremo inferior de cada classe
e do extremo inferior imediatamente superior.
x
Solução:
C. 2
=
 f i xi
n
=
610
= 30,5
20
~ (variável contínua):
Determinação da Mediana de uma distribuição de frequência, x
Procedimento:
n
, como a variável é contínua, não se preocupe se n é par ou ímpar;
2
~ );
Pela Fac identifica-se a classe que contém a mediana (classe da x
1. Calcula-se a ordem
2.
3. Utiliza-se a fórmula:
x~ = lMd +
Onde:
n
(   f ).h
2
f Md
lMd = limite inferior da classe Md (mediana);
n = número de elementos;
f
= soma das frequências anteriores à classe Md;
h = amplitude da classe Md;
fMd = frequência da classe Md
38
Exemplo:
Classes
35
 45
fi
5
45
 55
12
17
55
 65
18
35(classe Md)
65
 75
14
49
75
 85
6
55
85
 95
3
58

10 passo: Calcula-se
Fac
5
58
n
58
. Como n = 58, temos
2
2
= 290;
2o passo: Identifica-se a classe Md pela Fac. Neste caso, a classe Md é a 3a;
3o passo: Aplica-se a fórmula
x~ = lMd +
Neste caso:
n
(   f ).h
2
f Md
lMd = limite inferior da classe Md = 55
n = número de elementos = 58
f
= soma das frequências anteriores à classe Md = 17
h = amplitude da classe Md = 10
fMd = frequência da classe Md = 18
x~ = 55 +
C. 3
(
58
 17).10
2
= 61,57
18
~ (variável contínua)
Determinação da Moda de uma distribuição de frequência, x
Para determinar a moda de uma variável contínua, podemos optar por vários processos ( Moda de
Pearson, moda de King, moda de Czuber). Daremos destaque para a moda de Czuber.
MODA DE CZUBER
CZUBER levou em consideração, em sua fórmula a frequência simples da classe anterior, a
frequência simples da classe posterior, além da frequência simples da classe modal.
39
Mo = IMo +
f M o  f ant .h
2 f M o  f ant  f post 
Onde:
IMo = limite inferior da classe modal;
fMo = frequência simples da classe modal;
fant = frequência simples da classe anterior à classe modal;
fpost = frequência simples da classe posterior à classe modal;
h = amplitude do intervalo de classe.
Exemplo: Calcule a moda de Czuber para a distribuição:
Int. classe
0  10
10  20
20  30
30  40
fi
1
3
6
2
Solução: A classe modal é a terceira classe, a Mo vale:
Mo = 20 +
63
.10 = 24,29 (valor mais frequente nesta distribuição).
2(6)  (3  2)
Graficamente: É preciso construir o histograma da distribuição, identificar a classe modal (aquela
com maior altura) e fazer a construção abaixo:
fi
Mo
classes
40
MEDIDAS DE DISPERSÃO
Considere as séries de dados seguintes:
X : 10, 10, 10, 10, 10, 10, 10, 10, 10, 10
Y : 7, 8, 9, 9, 10, 10, 11, 11, 12, 13
Z : 3, 4, 5, 6, 10, 10, 14, 15, 16, 17
As três séries têm uma característica comum, que é o valor da média. Essa média é 10 para as três séries.
Entretanto elas diferem entre si com relação ao agrupamento dos dados em torno dessa média. Na série X
todos os dados são iguais a 10 e portanto a média representa muito bem essa série. Na seqüência Y vê-se
que vários dados diferem da média, mas estão próximos dela, ou seja, apresentam grande concentração em
torno de 10. A média representa razoavelmente bem a série. Na seqüência seguinte, Z , existem vários
valores muito afastados do valor 10 e portanto a média não representa muito bem a série.
Em resumo, em X todos os dados estão totalmente concentrados na média 10 e portanto não há dispersão de
dados. Em Y existe forte concentração de dados sobre a média e fraca dispersão. Em Z há fraca
concentração de valores sobre a média e grande dispersão de dados.
É portanto importante construir medidas que avaliem a representatividade da média, como será mostrado.
Define-se:
 Desvio médio simples ( DMS ). É a média aritmética dos desvios de cada elemento da série em relação
à média dessa série. O desvio de um elemento para a média é o valor absoluto (módulo) da diferença
entre ambos.
 Cálculo do DMS para variáveis discretas.
7  10  3 ,
Na série Y do exemplo anterior, os desvios da média são:
10  10  0 ,
12  10  2 e
11  10  1 ,
8  10  2 ,
9  10  1 ,
13  10  3 A média aritmética desses valores é
3  2  2 1  2  0  2 1  2  3 14

 1,4 . Esse cálculo pode ser melhor visualizado usando uma tabela
10
10
de distribuição de freqüências e aplicando a fórmula para o cálculo do DMS.
DMS 
 xi - x
fi
 fi
A tabela abaixo representa a série Y :
xi
fi
xi f i
xi  x
7
8
9
10
11
12
13
1
1
2
2
2
1
1
7
8
18
20
22
12
13
3
2
1
0
1
2
3
 f i  10
x i f i  100
Notar que sempre é preciso
calcular a média da série para se
ter o DMS
Lembrar que a média é dada
xi  x f i
3
2
2
0
2
2
3
x
100
 10
10
Substituindo os valores na fórmula tem-se que
por:
x
 xi  x f i  14
DMS 
14
 1,4 .
10
 xi f i
 fi
41
A interpretação desse resultado é que , em média, cada elemento da série está distante 1,4 unidades da média
10.
 Cálculo do DMS para variável contínua.
Neste caso usa-se a mesma fórmula da variável discreta, substituindo o valor
classe x i
DMS 
 xi - x
xi
pelo ponto médio da
fi
 fi
Exemplo: Calcule o DMS da distribuição de freqüências abaixo:
Int.
Classe
Acrescentam-se mais quatro colunas a essa
tabela. A primeira é o valor médio de cada
classe x i , a segunda é o produto x i f i , a
terceira é o desvio do valor médio de cada
classe em relação à média da série e a quarta
fi
classe
1
2
3
4
3
5
7
9
5
7
9
11
Int.
Classe
4
8
6
4
coluna é o produto
fi
xi
xi fi
xi  x
4
8
6
4
4
6
8
10
16
48
48
40
2,9
0,9
1,1
3,1
xi  x fi .
xi  x fi
classe
1
2
3
4
3
5
7
9
5
7
9
11
 f i  22
Então o DMS será:
x  6,9
 x i f i  152
DMS 
 xi - x
 fi
fi
=
11,6
7,2
6,6
12,4
 x i  x f i  37,8
37,8
 1,7 .
22
Interpretação do resultado: Em média, cada elemento está afastado 1,7 unidades da média 6,9.
42

Variância e Desvio Padrão.
O cálculo do desvio médio simples implica no cálculo do módulo dos desvios dos dados em relação à media.
Esse módulo é sempre um número positivo, que é associado a uma distância. Uma outra forma de se ter
valores positivos para os desvios é considerar o quadrado de ( x i  x ) , ou seja, ( x i  x ) 2 . Substituindo na
fórmula do DMS o módulo x i  x por essa expressão obtém-se uma nova medida de dispersão chamada
variância V( x ) .
Define-se o desvio padrão como sendo a raiz quadrada positiva de V( x ). O desvio padrão é representado
simbolicamente pela letra grega sigma minúsculo  . Assim, para uma população de n elementos, a
variância é dada por:
V ( x)   2 ( x) 
 ( xi  x ) 2 f i
n
O desvio padrão é:
 ( x) 
V ( x)
Obs: Quando os elementos da série representam uma população, a variância será simbolizada por  2 ( x ) e
o desvio padrão por  (x ) . Se os elementos representam uma amostra, a variância será denotado
s 2 ( x ) e o desvio padrão por
s 2 ( x ) diferem
por
s ( x ) . Os valores de  2 ( x ) e
numericamente , já que a variância amostral tem como denominador o valor n – 1 e não n, sendo
portanto ligeiramente maior que a variância populacional. Dessa forma, temos:
 ( x) 
Desvio padrão populacional:
 ( xi  x) 2 f i
n
 ( xi  x) 2 f i
n 1
As fórmulas acima são usadas para o cálculo de desvio padrão de variáveis discretas. No caso de
variáveis contínuas substitui-se o valor da variável xi pelo valor médio da classe x i .
s ( x) 
Desvio padrão amostral :
 Cálculo da variância e do desvio padrão.
1) Variável discreta.
Como exemplo, será calculada a variância e o desvio padrão de uma população
representada pela distribuição de freqüências da série Y da página 29.
xi
7
8
9
10
11
12
13
Acrescenta-se
a
coluna
que é o
produto x i f i para se
calcular a média. A
soma dos elementos
da segunda coluna dá
o número total de
elementos na série
fi
1
1
2
2
2
1
1
xi
fi
7
8
9
10
11
12
13
1
1
2
2
2
1
1
xi f i
7
8
18
20
22
12
13
n   fi  10
 x i f i  100
x
 xi f i
 10
n
43
Desenha-se outra tabela com a coluna dos valores ( x i  x ) 2 f i . A soma dos elementos dessa coluna
dividida por n dá o valor da variância da população.
xi
fi
7
8
9
10
11
12
13
1
1
2
2
2
1
1
xi f i
7
8
18
20
22
12
13
( xi  x ) 2 f i
9
4
2
0
2
4
9
( x i  x ) 2 f i  30
Portanto, V ( x ) =  2 ( x ) 
O desvio padrão é
30
3
10
 ( x )  3  1,7
Se a série representa uma amostra de uma população, então o denominador será igual a 9 e os valores da
variância e do desvio padrão serão 3,3 e 1,8 respectivamente.
2)
Variável contínua. Neste caso os valores contidos em uma certa classe i não são conhecidos.
Calculam-se então os valores médios das classes, denotados por x i .
A variância é calculada pela fórmula:
V (x) =  2 ( x ) 
O desvio padrão populacional é portanto:
 ( x) 
 ( x i  x) 2 f i
.
n
 ( x i  x) 2 f i
n
Se a variável representa uma amostra, a variância será denotada por s 2 ( x ) , que é calculada pela
fórmula:
s 2 ( x) 
 ( x i  x) f i
n 1
( x i  x ) f i
n 1
Exemplo:
(Ermes M. da Silva)
Calcule a variância e o desvio padrão para a distribuição de uma
amostra dos valores de 54 notas fiscais emitidas na mesma data, selecionadas em uma loja de departamentos
s( x ) 
O desvio padrão amostral é dado por:
Classe
Consumo por nota N 0 de notas
US$
1
2
3
4
5
6
0
50
100
150
200
250
50
100
150
200
250
300
10
28
12
2
1
1
44
Acrescentam-se as colunas que mostram os valores médios das classes ( x i ) e o produto desses valores
 
pelas respectivas freqüências. Isso é útil para se calcular o valor médio da distribuição x .
Consumo por nota N 0 de notas
Classe
xi
xi fi
25
75
125
175
225
275
250
2.100
1.500
350
225
275
US$
1
2
3
4
5
6
0
50
100
150
200
250
50
100
150
200
250
300
10
28
12
2
1
1
n   f i  54
A média é: x 
 x i f i 4.700

 87
n
54
Finalmente acrescenta-se a coluna com os valores de ( x i  x ) 2 f i .
Classe
Consumo por nota N 0 de notas
xi
xi fi
( xi  x )2 fi
25
75
125
175
225
275
250
2.100
1.500
350
225
275
38.440
4.032
17.328
15.488
19.044
35.344
US$
1
2
3
4
5
6
0
50
100
150
200
250
50
100
150
200
250
300
10
28
12
2
1
1
( x i  x ) 2 f i  129 .676
129.676
Variância = s 2 ( x ) 
 2.446,72
53
Desvio padrão = s( x )  2.446,72  49,46
A unidade da variância, neste exemplo, é ( US$ ) 2 e a unidade do desvio padrão é US$.
 Comentários sobre a variância e o desvio padrão.
A unidade em que a variância é expressa é o quadrado da unidade de medida de uma série. Isso leva à
conclusão que a variância não admite interpretação. Por exemplo, se os dados são expressos em unidade de
área , metro quadrado , por exemplo, a variância seria expressa em metro elevado à quarta potência, o que
não tem significado.
Entretanto, o desvio padrão tem a mesma unidade de medida dos dados, já que é a raiz quadrada da
variância. O desvio padrão admite portanto uma interpretação, como será visto nos exercícios.
Em distribuições de freqüências em que os dados são simétricos em relação à média, como na figura abaixo,
o intervalo em torno dessa média, desde x   até x   contém aproximadamente 68 % dos valores da
série. Os intervalos x  2 , x  2  e x  3 , x  3  contêm aproximadamente 95% e 99% dos
valores da série, respectivamente.
45
2,2
2,0
1,8
1,6
1,4
1,2
1,0
0,8
0,6
0,4
0,2


0,0
x-
-2
-1
x
x+
1
2
Se, por exemplo, temos um série de dados que apresenta média x  50 e desvio padrão  ( x )  3 , sendo
esses dados distribuídos simetricamente em relação à média, interpretamos esses valores como:
1)
2)
3)
4)
Os valores da série estão concentrados em torno de 50;
O intervalo  47, 53  contém aproximadamente 68 % dos valores da série;
O intervalo  44, 56  contém aproximadamente 95 % dos valores da série;
O intervalo  41, 59  contém aproximadamente 99 % dos valores da série.
As medidas de desvio padrão são medidas absolutas da dispersão dos dados de uma série. Assim, se uma
série X tem média 100m, com desvio padrão 5 e outra série Y tem média 50 com desvio padrão 4,
conclui-se que a série X tem uma dispersão absoluta maior. Entretanto pode-se definir uma medida,
chamada coeficiente de variação, que dá a dispersão relativa da série. Esse coeficiente, denotado por
CV(x), é dado por:
 ( x)
CV ( x ) 
x
O coeficiente de variação é um número puro, ou seja, não tem unidade de medida. Pode portanto ser
expresso em porcentagem. Nos exemplos acima calcula-se que para a série X CV(x) = 5% e para a série Y
CV(y) = 8%. Nota-se, portanto, que a série X tem uma dispersão relativa menor.

Outras fórmulas: Variância,

2
(variância populacional), s2 (variância amostral)
Para o cálculo da variância, é mais interessante o uso das fórmulas práticas:

2
2
s =
=
 x i f i 2 
1
2
 x i f i 

n
n

 x i f i 2 
1
2
 x i f i 

n
n1

46
Desvio padrão,

( populacional), s (amostral)
Deve-se primeiro calcular variância e em seguida extrair a raiz quadrada desse resultado.


=
s
s=
2
2
é o desvio padrão populacional;
é o desvio padrão amostral;
Exemplo:
Calcular a variância e o desvio padrão
xi
2 4
4 6
6 8
8 10
10 12
fi
2
4
7
4
3
Solução:
classes
xi
fi
xifi
x i .fi
2 4
3
2
6
18
4 6
5
4
20
100
6 8
7
7
49
343
8 10
9
4
36
324
10 12
11
3
33
363
20
144
1.1478

s2 =
s=
1
20  1
s
2
2

144  = 5,85
1
.
148


20 

, logo s =
5,85 = 2,41
2
47
Exercícios de fixação
1. Os resultados do lançamento de um dado 50 vezes foram os seguintes:
6
5
2
6
4
3
6
2
6
5
1
6
3
3
5
1
3
6
3
4
5
4
3
1
3
5
4
4
2
6
2
2
5
2
5
1
3
6
5
1
5
6
2
4
6
1
5
2
4
3
a) Construa uma distribuição de frequência sem intervalos de classe.
b) Construa um gráfico de barras ou de colunas simples.
2. De acordo com a Organização Nielsen de Pesquisa de Mídia, os cinco programas de TV de
maior audiência durante a semana de 28 de setembro a 4 de outubro de 1998 foram ER, Frasier,
Friends, Jesse e verônica´sCloset. Os dados para uma amostra de 50 telespectadores são
apresentados a seguir
Jesse
ER
Verônica
ER
ER
Frasier
Verônica
Friends
Verônica
ER
ER
Frasier
ER
ER
Friends
Friends
Frasier
Frasier
Friends
ER
Friends
Verônica
Friends
Verônica
Verônica
Verônica
ER
ER
Jesse
Friends
a) Estes dados são qualitatitvos ou quantitativos?
Frasier
ER
ER
Frasier
Friends
ER
Frasier
Frasier
Frasier
Verônica
Frasier
Frasier
Frasier
Friends
Frasier
ER
Friends
ER
Friends
ER
b) Forneça a tabela de distribuição de freqüência;
c) Construa um gráfico de barras e um gráfico de setores para os dados;
d) Com base na amostra, qual programa detém a maior participação de mercado? Qual fica em
segundo lugar?
e) Construa um gráfico de barras/colunas simples.
3. As notas de 32 estudantes de uma classe são dados abaixo:
6.0
0.0
2.0
6.5
5.0
3.5
4.0
7.0
8.0
7.0
8.5
6.0
4.5
0.0
6.5
6.0
2.0
5.0
5.5
5.0
7.0
1.5
5.0
5.0
4.0
4.5
4.0
1.0
5.5
3.5
2.5
4.5
Determinar:
a)
O rol
b)
A distribuição de freqüência (começar por 0.0 e usar amplitude de classe igual a 1.5)
48
c)
A amplitude total
d)
A porcentagem de alunos que tiraram nota menor que 4.0
e)
A porcentagem de alunos que tiraram nota entre 5.0 e 7.0 inclusive.
f)
O limite superior da 2ª classe.
g)
O limite inferior da 4ª classe.
h)
O ponto médio da 3ª classe
i)
Construa o histograma para a variável contínua e o polígono de freqüência. A partir destes
gráficos qual o valor aproximado da nota da maioria dos alunos?
4.
Os dados abaixo fornecem o tempo em dias exigido para se completar auditorias de fim de
ano para uma amostra de 20 clientes da Sanderson and Clifford, uma pequena firma de
contabilidade.
Tabela 1 – Tempo (em dias) de auditorias de fim de ano.
12
14
19
15
15
18
20
27
22
22
21
33
14
18
16
Fonte: dados hipotéticos
18
17
23
28
13
Pede-se:
a) Distribuição de freqüência para variável contínua. Sugestão: não esqueça de calcular o
intervalo/amplitude de classe.
b) Porcentagem e número de clientes que necessitaram os tempos de auditoria entre 15 e 20
dias.
c) Porcentagem e número de clientes que necessitaram os tempos de auditoria inferiores a
30 dias.
d) Porcentagem de clientes que necessitaram os tempos de auditoria pelo menos de 20 dias.
e) Construa dois gráficos: histograma e polígono de freqüência para os dados da Tabela item
a)
5. A distribuição abaixo indica o número de acidentes ocorridos com 70 motoristas de uma
empresa de ônibus:
No de acidentes
0
1
2
3
4
5
6
7
No de motoristas
20 10
16
9
6
5
3
1
Determine:
a) O número de motoristas que não sofreram nenhum acidente;
b) O número de motoristas que sofreram pelo menos 4 acidentes;
c) O número de motoristas que sofreram menos de 3 acidentes;
d) O número de motoristas que sofreram no mínimo 3 e no máximo 5 acidentes;
e) A porcentagem que sofreram no máximo 2 acidentes.
49
6.
Utilizar um gráfico de setores para representar a tabela:
Corpo Docente do Ensino de 30 Grau no país XY em 1999.
Especificação
Quantidade
Titular
Adjunto
Assistente
Colaborador
Auxiliar Ensino
Total
28.079
11.306
28.711
4.377
20.073
92.546
Fonte: Dados hipotéticos
7. Construir um gráfico de colunas múltiplas (ou de barras múltiplas) para representar a tabela:
Renda familiar e Saneamento básico
Rendimento Mensal familiar em salário
População Beneficiada
(%)
mínimo
Água
Instalação Sanitária
Coleta de lixo
1
52,4
33,7
56,1
>1a2
62,1
43,2
61,7
>2 a 5
77,7
58,3
73,7
> 5 a 10
90,7
76,9
86,6
>10
96,4
90,0
95,6
Oliveira et.al. O traço da desigualdade social no Brasil. Fundação IBGE, Rio de Janeiro. RJ, 1993.
8. Considerando a distribuição abaixo:
xi
3
4
5
6
7
8
fi
4
8
11
10
8
3
Calcule:
a) a média;
b) a mediana
c) a moda.
9. O Departamento de Pessoal de uma certa firma fez um levantamento dos salários dos 120
funcionários do setor administrativo, obtendo os seguintes resultados:
Faixa salarial
N0 de funcionários
(em salários mínimos)
02
30
24
48
46
24
6  10
18
a) Esboce o histograma correspondente e calcule a moda;
b) Calcule o salário médio dos funcionários do setor administrativo;
c) E o salário mediano?
d) Calcule a variância do setor administrativo (amostra) e desvio padrão do setor administrativo;
50
BIBLIOGRAFIA CONSULTADA
1. ANDERSON, David R. Estatística aplicada à administração e economia. 2a ed. Trad.
PAIVA, Luís Sérgio Castro. São Paulo: Pioneira, 2002.
2. LEVIN, Jack. Estatística aplicada a ciências humanas. 2a.ed. Trad. COSTA, Sérgio
Francisco. São Paulo : Harbra, 1987.
3.
MARTINS, Gilberto Andrade. Estatística geral e aplicada. 2a ed. São Paulo: Atlas, 2002.
4. FREUND, John E. & SIMON Geray A. Estatística aplicada para economia, administração
e ciências contábeis. 9a ed., Trad. FARIA, Alfredo Alves de. Porto Alegre: Bookman, 2000.
5. FONSECA, Jairo Simon da; MARTINS, Gilberto de Andrade. Curso de estatística. 6a.ed.
Sao Paulo : Atlas,1996.
6. DOWNING, D. & CLARK, J. Estatística aplicada. São Paulo: Saraiva, 1997.
7. OVALLE, Izidoro Ivo. Estatística básica. 2a ed. São Paulo: Atlas,1995.
8. MARTINS, GILBERTO DE ANDRADE, DONAIRE, DENIS. Princípios de Estatística. 4a
ed. São Paulo: Atlas, 1979.
9. SAMARA, BEATRIZ & BARROS, JOSÉ CARLOS. Pesquisa de Marketing. São Paulo:
Makron Books, 1997.
10. BUSSAB, W. O. & MORETIN, P. Métodos Quantitativos: Estatística Básica. 4a ed. São
Paulo. Atual. 1997.
11. STEVENSON, W. J. Estatística Aplicada à Administração. 2a ed. São Paulo. Harbra. 1986.
12. SILVA da, E. M. e colaboradores. Estatística para os Cursos de Economia, Administração e
Ciências Contábeis. V. 01 e 02. 2a ed. São Paulo. Atlas.1997.
51
ALGUNS
COMENTÁRIOS
SOBRE
ELABORAÇÃO
DE
QUESTIONÁRIO:
ELABORAÇÃO DE PERGUNTAS E ESCALAS

Perguntas Fechadas
Nas perguntas fechadas são fornecidas as possíveis respostas ao entrevistado, sendo que
apenas uma alternativa de resposta é possível.
Exemplo:
Em que bairro o sr.(a) mora?
( ) Higienópolis
( ) Sumaré

( ) Pacaembú
( ) Mooca
( ) Pinheiros
( ) ________
Perguntas Abertas
Nesse tipo de pergunta o entrevistado responde livremente o que pensa sobre o assunto.
Exemplo:
Qual a sua opinião sobre o bairro onde mora?

Pergunta Semi-Aberta
A pergunta semi-aberta é a junção de uma pergunta fechada a uma aberta em que, num
primeiro momento, o entrevistado responde a uma das opções de alternativas e depois
justifica ou explica a sua resposta.
Exemplo:
Em que bairro o sr.(a) mora?
( ) Higienópolis
( ) Sumaré
( ) Pacaembu
( ) Mooca
( ) Pinheiros
( ) ________
Por quê? __________________________________________________________

Pergunta Dicotômica
É a pergunta que tem como respostas Sim e Não.
Exemplo:
O sr.(a) mora em casa própria?
( ) Sim
( ) Não
52

Perguntas Encadeadas
A segunda pergunta depende da resposta da primeira.
Exemplo:
O sr.(a) mora em casa própria financiada?
( ) Sim
( ) Não
Caso a resposta seja afirmativa. Qual a entidade financiadora?
( ) BNH
( ) CEF
( ) Construtora
( ) Outros
( ) Banco particular
( ) Banco estatal
 Pergunta com Matriz de Resposta
Nesse caso, monta-se um quadro para facilitar a resposta do entrevistado.
Exemplo:
Bairro
Morou
Mora
Pretende Morar
Higienópolis
Perdizes
Mooca
Pinheiros
Bela Vista
Tatuapé

Perguntas com Ordem de Preferência
É dada ao entrevistado a possibilidade de escolha do 1º, 2º e 3º lugares:
Exemplo:
Caso o sr.(a) fosse mudar de casa, qual bairro escolheria em 1º, 2º e 3º lugares?
( ) Higienópolis
( ) Mooca
( ) Bela Vista
( ) Perdizes

( ) Pinheiros
( ) Tatuapé
Escala Ordinal de Preferência
Exemplo: Por favor, indique a sua preferência por companhias aéreas, numerando de 1 a 5,
sendo 1 para a de maior preferência e 5 para a de menor preferência. (mostrar cartão).
1.____________
2.____________
3.____________
4.____________
5.____________
Modelo do
cartão
53

Escala Ordinal de Ranking
Exemplo: Por favor, coloque em ordem de preferência as empresas listadas no cartão
(entregar cartão C para o entrevistado), de acordo com as características que estão sendo
avaliadas – sendo 1 para a melhor empresa no atributo e até 4 para a pior empresa. Vamos
começar com superior tecnologia. Qual empresa você colocaria em primeiro? em segundo ....
(até 4).
tecnologia
Empresa A
Empresa B
Empresa C
Empresa D

__________
__________
__________
__________
Cumprimento de
prazos
_______________
_______________
_______________
_______________
serviços
pós-venda
__________
__________
__________
__________
Escala de Lembrança de Marca
Exemplo: “Quando eu menciono indústria farmacêutica, qual nome lhe vem primeiro à
cabeça?”
______________ primeira empresa mencionada
Lembra outras?
______________ segunda empresa mencionada
______________ terceira empresa mencionada
Já ouviu falar da Empresa “XW”?
( ) sim
( ) não

Escala de Diferencial Semântico (Osgood)
Exemplo: Com relação ao Iogurte marca “P” com polpa de frutas, qual a sua opinião sobre os
seguintes atributos?
Puro
Saboroso
Natural
Alta qualidade
Embalagem higiênica

7654321
7654321
7654321
7654321
7654321
Impuro
Sem sabor
Artificial
Baixa Qualidade
Embalagem não-higiênica
Escala de Likert
O respondente indica o grau de concordância ou discordância de acordo com as variáveis e atitudes
relacionadas ao objeto:
54
CT CP NA DP DT
Os tênis importados são melhores que os nacionais
XZ é uma marca nacional
As melhores marcas de tênis patrocinam times de futebol
XZ é um tênis para pessoas jovens e ativas
5
5
4
4
3
3
2
2
1
1
5
5
4
4
3
3
2
2
1
1
CT= concordo totalmente
DP= discordo parcialmente
CP= concordo parcialmente DT= discordo totalmente
NA= não concordo nem discordo

Escala Itemizada
Exemplo: “Com relação ao grau de satisfação com seu atual plano de saúde, você afirmaria
que está:
(
(
(
(

)
)
)
)
totalmente satisfeito
parcialmente satisfeito
parcialmente insatisfeito
totalmente insatisfeito
Escala de Intenção de Compra
Exemplo: Qual a chance de você adquirir a marca “Y” na próxima compra desse tipo de
produto?
(
(
(
(
(
)
)
)
)
)
certamente comprarei
possivelmente comprarei
não sei se comprarei
possivelmente não comprarei
certamente não comprarei
BIBLIOGRAFIA CONSULTADA: ELABORAÇÃO DE PERGUNTAS
01. LEVIN, Jack. Estatística aplicada a ciências humanas. 2a.ed. Trad. COSTA, Sérgio
Francisco. São Paulo : Harbra, 1987.
02. MARTINS, Gilberto Andrade. Estatística geral e aplicada. 2a ed. São Paulo: Atlas,
2002.
03. SMAILES, Joanne; MC GRANE, Ângela. Estatística aplicada á administração com
Excel. 1a ed. Trad. BRITO, Christiane. São Paulo: Atlas, 2000.
04. SAMARA, BEATRIZ & BARROS, JOSÉ CARLOS. Pesquisa de Marketing. São
Paulo: Makron Books, 1999.
Download