Livro Texto - UNIPVirtual

Propaganda
Estatística Aplicada
Professora conteudista: Angela Maria Pizzo
Sumário
Estatística Aplicada
Unidade I
1 INTRODUÇÃO À ESTATÍSTICA .........................................................................................................................1
1.1 Introdução ..................................................................................................................................................1
1.2 Importância da estatística ...................................................................................................................2
1.3 Grandes áreas da estatística ...............................................................................................................2
1.4 Fases do método estatístico................................................................................................................5
1.5 Dados estatísticos ..................................................................................................................................9
1.6 Formas iniciais de tratamento dos dados .................................................................................. 10
1.7 Notação por índices .............................................................................................................................11
1.7.1 Notação sigma (∑) ..................................................................................................................................11
1.8 Séries estatísticas – simples e compostas .................................................................................. 15
1.8.1 Tipos de séries estatísticas .................................................................................................................. 16
1.8.2 Tabelas de dupla entrada ..................................................................................................................... 18
1.9 Apresentação de dados - gráficos e tabelas ............................................................................. 20
2 MEDIDAS DE TENDÊNCIA CENTRAL: MÉDIA, MODA E MEDIANA PARA
DADOS SIMPLES .................................................................................................................................................. 24
2.1 A média aritmética simples (µ,x) ................................................................................................... 25
2.2 A média aritmética ponderada ....................................................................................................... 28
2.3 A mediana ............................................................................................................................................... 29
2.4 A moda ..................................................................................................................................................... 31
3 MEDIDAS DE DISPERSÃO PARA DADOS SIMPLES.............................................................................. 33
3.1 Amplitude total ..................................................................................................................................... 37
3.2 Desvio médio absoluto ....................................................................................................................... 37
3.3 Variância .................................................................................................................................................. 39
3.4 Desvio padrão ........................................................................................................................................ 44
4 DISTRIBUIÇÃO DE FREQUÊNCIAS ............................................................................................................. 47
4.1 A construção de uma distribuição de frequências para dados contínuos.................... 48
4.2 A construção de uma distribuição de frequências para dados discretos ...................... 55
4.3 Representação gráfica de dados agrupados ............................................................................. 56
Unidade II
5 AS MEDIDAS DE POSIÇÃO E VARIABILIDADE NUMA DISTRIBUIÇÃO DE FREQUÊNCIA ...... 66
5.1 As medidas de posição ....................................................................................................................... 67
5.1.1 A média ....................................................................................................................................................... 67
5.1.2 A mediana .................................................................................................................................................. 69
5.1.3 A moda ........................................................................................................................................................ 70
5.2 As medidas de dispersão numa distribuição de frequência.................................................71
5.2.1 O desvio médio ........................................................................................................................................ 71
5.2.2 Variância .................................................................................................................................................... 72
5.2.3 Desvio padrão........................................................................................................................................... 74
6 INTRODUÇÃO À PROBABILIDADE ............................................................................................................. 78
6.1 Teoria dos conjuntos, espaço amostral e eventos................................................................... 78
7 PROBABILIDADE: ORIGEM, MÉTODOS E PRINCIPAIS TEOREMAS ................................................ 90
7.1 Origens da probabilidade .................................................................................................................. 90
7.1.1 Métodos objetivos .................................................................................................................................. 91
7.1.2 Método subjetivo .................................................................................................................................... 96
7.2 Principais teoremas de probabilidade .......................................................................................... 97
8 REVISÃO ............................................................................................................................................................102
ESTATÍSTICA APLICADA
Unidade I
1 INTRODUÇÃO À ESTATÍSTICA
1.1 Introdução
A palavra estatística lembra, à maioria das pessoas,
recenseamentos. Os censos existem há milhares de anos e
constituem um esforço imenso e caro feito pelos governos
com o objetivo de conhecer seus habitantes, sua condição
5 socioeconômica, sua cultura, religião, etc. Portanto, associar-se
estatística a censo é perfeitamente correto do ponto de vista
histórico, sendo interessante salientar que as palavras estatística
e estado têm a mesma origem latina: status.
A estatística é também comumente associada às pesquisas de
10 opinião pública, aos vários índices governamentais, aos gráficos
e médias publicadas diariamente na imprensa. Na realidade,
entretanto, a estatística engloba muitos outros aspectos, sendo
fundamental na análise de dados provenientes de quaisquer
processos em que exista variabilidade.
15
É possível distinguir duas concepções para a palavra
estatística:
No plural (estatísticas), indica qualquer coleção de dados
numéricos, reunidos com a finalidade de fornecer informações
acerca de uma atividade qualquer. Assim, por exemplo, as
20 estatísticas demográficas referem-se aos dados numéricos
sobre nascimentos, falecimentos, matrimônios, desquites, etc.
As estatísticas econômicas consistem em dados numéricos
relacionados com emprego, produção, vendas e com outras
1
Unidade I
atividades ligadas aos vários setores da vida econômica. No
singular (estatística), indica a atividade humana especializada ou
um corpo de técnicas, ou ainda uma metodologia desenvolvida
para a coleta, a classificação, a apresentação, a análise e a
5 interpretação de dados quantitativos e a utilização desses dados
para a tomada de decisões.
1.2 Importância da estatística
O mundo está repleto de problemas. Para resolvermos a
maioria deles, necessitamos de informações. Mas que tipo de
informações? Quantas? E após obtê-las, o que fazer com elas?
10 A estatística lida com essas informações, associando os dados
ao problema, descobrindo como e o que coletar e obtendo
conclusões a partir de todas essas informações de tal forma que
possam ser entendidas por outras pessoas.
Portanto, os métodos estatísticos auxiliam o cientista social,
o
economista,
o engenheiro, o agrônomo e muitos outros
15
profissionais a realizarem o seu trabalho com mais eficiência.
Vejamos alguns exemplos:
Os estatísticos do governo conduzem censos de população,
moradia, produtos industriais, agricultura e outros. São feitas
20 compilações sobre vendas, produção, inventário, folha de
pagamento e outros dados das indústrias e empresas. Essas
estatísticas informam ao administrador como a sua empresa
está crescendo, seu crescimento em relação a outras empresas
e como planejar ações futuras. A análise dos dados é muito
25 importante para se fazer um planejamento adequado.
1.3 Grandes áreas da estatística
Para fins de apresentação, é usual dividir-se a estatística em
três grandes áreas, embora não se trate de ramos isolados:
• amostragem, que é o mecanismo de coleta de dados;
30
2
• estatística descritiva, que se ocupa da organização,
apresentação e sintetização de dados;
Estatística é um conjunto de
técnicas e métodos que nos auxiliam
no processo de tomada de decisão na
presença de incerteza.
ESTATÍSTICA APLICADA
• estatística inferencial, que constitui o conjunto de métodos
para a tomada de decisões, nas situações em que existem
incerteza e variação.
Amostragem
5
É o processo de escolha da amostra. É a parte inicial de
qualquer estudo estatístico. Consiste na escolha criteriosa dos
elementos a serem submetidos ao estudo.
Exemplo 1. Pesquisas sobre tendências de votação. Em
épocas de eleição, é comum a realização de pesquisas com o
10 objetivo de se conhecerem as tendências do eleitorado. Para
que os resultados sejam, de fato, representativos, toma-se
o cuidado de se entrevistar um conjunto de pessoas com
características socioeconômicas, culturais, religiosas, etc. tão
próximas quanto possível da população à qual os resultados
15 da pesquisa serão estendidos. A escolha da amostra, a
redação do questionário, a entrevista, a codificação dos
dados, a apuração dos resultados são as etapas deste tipo de
pesquisa.
População e amostra
20
O estudo de qualquer fenômeno, seja ele natural, social,
econômico ou biológico, exige a coleta e a análise de dados
estatísticos. A coleta de dados é, pois, a fase inicial de qualquer
pesquisa.
População é a coleção de todas as observações potenciais
25 sobre determinado fenômeno. O conjunto de dados efetivamente
observados, ou extraídos, constitui uma amostra da população.
É sobre os dados da amostra que se desenvolvem os estudos,
visando a fazer inferências sobre a população.
Exemplo 2. Avaliação de um programa de ensino. Toma-se
30 certo número de pares de turmas: a um conjunto de turmas
3
Unidade I
ensina-se um assunto por um novo método, e ao outro, pelo
método clássico. Aplica-se uma prova a ambos os grupos. As
notas observadas nesses conjuntos de turmas constituem
a nossa amostra. Se os resultados do novo método forem
5 melhores, iremos aplicá-lo a todas as turmas, isto é, à população.
A partir da amostra, estabelecemos o que é conveniente
para a população, ou seja, fazemos uma inferência sobre a
população.
Exemplo 3. Renda média per capita em diversas regiões
10 do país. Toma-se um conjunto de indivíduos em cada região,
escolhidos ao acaso, e sobre esse grupo fazem-se os estudos.
Os indivíduos assim escolhidos constituem a amostra, e os
resultados nela observados serão estendidos à população.
Estatística descritiva
15
É a parte mais conhecida. Quem vê o noticiário, na televisão
ou nos jornais, sabe o quão frequente é o uso de médias, índices
e gráficos nas notícias.
Exemplo 4. INPC (Índice Nacional de Preços ao Consumidor).
Sua construção envolve a sintetização, em um único número,
20 dos aumentos dos produtos de uma cesta básica.
Exemplo 5. Anuário Estatístico Brasileiro. O IBGE publica
a cada ano este anuário, apresentando, em várias tabelas,
os mais diversos dados sobre o Brasil: educação, saúde,
transporte, economia, cultura, etc. Embora simples, fáceis de
25 serem entendidas, as tabelas são o produto de um processo
demorado e extremamente dispendioso de coleta e apuração
de dados.
Exemplo 6. Anuário Estatístico da Embratur. A Embratur
publica este anuário apresentando, em várias tabelas e gráficos,
30 os mais diversos dados sobre turismo interno e dados sobre
entrada de turistas estrangeiros no Brasil.
4
ESTATÍSTICA APLICADA
Estatística inferencial (ou indutiva)
A tomada de decisões sobre a população, com base em
estudos feitos sobre os dados da amostra, constitui o problema
central da inferência estatística.
5
Exemplo 7. Análise financeira. Os analistas financeiros
estudam dados sobre a situação da economia, visando a explicar
tendências dos níveis de produção e de consumo, projetando-os
para o futuro.
Exemplo 8. Ocorrência de terremotos. Os geólogos estão
10 continuamente coletando dados sobre a ocorrência de
terremotos. Gostariam de inferir quando e onde ocorrerão
tremores, e qual a sua intensidade. Trata-se, sem dúvida, de uma
questão complexa, que exige longa experiência geológica, além
de cuidadosa aplicação de métodos estatísticos.
15
Probabilidade
O processo de generalização, que é característico
do método indutivo, está associado a uma margem de
incerteza. A existência da incerteza deve-se ao fato de
que a conclusão que se pretende obter para o conjunto
20 de todos os indivíduos analisados quanto a determinadas
características comuns baseia-se em uma parcela do total
das observações. A medida da incerteza é tratada mediante
técnicas e métodos que se fundamentam na Teoria da
Probabilidade. Essa teoria procura quantificar a incerteza
25 existente em determinada situação.
Fica claro, assim, que as três áreas
da estatística não são separadas ou
distintas, mas tendem a se entrelaçar. A
descrição e o resumo dos dados tende
a ser a primeira fase da análise dos
mesmos; já a teoria e os fundamentos
da amostragem se baseiam na teoria
da probabilidade, que nos leva a
uma inferência ou a uma tomada de
decisões baseada nas informações
apresentadas.
1.4 Fases do método estatístico
Quando se pretende empreender um estudo estatístico
completo, existem diversas fases do trabalho que devem
ser desenvolvidas para se chegar aos resultados finais do
30 estudo.
5
Unidade I
As fases principais são as seguintes:
• definição do problema;
• planejamento;
• coleta de dados;
5
• apuração dos dados;
• apresentação dos dados;
• análise e interpretação dos dados.
Descrevendo mais atentatamente cada fase:
Definição do problema
10
A primeira fase do trabalho consiste em uma definição
ou formulação correta do problema a ser estudado. Além de
considerar detidamente o problema objeto do estudo, o analista
deverá examinar outros levantamentos realizados no mesmo
campo e análogos, uma vez que parte da informação de que se
15 necessita pode, muitas vezes, ser encontrada nesses últimos.
Planejamento
O passo seguinte, após a definição do problema, compreende
a fase do planejamento, que consiste em se determinar o
procedimento necessário para resolver o problema e, em especial,
20 como levantar informações sobre o assunto objeto do estudo.
É preciso planejar o trabalho a ser realizado, tendo em vista o
objetivo que se pretende atingir. É nesta fase que será escolhido
o tipo de levantamento a ser utilizado. Sob esse aspecto, pode
haver dois tipos de levantamento:
25
• levantamento censitário – quando a contagem for
completa, abrangendo todo o universo;
• levantamento por amostragem, quando a contagem for
parcial.
6
Observe quais são as fases principais
do método estatístico – compõem
a organização de um projeto, sua
execução e apresentação final.
ESTATÍSTICA APLICADA
Outros elementos importantes que devem ser tratados nessa
mesma fase são:
• cronograma das atividades – através do qual são fixados os
prazos para as várias fases;
5
• custos envolvidos;
• exame das informações disponíveis;
• delineamento da amostra, etc.
Coleta dos dados
O terceiro passo é essencialmente operacional,
10 compreendendo a coleta das informações propriamente ditas.
Nesta fase do método estatístico, é conveniente estabelecer
uma distinção entre duas espécies de dados:
• dados primários – quando são publicados ou comunicados
pela própria pessoa ou organização que os haja escolhido.
15
• dados secundários – quando são publicados ou comunicados
por outra organização.
Um conjunto de dados é, pois, primário ou secundário em
relação a alguém. As tabelas do censo demográfico são fontes
primárias. Quando determinado jornal publica estatísticas
20 extraídas de várias fontes e relacionadas com diversos setores
industriais, os dados são secundários para quem desejar utilizarse deles em alguma pesquisa que esteja desenvolvendo.
A coleta de dados pode ser realizada de duas maneiras:
25
• coleta direta – quando é obtida diretamente da fonte,
como no caso da empresa que realiza uma pesquisa
para saber a preferência dos consumidores pela sua
marca;
7
Unidade I
• coleta indireta – quando é inferida a partir dos elementos
conseguidos pela coleta direta, ou através do conhecimento
de outros fenômenos que, de algum modo, estejam
relacionados com o fenômeno em questão.
5
Apuração dos dados
Antes de começar a analisar os dados, é conveniente que
lhes seja dado algum tratamento prévio, a fim de torná-los mais
expressivos. A quarta etapa do processo é, então, a da apuração
ou sumarização, que consiste em resumir os dados através de
10 sua contagem e agrupamento.
Apresentação dos dados
Há duas formas de apresentação ou exposição dos dados
observados, que não se excluem mutualmente:
15
20
25
• apresentação tabular – é uma apresentação numérica dos
dados. Consiste em dispor os dados em linhas e colunas
distribuídas de modo ordenado, segundo algumas regras
práticas adotadas pelos diversos sistemas estatísticos. As
tabelas têm a vantagem de conseguir expor, sinteticamente
e em um só local, os resultados sobre determinado assunto,
de modo a se obter uma visão global mais rápida daquilo
que se pretende analisar;
• apresentação gráfica – constitui uma apresentação
geométrica dos dados numéricos. Embora apresentação
tabular seja de extrema importância, no sentido de facilitar
a análise numérica de dados, não permite ao analista obter
uma visão tão rápida, fácil e clara do fenômeno e sua
variação como conseguida através de um gráfico.
Análise e interpretação dos dados
Nesta última etapa, o interesse maior reside em tirar
30 conclusões que auxiliem o pesquisador a resolver seu problema.
8
Observe em jornais e revistas que,
normalmente, as informações gráficas
têm uma assimilação mais rápida por
parte dos leitores.
ESTATÍSTICA APLICADA
A análise dos estatísticos está ligada essencialmente ao cálculo
de medidas, cuja finalidade principal é descrever o fenômeno.
Assim, o conjunto de dados a ser analisado pode ser expresso por
números-resumos, as estatísticas, que evidenciam características
5 particulares desse conjunto. O significado exato de cada um dos
valores obtidos através do cálculo das várias medidas estatísticas
disponíveis deve ser bem interpretado. É possível mesmo, nesta
fase, arriscar algumas generalizações, as quais envolverão, como
mencionado anteriormente, algum grau de incerteza, porque
10 não se pode estar seguro de que o que foi constatado para
aquele conjunto de dados (a amostra) se verificará igualmente
para a população.
1.5 Dados estatísticos
Quando se trabalha com a observação, a mensuração,
a análise e a interpretação de números, esses números nos
15 conduzem a índices inflacionários, índices de desemprego,
probabilidade de determinado candidato ganhar as eleições, etc.
Tais números, portanto, serão chamados de dados estatísticos.
Esses dados precisarão ser organizados e sumarizados para sua
correta interpretação.
20
Dado bruto significa que os dados não estão numericamente
organizados e processados. O processamento e a organização
dos dados é que os transformam em informação, enfatizando
seus aspectos mais importantes. A informação, portanto, é
resultado de um tratamento dos dados.
25
Para organizar e processar os dados estatísticos, podemos
utilizar resumos visuais e numéricos, através de gráficos, mapas,
tabelas e modelos numéricos.
A mensuração ou a observação de itens como índices de
preços, renda mensal per capita de um Estado, etc., dão origem
30 aos dados estatísticos. Como esses itens originam valores que
tendem a apresentar um certo grau de variabilidade quando são
medidos sucessivas vezes, chamamos então de variáveis.
É importante identificar os quatro
tipos de variáveis: variáveis contínuas,
variáveis discretas, variáveis nominais e
variáveis por posto.
9
Unidade I
I. Variáveis contínuas: são as variáveis que podem assumir
qualquer valor num intervalo contínuo (dado contínuo).
Exemplos: altura, peso, velocidade, etc.
II. Variáveis discretas: em geral originam-se da contagem
5 de itens e só podem assumir valores inteiros. Exemplos: número
de alunos em sala de aula, número de professores que trabalham
na escola, etc.
III. Variáveis nominais: são aquelas que existem com o
objetivo de definir categorias, e as observações, mensurações e
10 análises são feitas levando-se em conta essas mesmas categorias.
Exemplos de categorias seriam: a separação por sexo, idade,
nível de escolaridade, etc.
IV. Variáveis por posto: quando existe o desejo de dispor
os elementos observados segundo uma ordem de preferência
15 ou desempenho, atribuem-se valores relativos para indicar esta
ordem. Exemplo: primeiro, segundo, terceiro.
As variáveis discretas e contínuas são ditas variáveis
quantitativas porque envolvem dados numéricos. Já as
variáveis nominais e por posto precisam ser transformadas em
20 valores numéricos para serem objeto da análise estatística, e
são ditas variáveis qualitativas.
1.6 Formas iniciais de tratamento dos dados
Em geral, quando nos propomos a buscar, construir
informações a partir de dados, deparamo-nos, inicialmente, com
um conjunto de dados brutos que pouco nos dizem. É preciso
25 organizá-los minimamente para que eles comecem a fazer
algum sentido, viabilizando sua análise.
Uma primeira forma de organização dos dados é o chamado
rol. Obtemos o rol quando organizamos os dados brutos em
ordem crescente ou decrescente de grandeza. A amplitude do
10
• variáveis discretas e contínuas =
variáveis quantitativas;
• variáveis nominais e por posto =
variáveis qualitativas.
ESTATÍSTICA APLICADA
rol é obtida pela diferença entre o maior e o menor número do
rol. Utiliza-se o rol quando o conjunto de dados for pequeno, ou
seja, for inferior a 30 observações.
Por outro lado, quando se trata de um conjunto grande
5 de dados, que seja superior a 30 observações, utilizamos a
distribuição de frequências, que consiste em organizar os
dados brutos em classes, a fim de identificar o número de itens
pertencentes a cada classe, denominado frequência de classe.
Os dados são assim organizados em intervalos de classes. Este
10 assunto será estudado no módulo II.
• rol inferior a 30 observações;
• distribuição de frequências superior a
30 observações.
1.7 Notação por índices
A notação por índices é bastante utilizada na estatística,
sendo assim importante esclarecer seu significado. O símbolo xi
(onde se lê “x índice i”) irá representar qualquer um dos n valores
assumidos pela variável x, x1,x2,x3,x4,...,xn. “n” é denominado índice
15 e poderá assumir qualquer dos números entre 1, 2, 3, 4, ..., n.
1.7.1 Notação sigma (∑)
A maioria dos processos estatísticos vai exigir o cálculo da
soma de um conjunto de números. A letra maiúscula grega
sigma (∑) é utilizada para representar essas somas.
Assim, se uma determinada variável y tiver os valores 3, 5, 7,
20 9 e 11, o ∑y será:
∑y = 3+5+7+9+11
∑y = 35
Por outro lado, se o consumo semanal de arroz de x, durante
um mês, foram 2kg,4kg, 3kg, 5kg, o total consumido por x no
25 mês teria sido:
∑x = 2+4+3+5
∑x = 14; x teria consumido 14kg de arroz durante o mês
referido.
11
Unidade I
A notação sigma possui algumas propriedades que
precisamos desenvolver, para facilitar os conteúdos que
estudaremos nesta disciplina.
n
a) ∑ i=1 x = ∑ xi = ∑ x ; isso significa que devemos somar
5 as n observações de x, começando com a primeira.
Por exemplo, num conjunto de dados em que xi={2,4,6,8,10,12},
onde n=6, temos:
n
6
∑ i=1xi = ∑ i=1xi = 2 + 4 + 6 + 8 + 10 + 12
∑ xi = 42
10
Por outro lado, é possível utilizar essa notação quando
se pretende analisar a soma de apenas uma parte dos dados
disponibilizados, podendo-se, portanto, abreviar a soma de um
conjunto de dados. Desta forma, podemos ter:
3
I) x1 + x2 + x 3 = ∑ i=1 xi
15
11
II) x8 + x 9 + x10 + x11 = ∑ i=8 xi
b) Se cada valor da variável x é multiplicado ou dividido por
uma constante, temos que isso será igual ao valor da constante
multiplicado ou dividido pela somatória de x.
∑ c.x = c.∑ x
20
Assim,
4
∑ 4 xi = 4 x1 + 4 x2 + 4 x3 + 4 x4
i=1
4
= 4( x1 + x2 + x 3 + x 4 ) = 4 ∑ xi
i=1
12
ESTATÍSTICA APLICADA
Por exemplo:
se xi={2,4,6,8,10,12}; onde n=6 e cada valor de x é multiplicado
pela constante c=2, temos:
∑ cx = c∑ x
5
6
6
i=1
i=1
∑ cxi = c∑ xi =2(2) + 2(4) + 2(6) + 2(8) + 2(10) + 2(12) =
= 2(2 + 4 + 6 + 8 + 10 + 12)
6
6
i=1
i=1
∑ 2xi = 2∑ xi = 2(42) = 84
c) O somatório de uma constante c será igual ao produto
da constante pelo número de vezes (n) que ela se repete. Assim,
10 temos:
n
∑ ci = nc
i=i
Por exemplo, se numa determinada observação o conjunto
de dados de xi={7,7,7,7,7,7}, onde n=6, temos que xi é uma
constante c que se repete. Então temos:
15
xi = ci
6
6
i=1
i=1
∑ xi = ∑ ci = nc = 7 + 7 + 7 + 7 + 7 + 7 = 6(7) = 42
d) O somatório de uma soma ou de uma diferença de duas
variáveis será igual à soma ou à diferença dos somatórios
individuais das duas variáveis. Assim, temos:
20
n
n
n
i=1
n
i=1
n
i=1
n
i=1
i=1
i=1
∑ ( xi + yi ) = ∑ xi + ∑ yi
∑ ( xi − yi ) = ∑ xi − ∑ yi
13
Unidade I
Por exemplo:
i
1
2
3
4
∑
X
8
3
4
5
20
Y
5
2
0
4
11
(X-Y)
3
1
4
1
9
∑ (x − y) = 9
∑ x − ∑ y = 20 − 11 = 9
e) O somatório de um conjunto de dados xi ao quadrado nos
obriga a elevar cada elemento de xi ao quadrado para efetuar a
soma. Assim, temos:
5
n
∑ xi2 = x12 + x22 + x23 + ... + xn2
i=1
Por exemplo, se numa dada observação o conjunto de dados
de xi={2,4,6,8,10}, onde n=5, temos:
5
∑ xi2 =22 +42 +62 +82 +102 =4+16+36+64+100=220
i=1
f) O somatório ao quadrado de um conjunto de dados será
10 obtido tomando-se a soma dos valores de xi e elevando-se ao
quadrado. Assim, temos:
n
( ∑ xi )2 = ( x1 + x2 + x 3 + ... + xn )2
i=1
Por exemplo, se temos um mesmo conjunto xi={2,4,6,8,10},
onde n=5, tal qual no exemplo do item e, teremos um resultado
15 distinto. Vejamos, neste caso:
5
( ∑ xi )2 = (2 + 4 + 6 + 8 + 10)2 = (30)2 = 900
i=1
14
Esta notação se encontra em
livros de matemática. Busque outros
exemplos.
ESTATÍSTICA APLICADA
1.8 Séries estatísticas – simples e compostas
Uma série estatística define-se como toda e qualquer
coleção de dados estatísticos referidos a uma mesma ordem
de classificação: quantitativa. No sentido mais amplo, série é
uma sucessão de números referidos a qualquer variável. Se os
5 números expressarem dados estatísticos, a série será chamada
de série estatística.
Em sentido mais estreito, pode-se dizer que uma série
estatística é uma sucessão de dados estatísticos referidos a
caracteres qualitativos, ao passo que uma sucessão de dados
10 estatísticos referidos a caracteres quantitativos configurará uma
serração. Em outros termos, a palavra série é usada normalmente
para designar um conjunto de dados dispostos de acordo com
um caráter variável, residindo a qualidade serial na disposição
desses valores, e não em uma disposição temporal ou espacial de
15 indivíduos. As tabelas servem para apresentar séries estatísticas;
os três caracteres presentes na tabela que as apresenta são:
• a época (fator temporal ou cronológico) – a que se refere
o fenômeno analisado;
20
• o local (fator espacial ou geográfico) – onde o fenômeno
acontece;
• o fenômeno (espécie do fato ou fator especificativo) – que
é descrito.
As séries são divididas em dois grupos:
25
• séries homógradas: aquelas em que a variável descrita
apresenta variação discreta ou descontínua. São séries
homógradas a série temporal, a série geográfica e a série
específica.
• séries heterógradas: aquelas nas quais o fenômeno
ou o fato apresenta gradações ou subdivisões. Embora
15
Unidade I
fixo, o fenômeno varia em intensidade. A distribuição de
frequências é uma série heterógrada.
1.8.1 Tipos de séries estatísticas
As séries estatísticas diferenciam-se de acordo com a
variação de um dos três elementos: época, local e fenômeno.
5
 Série temporal
Também chamada de série cronológica, série histórica, série
evolutiva ou marcha, identifica-se pelo caráter variável do fator
cronológico. Assim, deve-se ter:
• elemento variável: época
10
• elementos fixos: local e fenômeno
Exemplo:
Tabela 1.1
Operadora WKX – Venda de bilhetes aéreos – Mercado
Interno - 1995
Meses
Janeiro
Fevereiro
Março
Abril
Maio
Junho
Julho
Agosto
Setembro
Outubro
Novembro
Dezembro
TOTAL ANUAL
16
Vendas ( em milhares de reais)
2300
1800
2200
2210
2360
2600
2690
3050
3500
3440
3100
2760
31510
Fonte: Departamento de Análise de Mercado
ESTATÍSTICA APLICADA
 Série geográfica
Também chamada de série territorial, série espacial ou
série de localização, identifica-se pelo caráter variável do fator
geográfico. Assim, deve-se ter:
5
• elementos variável: local;
• elementos fixos: época e fenômeno.
Exemplo:
Tabela 1.2
Operadora WKX - Vendas por Unidade da Federação – 2008
Unidades da Federação
Minas Gerais
Paraná
Rio Grande do Sul
Rio de Janeiro
São Paulo
Outros
TOTAL BRASIL
10
Vendas (em milhares de reais)
4000
2230
6470
8300
10090
420
31510
Fonte : Departamento de Análise de Mercado
 Série específica
Também chamada de série categórica, série por categoria,
identifica-se pelo caráter variável de fator especificativo. Assim,
deve-se ter:
• elemento variável: fenômeno;
15
• elementos fixos: local e época.
Exemplos:
Tabela 1.3
Operadora WKX - Venda de bilhetes aéreos por Linha – 2008
Linha do produto
Linha A
Linha B
Linha C
TODAS AS LINHAS
Vendas (em milhares de reais)
6450
9310
15750
31510
Fonte : Departamento de Análise de Mercado
17
Unidade I
Tabela 1.4
Número de empregados das várias classes de salários no estado
de São Paulo – 2008
Classes de salários (R$)
Número de empregados
Até 80
41.326
123.236
De 80 a 119
De 120 a 159
428.904
De 160 a 199
324.437
De 200 a 399
787.304
De 400 a 599
266.002
De 600 a 799
102.375
De 800 a 999
56.170
1000 e mais
103.788
TOTAL
2.233.542
Fonte: Serviço de Estatística da Previdência e Trabalho – (dados alterados para
melhor compreensão)
1.8.2 Tabelas de dupla entrada
As tabelas apresentadas anteriormente são tabelas estatísticas
5 simples, em que apenas uma série está representada. É comum,
todavia, haver necessidade de apresentar, em uma única tabela,
mais do que uma série. Quando as séries aparecem conjugadas,
tem-se uma tabela de dupla entrada.
Exemplos:
10
A) Série específico-temporal.
B) Série geográfico-temporal.
Tabela 1.5
População economicamente ativa por setor de atividades – Brasil
Setor
18
População (1000 hab.)
1940
1950
1960
Primário
8.968
10.255
12.163
Secundário
1.414
2.347
2.962
Terciário
3.620
4.516
7.525
Fonte : IPEA
ESTATÍSTICA APLICADA
Tabela 1.6
População indígena brasileira
Unidade de produção
Produção
1937
1938
1939
Acre
5.007
4.765
4.727
Amazonas
6.858
5.998
5.631
Pará
4.945
4.223
4.500
Mato Grosso
1.327
1.285
1.235
Outros estados
333
539
337
Fonte : Anuário Estatístico do Brasil – IBGE (dados alterados para melhor
compreensão)
Observação:
 Nem sempre uma tabela representa uma série estatística.
5 Por vezes, os dados reunidos não revelam uniformidade, sendo
meramente um aglomerado de informações gerais sobre
determinado assunto, as quais, embora úteis, não apresentam a
consistência necessária para se configurar uma série estatística.
Exemplo:
10
Tabela 1.7
Situação dos espetáculos cinematográficos no Brasil – 1967
Especificação
Número de cinemas
Lotação dos cinemas
Sessões por dia
Filmes de longa metragem
Meia entrada
Dados numéricos
2.488
1.722.348
3.933
131.330.488
89.581.234
Fonte : Anuário Estatístico do Brasil – IBGE
19
Unidade I
1.9 Apresentação de dados - gráficos e tabelas
A representação gráfica das séries estatísticas tem por
finalidade representar os resultados obtidos, permitindo
chegar-se a conclusões sobre a evolução do fenômeno ou
sobre como se relacionam os valores da série. A escolha do
5 gráfico mais apropriado ficará a critério do analista. Contudo,
os elementos simplicidade, clareza e veracidade devem ser
considerados quando da elaboração de um gráfico.
Diretrizes para a construção de um gráfico:
10
• o título do gráfico deve ser o mais claro e completo possível.
Sendo necessário, acrescentem-se subtítulos;
• a orientação geral dos gráficos deve ser da esquerda para
a direita;
• as quantidades devem ser representadas por grandezas
lineares;
15
• sempre que possível, a escala vertical há de ser escolhida
de modo a aparecer a linha 0 (zero);
• só devem ser inclusas no desenho as coordenadas
indispensáveis para guiar a vista na leitura. Um tracejado
muito cerrado dificulta o exame do gráfico;
20
• a escala horizontal deve ser lida da esquerda para a direita,
e a vertical, de baixo para cima;
• os títulos e marcações do gráfico dispor-se-ão de maneira
que sejam facilmente legíveis, partindo da margem
horizontal inferior ou da margem esquerda.
20
ESTATÍSTICA APLICADA
Leitura e interpretação de um gráfico:
• declarar qual o fenômeno ou fenômenos representados, a
região considerada, o período de tempo, a fonte dos dados,
etc.;
5
10
• examinar o tipo de gráfico escolhido, verificar se é o mais
adequado, criticar a sua execução, no conjunto e nos
detalhes;
• analisar cada fenômeno separadamente, fazendo notar
os pontos mais em evidência, o máximo e o mínimo, as
mudanças mais bruscas;
• investigar se há uma “tendência geral” crescente ou
decrescente ou, então, se o fato exposto é estacionário;
• procurar descobrir a existência de possíveis ciclos periódicos,
qual o período aproximado, etc.
15
Eis os tipos mais comuns de gráficos:
Gráfico em linhas
500
400
300
Sequência 1
Sequência 2
200
100
0
1
2
3
4
5
6
7
Gráfico em colunas
População
100
80
60
40
20
0
População
1940
1950
1960
1970
21
Unidade I
Gráfico em barras
É semelhante ao gráfico em colunas, porém, os retângulos
são dispostos horizontalmente.
População do Brasil
1970
1960
População
do Brasil
1950
1940
0
20
40
60
80
100
Gráfico em setores
Anos
Receita (em R$ 1.000.000,00)
1975
90
1976
120
1977
150
360
Fonte: Departamento da Fazenda, Município X.
Total
5
É a representação gráfica de uma série estatística, em
círculo, por meio de setores . É utilizado principalmente quando
se pretende comparar cada valor da série com o total.
Total __________360º
Parte___________ xº
10
15
22
• Para 1975:
360 - 360º
90 - xº
x = 90º
• Para 1976:
360 - 360º
120 - xº
x = 120º
ESTATÍSTICA APLICADA
• Para 1977:
360 - 360º
150 - xº
x = 150º
Receita do Município X
1975
1976
1977
Gráfico polar
5
É a representação de uma série por meio de um polígono.
Movimento mensal de compras de uma agência em 1972
Meses
Valores (R$1.000,00)
Janeiro
Fevereiro
Março
Abril
Maio
Junho
Julho
Agosto
Setembro
Outubro
Novembro
Dezembro
12
13
14
12
15
19
17
18
14
16
12
18
Dez
Nov
Out
Jan
20
15
10
5
0
Fev
Mar
Abr
Mai
Set
Ago
Jul
Sequência 1
Resumindo:
• a estatística utiliza métodos
matemáticos
para
solucionar
problemas reais de tomada de
decisão quando há incerteza;
• em situações nas quais poderíamos
contar unicamente com a sorte,
temos um instrumento que nos
possibilita aumentar as chances de
tomar a melhor decisão;
• utiliza ferramentas matemáticas
definidas. Mesmo lidando com
um grande número de dados, essas
ferramentas resumem a análise em
tabelas ou gráficos;
• na prática, a estatística pode ser
empregada como base conceitual
e fundamental em várias outras
ciências, inclusive em análises
gerenciais.
Jun
23
Unidade I
2 MEDIDAS DE TENDÊNCIA CENTRAL: MÉDIA,
MODA E MEDIANA PARA DADOS SIMPLES
Na realização de qualquer estudo, quase nunca é possível
examinar todos os elementos da população de interesse. Temos
usualmente de trabalhar com uma amostra da população.
A inferência estatística nos dá elementos para generalizar,
5 de maneira segura, as conclusões obtidas da amostra para a
população.
É errôneo pensar que, caso tivéssemos acesso a todos os
elementos da população, seríamos mais precisos. Os erros
de coleta e manuseio de um grande número de dados são
10 maiores do que as imprecisões a que estamos sujeitos quando
generalizamos, via inferência, as conclusões de uma amostra
bem selecionada.
Em se tratando de amostra, a preocupação central é que ela
seja representativa.
15
Assim que decidimos obter informações através de um
levantamento amostral, temos imediatamente dois problemas:
• definir cuidadosamente a população de interesse;
• selecionar a característica que iremos pesquisar.
Portanto, temos situações profissionais em que nos bastam
20 poucos dados ou estatísticas de dados simples. Por outro
lado, há também situações nas quais um número maior de
elementos deve ser investigado e tratado como distribuições
de frequência.
Quando estamos diante de um conjunto de dados, seja ele
25 pequeno ou grande, em geral, buscamos medidas que possam
ser usadas para indicar um valor que tende a representar melhor
aquele determinado conjunto de números. E as medidas mais
24
ESTATÍSTICA APLICADA
usadas neste sentido são as chamadas medidas de tendência
eventual ou central, que são a média, mediana e moda.
Sabe-se que estes valores serão medidos de forma distinta
conforme um grande conjunto de dados ou um pequeno
5 conjunto de dados. Também o cálculo desses valores irá ser
afetado caso as variáveis sejam discretas ou contínuas.
Distribuição por frequência é a tabela em que se resumem
grandes quantidades de dados, determinando o número de
vezes que cada dado ocorre (frequência) e a porcentagem com
10 que aparece (frequência relativa).
Em estatística a média é o valor
médio de uma distribuição ou de
um conjunto de dados, determinado
segundo uma regra estabelecida a priori
e que se utiliza para representar todos
os valores da distribuição. Existem
diversas formas de se calcular a média
de um conjunto de números. Por
exemplo, algumas delas são: aritmética,
geométrica e harmônica.
ATENÇÃO: neste módulo, trataremos do cálculo destas
estatísticas para os chamados dados simples ou conjuntos
de dados com menos que 30 elementos.
2.1 A média aritmética simples (µ,x)
A média aritmética é um dos valores mais representativos de
15 um conjunto de dados. Obtém-se o valor da média aritmética
dividindo-se o somatório dos valores do conjunto de dados pelo
número de valores total deste conjunto.
Assim, temos que:
n
média =
∑ xi
i=1
n
Para a população, calcula-se a média aritmética utilizando-se
20
os seguintes parâmetros:
µ ⇒ Média aritmética da população (parâmetro)
N
µ=
∑ Xi
i=i
N
N ⇒ Total de observações da população (total da
, onde
população)
Xi ⇒ Cada variável populacional
25
Unidade I
Para a amostra, calcula-se o valor médio utilizando-se os
seguintes parâmetros:
x ⇒ Média aritmética da amostra (estimativa)
n
x=
∑ xi
i=1
, onde
n
n ⇒ Número de dados da amostra
xi ⇒ Cada variável da amostra
Embora tenhamos destacado uma
diferença na notação utilizada para o
cálculo da média aritmética em uma
amostra e numa população, a expressão
para o cálculo da média é a mesma,
tanto no cálculo da média de uma
população quanto de uma amostra.
Vamos agora tomar um exemplo de média aritmética.
Supondo um conjunto de dados xi = {2,4,6,8,10,12}, onde N=6,
5 temos:
N
µ=
∑ Xi
i=1
N
=
2 + 4 + 6 + 8 + 10 + 12
=7
6
Para simplificar o nosso estudo, padronizaremos a notação
para o cálculo da média, e passaremos a utilizar sempre a
notação utilizada para o cálculo da média aritmética simples
10 em conjuntos de dados amostrais, como no exemplo abaixo:
Uma amostra das notas das provas de matemática dos
estudantes da sétima série de uma grande escola de São Paulo:
xi, onde xi = {87,42,64,58,90,90,85,63,47,74,100,94} e n=12,
temos:
n
15 x =
∑ xi
i=1
n
=
87+42+64+58+90+90+85+63+47+74+100+94
=74,5
12
A nota média na prova de matemática dos estudantes da
sétima série desta escola de São Paulo, por amostragem, é 74,5.
São propriedades da média aritmética:
20
26
a) Em um conjunto de dados, é sempre possível o cálculo
da média, independentemente de quais os elementos
que compõem esse conjunto de dados.
São as propriedades que a média
aritmética simples possui que a fazem a
medida de tendência central mais usada
e mais importante de todas.
ESTATÍSTICA APLICADA
b) Em um determinado conjunto de dados, o valor da
média será único e corresponderá a uma constante.
5
c) Todos os valores de um determinado conjunto de
dados irão afetar a média. Se um valor se modifica, a
média aritmética também irá modificar-se.
10
d) Somando-se ou subtraindo-se uma determinada
constante c a cada elemento de um determinado
conjunto de dados xi = x1,x2,x3,...,xn, a média aritmética
ficará aumentada ou diminuída desta constante c. Se,
por outro lado, multiplicarmos cada elemento deste
conjunto de dados por uma constante c, a nova média
será também multiplicada por esta constante c; se
dividirmos cada elemento do conjunto de dados por
esta mesma constante c, a média será dividida por c.
15
Assim, se temos um conjunto xi = x1,x2,x3,...,xn, a média será:
n
x1 =
∑ x1
i=1
n
, logo
n
x2 =
20
∑ (c + x i )
i=1
n
n
⇒ x2 =
∑ xi
i=1
n
+
nc
⇒ x2 = x1 + c
n
e) A soma algébrica dos desvios dos números de um
conjunto de dados em torno da média é zero. Isto
pode ser representado da seguinte forma:
∑ xi − x = 0
Por exemplo, se temos um conjunto de dados xi = 2,4,6,8,10,
onde n=5, temos que :
5
x=
∑ xi
i=1
5
=
2 + 4 + 6 + 8 + 10
=6
5
27
Unidade I
Se aplicarmos a fórmula acima, temos:
∑ xi − x = ∑ xi -6=(2-6)+(4-6)+(6-6)+(8-6)+(10-6)
∑ xi -x=-4-2+0+2+4
∑ xi -x=0
2.2 A média aritmética ponderada
5
Num conjunto de dados em que cada elemento ou cada
observação possua a mesma importância, o cálculo da
média aritmética simples mostrará bem a população ou a
amostra estudada. Mas se queremos atribuir pesos distintos
ou importâncias distintas aos elementos de um conjunto
10 de dados, a estatística a ser adotada é a média aritmética
ponderada, em que a cada valor xi deverá ser atribuído um
determinado peso wi. A expressão estatística para o cálculo
da média ponderada é:
n
xp =
∑ wixi
i=1
n
∑ wi
i=1
15
Supondo que um estudante tenha que efetuar uma série de
4 exames para obter sua média final para passar de ano. Cada
exame possui um peso diferente na composição desta média,
conforme a tabela abaixo:
Exame
1
2
3
4
28
Nota
68
89
45
100
Peso
0,30
0,20
0,40
0,10
1,00
A média aritmética é a mais utilizada
no nosso dia-a-dia. É obtida dividindose a soma das observações pelo
número delas.
ESTATÍSTICA APLICADA
n
xp =
∑ wixi
i=1
n
,logo
∑ wi
i=1
xp =
(0, 30)68 + (0, 20)89 + (0, 40)45 + 0,10(100)
0, 30 + 0, 20 + 0, 40 + 0,10
xp = 20, 4 + 17, 8 + 18 + 10 = 66, 2
Num conjunto de dados em que cada
elemento ou cada observação possua
importância diferente, utilizamos a
média aritmética ponderada.
A nota média será então 66,2, resultado diferente do que
seria obtido se utilizássemos a média aritmética simples.
Exemplificando média aritmética e ponderada:
5
• um aluno tirou as notas 5, 7, 9 e 10 em quatro provas. A
sua média será (5 + 7 + 9 + 10) / 4 = 7,75;
10
• um aluno fez um teste (peso 1) e uma prova (peso 2),
tirando 10 no teste e 4 na prova. A sua média (ponderada)
será (10 + 2 x 4) / 3 = 6. Se o teste e a prova tivessem
mesmo peso (e não importa qual o valor do peso, importa
apenas a relação entre os pesos), a média seria 7.
2.3 A mediana
Uma outra medida importante de um conjunto de dados é
a mediana.
A mediana divide um determinado conjunto de dados,
que deverá estar ordenado, em dois grupos iguais, em que
15 metade terá valores menores que a mediana e metade terá
valores maiores que a mediana.
Antes de calcular a mediana, é preciso organizar os valores em
um rol em ordem crescente, para então contar até a metade dos
29
Unidade I
valores para encontrar a mediana. Em geral, após organizarmos
os dados em um rol, podemos calcular a posição da mediana
com a fórmula abaixo:
(n + 1) ,
posmed =
2
5
onde n é o número de dados observados.
Por exemplo, para um conjunto de dados xi = {6,9,3,5,2,9,
5,5,8,7,1,7,2}, onde n=13, temos primeiro que organizar estes
dados em um rol, depois encontrar a posição da mediana e
então saber qual será a mediana. Vejamos:
10
rolxi = {1,2,2,3,5,5,5,6,7,7,8,9,9}
posição mediana =
(n + 1) 13 + 1
=
=7
2
2
mediana = 5
Para um conjunto de dados xi={6,4,8,3,2,9,7,1}, onde n=8,
temos, então:
15
rolxi = {1,2,3,4,6,7,8,9}
posição mediana =
(n + 1) 8 + 1
=
= 4, 5
2
2
A mediana será o valor que está a meio caminho dos dois
valores médios; neste caso, entre 4 e 6. Como fazer? Deve-se
tirar a média entre os dois valores do meio para obter o valor da
20 mediana. Assim, temos:
mediana =
30
4+6
=5
2
A mediana é outra medida de posição
definida como o número que se encontra
no centro de uma série de números,
estando estes dispostos segundo uma
ordem. Em outras palavras, a mediana de
um conjunto de valores, ordenados, é
o valor situado de tal forma no conjunto
que o separa em dois subconjuntos de
mesmo número de elementos.
Obs.: - se o número de elementos for
ímpar, então a mediana será exatamente o
valor “do meio”;
- se o número de elementos for
par, então a mediana será exatamente a
média “dos dois valores do meio”.
Para determinar a mediana:
• organize o conjunto de dados em
um rol;
• para um conjunto de dados cujo n
= ímpar, a mediana será o valor do
meio;
• para um conjunto de dados cujo n
= par, a mediana será a média dos
dois valores do meio.
ESTATÍSTICA APLICADA
Quando usamos a mediana?
Empregamos a mediana quando:
• desejamos obter o ponto que divide a distribuição em
partes iguais;
5
• há valores extremos que afetam de uma maneira acentuada
a média;
• a variável em estudo é salário.
2.4 A moda
Muitas vezes, em um conjunto de dados, existem valores
que se repetem com uma frequência maior. A moda é
10 justamente este valor ou estes valores que mais se
repetem em um conjunto de dados. É possível haver
estatísticas que não possuam moda ou que possuam mais de
uma moda.
No exemplo que demos acima, para um conjunto de dados
15 xi={1,2,3,4,6,7,8,9}, não existe moda e diz-se que o conjunto ou
distribuição é amodal.
A moda é uma estatística muito mais descritiva, e sua
importância cresce na medida em que um valor ou grupo
de valores se repete mais que outros; neste sentido, a moda
20 indicaria o valor “típico” daquele conjunto de dados com maior
ocorrência.
Então, em teoria da probabilidade
e em estatística, a mediana é
uma medida de tendência central, um
número que caracteriza as observações
de uma determinada variável de tal
forma que este número (a mediana) de
um grupo de dados ordenados separa a
metade inferior da amostra, população
ou probabilidade de distribuição, da
metade superior. Mais concretamente,
1/2 da população terá valores inferiores
ou iguais à mediana e 1/2 da população
terá valores superiores ou iguais à
mediana.
Em casos de populações (n) ímpares,
a mediana será o elemento central
(n+1)/2. Para os casos de populações
(n) pares, a mediana será o resultado
da média simples dos elementos n/2 e
(n/2)+1.
Para a seguinte população: 1, 3, 5, 7,
9 – a mediana é 5 (igual à média); no
entanto, para a população 1, 2, 4, 10,
13, a mediana é 4 (enquanto a média
é 6). Para populações pares: 1, 2, 4, 7, 9,
10 – a mediana é (4+7)/2, que é 5,5.
Por exemplo, o conjunto de dados xi={2,2,7,9,9,9,10,10,11,12,18}
tem moda igual a 9, porque o número 9 é aquele com maior
frequência, repetindo-se três vezes.
25
Repetindo: denominamos moda, de um conjunto de dados,
o valor (ou valores) que ocorre com maior frequência.
31
Unidade I
Por exemplo: o salário modal dos empregados de uma
indústria é o salário mais comum, isto é, o salário recebido pelo
maior número de empregados dessa indústria.
Exemplo:
5
Sabendo-se que a produção leiteira diária da vaca A, durante
uma semana, foi de 10, 14, 13, 15, 16, 18 e 12 litros, encontre
a média, a moda e a mediana para a produção diária de leite
desta vaca.
Média:
10
x=
i=1
n
=
10 + 14 + 13 + 15 + 16 + 18 + 12 98
=
= 14
7
7
Logo, x = 14 litros de leite em média por dia, que representa
uma produção de 98 litros de leite em média por semana.
Obs.: a média pode ser um número diferente de todos os
valores da amostra que ela representa.
15
Moda: como não existe um valor que aparece com maior
frequência que os outros, não há valor de moda para este
exemplo.
Mediana: ordenando os dados, temos:
10 12 13 14 15 16 18
20
32
A moda de {maçã, maçã, banana,
laranja, laranja, laranja, pêssego} é
laranja.
A série {1, 3, 5, 5, 6, 6} apresenta
duas modas (bimodal): 5 e 6.
n
∑ xi
Em estatística descritiva, a
moda é o valor que detém o maior
número de observações, ou seja, o valor
ou valores mais frequentes. A moda não
é necessariamente única, ao contrário da
média ou da mediana. É especialmente
útil quando os valores ou observações
não são numéricos, uma vez que a
média e a mediana podem não ser bemdefinidas.
Desta forma, o valor mediano é o valor central dos dados,
ou seja, 14 litros de leite por dia.
A série {1, 3, 2, 5, 8, 7, 9} não apresenta
moda.
ESTATÍSTICA APLICADA
3 MEDIDAS DE DISPERSÃO PARA DADOS
SIMPLES
Vimos que a moda, a mediana e a média podiam ser usadas
para resumir, num único número, aquilo que é “médio” ou
“típico” de um conjunto de dados. Mas a informação contida
fornecida pelas medidas de posição necessita, em geral, ser
5 complementada pelas medidas de dispersão. Estas servem para
indicar o quanto os dados se apresentam dispersos em torno
da região central. Caracterizam, portanto, o grau de variação
existente no conjunto de valores. As medidas de dispersão que
nos interessam são:
10
• a amplitude total;
• o desvio padrão;
• a variância;
• o coeficiente de variação.
Observe que: quanto maior as medidas de dispersão, mais
15 heterogêneos são os dados, e ao contrário, quanto menor essas
medidas, mais homogêneo o conjunto.
Para ilustrar a necessidade de conhecermos as medidas de
dispersão de um conjunto de dados, iremos introduzir alguns
exemplos.
20
Exemplo 1:
Sabe-se que em Honolulu (Havaí) e Houston (Texas) a
temperatura média diária é quase a mesma, em torno de
aproximadamente 23,9ºC. Pergunta-se: será que, por isso,
podemos admitir que a temperatura é basicamente a mesma
25 em ambas as localidades? Ou não será possível que enquanto
uma cidade é melhor para natação a outra o seja para atividades
externas?
33
Unidade I
Sabemos que a temperatura em Honolulu varia muito
pouco ao longo do ano, oscilando, em geral, entre 21,1ºC
e 26,7ºC. Por outro lado, a temperatura em Houston
pode diferir sazonalmente (nas estações do ano), isto é,
5 apresentar-se baixa em janeiro (cerca de 4,4ºC) e alta em
julho e agosto (bem perto de 37,8ºC). Desnecessário dizer
que as praias em Houston não estão abarrotadas de gente
o ano todo!
Exemplo 2:
Suponham que, numa particular cidade, tanto ladrões
quanto professores secundários tenham uma renda média
mensal de R$ 900,00. Será que essa informação indica
que as duas distribuições de renda são necessariamente
semelhantes? Muito ao contrário, poder-se-ia descobrir que
15 elas diferem, e muito, num outro aspecto importante, que é
o fato de as rendas dos professores concentrarem-se ao redor
de R$ 900,00 (serem constantes, homogêneas), enquanto
que as dos ladrões espalham-se mais (são descontínuas,
heterogêneas), o que reflete, portanto, maiores oportunidades
20 para prisões, desemprego, pobreza e, em alguns casos, fortunas
excepcionais.
10
Tais fatos demonstram que necessitamos, além de uma
medida de tendência central, de um índice que indique o grau
de dispersão dos dados em torno da média. Este “índice” é uma
25 medida indicativa do que costumamos chamar de variabilidade
(ou dispersão).
Voltando ao exemplo 1, poderíamos dizer que a
distribuição de temperatura em Houston (Texas) tem
maior variabilidade do que a distribuição de temperaturas
30 em Honolulu (Havaí). Da mesma forma, podemos dizer
que a distribuição de rendas entre professores apresenta
menos variabilidade do que a distribuição de rendas entre
ladrões.
34
ESTATÍSTICA APLICADA
Exemplo 3:
Considere os seguintes conjuntos de valores das variáveis X,
Y e Z:
5
X: 70, 70, 70, 70, 70.
Y: 68, 69, 70, 71, 72.
Z: 5, 15, 50, 120, 160.
Calculando a média aritmética de cada um desses conjuntos,
obtemos:
10
X = 70
Y = 70
Z = 70
Vemos, então, que os três conjuntos apresentam a mesma
média aritmética: 70; entretanto, é fácil notar que o conjunto
X é mais homogêneo que os conjuntos Y e Z. Para quantificar o
15 quão heterogêneos os dados são, precisamos encontrar algumas
medidas de posição.
Assim, quando se deseja entender, analisar e descrever de
forma adequada um determinado conjunto de dados, fazse necessário dispor não apenas de informações relativas às
20 medidas de posição, vistas no módulo anterior. É preciso que
se disponha de informações relativas à variabilidade (dispersão)
daqueles números que compõem o referido conjunto de dados.
Essas medidas de variabilidade ou dispersão indicam se os dados
observados estão próximos ou separados uns dos outros.
25
Diferente das medidas de posição, as medidas de dispersão
não são autoexplicativas; sua aplicabilidade depende da
comparação de populações ou amostras do mesmo tamanho e
mesmas características para que se obtenha alguma informação
importante a partir daquela determinada variabilidade.
Medidas de dispersão não são
autoexplicativas, dependem de suas
aplicações em tratamentos comparativos
de dados.
35
Unidade I
As principais medidas de dispersão são a amplitude total
(ou intervalo), o desvio médio, a variância e o desvio padrão. A
média serve de referência para todas essas medidas, exceto para o
intervalo (ou amplitude total). À proporção que essas medidas se
5 elevam, isto representa um aumento da dispersão. Isso significa
que se a medida for igual a zero, não existe dispersão.
As medidas de variabilidade que têm a média aritmética
como ponto de referência são importantes porque nos
permitem avaliar o grau de dispersão das observações em
10 relação a esta mesma média, isto é, permitem-nos avaliar
o quão distante os dados de um determinado grupo de
observações estão da média calculada, dando-nos uma
noção mais precisa da situação de determinada população ou
amostra e condições de tirarmos conclusões e informações
15 importantes daqueles dados disponíveis.
Exemplo 4:
Um estudante de Economia resolve fazer uma pesquisa
sobre os salários médios dos funcionários de determinado setor
industrial em São Paulo. Nesta pesquisa, o estudante conseguiu
20 os seguintes dados em termos de salários mínimos mensais:
xi={1.0;1.5;2.0;2.0;2.0;2.5;3.0;3.0;80.0;85.0}
Ao calcular o salário médio deste setor, ele chegou ao valor
médio de 18,2 salários mínimos por mês. Ora, mas este dado, sem
o cálculo de sua dispersão em relação à média aritmética, pouco
25 nos diz sobre a realidade desta população e acabamos por ter uma
visão distorcida do padrão de vida da maior parte dos funcionários
do setor analisado pelo estudante. As medidas de variabilidade
ou dispersão nos permitem perceber essa distorção.
Temos, como principais medidas de dispersão, intervalo,
30 desvio médio, variância e desvio padrão.
36
As medidas mais comuns de
variabilidade para dados quantitativos
são a variância; a sua raiz quadrada,
o desvio padrão; a amplitude total,
a distância interquantílica e o desvio
absoluto são mais alguns exemplos de
medidas de dispersão.
ESTATÍSTICA APLICADA
3.1 Amplitude total
O intervalo, ou amplitude total, de um determinado
conjunto de dados é obtido pela diferença entre o maior e
o menor valor neste conjunto de números. Indica, portanto,
a distância entre a maior e a menor observação de um conjunto
5 de dados. Assim, temos:
Amplitudetotal = Valormáximo ∼ Valormínimo
Por exemplo, em um conjunto de dados xi={2,3,3,5,5,5,8,10,1
2}, onde n=9, a amplitude total será:
Atotal = Vmáximo - Vmínimo ⇒ Atotal = 12-2 = 10
Em alguns casos, o intervalo ou amplitude total pode
ser expresso simplesmente pela indicação do menor e
do maior número do conjunto de dados. No caso do
exemplo anterior, a amplitude total poderia ser expressa
simplesmente pela identificação do menor e do maior
15 número, indicada como sendo de 2 a 12 ou 2-12.
10
A grande vantagem da amplitude total é que ela
apresenta uma certa facilidade de ser calculada, mesmo
quando o conjunto de dados observados é relativamente
grande. No entanto, como a amplitude total apenas leva
20 em conta os dois extremos do conjunto de números, em
alguns casos, ela pode ser uma medida enganosa quanto à
indicação da dispersão de um conjunto de números, tendo,
portanto, uma utilidade limitada.
O intervalo de um determinado
conjunto de dados é obtido pela
diferença entre o maior e o menor valor
neste conjunto de números.
3.2 Desvio médio absoluto
O desvio médio absoluto inaugura o estudo das medidas de
25 variabilidade que têm a média como ponto de referência.
37
Unidade I
O chamado “desvio” nada mais é que a diferença
entre cada valor de um determinado conjunto de
dados e a média deste mesmo conjunto de números (x i
- x). O valor absoluto de um número será ele próprio, sem
5 o sinal que lhe é associado, e é indicado por meio de duas
linhas verticais que o enquadram. Assim, |-67|=67;|9|=9.
É preciso calcular primeiro a média aritmética dos dados
disponíveis, que, em geral, apresentam-se como dados
amostrais.
10
O desvio médio absoluto será calculado pela média dos
desvios dos valores a contar da média, ignorando o sinal (+ ou
-) do desvio, ou seja, convertendo os valores dos desvios em
valores absolutos, considerando-os todos desvios positivos.
Assim, temos:
n
15
DDmØdio
=
médio
∑ xi − x
i=1
n
,
onde n é o número de observações.
Vamos agora tomar um exemplo de desvio médio. Para
um conjunto de dados amostrais xi=2,4,6,8,10,12, onde n=6,
determine o desvio médio. Temos então:
20
Dmédio=
∑ xi − x
n
Precisamos primeiro calcular a média, para então passarmos
ao cálculo do desvio médio. Relembrando a fórmula do cálculo
da média aritmética, temos:
x=
38
∑ xi ⇒ x = 2 + 4 + 6 + 8 + 10 + 12 = 7 ⇒ x = 7
n
6
ESTATÍSTICA APLICADA
Agora podemos calcular os desvios para cada valor do
conjunto de dados. Assim, temos:
xi - x
2-7
4-7
6-7
8-7
10-7
12-7
-5
-3
-1
1
3
5
0
=
médio =
D
∑ xi − x = -5 + -3 + -1 + 1 + 3 + 5
n
5+3+1+1+3+5
D
=
=3
médio =
6
D
=
médio
6
3
O valor encontrado acima representa a diferença média de
cada observação e a média da distribuição. Mas também neste
5 caso só seria possível obter mais informações a partir do desvio
médio comparando com outras populações ou amostras de
mesmas características.
Por exemplo, se um outro conjunto de dados, com
as mesmas características e tamanho, apresentasse um
10 desvio médio absoluto igual a 2,4, ou seja, menor que
o desvio médio absoluto calculado no exemplo acima,
poderíamos dizer que este segundo conjunto de valores
é mais homogêneo do que o nosso exemplo, já que a
diferença de cada um dos seus elementos em relação à
15 média aritmética é menor. Teríamos, assim, uma dispersão
menor.
O desvio é a diferença entre cada
valor de um determinado conjunto de
dados e a média deste mesmo conjunto
de números.
3.3 Variância
Tanto para o cálculo do desvio médio como para o cálculo
da variância precisaremos utilizar o desvio de cada elemento de
um conjunto de dados em relação à média aritmética (xi - x).
20 No entanto, ao invés de trabalharmos com os valores absolutos
(em módulo), agora os desvios são elevados ao quadrado antes
da soma. Para o caso de dados amostrais, ao invés de dividirmos
por n, dividimos por n-1 (que é o total da amostra menos uma
unidade).
39
Unidade I
A variância irá nos dizer o grau de dispersão de um
determinado grupo de dados com relação à média aritmética
desses números.
Assim, a variância populacional poderá ser calculada da
5 seguinte forma:
σ
2
( xi − µ )2
∑
, onde
=
N
A variância amostral poderá ser calculada pela fórmula que
se segue:
s2 =
10
∑ (xi − x)2 , onde
n −1
Por exemplo, seja um determinado conjunto de dados
xi = {1,3,5,7,9,11,13}, onde n=7. Calcule a variância deste
conjunto de dados, supondo:
a) que este conjunto de dados representa toda uma
população;
15
b) que este conjunto de dados representa uma amostra.
a) Para calcular a variância deste conjunto de dados,
considerando que ele representa toda uma população, devemos
utilizar a seguinte fórmula:
σ
40
2
( xi − µ )2
∑
=
, onde devemos considerar n=N.
N
Ao invés de trabalharmos com os
valores em módulo, agora os desvios
são elevados ao quadrado antes da
soma. Para o caso de dados amostrais,
ao invés de dividirmos por n, dividimos
por n-1.
ESTATÍSTICA APLICADA
Devemos passar ao cálculo da média deste conjunto de
dados, para então proceder ao cálculo da variância. Sendo assim,
temos:
µ=
∑ xi ⇒ µ= 1+3+5+7+9+11+13 =7
N
7
5 µ=7
(média populacional)
Partindo da média, podemos agora calcular os desvios, e então
partir para o cálculo da variância populacional, já que supomos
que o conjunto de dados representava toda a população. Assim,
temos:
10
µ
xi - µ
(xi - µ)2
7
7-1=6
62
7
7-3=4
42
7
7-5=2
22
7
7-7=0
0
7
7-9=-2
(-2)2
7
7-11=-4
(-4)2
7
7-13=-6
(-6)2
Σ�
0
112
σ
2
( xi − µ )2
∑
=
N
6 +42 +22 +(-2)2 +(-4)2 +(-6)2
σ =
7
36+16+4+4+16+36
σ2 =
=16
7
2
2
σ2 = 16
Assim, a variância populacional desse conjunto de dados
seria igual a 16.
b) Se, por outro lado, temos o mesmo conjunto de dados
e supondo que ele represente apenas dados amostrais,
devemos calcular a variância amostral de outra forma.
15 Devemos partir do cálculo da média, para então calcularmos
a variância.
41
Unidade I
Como vimos no módulo 2, a expressão para o cálculo da
média aritmética em uma amostra é a mesma do cálculo da
média para uma população, mas utilizaremos para as amostras
uma outra notação. Vejamos:
x=
5
∑ xi ⇒ x = 7 (média amostral)
n
Normalmente, a média amostral aproxima-se da média
populacional quanto maior o tamanho da amostra, mas não se
iguala a ela.
Passemos então ao cálculo da variância amostral. Utilizaremos
10 os mesmos passos do cálculo da variância populacional.
Desta forma:
s
2
( xi − x )2
∑
=
n −1
x
xi - x
(xi - x)2
7
7-1=6
62
7
7-3=4
42
7
7-5=2
22
( xi − x )2
∑
s =
2
n −1
7
7-7=0
0
7
7-9=-2
(-2)2
7
7-11=-4
(-4)2
7
7-13=-6
(-6)2
6 +42 +22 +(-2)2 +(-4)2 +(-6)2
s =
7-1
36+16+4+4+16+36 112
=
s2 =
7-1
6
Σ�
0
112
s2 =18,666...
2
2
A variância amostral deste conjunto de dados é igual a
18,666...
42
ESTATÍSTICA APLICADA
Como a média aritmética, a variância possui algumas
propriedades importantes que devemos colocar em
destaque e que facilitam o cálculo de alguns problemas mais
complexos.
5
a) Somando-se ou subtraindo-se uma constante a cada
elemento de um conjunto de dados, o valor da variância
não se altera.
Por exemplo, um conjunto de dados xi={2,4,6,8}, onde n=4,
e a média é igual a 5. A variância deste conjunto será dada como
10 segue:
σ
2
(xi -m)2
(2-5)2 +(4-5)2 +(6-5)2 +(8-5)2
∑
=
⇒ σ2 =
N
σ2 =
2
4
2
2
(-3) +(-1) +1+3 9+1+1+9 20
=
= =5
4
4
4
Se somarmos uma constante c=4 a cada um dos elementos
do conjunto de dados, temos um novo conjunto de dados
15 yi={6,8,10,12}, em que a média será igual a 9. A variância será
então:
σ22
∑ ( yi − µ2 )
=
σ22 =
N
2
(6-9)2 +(8-9)2 +(10-9)2 +(12-9)2
=
4
(-3)2 +(-1))2 +(1)+(3)2 9+1+1+9 20
=
= =5
4
4
4
Sendo assim, demonstramos que σ2 = σ22 , ou seja, ao
20 somarmos uma constante a cada elemento de um conjunto de
dados, a variância permanece a mesma.
b) Ao multiplicarmos uma constante c a cada elemento
de um conjunto de dados, temos uma nova variância ao
multiplicarmos a variância do conjunto de dados original
25 por c2.
43
Unidade I
Assim, a nova variância será representada da seguinte
forma:
σ22 = c2 .σ12
c) Ao dividirmos cada elemento de um conjunto de
5 dados por uma constante arbitrária c, obtém-se a nova
variância dividindo-se a antiga variância por c2.
Assim, podemos apresentar a nova variância da seguinte
forma:
σ22 =
10
σ12
c2
d) A variância de uma constante é igual a zero.
Existe uma fórmula alternativa e reduzida para o cálculo da
variância populacional, deduzida da fórmula original, que é:
σ
2
xi2
∑
=
− µ2
N
Para a variância amostral também existe uma fórmula
15 alternativa bastante utilizada e que não exige o cálculo da
média, que decorre da fórmula acima:
s2x
xi2 − ( ∑ xi )2
∑
=
n
n −1
3.4 Desvio padrão
Obtém-se o desvio padrão extraindo-se a raiz
quadrada da variância. Assim como a variância e o desvio
20 médio, o desvio padrão também representa uma medida
de variabilidade absoluta e indica o desvio de cada um dos
44
Relembrando as propriedades de
variância:
- ao somarmos uma constante a cada
elemento de um conjunto de dados,
a variância permanece a mesma;
- ao multiplicarmos uma constante c
a cada elemento de um conjunto de
dados, temos uma nova variância
ao multiplicarmos a variância do
conjunto de dados original por c2;
- ao dividirmos cada elemento de
um conjunto de dados por uma
constante arbitrária c, obtém-se a
nova variância dividindo-se a antiga
variância por c2;
- variância de uma constante é igual
a zero.
ESTATÍSTICA APLICADA
números xi de um dado conjunto de observações em relação à
média µ. É também chamado por alguns autores de desvio da
raiz média quadrática.
Matematicamente, o desvio padrão poderá ser representado
5 da seguinte forma:
Desvio padrão populacional:
∑ (xi − µ)2
σ=
N
Desvio padrão amostral:
s=
∑ (xi − x)2
n −1
Por exemplo, um conjunto de dados amostrais xi = {2,4,6},
onde n=3 e a média é igual a 4. Vamos então calcular o desvio
10 padrão para a amostra:
s=
s=
∑ (xi− x)2 =
n −1
(2 − 4 )2 + (4 − 4 )2 + (6 − 4 )2
=
3 −1
8
( −2)2 + 0 + 22
=
= 4 =2
2
2
Este conjunto de dados irá apresentar um desvio padrão
igual a 2.
15
As propriedades da variância também são aplicáveis ao
desvio padrão. Mas existem duas propriedades que serão
distintas no caso do desvio padrão devido a sua característica
de raiz quadrada média positiva da variância.
Assim, ao multiplicarmos cada elemento de um conjunto de
20 dados por uma constante c, o novo desvio padrão será igual ao
antigo multiplicado pela constante. Temos então:
σ2 = c.σ1
45
Unidade I
Por outro lado, se dividirmos cada elemento de um conjunto
de dados por uma constante c, o novo desvio padrão será igual
ao anterior dividido pela constante c. Assim, temos então:
σ2 =
5
σ1
c
As demais propriedades da variância serão as mesmas para
o desvio padrão.
Exemplo: Sabendo-se que a produção leiteira diária da vaca
A, durante uma semana, foi de: 10, 14, 13, 15, 16, 18 e 12 litros,
pede-se calcular a amplitude, o desvio padrão (S), a variância
10 (S2) e o coeficiente de variação (cv).
Solução
Amplitude:
As propriedades da variância se
aplicam ao desvio padrão, exceto:
• quando multiplicarmos cada
elemento de um conjunto de
dados por uma constante c, o novo
desvio padrão será igual ao antigo
multiplicado pela constante;
• quando dividirmos cada elemento
de um conjunto de dados por uma
constante c, o novo desvio padrão
será igual ao anterior dividido pela
constante c.
Em Probabilidade e Estatística,
o desvio padrão é a medida mais
comum da dispersão estatística. O
desvio padrão define-se como a raiz
quadrada da variância. É definido
desta forma de maneira a dar-nos uma
medida da dispersão que:
R= 18 – 10 = 8 litros de leite,
ou seja, a maior variação do número de litros de leite
15 produzidos por dia pela vaquinha A é de 8 litros.
Obs.: sabemos que a média para estes dados é x =14 litros
de leite por dia.
Desvio padrão:
n
s=
20 =
∑ (xi -x)2
i=1
n-1
=
1. seja um número não-negativo;
2. use as mesmas unidades de medida
que os nossos dados.
Faz-se uma distinção entre o desvio
padrão σ (sigma) do total de uma
população ou de uma variável aleatória,
e o desvio padrão s de um subconjunto
em amostra.
O termo desvio padrão foi introduzido
na estatística por Karl Pearson, no
seu livro de 1894: “Sobre a dissecção
de curvas de frequência assimétricas”.
(x1-x)2 +(x2 -x)2 +...+(xn -x)2
=
n-1
(10-14)2 +(14-14)2 +(13-14)2 +(15-14)2 +(16-14)2 +(12-14)2 +
=
7-1
(-4)2 +(0)2 +(-1)2 +(1)2 +(2)2 +(4)2 +(-2)2 16+0+1+1+4+16+4 42
=
=
=
=
6
6
6
= 7 ≅ 2,65 litros de leite por semana.
46
ESTATÍSTICA APLICADA
Variância:
S2 = (S)2=(2,65)2 ≅ 7(litros de leite)2
Coeficiente de variação:
S 2, 65
=
= 0,1893 ou seja, existe uma variabilidade
x 14
5 de 18,93% dos dados em relação a média.
cv =
4 DISTRIBUIÇÃO DE FREQUÊNCIAS
Ao longo de nosso estudo, observamos que para extrair
dos dados estatísticos de que dispomos a correta análise e
interpretação, o primeiro passo deverá ser a correta organização
e sumarização destes dados; caso contrário, estes números não
10 farão qualquer sentido.
Além disso, dependendo do tamanho do nosso conjunto de
dados, podemos organizá-los em um rol de dados simples, ou
seja, por ordem de grandeza (crescente ou decrescente), ou em rol
(novamente ordenando o conjunto de dados) e, posteriormente,
tabelando sua distribuição de frequências.
A distribuição de frequências é o modo de tratamento de
dados utilizado quando é grande a quantidade de dados brutos,
e passamos a agrupar os dados estatísticos em subconjuntos
com características semelhantes – as classes ou categorias.
15
A distribuição de frequência é a organização de dados em
classes ou intervalos, para determinar o número de observações
ou a percentagem de observações de cada classe, chamada de
frequência de classes.
Para apresentar esses dados, podemos utilizar gráficos e
20 tabelas, bem como utilizar as medidas de posição e variabilidade
para interpretá-los, mas não sem organizá-los previamente em
47
Unidade I
uma distribuição, sem a qual ficaria impossível o cálculo de
algumas das medidas necessárias, como média, variância, etc.
5
Tabela 4.1
Idade de 100 estudantes formandos do curso de Gestão de
uma Universidade AB em dez/2006
Idade
Número de estudantes
20 a 22
8
22 a 24
10
24 a 26
12
26 a 28
20
28 a 30
17
30 a 32
15
32 a 34
9
34 a 36
5
36 a 38
3
38 a 40
1
Total = 100
A tabela acima é uma distribuição de frequências das
idades dos estudantes que estão se formando no curso
de Gestão de uma determinada Universidade fictícia AB.
A primeira classe corresponderia ao grupo de estudantes
10 formandos em Gestão no ano de 2006 e que possuem entre
20 e 22 anos, e é indicada pelo símbolo 20 |- 22. A frequência
desta classe corresponde a 8 porque existem 8 estudantes
cuja idade faz parte desta classe.
4.1 A construção de uma distribuição de
frequências para dados contínuos
Para se construir uma determinada distribuição de
15 frequências, é preciso, em primeiro lugar, definir o tipo de
variável em questão, para depois definir os passos que devem
ser seguidos para a construção desta distribuição. Vamos
supor que o conjunto de dados abaixo seja referente às idades de
48
ESTATÍSTICA APLICADA
uma amostra de 100 alunos formandos em Gestão de uma
Universidade AB:
Tabela 4.2
Dados das idades dos estudantes formandos de
Gestão da Universidade AB
5
20
20,4
20,5
21
21
22
22
22
22,1
22,2
22,3
22,5
22,6
22,7
22,8
22,9
23
24
24,1
24,2
24,3
24,4
24,5
25
25
25,3
25,5
25,7
26
26
26,2
26,3
26,4
26,5
26,6
26,7
26,8
26,9
27
27
27,1
27,2
27,3
27,4
28
28
28
28
28
28
28,2
28,3
28,5
29
29
29
29
29,1
29,1
29,2
29,3
29,4
29,5
29,5
30
30
30
31
31
31
31
31,1
31,2
31,3
31,4
31,5
31,6
31,6
32
32
32
32
32,3
33
33
33
34
34
34
34
34
34,5
35
35
36
36
37
37,5
38
40
Como podemos observar, os dados já estão dispostos em
ordem crescente de grandeza, em um rol, muito embora se trate
de um conjunto de números superior a 30 observações. Esta
amostra diz respeito às idades dos alunos de uma determinada
10 Universidade fictícia AB que estão se formando no curso
de Gestão. Estamos considerando, portanto, uma variável
contínua.
Uma variável contínua é aquela
que pode assumir qualquer valor num
intervalo contínuo.
Como vimos, tratar um conjunto de dados sob a forma de uma
distribuição de frequências significa organizá-los em intervalos
15 de classes. Precisamos, então, definir o número de classes, o
tamanho destas classes, para, então, enquadrar os dados nas
classes pela simples contagem desses dados amostrais.
A primeira coisa que devemos fazer ao nos depararmos com
um conjunto de dados como este apresentado na tabela 4.2 é
20 procurar calcular a amplitude total (ou intervalo). Neste caso,
será muito mais fácil, já que os números já estão dispostos em
um rol. Conforme vimos no módulo 3, a amplitude total ou
intervalo poderá ser calculada da seguinte forma:
Atotal = Vmáximo - Vmínimo
25
Atotal = 40-20 = 20
49
Unidade I
No caso do nosso exemplo, a amplitude total será igual a 20.
O valor da amplitude total será importante porque, juntamente
com o número de classes, definirá a chamada “amplitude de
classes”.
5
Mas como então estabelecer o número de classes? A
teoria estatística tem se desenvolvido ao longo dos anos e
chegou ao consenso de que é aconselhável estabelecer o
número de classes entre um mínimo de 5 e um máximo de
20. Uma distribuição de frequências que possua mais de
10 20 classes torna a apresentação dos dados muito confusa
e de mais difícil avaliação. Se estabelecemos um número
de classes inferior a 5, podemos correr o risco de ocultar
informações importantes sobre os dados disponíveis.
Quando se quer determinar o número de classes em função
15 do conjunto de dados disponíveis, basta tirarmos a raiz quadrada
de n, onde n corresponderia ao total de observações (seja da
população ou da amostra). Sendo assim, temos:
Númeroclasses = n
No caso do exemplo apresentado acima, temos um total
20 de observações n=100; portanto, o número de classes será
igual a 10:
Nclasses = n
Nclasses = 100 = 10
Uma vez estabelecido o número de classes, é preciso
25 pensar qual será o tamanho de cada classe, ou, dito de outra
forma, faz-se necessário determinar a amplitude de classe
desta distribuição de frequências. Para isso, calculamos a
amplitude total desta distribuição, a qual corresponde a
uma medida absoluta de variabilidade.
50
A amplitude de classes será
calculada, então, tomando-se o valor
da amplitude total e dividindo-se pelo
número de classes.
ESTATÍSTICA APLICADA
Assim, temos:
Seguindo o exemplo que estamos trabalhando (já fizemos
o cálculo da amplitude total e do número de classes), podemos
5 passar para o cálculo da amplitude de classes do exemplo. Temos,
então:
A amplitude das classes da distribuição de frequências que
10 estamos procurando construir em nosso exemplo será igual a
dois. Isso representa o intervalo ou tamanho de cada classe,
em que iremos dispor os nossos dados. É importante ressaltar
que uma distribuição de frequência não obrigatoriamente
apresenta uma única amplitude de classes, posto que mantenha
a composição estrutural da distribuição.
Temos agora o número de classes, a amplitude de classes,
podemos então calcular o intervalo de classes. O intervalo de
classes é composto por um limite inferior (número menor) e por
um limite superior (número maior). Os limites inferior e superior
15 podem ou não estar inclusos no intervalo de classes, existindo uma
simbologia própria dentro da estatística para se expressar isso.
Vejamos exemplos possíveis a partir da tabela 4.1 acima:
a) 20 |–| 22: diz-se que é um intervalo fechado, pois tanto o
20 quanto o 22 participam do intervalo;
20
b) 22 –| 24: diz-se que é um intervalo aberto, já que o limite
inferior, 22, não participa do intervalo, ao passo que o
limite superior participa do intervalo;
51
Unidade I
c) 20 |– 22: caso o exemplo se apresentasse assim, teríamos
um intervalo de classe aberto, já que o limite inferior
participa do intervalo, mas o limite superior não participa
do intervalo;
5
d) 20 – 22: aqui teríamos um intervalo de classe aberto, em
que nem o limite inferior nem o limite superior participam
do intervalo.
Após o cálculo do número de classes e da amplitude de
classes, devemos definir os limites inferior e superior de cada
10 classe, começando com o menor valor, ou, no caso de dados
fracionais, com um inteiro logo abaixo do menor valor. No nosso
exemplo, podemos calcular as classes da seguinte forma:
Para a primeira classe:
15
Limite inferior: 20.
Limite superior: 20 + amplitude de classe = 20 + 2 = 22.
Para a segunda classe:
Limite inferior: limite superior da classe anterior = 22.
Limite superior: limite inferior da segunda classe + amplitude
de classes = 22 + 2 = 24.
E assim sucessivamente até a classe de número 10, no
nosso exemplo, que terá como limite inferior 38 e como limite
superior 40. É importante frisar que determinado valor não
pode pertencer a mais de uma classe, mas, por outro lado, para
cada valor deve haver uma classe, não permitindo a existência
25 de lacunas na fixação destas mesmas classes.
20
Uma vez definido o número de classes e a amplitude total,
a partir delas pudemos estabelecer a amplitude de classes,
e pudemos também definir os limites superior e inferior de
cada classe; resta agora confrontar as nossas classes com as
30 observações de que dispomos na tabela 4.2.
52
ESTATÍSTICA APLICADA
Mediante contagem, devemos construir nossa distribuição
de frequência, fixando cada observação numa classe
determinada. Quando indicamos o número de observações
existentes em um dado intervalo, temos a chamada frequência
5 absoluta simples (ƒi).
A frequência absoluta é o número
de vezes que o dado aparece naquele
determinado conjunto de números.
É importante destacar que nenhuma classe poderá
apresentar frequência absoluta igual a zero. Assim, uma primeira
construção que podemos fazer nos leva à tabela 4.1, só que
agora colocaremos a notação estatística trabalhada até agora.
10 Então, temos:
Tabela 4.3
Distribuição de frequência das idades
Classes
Frequência absoluta simples
20 |— 22
8
22 |— 24
10
24 |— 26
12
26 |— 28
20
28 |— 30
17
30 |— 32
15
32 |— 34
9
34 |— 36
5
36 |— 38
3
38 |— 40
1
∑
100
É importante ressaltar que na construção da distribuição
de frequências acima, uma vez que determinado valor
15 tenha sido incluso em determinado intervalo de classes, não
deverá ser incluso em um outro. Daí a razão por que temos
intervalos em que o limite inferior não está incluso, pois ele
corresponde ao mesmo valor do limite superior da classe
anterior; portanto, o referido valor, provavelmente, já deve
20 ter sido alocado numa classe anterior. Por exemplo, na tabela
53
Unidade I
4.2, temos a observação do dado “22”, que se repete três
vezes, e que será incluso no primeiro intervalo de classes.
Mas este valor não deverá ser incluso novamente no segundo
intervalo de classes.
5
Frequência
absoluta
simples
acumulada indica o número de
observações acumuladas até o limite
superior de uma classe.
A seguir, devemos calcular as frequências absolutas
simples acumuladas (ƒi , A).
Por exemplo, na terceira classe, teríamos 30 alunos com
idade entre 20 e 26 anos se formando em Gestão. Vejamos como
ficaria a nova tabela, incluindo a nova notação da frequência
10 acumulada:
Tabela 4.4
Classes
Frequência absoluta
simples (ƒi )
Frequência absoluta simples
acumulada (ƒi ,
20 |— 22
8
8
22 |— 24
10
18
24 |— 26
12
30
26 |— 28
20
50
28 |— 30
17
67
30 |— 32
15
82
32 |— 34
9
91
34 |— 36
5
96
36 |— 38
3
99
38 |— 40
1
100
∑
100
A)
Um outro dado importante que podemos extrair da
construção de uma distribuição de frequências é a frequência
relativa simples (ƒi , R).
A soma das frequências relativas de todas as classes será igual
15 a 1, se expressa em forma fracionária, ou a 100% se expressa em
54
Frequência relativa simples nos
mostra a participação relativa do número
de observações em uma dada classe e
deverá ser calculada da seguinte forma:
fi ,R =
fi
∑ fi
em percentual.
, geralmente expresso
ESTATÍSTICA APLICADA
percentual. No caso da distribuição de frequências que estamos
construindo, temos agora a seguinte tabela:
Tabela 4.5
ƒi , A
Classes
ƒi
ƒi , R
20 |— 22
8
8
0,08
22 |— 24
10
18
0,10
24 |— 26
12
30
0,12
26 |— 28
20
50
0,20
28 |— 30
17
67
0,17
30 |— 32
15
82
0,15
32 |— 34
9
91
0,09
34 |— 36
5
96
0,05
36 |— 38
3
99
0,03
38 |— 40
1
100
0,01
∑
100
1
4.2 A construção de uma distribuição de
frequências para dados discretos
Numa distribuição de frequência de dados contínuos,
5 os valores individuais sofrem uma perda de identidade uma
vez agrupados em classes, o que gera a perda de uma certa
quantidade de informações. Isso ficará claro ao calcularmos
a média aritmética em uma distribuição de frequência e
compararmos o resultado ao obtido mediante o cálculo dos
10 dados individualmente, até mesmo no exemplo que demos neste
módulo. Os resultados não serão os mesmos, considerando essa
perda de informação.
Dependendo do tipo de dados e dos objetivos do observador,
este fenômeno pode ou não ocorrer numa distribuição de frequência
15 com dados discretos. Quando não há perda de informação, é possível
que os dados originais sejam reconstituídos a partir da tabela de
distribuição de frequência com dados discretos. No caso de dados
contínuos, isso não é possível.
55
Unidade I
Essencialmente, não existem diferenças substanciais entre
uma distribuição de frequência com dados contínuos e uma
com dados discretos. Os cálculos das frequências acumuladas e
relativas são feitos da mesma forma, bem como os cálculos das
5 medidas de posição e variabilidade.
4.3 Representação gráfica de dados
agrupados
Como já mencionado no módulo 1, a confecção de gráficos
permite melhor visualização dos dados, mostrando mais
claramente as diferenças existentes. Os gráficos mais comuns são
o gráfico de setor, de coluna ou de barra e o gráfico de curva. O
10 tipo de gráfico a ser utilizado depende do que se deseja enfatizar.
Assim, o gráfico de coluna ou de barra mostra diferenças entre
os valores absolutos, e o gráfico de curva é utilizado quando se
deseja mostrar variações ao longo do tempo; o gráfico de setor,
também conhecido como “gráfico de pizza”, é utilizado quando
15 se deseja ressaltar diferenças entre proporções. Esses gráficos
podem ser facilmente feitos em planilhas eletrônicas, como, por
exemplo, o Excel.
No caso de dados agrupados, ou de distribuições de
frequência, a representação gráfica utilizada é o histograma
20 ou, ainda, o polígono de frequência.
Reforçando os conceitos:
25
30
56
a) histograma: é a representação gráfica de uma distribuição
de frequência por meio de retângulos justapostos em
que a base colocada no eixo horizontal corresponde aos
intervalos de classe e a altura é proporcional à frequência
das classes;
b) polígono de frequências: é a representação gráfica
de uma distribuição de frequência por meio de um
polígono. Cada vértice do polígono tem como abscissa o
ponto médio de classe e como ordenada proporcional à
frequência dessa classe.
Distribuição de frequências é uma
técnica para apresentar uma coleção
de objetos classificados de modo a
mostrar o número existente em cada
classe. Mais ainda do que a técnica
de apresentar cotações, é importante
considerar a possibilidade de apresentar
distribuições especiais, tal como no
caso da distribuição de frequências
de probabilidades e de frequências de
amostragens.
ESTATÍSTICA APLICADA
Exemplo: salários de funcionários de uma determinada
empresa:
Intervalos
Salários
Freq.
Freq. acum.
15750 |-- 29000
29000
238
238
29000 |-- 42250
42250
144
382
42250 |-- 55500
55500
35
417
55500 |-- 68750
68750
29
446
68750 |-- 82000
82000
16
462
82000 |-- 95250
95250
6
468
95250 |-- 108500
108500
4
472
108500 |-- 121750
121750
1
473
121750 |-- 135000
135000
0
473
a) Histograma:
250
200
150
100
50
0|
00
29
15
75
0|
–2
90
00
–
42
42
25
2
0 | 50
55 – 5
50 55
00
0
68 |– 6
75 87
0 | 50
82 – 82
00
0
0 | 00
95 – 9
2
5
10 50 |– 250
85
00 108
12 |– 500
17 12
50 17
|– 50
13
50
00
0
b) Polígono de frequência:
250
200
150
100
50
0
15750 29000 42250 55500 68750 82000 95250 108500 121750
|–
|–
|–
|–
|–
|–
|–
|–
|–
29000 42250 55500 68750 82000 95250 108500 121750 135000
57
Unidade I
Vamos ressaltar novamente:
Estatística descritiva é o nome dado ao conjunto de
técnicas analíticas utilizado para resumir o conjunto de todos
os dados coletados numa dada investigação a relativamente
poucos números e gráficos. Ela envolve basicamente:
• distribuição de frequência: é o conjunto das
frequências relativas observadas para um dado
fenômeno estudado, sendo a sua representação gráfica
o histograma (diagrama em que o eixo horizontal
representa faixas de valores da variável aleatória e o
eixo vertical representa a frequência relativa). Por uma
consequência da Lei dos Grandes Números, quanto
maior o tamanho da amostra, mais a distribuição de
frequência tende para a distribuição de probabilidade.
Frequência
relativa (%)
Histograma
50
40
30
20
10
0
A
B
C
D
E
Faixa da variável aleatória
• medidas da tendência central: são indicadores que
permitem que se tenha uma primeira ideia, um resumo
de como se distribuem os dados de um experimento,
informando o valor (ou faixa de valores) da variável
aleatória que ocorre mais tipicamente. Ao todo, são os
seguintes três parâmetros:
- média: é a soma de todos os resultados dividida pelo
número total de casos, podendo ser considerada como
um resumo da distribuição como um todo;
- moda: é o evento ou categoria de eventos que ocorreu
com maior frequência, indicando o valor ou categoria
mais provável;
58
ESTATÍSTICA APLICADA
- mediana: é o valor da variável aleatória a partir do
qual metade dos casos se encontra acima dele e
metade se encontra abaixo.
Frequência
relativa (%)
Histograma
50
40
30
20
10
0
Tendência
central
A
B
C
D
E
Faixa da variável aleatória
• medidas de dispersão: são medidas da variação de um
conjunto de dados em torno da média, ou seja, da maior
ou menor variabilidade dos resultados obtidos. Elas
permitem se identificar até que ponto os resultados se
concentram ou não ao redor da tendência central de um
conjunto de observações. Incluem a amplitude, o desvio
médio, a variância, o desvio padrão, o erro padrão e o
coeficiente de variação, cada um expressando diferentes
formas de se quantificar a tendência que os resultados
de um experimento aleatório têm de se concentrarem
ou não em determinados valores (quanto maior a
dispersão, menor a concentração, e vice-versa).
Frequência
relativa (%)
Histograma
50
40
30
20
10
0
Dispersão
A
B
C
D
E
Faixa da variável aleatória
A ideia básica é a de se estabelecer uma descrição
dos dados relativos a cada uma das variáveis, dados esses
levantados através de uma amostra.
59
Unidade I
Desenvolvamos alguns exemplos, para tornar as definições e
suas aplicações técnicas mais claras:
Exemplo 1: em uma pesquisa feita para detectar o número de
filhos de empregados de uma multinacional, foram encontrados
5 os seguintes valores:
1
5
2
4
4
3
2
2
2
5
5
1
3
0
4
2
3
2
0
2
1
3
4
3
2
2
4
1
3
2
2
3
5
2
3
5
Responda as questões abaixo, para x=2 e x=4.
10
Solução
 Rol (dados em ordem crescente):
0
2
3
15
0
2
3
1
2
4
1
2
4
1
2
4
1
2
4
2
3
4
2
3
5
 Tabela de distribuição de frequências:
X
F
f%
F↓
F↑
F%↓
F%↑
0
2
fr
0,067
1
4
0,133
13,3
6
28
20
93,3
2
10
0,333
33,3
16
24
53,3
80
3
6
0,2
20
22
14
73,3
46,7
4
5
0,167
16,7
27
8
90
26,7
5
3
0,1
10
30
3
100
10
Total
30
1
100
-
-
-
-
6,7
2
30
6,7
100
 Algumas considerações ou conclusões:
a) Quantos empregados têm “x” filhos? A resposta é dada
através de f (frequência absoluta simples).
20
60
b) Quantos empregados têm menos de “x” filhos? A resposta
é dada através de F↓ (frequência absoluta acumulada
“abaixo de”).
ESTATÍSTICA APLICADA
c)Quantos empregados têm mais de “x” filhos? A resposta é
dada através de F↑ (frequência absoluta acumulada “acima
de”).
5
d) Quantos empregados têm “x” filhos ou menos? A resposta
é dada através de F↓ (frequência absoluta acumulada
“abaixo de”).
e) Quantos empregados têm “x” filhos ou mais? A resposta
é dada através de F↑ (frequência absoluta acumulada
“acima de”).
10
15
20
Exemplo 2: um determinado hospital está interessado
em analisar a quantidade de creatinina (em miligramas por
100 mililitros) encontrada na urina (de 24 horas) de seus
pacientes internados com problemas renais. Os dados são os
seguintes:
1,51
1,69
1,67
1,46
1,76
1,66
1,52
1,65
1,22
1,60
1,72
1,62
1,36
1,66
1,58
1,22
1,23
1,56
1,96
1,43
1,90
1,54
1,68
1,54
1,43
1,66
1,26
1,59
1,65
1,47
1,73
1,69
1,51
1,47
1,47
1,40
1,68
1,43
1,15
1,31
1,52
1,86
1,61
1,49
2,18
1,89
2,29
1,57
1,73
1,08
1,80
1,46
1,47
1,58
1,33
1,55
1,81
1,33
1,53
2,00
2,34
1,86
1,52
1,38
1,83
1,60
1,58
1,66
1,75
1,40
1,56
1,50
1,59
1,37
1,71
1,57
1,86
1,83
1,46
1,49
1,40
1,44
1,83
2,02
1,26
1,43
1,51
1,57
1,66
1,73
1,90
1,31
1,44
1,51
1,58
1,66
1,75
1,96
1,33
1,46
1,52
1,58
1,66
1,76
2,00
1,33
1,46
1,52
1,58
1,66
1,80
2,02
1,36
1,46
1,52
1,59
1,67
1,81
2,18
1,37
1,47
1,53
1,59
1,68
1,86
2,29
1,38
1,47
1,54
1,60
1,68
1,86
2,34
Solução
 Rol (dados em ordem crescente):
25
30
1,08
1,40
1,47
1,54
1,60
1,69
1,86
1,15
1,40
1,47
1,55
1,61
1,69
1,86
1,22
1,40
1,49
1,56
1,62
1,71
1,86
1,22
1,43
1,49
1,56
1,65
1,72
1,86
1,23
1,43
1,50
1,57
1,65
1,73
1,89
61
Unidade I
 Amplitude total (dá uma ideia do campo de variação dos
dados):
A = LS - LI = (2,34) - (1,08) = 1,26.
Analisando-se a quantidade de creatinina encontrada na
5 urina dos 84 pacientes, verificou-se que ocorreu a variação de
1,26 no seu campo (de 1,08 a 2,34).
 Estabelecer o número de classes (c):
c = 1 + (3,3333.....).log(n) = 1 + (3,3333....).log(84) = 7,414
c = 7.
10
 Estabelecer o intervalo de classe (i):
i = A / c = (1,26) / 7 = 0,18
 Construção da tabela:
Classes
fi
Pm
fr
f%
f%↓
f%↑
F↓
F↑
1,08 |- 1,26
5
1,17
0,059 5,9
5,9
100
5
84
1,26 |- 1,44
13
1,35
0,155 15,5
21,4
94,1
18
79
1,44 |- 1,62
32
1,53
0,381 38,1
59,5
78,6
50
66
1,62 |- 1,80
18
1,71
0,214 21,4
80,9
40,5
68
34
1,80 |- 1,98
11
1,89
0,131 13,1
94,0
19,1
79
16
1,98 |- 2,16
2
2,07
0,024 2,4
96,4
6,0
81
5
2,16 |- 2,34
3
2,25
0,036 3,6
100
3,6
84
3
Total
84
-
1
-
-
-
-
100
Observações:
15
(1) O melhor valor para representar cada classe é o ponto
médio (Pm), o qual se obtém pela fórmula:
Pm = Li + (i / 2), ou ainda, Pm = (Li + Ls) / 2.
(2) • fi : número de elementos de cada classe;
...• fr: mede o quanto cada valor significa e relação a unidade;
.. • f%: mede o quanto cada valor significa com relação a 100.
62
ESTATÍSTICA APLICADA
(3) 1,08 |- 1,26, intervalo fechado à esquerda (pertencem
à classe valores iguais ao extremo inferior) e aberto à
direita (não pertencem à classe valores iguais ao extremo
superior).
5
(4) Não necessariamente o último número será o limite
superior da última classe, mas obrigatoriamente as classes
devem conter todos os elementos.
 Algumas considerações ou conclusões:
a) Quantos pacientes têm quantidade de creatinina no
10 intervalo de “x”? A resposta é dada através de f (frequência
absoluta simples). Ex.: Quantos pacientes têm quantidade de
creatinina no intervalo [1,44; 1,62)? R.: 32 pacientes.
b) Quantos pacientes têm quantidade de creatinina inferior
ao intervalo “x”? A resposta é dada através de F↓ (frequência
15 absoluta acumulada “abaixo de”). Ex.: Quantos pacientes têm
quantidade de creatinina inferior ao intervalo [1,80; 1,98)? R.:
68 pacientes.
c) Quantos pacientes têm quantidade de creatinina superior
ao intervalo “x”? A resposta é dada através de F↑ (frequência
20 absoluta acumulada “acima de”). Ex.: Quantos pacientes têm
quantidade de creatinina superior ao intervalo [1,80; 1,98)? R.:
5 pacientes.
Atenção: para dados agrupados ou distribuição de
frequências.
25
Elementos principais:
a) classe – é cada um dos intervalos em que os dados são
agrupados;
63
Unidade I
b) limites de classes - são os valores extremos de cada classe.
li = limite inferior de uma classe;
Li = limite superior de uma classe;
5
c) amplitude – é a diferença entre o maior valor e o menor
valor de certo conjunto de dados. Pode ser referida ao total de
dados ou a uma das classes em particular:
• amplitude total (At) – é calculada pela seguinte expressão:
At = Max. (rol) – Min.(rol).
10
• amplitude das classes (h) – é a relação entre a amplitude
total e o número de classes, conforme mostra a expressão
a seguir:
, onde n é o número de intervalos
de classe;
d) ponto médio de classe (xi) - é calculado pela seguinte
15 expressão:
xi =
20
Li + li
2 ;
e) frequência absoluta (fi) - frequência absoluta de uma
classe de ordem i é o número de dados que pertencem a essa
classe;
f) frequência relativa (fri) - frequência relativa de uma
classe de ordem i é o quociente da frequência absoluta dessa
classe (fi) pelo total, ou seja,
ƒ ri =
25
64
ƒi
Total
Obs.: a soma de todas as frequências absolutas é igual ao
total;
ESTATÍSTICA APLICADA
g) frequência acumulada (Fi) - frequência acumulada de
uma classe de ordem i é a soma das frequências até a classe de
ordem i;
h) frequência relativa acumulada (Fri) - frequência relativa
acumulada de uma classe de ordem i é a soma das frequências
relativas até a classe de ordem i.
65
Download