ESTATÍSTICA APLICADA

Propaganda
ESTATÍSTICA APLICADA
Profª Simone Della Torre
Atualizada em 2016
1
ESTATÍSTICA APLICADA
A Estatística é a parte da Matemática Aplicada que fornece métodos para a coleta,
organização, descrição, análise e interpretação de dados e para a utilização dos
mesmos na tomada de decisões.
Estatística é dividida em duas áreas:
Estatística Descritiva: Coleta de dados estatísticos, organização dos dados, redução
dos dados, representação dos dados, obtenção de algumas informações que auxiliam a
descrição do fenômeno observado.
Estatística Indutiva: Tem por objetivo obter e generalizar conclusões para a população
a partir de uma amostra, através do cálculo da probabilidade, possibilitando assim,
propostas de soluções e decisões.
CÁLCULO DE PROBABILIDADES
ESPAÇO AMOSTRAL (S) : É o conjunto de todos os possíveis resultados de um
experimento.
Exemplo: Se consideramos o lançamento de um dado, teremos:
S = {1,2,3,4,5,6} e n(S) = 6
EVENTO (E): È qualquer subconjunto do espaço amostral.
Exemplo: Se observarmos no lançamento de um dado a face superior tendo como
resultado um número par, teremos:
E = {2,4,6} e n(E) = 3
PROBABILIDADE CLÁSSICA: P(E) = n(E)
n(S)
Exemplo: Qual a probabilidade de observarmos um número par no lançamento de um
dado?
S = {1,2,3,4,5,6} e n(S) = 6
E = {2,4,6} e n(E) = 3
P(E) = n(E) = 3 = 1 = 0,5 = 50%
n(S)
6
2
EVENTOS COMPLEMENTARES: Sabemos que um evento pode ou não ocorrer.
Sendo p a probabilidade que ele ocorra, (sucesso) e q a probabilidade de que ele não
ocorra, (insucesso), para um mesmo evento existe sempre a relação: p + q = 1
Exemplo: Se p = ¼, então q = ¾
2
EVENTOS INDEPENDENTES: Dizemos que dois eventos são independentes quando
a realização ou não de um dos eventos não afeta a probabilidade da realização do outro
e vice-versa.
Exemplo: Quando lançamos dois dados o resultado de um deles independe do resultado
do outro. Se dois eventos são independentes, a probabilidade de que eles se realizem
simultaneamente é: P = p1 x p2
Exemplo: lançamos dois dados. A probabilidade de obtermos 3 no primeiro dado é 1/6 .
A probabilidade de obtermos 5 no segundo dado é 1/6. Logo, a probabilidade de
obtermos SIMULTANEAMENTE 3 no primeiro dado e 5 no segundo dado é 1/6 x 1/6
= 1/36.
EVENTOS MUTUAMENTE EXCLUSIVOS: Dizemos que dois ou mais eventos
são mutuamente exclusivos quando a realização de um evento exclui a realização de(os)
outro(os).
Exemplo: No lançamento de uma moeda , o evento “tirar cara” e o evento “tirar coroa”
são mutuamente exclusivos , já que ao realizar um deles, o outro não se realiza.
Se dois eventos são mutuamente exclusivos, a probabilidade de que UM OU OUTRO
ocorra é igual a soma das probabilidades da realização de cada um deles: P = p1 + p2
Exemplo: Lançamos um dado. A probabilidade se lermos o 3 ou o 5 na face superior é
P = 1 + 1 = 2 = 0,3333 = 33,33%
6
6
6
1ª lista de Exercícios
01) Qual a probabilidade de sair o “ás” de ouros quando retiramos uma carta de um
baralho de 52 cartas?
02) Qual a probabilidade de sair um “rei” quando retiramos uma carta de um baralho de
52 cartas?
03) Em um lote de 12 peças, 4 são defeituosas. Sendo retirada uma peça, calcule:
a) A probabilidade de essa peça ser defeituosa
b) A probabilidade de essa peça não ser defeituosa
04) No lançamento de dois dados, calcule a probabilidade de se obter soma igual a 5.
3
05) Qual a probabilidade de sair uma figura quando retiramos uma carta de um baralho
de 52 cartas?
06) No lançamento de um dado, qual a probabilidade de se obter um número não
inferior a 5?
07) Dois dados são lançados simultaneamente. Determine a probabilidade de lermos os
resultados e obtermos a soma maior ou igual a 10.
08) Determine a probabilidade de cada evento:

Um número ímpar aparece na face de um dado.

Uma figura aparece ao se extrair uma carta de um baralho de 52 cartas.

Uma carta de “ouros” aparece ao se extrair uma carta de um baralho de 52
cartas

Uma só “coroa” aparece no lançamento de 3 moedas
09) O quadro abaixo representa a classificação por sexo e por estado civil, de um
conjunto de 50 deputados presentes em uma reunião:
Estado civil/Sexo
Casado
Solteiro
Desquitado
Divorciado
Homem
10
5
7
8
Mulher
8
3
5
4
Uma pessoa é sorteada ao acaso. Determine a probabilidade dos eventos:

Ser um homem;

Ser uma mulher;

Ser uma pessoa casada;

Ser uma pessoa solteira;

Ser uma pessoa desquitada;

Ser uma pessoa divorciada.
4
10) O quadro abaixo representa a classificação de um grupo de 30 mulheres, segundo o
estado civil e a cor dos cabelos:
Cor dos cabelos / Estado Civil
Casada
Solteira
Viúva
Divorciada
Loira
5
2
0
3
Morena
8
4
1
1
Ruiva
3
1
1
1
Uma mulher é sorteada neste grupo. Determine a probabilidade dos
eventos:

Ser casada;

Não ser loira;

Não ser morena nem ruiva;

Ser viúva;

Ser solteira ou casada;

Ser morena e solteira;

Ser viúva e ruiva.
11) De dois baralhos de 52 cartas, retiram-se simultaneamente uma carta do primeiro
baralho e uma carta do segundo baralho. Qual a probabilidade de a carta do
primeiro baralho ser um rei e a do segundo ser um 5 de paus?
12) Uma urna A contém: 3 bolas brancas, 4 pretas e 2 verdes
Uma urna B contém: 5 bolas brancas, 2 pretas e 1 verde
Uma urna C contém: 2 bolas brancas, 3 pretas e 4 verdes. Qual a
probabilidade das 3 bolas retiradas das urnas A,B e C serem
respectivamente: BRANCA, PRETA E VERDE?
13) De um baralho de 52 cartas retiram-se ao acaso 2 cartas sem reposição. Qual a
probabilidade da primeira carta ser o “ás” de paus e a segunda ser o “rei” de paus?
14) São dados dois baralhos de 52 cartas. Retiramos ao mesmo tempo uma carta do
primeiro baralho e uma carta do segundo baralho. Qual a probabilidade de
retirarmos uma “dama” e um “rei” não necessariamente nesta ordem?
15) Em um lote de 20 peças, 5 são defeituosas. Sendo retiradas aleatoriamente duas
peças, calcule:
 A probabilidade de ambas serem defeituosas.
5

A probabilidade de ao menos uma ser defeituosa.
16) Uma loja dispões de 18 geladeiras do mesmo tipo das quais 6 apresentam defeitos.
 Se um freguês vai comprar uma geladeira, qual a probabilidade de levar uma
defeituosa?

Se um freguês vai comprar duas geladeiras, qual a probabilidade de levar duas
defeituosas?

Se um freguês vai comprar duas geladeiras, qual a probabilidade de levar pelo
menos uma defeituosa?
17) Um lote é formado por 10 peças boas, 4 com defeitos e 32 com defeitos graves.
Uma peça é escolhida ao acaso. Determine a probabilidade de que:
 Ela não tenha defeitos graves.

Ela não tenha defeitos.
DIAGRAMA DE VENN
Diagramas de Venn são os diagramas usados em matemática para simbolizar
graficamente propriedades, axiomas e problemas relativos aos conjuntos e sua teoria.
Os respectivos diagramas consistem de círculos simples desenhados sobre um plano, de
forma a simbolizar os conjuntos e permitir a representação das relações
de pertença entre conjuntos e seus elementos
Também pode ser utilizado no estudo da Estatística, a fim de organizar e analisar dados
colhidos em pesquisas de opinião.
Diagrama de Venn mostrando todas as interseções possíveis entre os conjuntos A e B e
entre os conjuntos A, B e C.
Exemplo 01) Representação de conjunto único
N = (1, 2, 3, 4, 5, 6)
6
Exemplo 02) Representação de dois conjuntos: A e B
A = (1, 2, 3, 4, 5, 6)
B = (5, 6, 7, 8, 9, 10)
Símbolos
U = união
∩ = intersecção
A U B = (1, 2, 3, 4, 5, 6, 7, 8, 9, 10)
A ∩ B = (5, 6)
A U B = (1, 2, 3, 4, 5, 6, 7, 8, 9, 10)
A ∩ B = (5, 6)
Exemplo 03) Relação entre três conjuntos: A, B e C.
A = (3, 4, 5, 6, 7, 8)
B = (4, 6, 8, 10, 12)
C = (1, 2, 3, 4, 6, 10)
A U B = (3, 4, 5, 6, 7, 8, 10, 12)
A U C = (1, 2, 3, 4, 5, 6, 7, 8, 10)
B U C = (1, 2, 3, 4, 6, 8, 10, 12)
A ∩ B = (4, 6, 8)
A ∩ C = (3, 4, 6)
C ∩ B = (4, 6, 10)
A ∩ B ∩ C = (4, 6,)
7
Exemplo 04) Uma prova classificatória foi composta por apenas duas questões. Sabese que:
100 pessoas acertaram as duas questões
170 pessoas acertaram a primeira questão
100 pessoas acertaram apenas uma das questões
95 pessoas erraram as duas questões
Qual o número de pessoas que participaram da prova?
1º – O número de alunos que acertaram as duas questões será representado pela
intersecção dos conjuntos A e B, isto é, A ∩ B = 100
2º – O conjunto A tem 170 elementos, mas A ∩ B possui 100 elementos, dessa forma,
somente 70 pessoas acertaram a questão A.
3º –100 pessoas acertaram apenas uma das questões e 70 pessoas acertaram a questão
A, então 30 pessoas acertaram a questão B.
8
4º - Para finalizar, 95 pessoas que não acertaram nenhuma das questões.
Participaram: 70+100+30+95 = 295 pessoas
2ª lista de Exercícios
01) Uma empresa fabricante de achocolatados pretende lançar um novo produto no
mercado. Para isso encomendou uma pesquisa sobre as preferências dos
consumidores entre duas embalagens A e B . Foram consultadas 402 pessoas, e o
resultado foi precisamente:

150 pessoas gostaram somente da embalagem A;

240 pessoas gostaram das embalagens B;

60 pessoas gostaram das duas embalagens.
Quantas pessoas não gostaram de nenhuma das duas embalagens,
sabendo que todas as 402 pessoas opinaram?
02) Numa classe, 40 alunos tem noções de inglês, 45 de francês, sendo que 16 tem
noções das duas línguas. Se dois disseram não ter conhecimento algum de línguas
estrangeiras, pergunta-se: quantos alunos tem a classe?
03) Uma empresa entrevistou 300 dos seus funcionários a respeito de 3 embalagens : A,
B e C para o lançamento de um novo produto. O resultado foi o seguinte:
EMBALAGENS:
A
B
C
AeB
AeC
BeC
A, B e C
Nº DE PESSOAS :
160
120
90
30
40
50
10
9
a) Dos funcionários entrevistados, quantos não tinham preferência por nenhuma
das 3 embalagens?
b) Quantos não indicaram a embalagem C?
04) Numa pesquisa sobre preferências de detergentes realizada numa população de 100
pessoas, constatou-se que 62 consomem Minerval, 47 consomem Limpola e 10
pessoas nem Minerval nem Limpola. Quantas pessoas dessa população consomem
tanto Minerval quanto Limpola?
05) Uma empresa automobilística colocou no mercado um automóvel em duas cores
diferentes: Uma ousada, verde limão metálico e outra clássica, prata. Depois de
algum tempo, entrevistou 200 pessoas sobre a preferência pelas cores desse
automóvel. Dos entrevistados, 120 declararam preferir o verde, 142 o prata e 30
declararam desconhecer o automóvel. Quantas pessoas gostariam de encontrar o
automóvel nas duas cores disponíveis?
06) De um grupo de auxiliares técnicos de produção, 44 leem o jornal A, 42 o jornal B e
18 leem ambos os jornais. Sabendo que todo auxiliar deste grupo é leitor de pelo
menos um dos jornais, qual o número de auxiliares? Qual a probabilidade de
selecionarmos ao acaso uma pessoa que lê somente o jornal A?
07) Realizou-se uma pesquisa e verificou-se que, das pessoas consultadas, 200 ouviam a
rádio A, 300 ouviam a rádio B, 20 ouviam as duas rádios e 220 não ouviam
nenhuma das duas rádios. Quantas pessoas foram consultadas? Qual a probabilidade
de selecionarmos ao acaso uma pessoa que não ouve nenhuma das duas rádios?
08) Em uma escola foi realizada uma pesquisa sobre o gosto musical dos alunos. Os
resultados foram os seguintes:
458 alunos disseram que gostam de Rock
112 alunos optaram por Pop
36 alunos gostam de MPB
62 alunos gostam de Rock e Pop
Determine quantos alunos foram entrevistados.
10
ESTATÍSTICA DESCRITIVA
Estatística Descritiva: Coleta de dados estatísticos, organização dos dados, redução
dos dados, representação dos dados, obtenção de algumas informações que auxiliam a
descrição do fenômeno observado.
POPULAÇÃO E AMOSTRA
População: Conjunto de todos os itens (pessoas, coisas, objetos) que interessam ao
estudo de um fenômeno coletivo. Exemplo: A idade de todos os alunos de uma
faculdade.
Amostra: Qualquer subconjunto (não vazio) de uma população. Exemplo: a idade dos
alunos de uma classe de uma faculdade.

Amostragem: A obtenção da amostra é feita através das seguintes técnicas:
Amostragem casual ou aleatória simples. (sorteio)
Amostragem proporcional estratificada. (proporção)
Amostragem sistemática. (elaboração de um sistema a partir dos dados
ordenados)
Amostragem casual simples:
No processo de amostragem casual simples, todos os elementos da população
têm igual probabilidade de serem selecionados para constituir a amostra. Como
exemplo, imagine que o gerente de uma indústria pretenda obter uma amostra
dos empregados. Para isso, o gerente pode conferir um número a cada
empregado e sortear aqueles que irão constituir a amostra, através de uma urna
contendo todos os números.
Amostragem proporcional estratificada:
Usa-se o processo de amostragem estratificada quando a população se apresenta
dividida em estratos, isto é, quando a população está dividida em grupos
distintos. Como exemplo, imagine que o diretor de uma faculdade quer obter
uma amostra da comunidade acadêmica. O diretor precisa considerar que a
faculdade é constituída por três grupos distintos de pessoas, isto é, professores,
funcionários e alunos.
Então, para obter uma amostra mais representativa da comunidade acadêmica, o
diretor deve selecionar uma amostra dentro de cada estrato, isto é, uma amostra
dos professores, uma amostra dos funcionários e uma amostra dos alunos e
depois reunir essas três amostras em uma só, constituindo então uma amostra
estratificada.
11
Amostragem sistemática:
No processo de amostragem sistemática, os elementos são selecionados para a amostra
por um sistema preestabelecido. Assim, por exemplo, imagine que um gerente de
vendas quer obter uma amostra dos clientes cadastrados de sua firma. Se as fichas dos
clientes estiverem organizadas por ordem alfabética, o gerente obterá uma amostra
sistemática se escolher a quinta de cada cinco fichas, ou a décima, de cada dez, etc.
SÉRIES ESTATÍSTICAS:
Apresentação dos dados:
Dados Brutos: Seqüência de valores numéricos não organizados.
Rol: Seqüência ordenada dos dados brutos. (pode ser crescente ou decrescente).
A variável (objeto de estudo: altura, peso, idade, salário,etc.) pode ser qualitativa ou
quantitativa.
CLASSIFICAÇÃO DAS VARIÁVEIS:
Vamos considerar dois tipos de variáveis: numéricas e não numéricas. As não
numéricas serão consideras qualitativas e as numéricas quantitativas.
A variável é qualitativa quando os possíveis valores que assumem representam
atributos ou qualidades. Se tais variáveis têm uma ordenação natural, indicando
intensidades crescentes de realização, então serão classificadas como qualitativas
ordinais (tamanho: pequeno, médio, grande; classe social: baixa, média, alta). Caso
contrário, quando não é possível estabelecer uma ordem natural entre seus valores, elas
serão classificadas como qualitativas nominais ( sexo: feminino, masculino; candidato:
A ou B; se fuma: sim ou não)
A variável é quantitativa quando sua natureza é numérica, (idade, peso, salário, etc) e
podem ser divididas em discretas e contínuas.
Variáveis quantitativas discretas podem ser vistas como resultantes de contagens,
assumindo em geral, valores inteiros (número de irmãos: 0,1,2...; número de defeitos:
0,1,2,3... )
Variáveis quantitativas contínuas assumem valores em intervalos dos números reais e ,
geralmente, são provenientes de uma mensuração (peso, altura).
Qualitativa
Nominal
Ordinal
Quantitativa
Discreta
Contínua
VARIÁVEL
12
1ª Lista de Exercícios
01) Classifique cada uma das variáveis abaixo em qualitativa (nominal/ordinal) ou
quantitativa (discreta ou contínua):
a) Ocorrência de hipertensão pré-natal em grávidas com mais de 35 anos (sim ou
não são possíveis respostas para esta variável).
b) Intenção de voto para presidente (possíveis respostas são os nomes dos
candidatos, além de não sei).
c) Perda de peso de maratonistas na Corrida de São Silvestre, em quilos.
d) Intensidade da perda de peso de maratonistas na corrida de São Silvestre (leve,
moderada, forte).
02) Qual a diferença entre população e amostra? Exemplifique
03) Numa escola com 500 alunos, 300 são homens e 200 são mulheres. Obtenha uma
amostra de 10% da população, utilizando a amostragem proporcional estratificada.
.
04) Numa empresa, um equipamento funciona em 4 turnos cuja produção/turno é
indicada na tabela abaixo. Serão coletadas, para análise, 160 peças durante o
processo de produção. Determinar o total de peças que serão coletadas de cada turno
(amostragem proporcional estratificada).
TURNO
0 h às 6:00 h
6:00 h às 12:00 h
12:00 h às 18:00 h
18:00 h às 24:00 h
Total
PRODUÇÃO/TURNO
300
400
500
400
1.600
AMOSTRA
TABELAS E GRÁFICOS
Tabelas : As informações obtidas podem ser apresentadas através de tabelas, contendo
todas as informações necessárias para uma boa leitura e interpretação dos dados.
Uma empresa fez o levantamento do salário de seus 50 funcionários, conforme mostra
a tabela:
Salário dos 50 funcionários da Empresa XYZ em dez/2016
Salário Mínimo
2
3
4
5
6
Nº e funcionários
18
12
10
6
4
13
Gráficos: As informações obtidas podem ser apresentadas através de gráficos, contendo
todas as informações necessárias para uma boa leitura e interpretação dos dados. As
apresentações gráficas são variadas. A escolha do tipo de gráfico fica a critério do
analista. Vamos ressaltar alguns modelos mais utilizados:
Gráfico de colunas:
Salários (S.M.) dos funcionários
da empresa
Nº de Funcionários
20
15
10
5
0
1
2
3
4
5
Quantidade de Salário Mínimo
Gráfico de barras:
Nº de funcionários
Salário de 50 funcionários da
Empresa XYZ em dez/2000
6
5
4
3
2
1
0
5
10
15
20
Salário Mínimo (quantidade)
Gráfico de Linhas (curva)
Salário de 50 funcionários da
Empresa XYZ em dez/2000
Salário Mínimo
(quantidade)
20
15
10
5
0
1
2
3
4
5
6
7
Nº de funcionários
Gráfico de Setores (Pizza)
Esporte Preferido dos alunos do
1º ano da Faculdade WW de
Adm inistração/período m atutino
Futebol
Voley
Natação
Basquete
14
DISTRIBUIÇÃO DE FREQUÊNCIAS

A variável é o objeto de estudo e é indicado pela letra x

Tabulamos o conjunto de freqüências em ordem crescente na primeira coluna
(variável x) e na segunda coluna colocamos os valores das freqüências simples,
(quando o número de elementos distintos da série for pequeno) .
Exemplo: Notas de prova de 30 alunos : 3 – 4 - 2,5 – 4 - 4,5 – 6 – 5 - 5,5 - 6,5 – 7 – 7,5
2 - 3,5 – 5 - 5,5 – 8 - 8,5 – 7,5 - 9 - 9,5 – 5 - 5,5 - 4,5 – 4 - 7,5 - 6,5 – 5 - 6 - 6,5 - 6
Notas (xi)
2,0
2,5
3,0
3,5
4,0
4,5
5,0
5,5
6,0
6,5
7,0
7,5
8,0
8,5
9,0
9,5

nº de alunos (fi)
1
1
1
1
3
2
4
3
3
3
1
3
1
1
1
1
Agrupamos os dados por faixa de valores na primeira coluna e na segunda
colocamos os valores das freqüências relativas aos agrupamentos.
Classe
1
2
3
4
Intervalo de classe
2 |---- 4
4 | ---- 6
6 | ---- 8
8 | ----10
fi
4
12
10
4
Intervalos de classe: Note que as notas do exemplo anterior foram agrupadas em
intervalos de classe: O intervalo da 1ª classe é: 2 |---- 4, que compreende as notas
maiores ou iguais a 2 e menores que 4. O intervalo da 2ª classe é 4 | ---- 6, que
compreende notas maiores ou iguais a 4 e menores que 6, e assim por diante.
Faremos agora, algumas observações:
15
Dado um intervalo de classe, o limite inferior é dado por l e o limite superior é dado
por L. No caso da 1ª classe do exemplo: 2 |---- 4, o limite inferior é igual a 2 e o limite
superior é igual a 4. Assim temos l = 2 e L = 4. A diferença entre os limites superior e
inferior, denominamos de amplitude do intervalo de classe h = L - l
Amplitude Total da Série: É a diferença entre o maior e menor elemento de uma
seqüência de dados. At = Xmáx – Xmín
Número de classes (K) : O número de classes depende muito do pesquisador e de sua
experiência. Existem diferentes critérios para determinarmos o número de classes.
Vamos adotar o critério da RAIZ:
Critério da raiz: K = n , onde n = número de elementos e K o número (inteiro) de
classes
No exemplo dado anteriormente, n = 30 (30 notas de alunos) onde K = 30 = 5,477.
Vamos ajustar o valor, pois K é necessariamente um número inteiro: 4 , 5 ou 6
At
10  2 8
e aplicando a fórmula, temos: h 
h
 2
k
4
4
Portanto, temos que a amplitude do intervalo de é igual a 2. Assim, O primeiro intervalo
começa com a menor nota (2) e vai até 4, ou seja (2+2). O segundo intervalo de classe
começa com 4 e vai até 6 (4+2), o terceiro intervalo começa com 6 e vai a té 8 (6+2) e
finalmente o quarto e último intervalo começa com 8 e vai até 10 (8+2).
Exemplo: Um teste para aferir o quociente de inteligência (QI) em determinada classe
de alunos de uma faculdade, deu origem a seqüência de valores :
60
90
102
112
116
124
70
91
103
112
115
125
72
92
104
112
117
125
75
93
105
113
118
125
78
94
106
113
119
127
79
95
107
114
119
128
80
96
108
114
121
128
82
97
108
115
122
128
83
98
109
115
122
130
84
99
109
115
123
138
87
100
110
116
123
88
101
111
116
124
Observe que fica inviável a tabela de freqüência através da variável discreta. Portanto,
vamos elaborar a tabela de freqüências através da variável contínua:
1º Passo: Verificamos que a seqüência possui 70 elementos. n = 70
2º Passo: Pelo critério da Raiz, temos K = n , então K = 70  8,37
3º Passo: Temos a opção de construir a variável contínua com 7, 8 ou 9 classes.
4º Passo: Determinar a amplitude total da série: At = Xmáx – Xmín
At = 140 –60 = 80
Observe que 80 é divisível por 8. Então, K = 8 (vamos construir uma
tabela com 8 classes.)
At
5º Passo: Cálculo da amplitude do intervalo de classe: h 
k
16
h
80
 10 (cada classe contém um intervalo igual a 10)
8
Computando as freqüências simples de cada classe, temos:
Classe
Intervalo de
classe
60 |---- 70
70 |---- 80
80 |---- 90
90 |---- 100
100 |---- 110
110 |---- 120
120 |---- 130
130 |---- 140
1
2
3
4
5
6
7
8
Total
Freqüência
Simples (fi)
1
5
6
10
12
19
14
3
n = 70
HISTOGRAMA – Representação gráfica – variável contínua (intervalos de classe)
Notas dos alunos de uma Faculdade)
20
15
10
5
0
60 70
80
90 100 110 120 130 140
Histograma
Na estatística, um histograma é uma representação gráfica da distribuição de
frequências de uma massa de medições, normalmente um gráfico de barras verticais. É
uma das Sete Ferramentas da Qualidade. O histograma é um gráfico composto por
retângulos justapostos em que a base de cada um deles corresponde ao intervalo de
classe e a sua altura à respectiva freqüência.
Tabela de Freqüências:
Freqüência simples ou absoluta (fi): é o número de vezes que o elemento aparece na
série de dados
Freqüência relativa (fr): representa a participação percentual de cada freqüência
fi
simples ou absoluta da série de dados. fr  .100
n
Freqüência simples acumulada (Fi) : é a soma das freqüências simples deste elemento
com as freqüências simples dos elementos que o antecedem.
17
Freqüência acumulada relativa de um elemento da série (Fr): é a divisão da
Fi
freqüência acumulada deste elemento pelo total de elementos da série. Fr 
n
Exemplo: Suponha o resultado das notas de 25 alunos de uma faculdade:
Tabela de Freqüência – Variável Discreta
Nota
(xi)
2
3
4
6
7
Total
Freq. simples
(fi)
3
7
8
6
1
n = 25
Freq. relativa (fr)
%
(3/25).100= 12
(7/25).100= 28
(8/25).100= 32
(6/25).100= 24
(1/25).100= 4
100
Freq. Simples
Acumulada (Fi)
3
10
18
24
25
Freq. Relativa
acumulada (Fr)
( 3/25).100=
(10/25).100=
(18/25).100=
(24/25).100=
(25/25).100=
%
12
40
72
96
100
Exemplo: Suponha o resultado das notas de 40 alunos de uma faculdade:
Classe
1
2
3
4
Total
Intervalo
de classe
2 |--- 4
4 |--- 6
6 |--- 8
8 |--- 10
Freq.
simples (fi)
6
18
10
6
n = 40
Freq. relativa
simples (%)
15%
45%
25%
15%
100 %
Freq. Simples
Acumulada (Fi)
6
24
34
40
Freq. Relativa
acumulada (Fr) %
15%
60%
85%
100%
2ª Lista de Exercícios
01) O que são dados brutos?
02) O que é Rol?
03) Por que os estatísticos estudam amostras e não populações?
04) Para cada uma das séries seguintes, determine o Rol, o número total da série e a
amplitude total:
a) Pesquisa A: 2 - 4 - 8 - 7 - 12 - 15 - 21 - 20
At = ________________________ n = ____________________________
18
b) Pesquisa B: 8 - 7 - 8 - 7 - 8 - 7 - 9
At = ________________________ n = ____________________________
05) Uma pesquisa com usuários de transporte coletivo na cidade de São Paulo indagou
sobre os diferentes tipos usados nas suas locomoções diárias. Dentre ônibus, metrô
e trem, o número de diferentes meios de transportes utilizados foi o seguinte:
2
1
2
3
1
1
2
1
1
1
2
2
2
2
2
1
3
1
2
1
2
1
1
1
2
1
2
3
1
3
a) Construa a tabela de freqüência.
b) Represente graficamente os dados obtidos (gráfico de Colunas)
c) Admitindo que essa amostra represente bem o comportamento do usuário
paulistano, você acha que a porcentagem dos paulistanos que utilizam mais de
um tipo de transporte é grande? Justifique.
Meios de Transporte
xi
1
2
3
total
nº usuários
fi
porcentagem Freq acumul
fr
Fi
Freq Acumul (%)
Fr
06) A idade dos 20 ingressantes num certo ano no curso de pós-graduação em
jornalismo de uma universidade foi o seguinte:
22
25
22
25
22
26
22
26
23
26
23
26
24
27
24
28
24
35
24
40
a) Determine a amplitude total da série.
b) Represente os dados em uma tabela de freqüência (sem intervalo de classe).
19
Idade
xi
nº ingressantes
fi
porcentagem
fr
Freq acumul
Fi
Freq Acumul (%)
Fr
c) Qual o percentual de alunos com menos de 25 anos de idade?
d) Quantos alunos ingressaram com 25 anos ou mais?
e) Represente graficamente (Faça o gráfico de colunas)
Idade de Ingressantes no curso de Pós-Graduação
fi
nº ingressantes
xi
Idade
07) Um grupo de pedagogas estuda a influência na troca de escolas no desempenho dos
alunos do ensino fundamental. Como parte do levantamento realizado, foi anotado
o número de escolas cursadas pelos alunos participantes do estudo:
20
Escolas cursadas (xi)
1
2
3
4
5
nº de alunos (fi)
46
57
21
15
4
a) Qual é a porcentagem dos alunos que cursaram uma escola?
b) Qual é a porcentagem dos alunos que cursaram até duas escolas?
c) Qual é a porcentagem dos alunos que cursaram mais de 3 escolas?
08) O tempo de utilização de caixas eletrônicos depende de cada usuário e das
operações efetuadas. Foram coletadas 26 medidas desse tempo (em minutos):
1,1
1,3
1,2
1,7
1,7
1,6
1,5
1,4
0,9
1,2
1,3
1,2
1,4
1,0
1,6
0,9
1,7
1,8
1,6
1,7
1,0
1,5
0,8
1,3
1,5
1,5
a) Agrupe os dados em intervalos de classe com amplitude do intervalo de 0,2
começando com 0,8.
b) Construa a tabela de freqüência.
c) Qual a porcentagem de usuários com 1,6 minutos ou mais?
d) Quantos usuários utilizam menos de 1,4 minutos?
Tempo (min)
xi
0,8 | --- 1,0
1,0 | --- 1,2
1,2 | --- 1,4
nº usuários
fi
porcentagem
fr
Freq acumul Freq Aculum (%)
Fi
Fr
Total
21
Tempo de utilização de caixas eletrônicos (em minutos)
fi
Nº usuários
xi
Tempo em minutos
09) Uma empresa automobilística selecionou ao acaso uma amostra de 40
revendedores
autorizados em todo o Brasil e anotou em determinado mês o número de unidades
adquiridas por estes revendedores:
10 – 15 – 25 – 21 – 6 – 23 – 15 – 21 – 26 – 32 – 9 – 14 – 19 – 20 – 32 – 18 – 16 –
26 – 24 – 20 – 7 – 18 – 17 – 28 – 35 – 22 – 19 – 39 – 18 – 21 – 15 – 18 – 22 – 20 –
25 – 28 – 30 – 16 – 12 – 20
a) Construa a tabela de freqüência através da variável contínua, utilizando o
método da Raiz. .
b) Observando a tabela, qual a porcentagem de revendedores que adquiriram
menos de 25 carros?
Rol:
6
7
9
10) Observe o gráfico abaixo:
22
Nº de dias
Vendas diárias de um
determinado aparelho elétrico,
durante um mês, por uma firma
comercial
10
8
6
4
2
0
10 11 12 13 14 15 16 17
Nº de aparelhos vendidos
a) Construa a tabela de freqüência.
Nº aparelhos (xi)
Nº de dias (fi)
fr %
Fi
Fr %
b) Qual a amplitude total da série de dados?
c) Qual a porcentagem registrada para as vendas de até 14 aparelhos diários?
11) A tabela abaixo apresenta a distribuição de freqüência de duração de 300 lâmpadas
efetuadas num laboratório.
Duração em horas
(xi)
300 | --- 400
400 | --- 500
500 | --- 600
600 | --- 700
700 | --- 800
Total
Número de
lâmpadas (fi)
24
56
68
86
66
Determine:
a) O limite inferior da 2ª classe.
23
b) O ponto médio (xi) da 2ª classe.
c) A amplitude do intervalo da 3ª classe.
d) A freqüência relativa das 3ª classe.
e) A freqüência acumulada das 2ª classe.
f) A porcentagem de lâmpadas com duração maior ou igual a 500 horas.
MEDIDAS DE TENDÊNCIA CENTRAL
(Média – Mediana – Moda)
Ao estudarmos uma série estatística, é conveniente o cálculo de algumas medidas que a
caracterizam. Essas medidas podem nos fornecer informações importantes em relação à
série estatística. Dessa forma, podemos localizar a maior concentração de valores de
uma distribuição.
__
Média: X
Em um conjunto de dados, podemos definir vários tipos de médias. Porém, em nossos
estudos, iremos nos limitar a mais importante: a média aritmética:
Média Aritmética é o quociente da divisão da soma dos valores da variável (x) pelo
número deles.
__
1º Caso: Dados não agrupados: X 
 x , onde n é o número de elementos da série:
n
Exemplo) Observe a nota de 5 alunos de uma turma: 5,0 - 6,0 - 7,0 - 8,0 - 9,0
__
X 
x
n
=
50  6,0  7,0  8,0  9,0
 7,0
5
Interpretação: A média de notas da turma é de 7,0, (7,0 é o valor em torno do qual os
elementos se concentram).
__
 xi. fi
2º caso: Dados agrupados – variável discreta: X 
n
Exemplo) Observe o resultado de um levantamento feito com 50 funcionários de uma
empresa, referente aos salários (em S.M.)
Salário Mínimo
2
3
4
5
6
nº e funcionários
18
12
10
6
4
xi.fi
2.18 = 36
3.12 = 36
4.10 = 40
5. 6 = 30
6. 4 = 24
 xi. fi  166
24
__
X 
 xi. fi
n
=
166
 3,32
50
Interpretação: A média de salários (S.M.) dos funcionários da empresa é de 3,32, (3,32
é o valor em torno do qual os elementos da série se concentram).
__
3º caso: Dados agrupados – variável contínua: X 
 xi. fi
n
Exemplo) Suponha o resultado das notas de 40 alunos de uma faculdade:
Intervalo
2 |--- 4
4 |--- 6
6 |--- 8
8 |--- 10
__
 xi. fi
freq. simples (fi)
6
18
10
6
n = 40
xi
3
5
7
9
xi.fi
3 . 6 = 18
5 .18 = 90
7 .10 = 70
9 . 6 = 54
 xi. fi  232
232
 5,8
40
n
Interpretação: A média de notas dos alunos da faculdade é de 5,8, (5,8 é o valor em
torno do qual os elementos da série se concentram)
X 
=
3ª Lista de Exercícios
01) O consumo de energia elétrica em Kwh nos últimos 5 meses, de uma família com
dois filhos foi: 170 – 180 – 190 – 185 – 190.
Determine o consumo médio referente ao período citado.
02) Uma máquina produz peças que são embaladas em caixas . Uma pesquisa realizada
com 59 caixas revelou a existência de peças defeituosas segundo a tabela:
nº de peças com defeito (xi)
0
1
2
3
4
5
número de caixas (fi)
20
15
12
6
4
2
Determine a quantidade média de peças com defeito encontradas nas caixas.
25
03) Uma pesquisa para determinar a eficiência de uma nova ração para animais, em
termos de ganho de peso, mostrou que após um mês em que a ração normal foi
substituída pela nova ração, os animais apresentaram um aumento de peso segundo
a tabela:
aumento de peso em Kg
0 |--- 1
1 |--- 2
2 |--- 3
3 |--- 4
4 |--- 5
Total
nº de animais (fi)
5
15
25
35
20
a) Qual o aumento médio de peso por animal?
b) Se a ração antiga proporcionava em iguais circunstâncias um aumento médio
de 3,1 Kg/animal, esta nova ração pode a princípio ser considerada mais
eficiente?
04) Uma empresa de aviação observou em seus registros recentes, o tempo de mão-deobra gasto na revisão completa de um motor de jato. O seguinte quadro foi
observado:
tempo de mão-de-obra
(horas)
xi
nº de motores
0 |--- 4
4 |--- 8
8 |--- 12
12|--- 16
16|--- 20
Total
1
5
10
12
4
xi
xi.fi
fi
a) Determine o tempo médio de mão-de-obra necessário para a revisão de cada
motor.
b) Com base nesta informação, qual deve ser o tempo total de mão-de-obra para a
revisão de dez motores que aguardam revisão?
c) Se a empresa dispõe no momento de dois homens trabalhando 12 horas por dia
nestas revisões conseguirá provavelmente revisar estes dez motores em quatro
dias?
d) Construa o histograma.
26
~
Mediana: X ou Md
A mediana é um valor que ocupa a posição central em uma série, que separa o rol em
duas partes deixando à sua esquerda o mesmo número de elementos que a sua direita.
1º Caso: Dados não agrupados:
se n é ímpar : o rol apresenta somente um termo central que ocupa a posição
~  n 1
X =
º
 2 
n
n 
se n é par: o rol apresenta dois termos centrai que ocupam as posições   º e   1 º.
2
2 
A mediana é calculada pela média das duas posições centrais.
Exemplo) Observe a nota de 5 alunos de uma turma: 5,0 - 6,0 - 7,0 - 8,0 - 9,0
5 1
~  n 1
n = 5, portanto, a mediana ocupa a posição X = 
 3ª posição,
 º=
2
 2 
~
X = 7,0
Interpretação: 50% dos valores do rol são valores menores ou iguais a 7 e 50% dos
valores do rol são valores maiores ou iguais a 7,0
Exemplo) Observe a nota de 6 alunos de uma turma: 5,0 - 6,0 - 7,0 - 8,0 - 9,0 – 9,0
n
n 
n = 6, portanto, a mediana ocupa a posição   ª posição e   1 ª posição.
2
2 
n 6
n  6 
  =  3 ª posição e   1 =   1  3  1  4 ª posição,
2 2
2  2 
~ 78
 7,5
X=
2
Interpretação: 50% dos valores do rol são valores menores ou iguais a 7,5 e 50% dos
valores do rol são valores maiores ou iguais a 7,5
2º caso: Dados agrupados – variável discreta
O processo do cálculo da mediana é o mesmo. Basta observar o número de elementos da
série e seguir os critérios já estabelecidos, localizando o valor mediano na tabela de
freqüência acumulada (Fi):
Exemplo) Observe o resultado de um levantamento feito com 51 funcionários de uma
empresa, referente aos salários (em S.M.)
27
Salário Mínimo
2
3
4
5
6
Total
nº de funcionários (fi) Freq. Acumulada (Fi)
18
18
12
30
10
40
6
46
5
51
n = 51
~  n  1  51  1 52
n = 51 (ímpar), a posição central é X = 

 26ª posição
=
2
2
 2 
A mediana ocupa a 26ª posição e fazendo a localização através da freqüência
acumulada, observamos que a mediana é 3.
Interpretação: 50% dos funcionários recebem 3 salários mínimos ou menos e 50% dos
funcionários recebem 3 salários mínimos ou mais.
Exemplo) Observe o resultado de um levantamento feito com 50 funcionários de uma
empresa, referente aos salários (em S.M.)
Salário Mínimo
2
3
4
5
6
Total
nº e funcionários (fi)
18
12
10
6
4
n = 50
Freq. Acumulada (Fi)
18
30
40
46
50
N = 50 (par). Vamos determinar os dois termos centrais:
 n  50
 25 ª posição
 =
2 2
25ª posição = 3
e
 n  50
 1  25  1  26ª posição
  1 =
2
2 
~ 33 6
e 26ª posição = 3 X =
 3
2
2
Interpretação: 50% dos funcionários recebem 3 salários mínimos ou menos e 50% dos
funcionários recebem 3 salários mínimos ou mais.
3º caso: Dados agrupados – variável contínua:
n

  Fac ant   h
~
2

X  li  
fi classe
28
Onde:
li
= limite inferior da classe da mediana
n
= número de elementos da série
Facant = freqüência acumulada anterior à classe da mediana
h
= amplitude da classe da mediana
ficlasse = freqüência simples da classe da mediana
Exemplo) Suponha o resultado das notas de 40 alunos de uma faculdade:
Classe
1
2
3
4
Total
Intervalo
2 |--- 4
li 4 |--- 6
6 |--- 8
8 |--- 10
freq. simples (fi)
6
18 fi
10
6
n = 40
Freq Acumulada (Fi)
6 Facant
24
34
40
n 40

 20ª posição, portanto, a mediana pertence à segunda classe
2 2
4 |--- 6
1ºpasso: calcular
de intervalos:
2º passo: identificamos: li = 4 h = (4-2) = 2 Facant = 6 e fi = 18
n

 40

  Fac ant   h
  6  2
~
~
2
2
 20  6 
 14 


= X  4 
X  li  
 4
.2  4   .2
fi classe
18
 18 
 18 
~
X  4  0,77.2  4  1,55  5,55
Interpretação: 50% dos alunos tem notas menores ou iguais a 5,55 e 50% dos alunos
tem notas maiores ou iguais a 5,55.
4ª Lista de Exercícios
01) O consumo de energia elétrica em Kwh nos últimos 5 meses, de uma família com
dois filhos, foi: 170 – 180 – 190 – 185 – 190.
Determine o consumo mediano referente ao período citado e interprete o resultado.
02) Uma máquina produz peças que são embaladas em caixas contendo 48 unidades.
Uma pesquisa realizada com 59 caixas revelou a existência de peças defeituosas
segundo a tabela:
29
nº de peças com
defeito (xi)
0
1
2
3
4
5
Total
número de caixas (fi)
20
15
12
6
4
2
Determine a quantidade mediana de peças com defeito encontradas nas caixas e
interprete o resultado.
03) Uma pesquisa para determinar a eficiência de uma nova ração para animais, em
termos de ganho de peso, mostrou que após um mês em que a ração normal foi
substituída pela nova ração, os animais apresentaram um aumento de peso segundo
a tabela:
aumento de peso em Kg
0 |--- 1
1 |--- 2
2 |--- 3
3 |--- 4
4 |--- 5
Total
nº de animais (fi)
5
15
25
35
20
a) Qual o aumento mediano de peso por animal?
b) Interprete o resultado.
04) Uma empresa de aviação observou em seus registros recentes, o tempo de mão-deobra gasto na revisão completa de um motor de jato. O seguinte quadro foi
observado:
tempo de mão-de-obra (h)
0 |--- 4
4 |--- 8
8 |--- 12
12 |--- 16
16 |--- 20
nº de motores
1
5
10
12
8
a) Determine o número mediano de hora de mão-de-obra necessário para a revisão
de cada motor.
b) Interprete o resultado
30
05) O departamento de recursos humanos de uma empresa, tendo em vista o aumento de
produtividade de seus vendedores, resolveu premiar com um aumento de 5% no
salário, a metade de seus vendedores mais eficientes. Para isso, fez um
levantamento de vendas semanais, por vendedor, obtendo a tabela:
Vendas (R$)
0
10.000
20.000
30.000
40.000
|--|--|--|--|---
nº de
vendedores (fi)
10.000
20.000
30.000
40.000
50.000
1
12
27
31
10
a) A partir de qual volume de vendas o vendedor será premiado?
b) Qual a média de vendas?
c) Interprete os resultados obtidos.
Moda (Mo)
A moda é o valor que aparece com maior freqüência em um conjunto de dados
1º Caso: Dados não agrupados:
Exemplo) Observe a nota de 5 alunos de uma turma: 5,0 - 6,0 - 6,0 - 8,0 - 9,0
A moda é 6,0 , pois aparece com maior freqüência.
Exemplo) Observe a nota de 5 alunos de uma turma: 5,0 - 6,0 - 6,0 - 8,0 - 8,0
A moda é 6 e 8, pois aparecem com maior freqüência
Observe a nota de 5 alunos de uma turma: 5,0 - 5,0 - 6,0 - 6,0 - 9,0 – 9,0
Note que não há um elemento que se destaque pela maior freqüência. Portanto, a série é
amodal (não há moda)
2º caso: Dados agrupados – variável discreta:
Basta identificar o valor que aparece com maior freqüência.
Exemplo) Observe o resultado de um levantamento feito com 50 funcionários de uma
empresa, referente aos salários (em S.M.)
31
Salário Mínimo
2 = moda
3
4
5
6
Total
nº de funcionários (fi)
18 (maior freq)
12
10
6
5
n = 51
Tabela 10
A moda é igual a 2 salários mínimos, pois apresenta a maior freqüência.
3º caso: Dados agrupados – variável contínua:
Neste caso, vamos utilizar a fórmula de Czuber:


f mo  f ant
h
Mo  l mo  
 2. f  ( f  f ) 
mo
ant
post


Onde:
lmo =
fmo =
fant =
fpost =
h
=
limite inferior da classe modal
freqüência simples da classe modal
freqüência simples da classe anterior à modal.
freqüência simples da classe posterior à classe modal
amplitude do intervalo de classe.
Exemplo) Suponha o resultado das notas de 40 alunos de uma faculdade:
Classe
1
2
3
4
Total
Intervalo
2 |--- 4
li 4 |--- 6
6 |--- 8
8 |--- 10
freq. simples (fi)
6 fant
18 fmo
10 fpost
6
n = 40
Tabela 11
1º passo: Verificar a classe com a maior freqüência: classe 2 com freqüência = 18
2º passo: identificar:
lmo = 4
fmo = 18
fant = 6
fpost = 10
h
= 2 (6-4)


18  6
  2
Mo  4  
 2.18  (6  10) 
32
 12 
Mo  4  
2
 36  16 
 12 
Mo  4     2
 20 
Mo  4  0,6  2
Mo  4  1,2
Mo  5,2
Interpretação: A moda é nota igual a 5,2.
5ª Lista de Exercícios
01) Calcule a moda das séries abaixo:
a) x: 2 – 3 – 5 – 4 – 2 – 4 – 8
b) x: 4 – 23 – 5 – 9 – 12 – 4 – 3
c) x: 4 – 5 – 6 – 6 – 6 – 7 – 8 – 8 – 8 – 10 – 10 – 10 – 11
02) Calcule a moda da distribuição do número de acidentes diários, observados em um
cruzamento, durante 40 dias:
nº de acidentes (xi)
0
1
2
3
4
nº de dias (fi)
30
5
3
1
1
03) O consumo de energia elétrica em Kwh nos últimos 5 meses, de uma família com
dois filhos, foi: 170 – 180 – 190 – 185 – 190.
Determine a moda de consumo referente ao período citado e interprete o resultado.
04) Uma máquina produz peças que são embaladas em caixas . Uma pesquisa realizada
com 59 caixas revelou a existência de peças defeituosas segundo a tabela:
nº de peças com defeito (xi)
0
1
2
3
4
5
número de caixas (fi)
20
15
12
6
4
2
Determine a moda de peças com defeito encontradas nas caixas e interprete o
resultado.
33
05) Uma pesquisa para determinar a eficiência de uma nova ração para animais, em
termos de ganho de peso, mostrou que após um mês em que a ração normal foi
substituída pela nova ração, os animais apresentaram um aumento de peso segundo
a tabela:
aumento de peso em Kg
0 |--- 1
1 |--- 2
2 |--- 3
3 |--- 4
4 |--- 5
nº de animais (fi)
5
15
25
35
20
a) Determine a moda de aumento de peso dos animais com a nova ração.
b) Interprete o resultado.
06) Uma empresa de aviação observou em seus registros recentes, o tempo de mão-deobra gasto na revisão completa de um motor de jato. O seguinte quadro foi
observado:
tempo de mão-de-obra (h)
0 |--- 4
4 |--- 8
8 |--- 12
12 |--- 16
16 |--- 20
Total
nº de motores
1
5
10
12
4
a) Determine a moda de tempo de mão-de-obra
b) Interprete o resultado
07) O departamento de recursos humanos de uma empresa, tendo em vista o aumento de
produtividade de seus vendedores, resolveu premiar com um aumento de 5% no
salário, a metade de seus vendedores mais eficientes. Para isso, fez um
levantamento de vendas semanais, por vendedor, obtendo a tabela:
Vendas (R$)
0 |--- 10.000
10.000 |--- 20.000
20.000 |--- 30.000
30.000 |--- 40.000
40.000 |--- 50.000
Total
nº de vendedores (fi)
1
12
27
31
10
a) Determine a moda de vendas dos funcionários.
b) Interprete o resultado.
34
MEDIDAS SEPARATRIZES
Chamamos medidas separatrizes àquelas que separam a distribuição em partes iguais.
As medidas separatrizes são:
Quartis – dividem a distribuição em 4 partes iguais
Q1
0%
25%
Q2
Q3
50%
75%
100%
Decis – dividem a distribuição em 10 partes iguais:
D1
0%
D2
D3
10% 20% 30%
D4
D5
40% 50%
D6
D7
D8
D9
60%
70%
80% 90% 100%
Centis – dividem a distribuição em 100 partes iguais
0%
P1
P2
P3
P4
P5
1%
2%
3%
4%
5%
P6 … P97
P98
P99
6% ... 97% 98% 99% 100%
1º Caso: Dados não agrupados:
Exemplo: X: 2 – 3 – 5 – 5 – 5 – 8 – 10 – 11 – 12 – 12 – 13 – 15
Q1 = 25% Calculamos 25% de 12 = 3
Este valor indica que o Q1 localiza-se na 3ª posição e é igual a 5
Interpretação: 25% dos valores da seqüência são menores ou iguais a 5 e 75% dos
valores da seqüência são maiores ou iguais a 5
P1 = 10% Calculamos 10% de 12 = 1,2
Este valor não inteiro indica que o P1 é um valor situado entre o 1º e 2º elemento da
seqüência. Calculamos a média correspondente:
35
1º valor = 2 e 2º valor = 3
23 5
P1 =
  2,5
2
2
Interpretação: 10% dos valores da seqüência são menores ou iguais a 2,5 e 90% dos
valores da seqüência são maiores ou iguais a 2,5.
2º Caso: Dados agrupados – variável discreta.
Exemplo: Observe a tabela:
xi
2
4
5
7
10
Total
Fi
3
5
8
6
2
n = 24
Fi
3
8
16
22
24
Tabela 12
D4 = 40% de 24 = 9,6
Esta posição não inteira significa que D4 é um valor compreendido entre o 9º e 10º
elemento da série.
Observando a tabela de freqüência acumulada, percebemos que o 9º elemento é igual a
5 e o 10º elemento também é 5. A média entre eles é igual a 5. Portanto, D4 = 5
Interpretação: 40% dos valores desta série são valores menores ou iguais a 5 e 60% dos
valores desta série são maiores ou iguais a 5
3º Caso: Dados agrupados – variável contínua
 in

 Fac ant 

h
Pi  li   100
fi






Onde:
Pi
= Percentil i (i = 1,2,3,4,...99)
li
= limite inferior da classe que contém o percentil i
n
= número de elementos da série.
Facant = freqüência acumulada da classe anterior a classe que contém o Pi
fi
= freqüência simples da classe que contém o percentil i
h
= amplitude do intervalo de classe.
36
Exemplo) Observe a tabela abaixo:
Intervalo classe
0 | --- 10
10 | --- 20
20 | --- 30
li 30 | --- 40
40 | --- 50
Total
fi
16
18
24
35 fi
12
n = 105
Fi
16
34
58 Facant
93
105
Tabela 13
Calcule o Q3 da série:
Q3 = P75 = 75%
75% de 105 = 78,75, isto é, nos dá a posição de P75 na série
A classe que contém o elemento que ocupa a posição 78,75 na série é a quarta classe.
Esta é a classe que contém P75.
 in

 Fac ant 

h
Pi  li   100
fi






 78,75  58 
P75  30  
  10
35


P75  30  5,93 
P75  35,93
Interpretação: 75% dos valores da série são menores ou iguais a 35,93 e 25% dos
valores da série são maiores ou iguais a 35,93
6ª Lista de Exercícios
01) A distribuição de freqüência abaixo representa a idade de 50 alunos de uma classe .
Idade (xi)
17
18
19
20
21
total
nº de alunos (fi)
3
18
17
8
4
a) Calcule Q1 , D5, P95 e interprete o resultado
37
02) A tabela abaixo representa o consumo por nota de 54 notas fiscais emitidas durante
um dia em uma loja de departamentos:
Consumo por notas (R$)
0 | --- 50
50 | --- 100
100 | --- 150
150 | --- 200
200 | --- 250
250 | --- 300
Total
fi
10
28
12
2
1
1
a) Calcule Q3 e interprete o resultado
b) Calcule D3 e interprete o resultado
c) Calcule P98 e interprete o resultado
03) Uma empresa estabelece o salário dos vendedores com base na produtividade. Uma
amostra de salários mensais nesta empresa revelou o quadro abaixo:
Salários US$
70 | --- 120
120 | --- 170
170 | --- 220
220 | --- 270
270 | --- 320
320 | --- 370
Total
fi
8
28
54
32
12
6
a) A empresa colocou uma meta extra para 5% dos vendedores que pior
desempenho tiveram. Até que valor de vendas o funcionário receberá a meta de
vendas?
b) Para premiar os melhores vendedores, a empresa resolveu conceder um abono
para 3% dos funcionários que tiveram melhor desempenho. A partir de que
salário o funcionário receberá o abono?
38
MEDIDAS DE DISPERSÃO:
Observe as seqüências:
1 – 3 – 7 – 10 – 10 – 11 – 15 – 18 – 20 – 35, cuja média é 13
12 – 12 – 12 – 13 – 13 – 13 – 13 – 14 – 14 – 14 , cuja média é 13
13 – 13 – 13 – 13 – 13 – 13 – 13 – 13 – 13 – 13 – cuja média é 13
Analisando as três séries acima, podemos concluir que todas possuem a mesma média,
no entanto, são completamente distintas do ponto de vista da variabilidade de dados.
Uma breve reflexão sobre as medidas de tendência central não são suficientes para
caracterizar totalmente uma seqüência numérica.
As medidas de dispersão avaliam a representatividade da média.


Amplitude Total: É a diferença entre o maior e o menor valor da seqüência.
Desvio Padrão
VARIÂNCIA E DESVIO PADRÃO
Observamos no item anterior que a dificuldade em se operar o DMS se deve à
_
presença do módulo, para que as diferenças xi - x possam ser interpretadas como
distâncias. Outra forma de conseguir que as diferenças se tornem sempre positivas
_
ou nulas é considerar o quadrado destas diferenças, isto é: (xi - x )2.
A variância é uma média aritmética calculada a partir dos quadrados dos desvios
obtidos entre os elementos da série e sua média.
O desvio padrão é a raiz quadrada positiva da variância.

Quando a seqüência de dados representa uma POPULAÇÃO, a variância está
_

denotada por  2 
 ( xi  x) 2 . fi
denotada por s 2 
 ( xi  x)
e o desvio padrão por    2
n
Quando a seqüência de dados representa uma AMOSTRA, a variância está
n 1
2
 fi
e o s2 
 ( xi  x)
2
 fi
n 1
Veremos os mesmos exemplos dados anteriormente, considerando-os amostra.
Exemplo 1) Considere as notas de uma turma de 4 alunos: 3 – 4 – 6 – 7
39
3  4  6  7 20

5
4
4
Vamos determinar as distâncias de cada nota para a média da série:
_
Vamos determinar a média: x 
(3 – 5)2 = 4 .1 = 4
(4 – 5)2 = 1 .1 = 1
(6 – 5)2 = 1 .1 = 1
 ( xi  x)
2
= 4 + 1 + 1 + 4 = 10
(7 – 5)2 = 4 .1 = 4
Variância = s 2 
 ( xi  x)
2
 fi
=
n 1
Desvio padrão = S = 3,33  1,82
10
10

 3,33
4 1 3
Interpretação: Há um desvio padrão de 1,82 pontos em relação à média 5.
Exemplo 2) Observe a tabela abaixo, que demonstra as notas de 10 alunos de uma
turma:
Notas(xi) nº de alunos(fi)
5
6
7
8
xi.fi
2
3
4
1
N = 10
10
18
28
8
 xi.fi = 64
_
( xi  x) 2 . fi
(5 – 6,4)2 . 2
(6 – 6,4)2 . 3
(7 – 6,4)2 . 4
(8 – 6,4)2 . 1
=
=
=
=
3,92
0,48
1,44
2,56

 | xi  x | . fi 
8,40
Tabela 15
_
Vamos determinar a média: x 
Variância = s 2 
 ( xi  x)
Desvio padrão = S =
2
64
 6,4
10
 fi
=
n 1
0,933  0,96
8,4
8,4

 0,933
10  1 9
Interpretação: Há um desvio padrão de 0,96 pontos em relação à média 6,4.
40
Exemplo 3) Observe a tabela abaixo, referente a notas de 20 alunos de uma turma:
classe Notas
Nº de alunos (fi) Notas (xi)
1
2
3
4
5
10
4
1
n = 20
2 | --- 4
4 | --- 6
6 | --- 8
8 | --- 10
3
5
7
9
xi.fi
15
50
28
9
102
_
( xi  x) 2 . fi
(3 – 5,1)2 5 =
(5 – 5,1)2 10 =
(7 – 5,1)2. 4 =
(9 – 5,1)2 1 =
22,05
0,1
14,44
15,21

 | xi  x | . fi  51,8
Tabela 16
102
 5,1
20
Cálculo da média:
Variância = s
2
 ( xi  x)

Desvio padrão = S =
2
 fi
n 1
2,73  1,65
=
51,8
51,8

 2,73
20  1 19
Interpretação: Há um desvio padrão de 1,65 pontos em relação à média 5,1.
Interpretação do desvio padrão: O desvio padrão é a mais importante das medidas de
dispersão. È fundamental que o interessado consiga relacionar o valor obtido do desvio
padrão com os dados da série.
Quando uma curva de freqüência da série é perfeitamente simétrica, podemos afirmar:
_
_
o intervalo [ x  , x  ] contém aproximadamente 68% dos valores da série;
_
_
o intervalo [ x 2 , x 2 ] contém aproximadamente 95% dos valores da série;
_
_
o intervalo [ x 3 , x 3 ] contém 99% dos valores da série.
Obs: Quando a distribuição não é perfeitamente simétrica, esses percentuais apresentam
pequenas variações para mais ou para menos, segundo caso.
Exemplo: Quando uma série apresenta média = 100 e desvio padrão = 5, podemos
interpretar esses valores das seguinte maneira:




Os valores da série estão concentrados em torno de 100;
O intervalo [95,105] contém aproximadamente 68% dos valores da série.
O intervalo [90,100] contém aproximadamente 95% dos valores da série;
O intervalo [85,115] contém aproximadamente 99% dos valores da série.
É importante que se tenha observado que, ao aumentar o tamanho do intervalo,
aumenta-se o percentual de elementos contidos que queremos.
41
COEFICIENTE DE VARIAÇÃO
É uma medida de dispersão relativa (%) . Note que é uma divisão de elementos de
mesma unidade, é um número puro. Portanto, pode ser expresso em percentual.
CV =

_
. 100 (população)
ou
CV =
x
S
_
. 100 (amostra)
x
Nos exemplos dados anteriormente, temos:
1,82
.100  36,4%
5
0,96
Exemplo 2) Média = 6,4 e desvio padrão = 0,96 , assim, CV =
.100  15%
6,4
1,65
Exemplo 3) Média = 5,1 e desvio padrão = 1,65, assim, CV =
.100  32,35%
5,1
Exemplo 1) Média = 5 e desvio padrão = 1,82 , assim, CV =
7ª Lista de Exercícios
01) Observe a seqüência: 2 – 3 – 3 – 4 – 6. Determine o desvio padrão e o coeficiente
de variação, considerando:
a) amostra,
b) população
02) Dada a tabela abaixo, determine o desvio padrão e o coeficiente de variação,
considerando:
a) amostra;
b) população
Escolas
cursadas (xi)
1
2
3
4
5
total
nº de alunos (fi)
46
57
21
15
4
42
03) Dada a tabela abaixo, determine o desvio padrão e o coeficiente de variação,
considerando a pesquisa:
a) amostra
b) população
Comprimento do
peixe mm (xi)
100 |--- 110
110 | --- 120
120 | --- 130
130 | --- 140
nº de peixes
(fi)
5
10
20
15
04) Uma prova de Matemática foi realizada para duas turmas. Os resultados foram os
seguintes:
Turma A: média 5 e desvio-padrão 2,5
Turma B: média 4 e desvio-padrão 2
Qual a turma com maior dispersão relativa?
05) Visando estudar a rotatividade de sua mão-de-obra, um grande magazine avaliou o
número de empregos (nos últimos 5 anos) de seus operários especializados. Os
dados obtidos foram:
Número de
empregos
1
2
3
4
5
total
Pede-se:
Número de
funcionários
150
200
75
50
25
500
Fi
fr%
Fr%
xi.fi
variância
a) A tabela de freqüência;
b) O número médio de empregos dos funcionários nos últimos 5 anos;
c) Qual o número mais freqüente de empregos dos funcionários nos últimos 5
anos?
d) O número mediano de empregos dos funcionários nos últimos 5 anos;
e) A variância
f) O desvio padrão
g) O coeficiente de variação
h) Represente graficamente os dados da tabela.
43
Fórmulas de Estatística
Medidas de Tendência Central:
__
 xi. fi
 Média: X 
n
n

  Fac ant   h
~
2

 Mediana: X  li  
fi classe


f mo  f ant
h
Moda: Mo  li  
 2. f  ( f  f ) 
ant
post 
 mo
Medidas Separatrizes
 in

 Fac ant 

h
 Pi  li   100
fi






Medidas de Dispersão:


Amplitude Total (Xmáx – X mín)
_
 ( xi  x) 2 . fi

Variância – população:  2 

Desvio Padrão – população:    2

Variância – amostra: s 2 

Desvio Padrão – amostra: s  s 2

Coeficiente de Variação - população:
n
 ( xi  x)
2
 fi
n 1

_
x

Coeficiente de Variação – amostra:
S
_
x
44
Download