Curso de Estatística para Concursos – André L. Santos

Propaganda
ESTATÍSTICA PARA O ISS-Teresina
AULA 0
Sumário
APRESENTAÇÃO ......................................................................... 2
1.
CONCEITOS ........................................................................ 4
2.
TABELAS DE FREQUÊNCIAS E HISTOGRAMAS .......................... 9
3.
GRÁFICOS DE PARETO ........................................................ 13
4.
MEDIDAS DE TENDÊNCIA CENTRAL ....................................... 17
5.
ASSIMETRIA ...................................................................... 20
6.
GRÁFICOS DE CAIXA (BLOXPLOT), QUARTIS E PERCENTIS ....... 23
7.
MEDIDAS DE VARIABILIDADE .............................................. 24
8.
FÓRMULA ABREVIADA DA VARIÂNCIA ................................... 28
9.
PROPRIEDADES DA MÉDIA E DA VARIÂNCIA .......................... 29
10. EXERCÍCIOS RESOLVIDOS ................................................... 33
11. ENUNCIADOS DE EXERCÍCIOS ............................................. 80
12. GABARITOS ....................................................................... 93
13. FO29RMULÁRIO DESTA AULA ............................................... 95
14. TIPOS DE GRÁFICOS VISTOS ............................................... 97
15. RESUMÃO DE CONCEITOS ................................................... 99
Prof. André L. Santos
www.passeicursos.com.br
1
ESTATÍSTICA PARA O ISS-Teresina
AULA 0
APRESENTAÇÃO
Futuros servidores,
Glorioso concurso de Teresina! Concurso fiscal da FCC é sempre um evento épico.
Felizes serão seus aprovados!
Mas havia Estatística no meio do caminho... E o edital está complicado. Francamente,
cair F de Snedecor é mais árido que as penhas e cavernas das Sete Cidades do Piauí...
Estatística é uma matéria estratégica porque é desproporcionalmente difícil e
consumidora de tempo para as poucas questões que caem. E pior, estatística cai sempre na
prova de conhecimentos gerais, que é uma grande destruidora de sonhos.
Já ouvi quem recomendasse dar os pontos por perdidos em estatística e concentrar-se
em outras matérias. Não gosto deste conselho. Ao verificar seu gabarito você pode chorar
lágrimas de sangue pela falta de preciosos pontos de estatística.
Atualmente um dos maiores filões de mercado é vender métodos para reduzir aquelas
conquistas que requerem esforço. Vende-se perder peso sem esforço. Vende-se aprender
línguas sem esforço. Vende-se passar num concurso sem esforço. Quem ficou fluente em
inglês sem persistir? Quem perdeu peso sem privações? Quem passou num concurso de
primeira sem estudar? Não prometo que você aprenderá estatística sem sua dedicação
pessoal. Mas o desafio que estas aulas se propõem é fazê-lo entender.
Não sei dizer “o segredo”. Já vi quem passasse abrindo mão de pontos em algumas
disciplinas, e já vi quem passasse estudando tudo e lutando tudo em todas. Eu apenas sei que
quem promete um método infalível de aprovação está vendendo gato por lebre. Aqui apenas
vamos te dar a matéria estrita, e muito bem explicada, mas o esforço será em grande parte
seu.
Ah, se livros e apostilas aprovassem sozinhos, quantas estantes não seriam fiscais? Se
você deixar este curso esquecido no seu HD, sem estuda-lo, garanto que nem você nem seu
PC serão aprovados.
Mas se você estudar com dedicação este programa, as probabilidades são grandes.
Palavra de estatístico! A margem de erro desta afirmação é baixa: “Quem faz muitos exercícios
vai bem”. E entre os aprovados estão apenas aqueles que foram bem. Estas conclusões são
verdadeiras e a prova de truques, Raciocínio Lógico não me deixa mentir.
“Não adianta entender se não sabe resolver os exercícios”. Concordo com ela. Mas
quem faz os exercícios sem entender, não entenderá quando os exercícios vierem
diferentes. E eles vêm. As bancas são pouco criativas e se repetem, mas quando o
examinador está inspirado, lá vem uma questão cheia de pegadinhas para te testar, muito
além dos xizes e sigmas. Leia as aulas com atenção na parte teórica. Não deixe de ler a teoria,
em Estatística é importante, e quando cai teoria não é nada simples. Fiz estas aulas supondo
que você não gosta e não tem base de estatística (estatisticamente é maior parte dos alunos).
E faça os exercícios. Não se passa sem exercícios, fique posto. Porém saiba que não há
matéria que exija mais seus fundamentos teóricos básicos nos exercícios avançados que
Estatística. E o edital está complicado. Vá desprezando a Chi-Quadrado e você pode se
arrepender na prova.
Mas eu coloquei bastante exercícios da FCC para você pegar a mão. E de outras
bancas também, afinal, uma banca se inspira na outra sempre
Vai ser difícil. Vai mesmo. Mas temos de passar por isto se queremos passar.
Quanto à estrutura didática desta aula, tentei ser tudo para todos. Parto do pressuposto
que meu aluno não é hábil com números e equações. Procuro ser explícito. Ao mesmo tempo,
rigoroso com as notações matemáticas.
Prof. André L. Santos
www.passeicursos.com.br
2
ESTATÍSTICA PARA O ISS-Teresina
AULA 0
A teoria está na parte inicial da aula, sendo desenvolvida com calma, com bastantes
exemplos gráficos e numéricos. Você precisa entender. Não adianta vender ilusão, não se
passa em estatística na base do macete, mas sim na base do conhecimento. Após isto temos
uma bateria de exercícios de concurso resolvidos. Finalmente, os enunciados para que você
mesmo resolva.
Vamos observar como serão distribuídos em nossas aulas os itens do edital. Aqui entre
nós o tema teresinense foi francamente inspirado no concurso FCC passado piauiense. Eis uma
dica poderosa, aluno, para seus estudos:
Aula
0
Data
Imediato
Item do edital
1
15/jun/16
Probabilidades: conceito, axiomas
2
20/jun/16
Probabilidades: distribuições (binominal, normal, Poisson)
3
25/jun/16
Distribuições qui-quadrado. Inferência estatística. 8. Amostragem:
amostras casuais e não casuais. Processos de amostragem, incluindo
estimativas de parâmetros. Intervalos de confiança
4
28/jun/16
Testes de hipóteses para médias e proporções
5
02/jul/16
Correlação e Regressão.
Estatística Descritiva: Gráficos, tabelas. Medidas de posição e de
variabilidade
É praxe para tranquilizar o aluno e saber que não está lendo material de um
aventureiro comentar um pouco de sua biografia: Sou André Luiz dos Santos, técnico judiciário
do TJ-SP. Sou formado pela Escola Politécnica da Universidade de São Paulo, mestre em
Processo Industriais da Engenharia Química pelo Instituto de Pesquisas Tecnológicas de São
Paulo e MBA em Gestão Empresarial pela Fundação Getúlio Vargas. Ou seja, muito além de
professor ou concurseiro sênior, aqui está alguém que põe as mãos na massa com a matéria.
Há que sermos pragmáticos, o tempo é curto, a matéria é grande, não há tempo de sutilezas
por mais interessantes que elas sejam.
Aprendi a respeitar os concurseiros em sua dedicação, pragmatismo e senso de
objetivo. Procurei colocar tudo isto aqui, e isto explica o sucesso que nossos cursos no Passei
Fiscal estão tendo. É bom e barato. Espero que vocês não só gostem, mas passem. Afinal,
estamos aqui para passar.
Vamos lá, bons estudos!
André L. Santos
Prof. André L. Santos
www.passeicursos.com.br
3
ESTATÍSTICA PARA O ISS-Teresina
AULA 0
Aula 0
ESTATÍSTICA DESCRITIVA
1. CONCEITOS
Durante nossos exercícios de estatística para concurso, vamos ver
diversos conceitos espalhados pelos enunciados. No início desta aula de
estatística descritiva é prudente que repassemos os conceitos mais pedidos
pelas bancas. Dessa forma, tendo visto o conceito com rigor, poderemos
rapidamente compreender os enunciados.
A Ciência da Estatística é a ramo da Matemática que se preocupa
com a organização, descrição, análise e interpretação dos dados
experimentais. Exemplo: Este curso visa ensinar a Ciência da Estatística
População é uma coleção completa de todos os elementos a
serem estudados. Exemplo que veio da vida para a matemática, o conjunto
de todos os brasileiros é a população brasileira. O conjunto de todos os
planetas do sistema solar é uma população.
Censo é uma coleção de dados relativos a todos os elementos de
uma população. Como exemplo, a contagem dos cidadãos do um país feito
pelo Instituto Brasileiro de Geografia e Estatística (por que será que tem este
nome, hein?)
Amostra é uma subcoleção de elementos extraídos de uma
população. Ao se sortear pessoas para uma entrevista, fazemos uma
“amostra” da população. Ao se tirar 2 ml de sangue para um exame clínico
com uma seringa, tiramos uma “amostra” de sangue para análise. Neste
exemplo, a população seria todo o sangue do paciente. Rapidamente percebese que trabalhar com populações é inviável.
Parâmetro é uma medida numérica que descreve uma
característica de uma população. Por exemplo, o parâmetro de expectativa
de vida do brasileiro (até agora) é 76 anos. Em média, a população de
cidadãos brasileiros vive 76 anos.
Prof. André L. Santos
www.passeicursos.com.br
4
ESTATÍSTICA PARA O ISS-Teresina
AULA 0
Uma estatística no sentido estrito é uma medida numérica que
descreve uma característica de uma amostra. No exemplo do sangue, se
a análise resultar que o nível de glicose é de 86 mg/dl esta é uma estatística
da amostra, e só se refere à amostra. No decorrer do curso, veremos como
avaliar se a amostra é representativa da população. Pode não ser. Se
tomarmos uma amostra de óbitos de cidadãos brasileiros de zonas
notadamente carentes de saúde, teremos uma estatística de expectativa de
vida menor que 76 anos, que é diferente do parâmetro da população brasileira.
Um dado é uma unidade básica de informação, normalmente o
resultado da experiência ou observação. Por exemplo, “este frasco de talco
tem peso líquido de 199,8g”
Uma informação é o conhecimento obtido pela comparação de
diversos dados. Por exemplo, “Os frascos de talco desta marca tem peso
líquido médio de 200g”. Nota-se que esta informação não poderia ter sido
obtida do dado de um único frasco, ela veio de mais de um dado, seja da
medição de uma amostra ou população de frascos. Mas estas definições não
são escritas na rocha: No caso, se o fabricante tivesse afirmado, seria um
dado.
Uma proposição é o conjunto de palavras ou símbolos que
exprimem um pensamento ou juízo de sentido completo. Por exemplo,
“este frasco de talco tem peso líquido de 199,8g” ou 9<6. As proposições são
expressas em linguagem. Nos exemplos, a primeira foi em bom português, a
segunda em símbolos matemáticos. As proposições podem ser verdadeiras ou
falsas. No exemplo dado, 9<6 é uma proposição falsa. As proposições podem
ser simples (no caso os exemplos) ou compostas, por exemplo “este frasco de
talco tem peso líquido de 199,8g e tem gipsita em sua composição”. A
estatística lidará com proposições, mas a disciplina que lida com elas por
excelência é o raciocínio lógico.
Dados quantitativos consistem em números que representam
contagens ou medidas. Por exemplo, “Alturas dos alunos de uma sala em
metros: 1,52; 1,61; 1,54; 1,52; 1,85; 1,71”
Dados qualitativos (ou dados categóricos ou dados atributos)
podem ser separados em diferentes categorias que se distinguem por
Prof. André L. Santos
www.passeicursos.com.br
5
ESTATÍSTICA PARA O ISS-Teresina
AULA 0
alguma característica não-numérica. Por exemplo, “Principais bancas no
Brasil: CESPE, ESAF, FCC, FGV, Cesgranrio, Vunesp”
Dados discretos são dados quantitativos que resultam de um
conjunto finito de valores possíveis, ou de um conjunto enumerável destes
valores. Por exemplo, “Pontuações possíveis num concurso de 160 questões de
alternativa de um ponto cada: 0,1,2,3... 157,158,159,160”
Dados contínuos (numéricos) são dados quantitativos resultam
de um número infinito de valores possíveis que podem ser associados
a pontos em uma escala contínua de tal maneira que não haja
interrupções. Por exemplo, “Velocidades instantâneas de carros num
determinado ponto da estrada em km/h: 100,2; 110,5; 96,3”
Importante: A mínima unidade de medição não significa que um dado
contínuo é discreto. Se minha régua mede até milímetros, não quer dizer
que minha medida de distância é discreta em milímetros. Se a régua mediu
25mm, a medida real bem poderia ter sido 25,46mm se tivesse um
instrumento com mais precisão, como um micrômetro, por exemplo.
Nível nominal de mensuração é caracterizado por dados que
consistem apenas em nomes, rótulos ou categorias. Os dados não podem
ser dispostos segundo um esquema ordenado. Exemplo, “Respostas possíveis
a uma pesquisa eleitoral de segundo turno: Candidato Alfa, Candidato Beta,
Branco, Nulos, Indecisos”.
Nível ordinal de mensuração envolvem dados que podem ser
dispostos em alguma ordem, mas as diferenças entre valores dos
dados não podem ser determinadas ou não tem sentido. Exemplo,
“Respostas possíveis a uma pergunta em uma pesquisa: Concordo fortemente,
concordo, indiferente, discordo, discordo fortemente, não sei”. Dá para
perceber que há uma ordem e hierarquia, mas não há uma medição precisa da
distância entre elas.
Nível intervalar de mensuração é análogo ao nível ordinal, com a
propriedade de que podemos determinar diferenças significativas
entre os dados. Todavia não existe um ponto de partida zero inerente ou
natural onde não haja qualquer quantidade presente. Isto é muito comum em
escalas com zero arbitrado. Exemplo, “temperaturas médias mensais em São
Paulo em graus Celsius, 25; 24;20;16;18;22;25”. Não se pode dizer que 20ºC
Prof. André L. Santos
www.passeicursos.com.br
6
ESTATÍSTICA PARA O ISS-Teresina
AULA 0
é 20% mais quente que 24ºC porque 0ºC foi determinado arbitrariamente no
congelamento da água (isto não se aplica graus Kelvin, que parte do zero
absoluto)
Nível de razão de mensuração é o nível de intervalo modificado
de modo a incluir o ponto de partida zero inerente, onde zero significa
nenhuma quantidade presente. Para valores neste nível, tanto as
diferenças como as razões tem significado. Exemplo, “Receitas trimestrais de
uma empresa em milhões de reais: 250, 300, 200, 180”. Pode-se dizer que R$
200.000.000,00 é 20% menor que 240.000.000,00. Pode-se dizer que R$
300.000.000,00 é cem milhões de reais maior que R$ 200.000.000,00. E que
receita zero é receita nenhuma.
Um
estudo
observacional
verificam-se
e
medem-se
características específicas, mas não se tenta manipular ou modificar os
elementos a serem estudados.
Por exemplo, “Peso total bruto de
caminhões trafegando numa rodovia: 25t; 20t; 12t; 8t; 23t”
Em um experimento aplica-se determinado tratamento e passa-se
a observar seus efeitos a serem pesquisados. Exemplo “Teores de
determinada substância na urina de pacientes submetidos a tratamento:
60mg/ml; 56 mg/ml; 80 mg/ml”. Ou seja, é uma condição não natural, houve
um tratamento que podia ou não ter alterado os teores normais.
Uma amostra aleatória os elementos da população são escolhidos
de tal forma que cada um deles tenha igual chance de figurar na
amostra. Exemplo, num tanque perfeitamente agitado, 100ml de líquido são
retirados a título de amostra. Como é um granel misturado, pode-se considerar
uma amostra aleatória. Outro exemplo, num tanque com uma população de
peixes, uma rede é lançada e captura 3 peixes para exames. Supõe-se que os
peixes estejam nadando aleatoriamente.
Uma amostragem estratificada é uma amostragem que a
população é subdividida em no mínimo duas subpopulações que
compartilham das mesmas características e em seguida se extrai uma
amostra aleatória de cada extrato. Por exemplo, os computadores da
Receita Federal separam as declarações de renda de pessoas físicas em faixas
de renda e sorteiam algumas de cada faixa para escrutínios dos fiscais.
Prof. André L. Santos
www.passeicursos.com.br
7
ESTATÍSTICA PARA O ISS-Teresina
AULA 0
Uma amostragem por conglomerados é uma estratificada em que
o espaço amostral é um dos conglomerados/extratos. Repetindo o
exemplo anterior, os computadores da Receita Federal separam as declarações
de IRPF em faixas de renda, mas especificamente os fiscais se interessam no
escrutínio de amostras aleatórias na faixa de renda superior do estudo. A
banca FGV considerou esta como uma definição de amostragem por
conglomerados: “na amostragem por conglomerado a população é
dividida em diferentes grupos, extraindo-se uma amostra apenas dos
conglomerados selecionados”
Uma amostragem sistemática escolhemos um ponto de partida e
selecionamos um elemento a cada determinada distância ou
frequência. Exemplo, uma tecelagem extrai uma amostra para análise de fio
a cada 10000m de fio produzido.
Um erro amostral é a diferença entre os resultados amostrais e o
verdadeiro resultado populacional; tais erros resultam de flutuações
amostrais aleatórias. Exemplo, uma linha de produção envasa um silo de 200t
de dolomita em 200.000 sacos de 1000g por hora. Em uma amostra de 5
sacos retirados aleatoriamente dos produzidos, a média de peso foi de 995g.
Este 5g é o erro amostral. Se todos os sacos, ie, a população pudesse ser
medida, o peso médio seria de 1000g.
Um erro não amostral ocorre quando os dados amostrais são
coletados, registrados ou analisados incorretamente, é um erro que não
se atribui à variação amostral aleatória, como a escolha de uma amostra não
aleatória e tendenciosa ou a utilização de um instrumento de mensuração
defeituoso. Por exemplo, no caso da linha de produção acima, os cinco sacos
de amostra podem ser medidos numa balança descalibrada que dá média de
peso deles de 975g. 25g é um erro não amostral. No caso, o amostrador
também propositadamente podia ter escolhido os sacos mais murchos para
retirar de amostra e subavaliar de caso pensado o peso do envase.
Todas as definições acima deram precisas definições do que veremos ao
longo do curso e das questões de estatística.
Prof. André L. Santos
www.passeicursos.com.br
8
ESTATÍSTICA PARA O ISS-Teresina
AULA 0
2. TABELAS DE FREQUÊNCIAS E HISTOGRAMAS
Este tema é querido às bancas. Ele é bem básico, mas por que não tirar
pontos preciosos dele? Só requer experiência para no dia da pressão da prova
manipular os dados e extrair o ponto.
Uma tabela de frequências relaciona categorias (ou classes) de valores
juntamente com contagens (ou frequências) do número de valores que se
enquadram em cada categoria.
Vamos ao exemplo: Um grande fabricante de peças dividiu seus clientes
em classes de faturamento anual de pedidos para determinar o nível de
atendimento, pós-venda e assistência técnica a cada um deles.
Classe de cliente
Pedidos anuais
# clientes
Padrão
Até R$ 100.000
80
Preferencial
de R$ 100.000 até R$ 200.000
20
Premium
de R$ 200.000 até R$ 300.000
5
Nesta tabela, os limites inferiores de classe são os menores números
que podem efetivamente pertencer a cada classe. No caso, 0 (hipoteticamente.
Quem fez R$0 de pedido não é cliente); 100.000 e 200.000. Os limites
superiores de classe são os maiores números que podem efetivamente
pertencer a cada classe. Ou seja, 100.000; 200.000 e 300.000.
Uma questão que sempre pode surgir é o que fazer nas fronteiras. No
caso, a tabela já explicou usando o de... até. “De“ pertence à classe, “até” não
é da classe. Por exemplo, um cliente que tenha pedido R$ 200.000,00 exatos é
cliente Premium, porque a categoriam Premium é “de 200.000” enquanto a
Preferencial
é
“até
200.000”.
Em
linguagem
matemática,
100.000<=Preferencial<200.000
O aluno também encontrará as seguintes notações nos enunciados, todas
análogas:




100.000 <= x < 200.000
100.000 [ ---------------- [ 200.000
100.000 |----------------- 200.000
100.000
200.000
Todas elas significam a mesma coisa. Que 100.000 está incluso no
intervalo, mas 200.000 não faz parte.
Prof. André L. Santos
www.passeicursos.com.br
9
ESTATÍSTICA PARA O ISS-Teresina
AULA 0
Marcas de Classe ou Pontos Médios de Classe é auto explicativo, é o
ponto médio da classe. No caso, Padrão 50.000; Preferencial 150.000;
Premium 250.000.
Finalmente, amplitude de classe é a diferença entre dois limites de
classe. Na tabela é de R$ 100.000. O exemplo apresentou amplitudes iguais,
mas nem sempre é assim. A empresa poderia ter dito que os Premium iam de
200.000 até 1.000.000. Ou até infinito, oras, alguém que quisesse fazer um
bilhão em pedido seria um tremendo cliente Premium, não?
Usualmente, a amplitude de classe para uma boa construção de classes é
dada pela amplitude dos dados dividido pelo número de classes desejada.
Amplitude é o maior menos o menor valor dos dados. A regra prática de
histogramas é que o número de classes seja a raiz quadrada do número de
valores. Sendo assim, para 50 valores termos 7 classes é um bom número a se
trabalhar (√50=7,071067...)
Finalmente, podemos montar o famoso gráfico de colunas de frequências
por classes tão venerado da estatística chamado de HISTOGRAMA. Enquanto
você ouvir falar de estatística na sua vida você ouvirá dos histogramas.
90
80
70
60
50
40
30
20
10
0
Histograma de clientes
80
20
5
R$ 0
Padrão
Preferencial
R$ 100.000
Premium
R$ 300.000
R$ 200.000
Uma outra modalidade de tabela de frequência muito usada é a de
frequência relativa. Ela tem a vantagem que os dados dela podem ser usados
para cálculos de probabilidade, se desejar.
Frequência relativa = frequência da classe / frequência total
No exemplo dos clientes, a frequência total é a somatória do número de
clientes, ie, 105 clientes. Dividindo cada classe de cliente pela somatória
Classe de cliente
Pedidos anuais
# clientes
Freq.
Relativa
Padrão
Até R$ 100.000
80
0,76
Prof. André L. Santos
www.passeicursos.com.br
10
ESTATÍSTICA PARA O ISS-Teresina
AULA 0
Preferencial
de R$ 100.000 até R$ 200.000
20
0,19
Premium
de R$ 200.000 até R$ 300.000
5
0,05
Soma clientes
105
1,00
Também o histograma pode ser feito com frequências relativas
Histograma de freq. Relativa de clientes
0,80
0,76
0,70
0,60
0,50
0,40
0,30
0,19
0,20
0,10
0,05
0,00
Padrão
Preferencial
Premium
Outra forma comum de expressar nestas tabelas é a frequência
acumulada, que é a soma das frequências daquela classe e de suas
precedentes, seja em termos absolutos, sejam em termos relativos. No caso
do exemplo, a tabela fica trabalhada um pouco diferente:
Pedidos anuais
Número clientes
Freq. Relativa Acumulada
Até R$ 100.000
80
0,76
Até R$ 200.000
100
0,95
Até R$ 300.000
105
1,00
E o histograma vira uma escadinha:
Prof. André L. Santos
www.passeicursos.com.br
11
ESTATÍSTICA PARA O ISS-Teresina
AULA 0
Freq. Relativa Acumulada
1,00
0,90
0,80
0,70
0,60
0,50
0,40
0,30
0,20
0,10
0,00
Até R$ 100.000
Até R$ 200.000
Até R$ 300.000
O aluno perspicaz que vai ganhar muitos pontos na prova já percebeu
que forçosamente a última classe da frequência acumulada é a somatória da
tabela, e tem frequência de 1.
Um “irmão” do gráfico de histograma de frequência relativa é o famoso
gráfico de pizza. No gráfico de pizza a área de um círculo é dividida
radialmente de acordo com a frequência relativa de cada categoria. Portanto
uma categoria com 50% da frequência ocupará uma meia-lua, e assim
sucessivamente.
Vermelha; 130; 7%
Azul; 100; 5%
Cores de automóveis vendidos
Outras; 5; 0%
Verde; 15; 1%
Marrom; 50; 2%
Prata; 1000; 50%
Branca; 200; 10%
Prata
Preta
Branca
Marrom
Verde
Azul
Vermelha
Outras
Preta; 500; 25%
Prof. André L. Santos
www.passeicursos.com.br
12
ESTATÍSTICA PARA O ISS-Teresina
AULA 0
3. GRÁFICOS DE PARETO
Uma aplicação muito comum das tabelas de frequências e frequências
acumuladas é o chamado gráfico de Pareto. Trata-se de dois gráficos num só.
As barras são as frequências individuais das categorias, e uma linha expressa a
frequência acumulada.
Pareto Chart of Campeoes
20
100
Count
60
10
40
5
0
Campeoes
Count
Percent
Cum %
Percent
80
15
20
Brasil
5
26,3
26,3
Italia
4
21,1
47,4
Alemanha Argentina
3
2
15,8
10,5
63,2
73,7
Uruguai
2
10,5
84,2
Other
3
15,8
100,0
0
No exemplo acima, podemos ver uma população de campeões das Copas
do Mundo até 2013. As barras é a frequência absoluta da população de
maneira ordenada decrescentemente (os últimos valores, para o bem da visão,
costumam ser agrupados). Portanto lê-se diretamente das barras que foram 5
campeonatos do Brasil, 4 da Itália, 3 da Alemanha, por exemplo. A ordenação
decrescente permite logo se perceber as maiores frequências. Qual país mais
ganhou a Copa? O Brasil, a primeira barra. Os gráficos de Pareto servem por
excelência para ressaltar as categorias mais frequentes.
A linha vermelha é a frequência acumulada. Ela permite responder, por
exemplo, a pergunta: “Quais países correspondem sozinhos à 50% das vitórias
na Copa?”. A resposta é “Brasil e Itália correspondem sozinhos à metade dos
campeonatos”.
O gráfico tem duas escalas. A da esquerda é a frequência absoluta, já a
porcentagem da direita pode ser tanto a frequência relativa (para as barras)
quanto a acumulada (para a linha).
Prof. André L. Santos
www.passeicursos.com.br
13
ESTATÍSTICA PARA O ISS-Teresina
AULA 0
Gráficos de pareto são especialmente usados como ferramentas da
qualidade para avaliar as principais causas. Foram desenvolvidos pelo célebre
Juran (quem estiver estudando Administração Industrial ou Geral
provavelmente o conhece) baseado na conclusão atribuída ao economista
italiano Pareto: “Em geral, 20% das pessoas/causas consomem/geram cerca
80% dos recursos/conseqüências”. Os 20% no caso seriam as barras
absolutas, os 80% a linha acumulada.
Exemplo: Construa o gráfico de pareto das seguintes causas de
interrupção de produção industrial:
Ordena-se
absoluta
Prof. André L. Santos
Causa de perda de
produção
Ocorrência
Falta de matéria-prima
6
Falta de embalagem
5
Falta de demanda
4
Falta de mão de obra
2
Quebra do reator
10
Quebra da esteira
2
Acerto de estoque
1
Auditoria física
1
Força maior
1
Quedas de energia
3
Erro de instrumentação
2
decrescentemente
as
categorias
www.passeicursos.com.br
pela
frequência
14
ESTATÍSTICA PARA O ISS-Teresina
Causa de perda de
produção
Ocorrência
Quebra do reator
10
Falta de matéria-prima
6
Falta de embalagem
5
Falta de demanda
4
Quedas de energia
3
Quebra da esteira
2
Falta de mão de obra
2
Erro de instrumentação
2
Força maior
1
Auditoria física
1
Acerto de estoque
1
AULA 0
Calcula-se a frequência relativa de cada categoria. Relembrando,
frequência relativa = frequência absoluta/soma de frequências
Prof. André L. Santos
Causa de perda de
produção
Ocorrência
Freq.
Rel
Quebra do reator
10
0,270
Falta de matéria-prima
6
0,162
Falta de embalagem
5
0,135
Falta de demanda
4
0,108
Quedas de energia
3
0,081
Quebra da esteira
2
0,054
Falta de mão de obra
2
0,054
Erro de instrumentação
2
0,054
Força maior
1
0,027
Auditoria física
1
0,027
Acerto de estoque
1
0,027
www.passeicursos.com.br
15
ESTATÍSTICA PARA O ISS-Teresina
AULA 0
Calcula-se a frequência acumulada de cada categoria.
Relembrando, frequência acumulada = frequência absoluta/soma de
frequências + frequência relativa anterior. Se você fez certo as contas,
a última categoria de frequência acumulada será igual a 1.
Ocorrência
Freq.
Relativa
Freq.
Relativa
acumulada
Quebra do reator
10
0,270
0,270
Falta de matéria-prima
6
0,162
0,432
Falta de embalagem
5
0,135
0,568
Falta de demanda
4
0,108
0,676
Quedas de energia
3
0,081
0,757
Quebra da esteira
2
0,054
0,811
Falta de mão-de-obra
2
0,054
0,865
Erro de instrumentação
2
0,054
0,919
Força maior
1
0,027
0,946
Auditoria física
1
0,027
0,973
Acerto de estoque
1
0,027
1,000
Causa de perda de
produção
Num gráfico de dois eixos de colunas/linhas atribui-se as frequências absolutas às
colunas e as frequências acumuladas à linha
12
10
0,973
0,9190,946
0,865
0,811
0,757
0,676
10
8
6
4
0,568
6
2
0,800
0,700
0,600
0,400
4
3
2
2
2
1
1
1
0,300
Ocorrência
0,200
Freq. Abs
0,100
0,000
0
Prof. André L. Santos
0,900
0,500
5
0,432
0,270
1,000
www.passeicursos.com.br
16
ESTATÍSTICA PARA O ISS-Teresina
AULA 0
Vê-se que é uma poderosa ferramenta estatística de qualidade. No
exemplo acima, mais de 40% das paradas foram geradas pelas duas causas
principais. Como os recursos são limitados, resolver estas duas únicas causas
de parada prioritariamente geraria um grande ganho de produtividade.
4. MEDIDAS DE TENDÊNCIA CENTRAL
Uma medida de tendência central é um valor no centro ou no meio de
um conjunto de dados
A média aritmética ou simplesmente média de um conjunto de valores
é o valor obtido somando-se todos eles e dividindo o total pelo número de
valores. É a medida de tendência central mais importante e mais usada.
Notações
Somatória de um conjunto de valores
Σ
x
Uma variável usada
individuais dos dados
para
representar
n
Número de valores de uma amostra
N
Número de valores de uma população
𝑥𝑥̅ =
µ=
∑ 𝑥𝑥
𝑛𝑛
∑ 𝑥𝑥
𝑁𝑁
valores
Média de um conjunto de valores de uma amostra
Média
população
de
um
conjunto
de
valores
de
uma
Exemplo, qual a média do conjunto: 10; 20; 25; 75?
� 𝑥𝑥 = 10 + 20 + 25 + 75 = 130
Como n=4:
𝑥𝑥̅ =
∑ 𝑥𝑥
𝑛𝑛
=
130
4
= 32,5
Cuidado! Não confunda o símbolo “traço” da média com o símbolo NÃO
do operador lógico!
Prof. André L. Santos
www.passeicursos.com.br
17
ESTATÍSTICA PARA O ISS-Teresina
AULA 0
No exemplo acima, vê-se uma propriedade importante da média: valores
extremos afetam a média. Naquela amostra há 3 números menores que a
média, mas o 75 é tão grande comparado a eles que “puxa” a média para si.
A média ponderada de um conjunto de valores é o valor obtido pela
multiplicação dos dados pela sua proporção dividida pela soma total. É útil
para misturas e quando componentes se mesclam
𝑥𝑥̅ =
∑ 𝑥𝑥. 𝑃𝑃(𝑥𝑥)
∑ 𝑥𝑥
Exemplo: Uma fábrica de suco mistura duas polpas concentradas de frutas, a
primeira tem 300l e 50% de sólidos, a segunda tem 1000l e 30% de sólidos. Qual a
concentração final?
𝑥𝑥̅ =
∑ 𝑥𝑥. 𝑃𝑃(𝑥𝑥)
𝑥𝑥1𝑃𝑃1 + 𝑥𝑥2𝑃𝑃2 300.0,50 + 1000.0,30 150 + 300
=
=
=
= 0,3461 = 35%
∑ 𝑥𝑥
𝑥𝑥1 + 𝑥𝑥2
300 + 1000
1300
A média de teores finais é 35%. Os valores de concentração foram ponderados.
Veremos mais detalhes da média ponderada na aula de distribuição de
probabilidades.
A mediana de um conjunto de valores é o valor que divide o conjunto
em duas partes iguais quando os valores estão em ordem crescente. O símbolo
da mediana é 𝑥𝑥�
Quando o conjunto tem um número ímpar de elementos, a mediana é o
elemento central. Se um número par, a média dos valores centrais.
Exemplo, qual a mediana do conjunto: 500; 10; 17; 20; 19; 75; 40?
500
O primeiro passo é ordenar o conjunto, portanto: 10 17 19 20 40 75
A mediana é o número do meio porque temos um número ímpar de
elementos
10
17
19
20
Prof. André L. Santos
40 75
500
portanto 𝑥𝑥�= 20
www.passeicursos.com.br
18
ESTATÍSTICA PARA O ISS-Teresina
AULA 0
Podemos perceber uma propriedade interessante da mediana, ela não é
afetada por pontos extremos. O 500 não move a mediana. Podia ser 76 no
lugar de 500, a mediana continuaria 20.
Exemplo, qual a mediana do conjunto: 10; 20; 25; 75?
Já temos o conjunto ordenado, mas é um número par de elementos:
10
20
25 75
A mediana é a média dos elementos centrais, ie 20 e 25. Portanto 𝑥𝑥�= (20+25)/2 =
22,5
A moda de um conjunto de dados é o valor que ocorre com mais
frequência. Cuidado, não necessariamente a moda é única. Se há duas, o
conjunto é bimodal. Se há mais, é multimodal.
Histogram of a
30
moda
25
Frequency
20
15
10
5
0
-2,25
-1,50
-0,75
0,00
a
0,75
1,50
Abaixo, um conjunto bimodal:
Prof. André L. Santos
www.passeicursos.com.br
19
ESTATÍSTICA PARA O ISS-Teresina
AULA 0
Conjunto bimodal
12
moda
moda
Frequency
10
8
6
4
2
0
19,5
21,0
22,5
24,0
b
25,5
27,0
28,5
O ponto médio é o valor que está no meio do caminho entre o maior e
o menor valor.
A amplitude é a diferença entre o maior e o menor valor. Tecnicamente
a amplitude não é uma medida de tendência central, e sim de variação. Mas
como o ponto médio é a média da amplitude, explico aqui.
Exemplo: calcule a amplitude e o ponto médio de 10; 50; 60; 100; 20
O maior valor é 100, o menor é 10. Portanto a amplitude é 90. O ponto médio é a
média de 10 e 100, portanto (10+100)/2= 55
5. ASSIMETRIA
Diz-se que uma distribuição é simétrica quando as metades esquerdas
e direitas de seu histograma são iguais. Uma propriedade importantíssima de
uma distribuição simétrica é que a mediana, a moda e a média são iguais, ie,
coincidem.
Prof. André L. Santos
www.passeicursos.com.br
20
ESTATÍSTICA PARA O ISS-Teresina
AULA 0
Exemplo de distribuição simétrica
0
900
Média = Mediana = Moda
800
700
Frequency
600
500
400
300
200
100
0
-5,2
-3,9
-2,6
-1,3
0,0
1,3
2,6
3,9
A
Diz-se que uma distribuição é assimétrica quando as metades
esquerdas e direitas de seu histograma não são iguais e estendem-se mais
para um lado que para o outro. As distribuições assimétricas podem ser à
direta ou à esquerda, respectivamente positiva e negativa.
Uma distribuição assimétrica à esquerda tem a média e a mediana à
esquerda da moda. Já uma distribuição assimétrica à direita tem a média e a
mediana à direita da moda.
Prof. André L. Santos
www.passeicursos.com.br
21
ESTATÍSTICA PARA O ISS-Teresina
AULA 0
Distribuição assimétrica a direita
1
6000
1,89 2
Moda 1
Média 1,89
Mediana 2
5000
Assimetria a direita:
Média > Moda
Mediana > Moda
Frequency
4000
3000
2000
1000
0
0
2
4
6
10
8
B
Distribuição assimétrica a esquerda
8,98 9,29 9,8
1200
Moda 9,8
Mediana 9,29
Media 8,98
1000
Frequency
800
Assimetria a esquerda:
Moda > Mediana
Moda > media
600
400
200
0
1,2
2,4
3,6
4,8
6,0
7,2
8,4
9,6
d
Prof. André L. Santos
www.passeicursos.com.br
22
ESTATÍSTICA PARA O ISS-Teresina
AULA 0
Resumindo:
Assimétrica à
esquerda ou
negativamente
assimétrica
Simétrica
Assimétrica à direta
ou positivamente
assimétrica
Mediana < Moda
Moda = Média =
Mediana
Mediana > Moda
Média < Moda
Média > Moda
6. GRÁFICOS DE CAIXA (BLOXPLOT), QUARTIS E PERCENTIS
A mediana tem dois “irmãos”. São o primeiro quartil e o terceiro
quartil. Se a mediana divide a distribuição ordenada em duas partes iguais,
cada uma com 50% de elementos, o primeiro quartil divide no primeiro um
quarto, ie, 25% antes versus 75% após. Analogamente, o terceiro quartil
divide em 75% e 25%.
Para calcular os quartis é da mesma maneira que a mediana. Ordena-se
a distribuição e pega-se o elemento em 25/100 n-ésima posição para o
primeiro quartil (Q1) e 75/100 n-ésima posição para o terceiro (Q3),
lembrando sempre que n é o número de elementos na distribuição. Se os
quartis ficarem entre dois elementos, adota-se o inteiro mais próximo. Em
certo sentido, a mediana é o segundo quartil (Q2).
Posição Q1 = 25/100 * n
Mediana (Q2) = 50/100 * n
; Posição Q3 = 75/100 * n; Posição da
A distância interquartílica é a diferença entre Q3 e Q1.
Os percentis são análogos aos quartis e são calculados da mesma
forma. Exemplo, O 10% percentil de uma distribuição é o elemento ordenado
que ocupa a posição 10/100 * n. O 64% percentil de forma análoga é
64/100*n. O Q1 é o 25% percentil, o Q3 é o 75% percentil e a mediana é o
50% percentil.
Posição 10% percentil = 10/100*n; Posição 64% percentil = 64/100*n
Posição k percentil = k/100 * n; onde 0<k<100%
Um gráfico muito comum em estatística para observar os quartis e
medianas é o gráfico de caixa ou bloxplot. Trata-se de uma caixa dividida na
mediana que vai do Q1 até o Q3. Veja o exemplo:
Prof. André L. Santos
www.passeicursos.com.br
23
ESTATÍSTICA PARA O ISS-Teresina
AULA 0
Exemplo de Boxplot
250
Os pontos avulsos são "Outliers"
Valores extremos acima ou abaixo
dos limites
Limite superior = Q3 + 1.5 (Q3 - Q1)
200
150
Q3
100
Distância
interquartílica
mediana
Q1
50
0
Limite inferior = Q1- 1.5 (Q3 - Q1)
Os boxplot também possuem uma linha ligando até 150% da distância
interquartílica abaixo e acima de Q1 e Q3 respectivamente. Os pontos fora
deste intervalo são os ditos “outliers”, os pontos famosos da expressão “pontos
fora da curva”. Não se preocupe com outliers por hora, nunca vi caírem em
prova alguma mesmo nos exercícios de boxplot, mas sempre é bom saber.
7. MEDIDAS DE VARIABILIDADE
A amplitude de uma distribuição é a diferença entre o maior e o menor
valor. Tem uso limitado, exceto para o cálculo do ponto médio. A medida de
variação por excelência é o desvio-padrão:
O desvio-padrão de um conjunto de dados é uma medida de variação
dos valores em relação à média. É uma medida de dispersão absoluta.
A variância de um conjunto de dados é a média dos quadrados das
diferenças dos valores em relação à sua média.
Na prática, o desvio-padrão (e sua mãe, a variância) representa o “grau
de espalhamento” que os pontos estão da média. Veja o exemplo abaixo para
entender. O histograma mais “espalhado” tem maior desvio-padrão.
Prof. André L. Santos
www.passeicursos.com.br
24
ESTATÍSTICA PARA O ISS-Teresina
AULA 0
Histogram of a; b
Normal
0,0016
A população "b"
tem menor desvio
padrão que "a".
Os dados são
menos
"espalhados" ao
redor das médias
0,0014
Density
0,0012
0,0010
0,0008
Variable
a
b
Mean StDev
N
5010 403,1 200
5003 275,2 200
0,0006
0,0004
0,0002
0,0000
4200
4500
4800
5100
Data
5400
5700
6000
Desvio-padrão é a raiz quadrada (√ ) da variância. Não posso
deixar de reforçar a importância deste conceito. Porque se calcula a variância
da distribuição em primeiro lugar e todas as operações com desvio devem ser
feitas com a variância. Porém o desvio-padrão é realmente aquilo útil para se
compreender a distribuição por ter a unidade dos elementos. Ou seja, fala-se
em desvio-padrão, mas se mexe nele com a variância. Insisto, este conceito
cai muito.
Vamos revisar as notações e fórmulas. Algumas são novas, outras você
já conhece:
Notações
�x
Somatória de um conjunto de valores x
x
Uma variável usada para representar valores
individuais dos dados
n
Número de valores de uma amostra
N
Número de valores de uma população
𝑥𝑥̅ =
∑ 𝑥𝑥
𝑛𝑛
Prof. André L. Santos
Média de um conjunto de valores de uma amostra
www.passeicursos.com.br
25
ESTATÍSTICA PARA O ISS-Teresina
∑(𝑥𝑥−𝑥𝑥̅ )2
S2 =
𝑛𝑛−1
=
𝑁𝑁
2
𝑛𝑛(𝑛𝑛−1)
𝑁𝑁
∑(𝑥𝑥−𝑥𝑥̅ )2
∑(𝑥𝑥−µ)2
𝑛𝑛−1
2
(∑ 𝑥𝑥)
𝑁𝑁
�
n(∑ x2 )−(∑ x)2
=�
=� �∑ 𝑥𝑥2 −
𝑁𝑁
Variância de um conjunto de valores de uma
população
=
σ=√𝜎𝜎 2 =
1
Variância de um conjunto de valores de uma
amostra
n�∑ x2 �−(∑ x)2
�� 𝑥𝑥 −
s=√𝑆𝑆 2 =�
𝑁𝑁
𝑁𝑁
∑(𝑥𝑥−µ)2
σ2=
1
Média de um conjunto de valores de uma
população
∑ 𝑥𝑥
µ=
AULA 0
𝑛𝑛(𝑛𝑛−1)
(∑ 𝑥𝑥)
𝑁𝑁
2
�
Desvio-padrão de um conjunto de valores de uma
amostra
Desvio-padrão (sigma) de
valores de uma população
um
conjunto
de
A mesma distinção entre amostra e população deve ser feita com mais
rigor no cálculo de desvio-padrão que no cálculo das médias e as bancas
cobram nas questões este conhecimento. Quando é uma amostra, a divisão é
por n-1, quando é população, por N. Por quê? Porque uma amostra perde um
grau de liberdade. Ela é uma partição de um sistema, é algo a menos que um
sistema, é um grau de liberdade a menos, portanto n-1. Ora, como a divisão é
feita por um número menor, percebemos que o desvio-padrão de uma amostra
é MAIOR que o de uma população. Lógico! A amostra é uma tentativa de
previsão da população por um subconjunto, naturalmente tem medidas mais
imprecisas.
Usualmente, o desvio-padrão “padrão” é o amostral, isto é, o s,
calculado com n-1. Inclusive é o padrão das maiorias das calculadoras
científicas. Mas cuidado, elas também tem o botão sigma N. O candidato deve
ficar esperto para perceber quando se fala de desvio-padrão se é o amostral ou
populacional. Dá para perceber que quanto maior for o tamanho da amostra,
menos importante será o desvio-padrão amostral e populacional. Natural,
porque se uma amostra começa a crescer, fica menos imprecisa perante o todo
da população, que a perda de um grau de liberdade é irrelevante.
Chega de papo! Vamos a um exemplo bem simples:
Prof. André L. Santos
www.passeicursos.com.br
26
ESTATÍSTICA PARA O ISS-Teresina
AULA 0
Calcule o desvio-padrão da amostra: 2; 10; 3; 6 ;8; 2; 3 :
O procedimento é simples e pode ser usada uma tabela que nem precisa ser
ordenada:
Calcule a média 𝑥𝑥̅ =
∑ 𝑥𝑥
𝑛𝑛
Calcule cada um dos quadrados (𝑥𝑥 − 𝑥𝑥̅ )2
Faça a somatória ∑(𝑥𝑥 − 𝑥𝑥̅ )2
∑(𝑥𝑥−𝑥𝑥̅ )2
Calcule a variância S2=
𝑛𝑛−1
Calcule o desvio-padrão s=√𝑆𝑆 2
x
x-𝑥𝑥̅
(x-𝑥𝑥̅ )2
2
-2,9
8
10
5,1
26
3
-1,9
3
6
1,1
1
8
3,1
10
2
-2,9
8
3
-1,9
3
Σ
34
-
61
n
7
média 𝑥𝑥̅
4,9
n-1
Variância s
6
2
10
Desvio-padrão s
3
O desvio-padrão sempre tem o número de algarismos depois da
vírgula da média. Portanto arredondamos para 27, porque esta amostra não
tem algarismos depois da vírgula.
Podemos dizer que a amostra acima tem média 𝑥𝑥̅ = 126 ± 11. O
desvio-padrão tem as mesmas unidades da média, e é sempre um “mais ou
menos” de dispersão em torno da média
O coeficiente de variação é definido como o quociente entre o desviopadrão e a média. Sua vantagem é caracterizar a dispersão dos dados em
termos relativos.
CV=
Prof. André L. Santos
𝑠𝑠
𝑥𝑥̅
www.passeicursos.com.br
27
ESTATÍSTICA PARA O ISS-Teresina
AULA 0
Exemplo, uma amostra com média de 100 e desvio padrão de 20 tem coeficiente de
variação de 0,2
É uma medida de dispersão relativa.
CUIDADO! As bancas muitas vezes chamam sem critério o coeficiente de
variação de VARIABILIDADE, pura e simplesmente, e fazem uma confusão
danada entre variabilidade relativa (o CV) e absoluta (o desvio). Fique
atento.
8. FÓRMULA ABREVIADA DA VARIÂNCIA
Aqui vai um macete precioso para a sua prova.
Na aula anterior, vimos a fórmula usual para o cálculo do desvio-padrão:
∑(𝑥𝑥−𝑥𝑥̅ )2
s=�
𝑛𝑛−1
Esta fórmula requer que se faça uma tabela para o cálculo da média.
Muitas vezes esta fórmula agrega erros de truncamentos nas médias.
Esta fórmula pode ser expressa de um segundo modo, que é
interessante por não precisar da média. É usada pelas calculadoras, porque
permite que o desvio seja recalculado a cada dado novo que se coloca na
amostra. É importante conhecê-la porque algumas bancas pedem exercícios
em que ela é usada.
Variância: s2=
n�∑ x2 �−(∑ x)2
𝑛𝑛(𝑛𝑛−1)
n(∑ x2 )−(∑ x)2
Desvio: s=�
𝑛𝑛(𝑛𝑛−1)
Ela é um desenvolvimento da primeira fórmula. Ambas resultam no
mesmo valor. Pode fazer a conta.
Antes que me perguntem... e para populações?
1
Variância: σ2= �∑ 𝑥𝑥 2 −
𝑁𝑁
1
Desvio: σ=� �∑ 𝑥𝑥 2 −
𝑁𝑁
Prof. André L. Santos
(∑ 𝑥𝑥)2
𝑁𝑁
(∑ 𝑥𝑥)2
𝑁𝑁
�
�
www.passeicursos.com.br
28
ESTATÍSTICA PARA O ISS-Teresina
AULA 0
Qual fórmula você usa na prova? Ora, veja o jeitão da questão. Se der
somatórias ou seus quadrados, pimba, use a abreviada.
Variância de Populações
Fórmula clássica
Fórmula abreviada
- Usa a média -
- Usa os quadrados -
σ2 =
Variância de Amostras
∑(𝑥𝑥 − µ)2
𝑁𝑁
s2=
(∑ 𝑥𝑥)2
1
σ2= �∑ 𝑥𝑥 2 −
𝑁𝑁
∑(𝑥𝑥−𝑥𝑥̅ )2
s2=
𝑛𝑛−1
𝑁𝑁
n�∑ x2 �−(∑ x)2
�
𝑛𝑛(𝑛𝑛−1)
9. PROPRIEDADES DA MÉDIA E DA VARIÂNCIA
A FCC adora cobrar propriedades das medidas de distribuições.
As propriedades da média são:
9.1 Multiplicando-se todos os valores de uma variável por uma
constante, a média do conjunto fica multiplicada por esta constante;
Elementos
População
10
20
Multiplicando por 2
Nova População
30
𝑥𝑥̅
10
10
16
20
20
32
X2
20
40
60
9.2 Somando-se ou subtraindo-se uma constante a todos os valores de
uma variável, a média do conjunto fica acrescida ou diminuída dessa constante
Elementos
População
10
20
Somando 4
Nova População
30
𝑥𝑥̅
10
10
16
14
14
20
+4
14
24
34
Fique atento. Especialmente porque como sempre estou reforçando aqui,
não se faz cálculos com desvio, e sim com a variância. Portanto as
propriedades da variância são:
9.3 Multiplicando-se todos os valores de uma variável por uma
constante, a variância do conjunto fica multiplicada pelo quadrado desta
constante
Elementos
População
10
Prof. André L. Santos
20
30
10
10
www.passeicursos.com.br
𝜎𝜎 2
64
29
ESTATÍSTICA PARA O ISS-Teresina
Multiplicando por 2
AULA 0
X2
256
Nova População
20
40
60
20
20
(64 X 2^2)
9.4 Somando-se ou subtraindo-se uma constante a todos os valores de
uma variável, a variância não se altera. (Natural, porque a média se move,
não a dispersão dos valores)
𝜎𝜎 2
Elementos
População
10
20
30
Somando 4
10
10
64
14
14
64
+4
Nova População
14
24
34
Agora vamos num exemplo com desvio-padrão amostral e variância para
o aluno ver que estas propriedades são da variância, não do desvio.
S2
s
1670
41
Elementos
Amostra
10
5
Multiplicando por 2
Nova amostra
10
10
100
X2
20
10
20
X 4 (ie, 2^2)
20
6680
200
82
4X41=
164
A propriedade da
variância não se
conservou no desvio!
9.5 Variância combinada ocorre na combinação de duas populações:
σ2 (𝐴𝐴 + 𝐵𝐵) =
(∑ 𝐴𝐴 + ∑ 𝐵𝐵)2
1
��� 𝐴𝐴2 + � 𝐵𝐵2 � −
�
𝑁𝑁𝐴𝐴 + 𝑁𝑁𝑏𝑏
𝑁𝑁𝑎𝑎 + 𝑁𝑁𝑏𝑏
Onde σ𝑎𝑎 2=
1
𝑁𝑁𝐴𝐴
�∑ 𝐴𝐴2 −
(∑ 𝐴𝐴)2
𝑁𝑁𝐴𝐴
�
1
σ𝑏𝑏 2=𝑁𝑁 �∑ 𝐵𝐵2 −
𝐵𝐵
Cuidado: 𝝈𝝈𝟐𝟐𝑨𝑨 + 𝝈𝝈𝟐𝟐𝑩𝑩 <> 𝝈𝝈𝟐𝟐𝑨𝑨+𝑩𝑩
(∑ 𝐵𝐵)2
𝑁𝑁𝐵𝐵
�
Não tem mistério, é pura equação e decoreba. Mas a FCC adora esta
fórmula e não foram poucas provas em que cobrou. Se você olhar com
cuidado, verá que é pura e simplesmente a fórmula de desvios de população
abreviada somada.
ADVERTÊNCIA: O desvio-padrão combinado é a raiz da variância
combinada. Mais uma vez digo e repito, não se faz contas com desvio, e sim
com a variância.
Prof. André L. Santos
www.passeicursos.com.br
30
ESTATÍSTICA PARA O ISS-Teresina
AULA 0
Calcule o desvio-padrão combinado das populações A e B abaixo:
A
0
0
0
1
0
0
2
2
B
4
6
5
9
4
2
6
6
7
1
6
8
Vamos fazer os cálculos necessários
A
0
0
0
1
0
0
2
2
5
ΣA
ΣA2
Na
A2
0
0
0
1
0
0
4
4
B
4
6
5
9
4
2
6
6
7
1
6
8
64
9
8
ΣB
ΣB2
400
Nb
σ2 (𝐴𝐴 + 𝐵𝐵) =
B2
16
36
25
81
16
4
36
36
49
1
36
64
12
(∑ 𝐴𝐴 + ∑ 𝐵𝐵)2
1
��� 𝐴𝐴2 + � 𝐵𝐵2 � −
�
𝑁𝑁𝐴𝐴 + 𝑁𝑁𝑏𝑏
𝑁𝑁𝑎𝑎 + 𝑁𝑁𝑏𝑏
(5 + 64)2
(69)2
1
1
=
�(9 + 400) −
�=
�(409) −
� = 8,5475 = 8
8 + 12
8 + 12
20
20
E o desvio: 𝜎𝜎 = √𝜎𝜎 2 =�8,5475=2,9236=3
Quer fazer o tira teima? Vamos juntar as duas populações e calcular a
variância:
AUB
0
0
0
1
0
0
2
2
Prof. André L. Santos
(A U B)2
0
0
0
1
0
0
4
4
www.passeicursos.com.br
31
ESTATÍSTICA PARA O ISS-Teresina
4
6
5
9
4
2
6
6
7
1
6
8
69
Σ
Σ2
N
σ2
AULA 0
16
36
25
81
16
4
36
36
49
1
36
64
409
20
8,5475
Como queríamos demonstrar
Cuidado: 𝝈𝝈𝟐𝟐𝑨𝑨 + 𝝈𝝈𝟐𝟐𝑩𝑩 <> 𝝈𝝈𝟐𝟐𝑨𝑨+𝑩𝑩
2
No exemplo acima também vale: 𝜎𝜎𝐴𝐴2 + 𝜎𝜎𝐵𝐵2 <> 𝜎𝜎𝐴𝐴+𝐵𝐵
Sabendo que 𝜎𝜎𝐴𝐴2 = 0,73
Prof. André L. Santos
𝜎𝜎𝐵𝐵2 = 4,42
0,73 + 4,42 <> 8,55
www.passeicursos.com.br
32
ESTATÍSTICA PARA O ISS-Teresina
AULA 0
EXERCÍCIOS RESOLVIDOS
10.
EXERCÍCIOS RESOLVIDOS
FCC/ICMS-RJ/2014 - O Departamento de Pessoal de certo órgão
público fez um levantamento dos salários, em número de salários
mínimos (SM), dos seus 400 funcionários, obtendo os seguintes
resultados:
1.
Sabe-se que a mediana dos salários desses funcionários
calculada por meio dessa tabela pelo método da interpolação linear é
igual a 8,8 SM. Nessas condições, o salário médio desses 400
funcionários, em número de salários mínimos, considerando que todos
os valores incluídos em um intervalo de classe são coincidentes com o
ponto médio do intervalo, é igual a
a) 8,54
b) 8,83
c) 8,62
d) 8,93
e) 8,72
O enunciado deu uma informação muito preciosa, de que a mediana foi
interpolada em 8,8, ou seja, e está no intervalo [8,10[. Ou seja, está em x.
Outra informação é que temos 400 elementos. Se a mediana divide meio
a meio, quando chegarmos ao 8,8 temos 200 de cada lado.
Vamos entender o intervalo x
Prof. André L. Santos
www.passeicursos.com.br
33
ESTATÍSTICA PARA O ISS-Teresina
AULA 0
Ora, se até 8 temos a frequência acumulada de 148 e até 8,8 temos de 200, por
divisão simples vemos que temos 200-148 em 8,8-8,0
Ou seja, 52 em 0,8
Como a classe de x tem uma extensão de 2, pela regra de 3
0,8 2
8,8 − 8,0
=
=
𝑥𝑥
200 − 148 52
x= 130
Como a somatória dos intervalos é 400, temos uma equação onde chegamos à y
48 + 100 + x+ y+40=400
x+y=212
Se temos x, teremos y
130 + y = 212
y = 82
Refazendo nossa tabela
Inf (contém)
Sup (não
contém)
PM
Freq abs
4
6
5
48
6
8
7
100
8
10
9
130
10
12
11
82
Prof. André L. Santos
www.passeicursos.com.br
34
ESTATÍSTICA PARA O ISS-Teresina
12
16
14
40
Total
400
AULA 0
E a média? Ora, é aplicar a fórmula da média ponderada, usando como x os pontos
médios dos intervalos
𝑥𝑥̅ =
Melhor fazer esta conta com uma tabela
∑ 𝑥𝑥. 𝑓𝑓
𝑛𝑛
Inf
(contém)
Sup (não
contém)
PM (x)
Freq abs (f)
PM X Freq (x.f)
4
6
5
48
240
6
8
7
100
700
8
10
9
130
1170
10
12
11
82
902
12
16
14
40
560
Total (n)
400
Σxf
3572
média = Σxf/n
8,93
GABARITO: D
FCC/ICMS-RO/2010 - Em uma cidade é realizado um
levantamento referente aos valores recolhidos de determinado tributo
estadual no período de um mês. Analisando os documentos de
arrecadação, detectou-se 6 níveis de valores conforme consta no eixo
horizontal do gráfico abaixo, em que as colunas representam as
quantidades de recolhimentos correspondentes.
2.
Prof. André L. Santos
www.passeicursos.com.br
35
ESTATÍSTICA PARA O ISS-Teresina
AULA 0
Com relação às medidas de posição deste levantamento tem-se
que o valor da
a) média aritmética é igual a metade da soma da mediana e a
moda.
b) média aritmética é igual ao valor da mediana.
c) média aritmética supera o valor da moda em R$ 125,00.
d) moda supera o valor da mediana em R$ 500,00.
e) mediana supera o valor da média aritmética em R$ 25,00.
Qual é a moda? A moda é 1500. É o valor de maior ocorrência, é o valor
da maior barra.
E a boa e velha média? Vamos calcular na marra.
𝑥𝑥̅ =Σx/n=(30X500+50X1000+60X1500+30X2000+20X2500+10X3000)/(
30+50+60+30+20+10)=(15000+50000+90000+60000+50000+30000)/200
=295000/200=2950/2=1475
Observe aqui que o histograma dá a frequência dos eventos. Sendo
assim, se fôssemos escrever a população, seriam trinta linhas de 500,
cinquenta linhas de 1000, sessenta de 1500 e assim vai. O número de linhas,
ie, a somatória das frequências, é o número de elementos, n.
A mediana é um cálculo interessante. Se temos 200 elementos (n) e o
histograma está ordenado, amediana é o número entre o 99º e 100º
elemento. Ora, se temos 30 de 500, 50 de 1000 e 60 de 1500, raciocine
comigo graficamente:
99º-100º
500
Prof. André L. Santos
1000
elemento
é
um
1500
www.passeicursos.com.br
36
ESTATÍSTICA PARA O ISS-Teresina
0
30º
80º
140º
AULA 0
200º
Portanto a mediana ẋ =1500
Agora é comentarmos as questões:
a) média aritmética é igual a metade da soma da mediana e a
moda. – Nananinanão. A média é 1475, e a soma da mediana e da moda
é 1500+1500=3000
b) média aritmética é igual ao valor da mediana. – Negativo.
𝑥𝑥̅ =1475 <> 𝑥𝑥̇ =1500
c) média aritmética supera o valor da moda em R$ 125,00. –
Hum... A moda é 1500, a média é 1475. A moda supera a média em 25,
não 125. Errada
d) moda supera o valor da mediana em R$ 500,00. – A moda é
1500, a mediana é 1500. Elas são iguais. Errada
e) mediana supera o valor da média aritmética em R$ 25,00. –
Opa, certa, certíssima. A 𝑥𝑥̇ =1500 e 𝑥𝑥̅ =1475, portanto 𝑥𝑥̇ - 𝑥𝑥̅ = R$ 25,00
GABARITO: E
3.
FCC/ICMS-SP/2013 - Considere:
I. O coeficiente de variação de uma variável é uma medida de
dispersão absoluta que é o resultado da divisão entre a média e o
desvio padrão da variável em questão.
II. Um dispositivo útil quando se deseja verificar se existe
correlação linear entre duas variáveis é o gráfico de colunas
justapostas.
III. O desvio padrão é mais apropriado do que o coeficiente de
variação quando se deseja comparar a variabilidade de duas variáveis.
IV. Na amostragem aleatória estratificada, a população é dividida
em estratos, usualmente, de acordo com os valores ou categorias de
uma variável, e, depois, uma amostragem aleatória simples é utilizada
na seleção de uma amostra de cada estrato.
Está correto o que se afirma APENAS em
a) I.
b) II.
c) III.
Prof. André L. Santos
www.passeicursos.com.br
37
ESTATÍSTICA PARA O ISS-Teresina
AULA 0
d) I e IV.
e) IV.
Ah, questões teóricas não são pontos dados não! São terríveis às vezes!
I - O coeficiente de variação de uma variável é uma medida de dispersão
absoluta que é o resultado da divisão entre a média e o desvio padrão da
variável em questão. – ERRADA. O CV é a divisão do desvio pela média. E é
uma medida relativa.
II. Um dispositivo útil quando se deseja verificar se existe correlação
linear entre duas variáveis é o gráfico de colunas justapostas. – ERRADA.
Você coloca duas colunas justapostas e faz o quê com elas? Gráfico de colunas
é útil para populações e amostras, não variáveis.
III. O desvio-padrão é mais apropriado do que o coeficiente de variação
quando se deseja comparar a variabilidade de duas variáveis. – ERRADA. Sem
levar em conta a questão subjetiva de ser apropriado ou não, o desvio-padrão
não fala nada em relação à média. Veja o exemplo abaixo. Ambas populações
tem σ=100, dá para perceber que b é menos dispersa que a. Porém o CV de B
é menor que A.
Histogram of a; b
0
800
1600 2400 3200 4000 4800
b
a
700
600
Frequency
500
400
300
200
100
0
0
800
1600 2400 3200 4000 4800
Prof. André L. Santos
www.passeicursos.com.br
38
ESTATÍSTICA PARA O ISS-Teresina
AULA 0
IV. Na amostragem aleatória estratificada, a população é dividida em
estratos, usualmente, de acordo com os valores ou categorias de uma variável,
e, depois, uma amostragem aleatória simples é utilizada na seleção de uma
amostra de cada estrato. – CERTA. Impecável. É praticamente a definição.
GABARITO: E
FCC/ISS-SP/2007 - No presente mês, o salário médio mensal
pago a todos os funcionários de uma firma foi de R$ 530,00. Sabe-se
que os salários médios mensais dos homens e mulheres são
respectivamente iguais a R$ 600,00 e R$ 500,00. No próximo mês,
todos os homens receberão um adicional de R$ 20,00 e todas as
mulheres um reajuste salarial de 10%, sobre os salários atuais.
Supondo que o quadro de funcionários não se alterou, após esses
reajustes o salário médio mensal de todos os funcionários passará a
ser igual a:
4.
a) R$ 540,00
b) R$ 562,00
c) R$ 571,00
d) R$ 578,00
e) R$ 580,00
Esta é uma questão de propriedades da média requer um certo
pensamento para sair do problema da ponderação. Porque mesmo que seja
simples aplicar os reajustes aos salários, depois não vai se conseguir sair para
a soma ponderada
𝑥𝑥
� ℎ = 600; 𝑥𝑥� 𝑚𝑚 = 500
𝑥𝑥
� todos = 530
Aumento homens + R$20
Novo 𝑥𝑥� ℎ = 600 + 20 = 620
Aumento mulheres X R$1,10
Novo 𝑥𝑥� 𝑚𝑚 = 500 X 1,1 = 550
E ai? Temos que chegar à proporção de homens e mulheres na firma!
Prof. André L. Santos
www.passeicursos.com.br
39
ESTATÍSTICA PARA O ISS-Teresina
AULA 0
𝑥𝑥̅todos = 𝑥𝑥̅ℎ . PropH + 𝑥𝑥̅𝑚𝑚 . PropM
530 = 600. PropH + 500. PropM
A Proporção de homens e mulheres dá 1. Então temos a segunda
equação:
Voltando acima
PropH + PropM = 1
PropH = 1 − PropM
530 = 600. PropH + 500. PropM
530 = 600. (1 − PropM) + 500. PropM
530 = 600 − 600PropH + 500. PropM
Agora vai:
−70 = −100. PropM
PropM = 0,7 in consequentiam PropH=0,3
Nova media = Novo 𝑥𝑥̅𝑚𝑚 X 0,7 + Novo 𝑥𝑥̅ℎ X 0,3 = 550 X0,7 + 620 X0,3
GABARITO: C
5.
= 385 + 186 = 571
FCC/ISS-SP/2012 - Considere as seguintes afirmações:
I. Um dispositivo útil quando se quer verificar a associação entre
duas variáveis quantitativas é o gráfico de dispersão entre essas duas
variáveis.
II. O coeficiente de variação é uma medida de dispersão relativa
que depende da unidade de medida da variável que está sendo
analisada.
III. Dentre as medidas de posição central, a média é considerada
uma medida robusta pelo fato de não ser afetada por valores
aberrantes.
IV. Se o coeficiente de correlação linear de Pearson entre duas
variáveis for igual a zero, não haverá associação linear entre elas,
implicando a ausência de qualquer outro tipo de associação.
Está correto o que se afirma APENAS em
a) II e III.
b) I e II.
Prof. André L. Santos
www.passeicursos.com.br
40
ESTATÍSTICA PARA O ISS-Teresina
AULA 0
c) I e III.
d) II e IV.
e) I.
I. Um dispositivo útil quando se quer verificar a associação entre duas
variáveis quantitativas é o gráfico de dispersão entre essas duas variáveis. CERTA
Vamos a um exemplo de gráfico de dispersão, vulgo X versus Y
Dispersão de A versus C
10
8
6
a
Aparentemente há
correlação
4
2
0
5
10
15
20
25
c
II. O coeficiente de variação é uma medida de dispersão relativa que
depende da unidade de medida da variável que está sendo analisada. –
ERRADA – De jeito nenhum. Média e desvio-padrão que compõe o CV tem a
mesma unidade.
III. Dentre as medidas de posição central, a média é considerada uma
medida robusta pelo fato de não ser afetada por valores aberrantes. –
ERRADA – Uma das propriedades e desvantagens da média é justamente ser
afetada por valores extremos.
IV. Se o coeficiente de correlação linear de Pearson entre duas variáveis
for igual à zero, não haverá associação linear entre elas, implicando a ausência
Prof. André L. Santos
www.passeicursos.com.br
41
ESTATÍSTICA PARA O ISS-Teresina
AULA 0
de qualquer outro tipo de associação. – ERRADA – Veremos com mais
detalhes na última aula. O coeficiente linear de Pearson, como o nome mesmo
já diz, mede correlações lineares. OU seja, quando é zero, significa que a
correlação não é linear, mas pode haver outra correlação.
O exemplo abaixo é uma correlação quadrática. Observem que o coeficiente linear é
bem próximo de zero, mas HÁ correlação.
Scatterplot of a vs d
Regression fit; a = 2,176 + 0,08634 d
12
Indica quase nenhuma correlação
LINEAR
10
a
8
6
4
2
0
0
20
40
60
80
100
d
GABARITO: E
FCC/ICMS-RO/2010 - A média aritmética de todos os salários dos
funcionários em uma repartição pública é igual a R$ 1.600,00. Os
salários dos funcionários do sexo masculino apresentam um desvio
padrão de R$ 90,00 com um coeficiente de variação igual a 5%. Os
salários dos funcionários do sexo feminino apresentam um desvio
padrão de R$ 60,00 com um coeficiente de variação igual a 4%.
Escolhendo aleatoriamente um funcionário desta repartição, a
probabilidade dele ser do sexo feminino é igual a
6.
a) 1/2
b) 1/3
Prof. André L. Santos
www.passeicursos.com.br
42
ESTATÍSTICA PARA O ISS-Teresina
AULA 0
c) 3/4
d) 3/5
e) 2/3
Vamos colocar os dados do enunciado:
Homens
Mulheres
𝜎𝜎𝐻𝐻 = 90
𝜎𝜎𝑀𝑀 = 60
𝐶𝐶𝐶𝐶𝐻𝐻 =0,05
População
µ=1600
𝐶𝐶𝐶𝐶𝑀𝑀 =0,04
Pela definição de CV: CV=σ/µ
𝜎𝜎𝐻𝐻 = 90
𝜇𝜇𝐻𝐻 =
𝐶𝐶𝐶𝐶𝐻𝐻 = 𝜎𝜎𝐻𝐻�𝜇𝜇𝐻𝐻 ---> 0,05=90/𝜇𝜇𝐻𝐻
90
= 1800
0,05
𝜎𝜎𝑀𝑀 = 60
𝐶𝐶𝐶𝐶𝑀𝑀 = 𝜎𝜎𝑀𝑀�𝜇𝜇𝑀𝑀 ---> 0,04=90/𝜇𝜇𝐻𝐻
Homens
𝜎𝜎𝐻𝐻 = 90
𝐶𝐶𝐶𝐶𝐻𝐻 =0,05
𝜇𝜇𝐻𝐻 =1800
𝜇𝜇𝑀𝑀 =
60
= 1500
0,04
Mulheres
𝜎𝜎𝑀𝑀 = 60
População
µ=1600
𝐶𝐶𝐶𝐶𝑀𝑀 =0,04
𝜇𝜇𝐻𝐻 =1500
A média da população é a média (ponderada) de homes e mulheres
𝑥𝑥𝐻𝐻 𝜇𝜇𝐻𝐻 + 𝑥𝑥𝑀𝑀 𝜇𝜇𝐻𝐻 = 𝜇𝜇
𝑥𝑥𝐻𝐻 1800 + 𝑥𝑥𝑀𝑀 1500 = 1600
Como homens e mulheres são frequências relativas a somatória precisa
ser 1
Prof. André L. Santos
𝑥𝑥𝐻𝐻 + 𝑥𝑥𝑀𝑀 = 1
www.passeicursos.com.br
43
ESTATÍSTICA PARA O ISS-Teresina
AULA 0
Temos duas equações e duas incógnitas
�
𝑥𝑥𝐻𝐻 1800 + 𝑥𝑥𝑀𝑀 1500 = 1600
𝑥𝑥𝐻𝐻 + 𝑥𝑥𝑀𝑀 = 1
Arrumando a segunda equação e a colocando na primeira:
𝑥𝑥𝐻𝐻 + 𝑥𝑥𝑀𝑀 = 1
𝑥𝑥𝑀𝑀 = 1 − 𝑥𝑥𝐻𝐻
𝑥𝑥𝐻𝐻 1800 + 𝑥𝑥𝑀𝑀 1500 = 1600
𝑥𝑥𝐻𝐻 1800 + (1 − 𝑥𝑥𝐻𝐻 )1500 = 1600
1800𝑥𝑥𝐻𝐻 + 1500 − 1500𝑥𝑥𝐻𝐻 = 1600
300𝑥𝑥𝐻𝐻 = 1600 − 1500 = 100
𝑥𝑥𝐻𝐻 =
100
= 1/3
300
Em consequência da complementaridade 𝑥𝑥𝑀𝑀 = 1 − 𝑥𝑥𝐻𝐻 =
Gênero
x
Homens
1/3
Mulheres
2/3
2
3
As mulheres corresponde a 2/3 do total, portanto P(Mulher)=2/3
GABARITO: E
FCC/ICMS-BA/2004 - O gráfico abaixo é o histograma de
frequências absolutas de uma amostra de valores arrecadados de
determinado tributo em um município.
7.
Prof. André L. Santos
www.passeicursos.com.br
44
ESTATÍSTICA PARA O ISS-Teresina
AULA 0
Com relação aos dados dessa amostra, é verdade que
a) 60% dos valores são maiores ou iguais a R$ 1 500,00
menores que R$ 3 000,00.
b) mais de 30% dos valores são maiores ou iguais a R$ 2 500,00
menores que R$ 3 500,00.
c) a porcentagem dos valores iguais ou superiores a R$ 3 500,00
maior que a porcentagem dos valores inferiores a R$ 1 500,00.
d) a frequência relativa de valores inferiores a R$ 1 500,00
menos que 10%.
e) a amplitude da amostra é igual a R$ 4 000,00.
e
e
é
é
Neste caso temos que fazer a frequência acumulada numa tabela. Vou
abrir os limites para enxergar melhor os valores
Limite
Inferior
500
1.000
1.500
2.000
2.500
3.000
3.500
Limite
superior
1.000
1.500
2.000
2.500
3.000
3.500
4.000
Soma
Frequencia
absoluta
100
100
200
400
300
300
200
1600
Frequencia
acumulada
100
200
400
800
1100
1400
1600
Frequencia acumulada
relativa
6%
13%
25%
50%
69%
88%
100%
Vamos lá, alternativa por alternativa:
a) 60% dos valores são maiores ou iguais a R$ 1 500,00 e
menores que R$ 3 000,00. – ERRADA. Vamos a nossa tabela
Limite
Inferior
500
1.000
1.500
2.000
2.500
3.000
3.500
Limite
superior
1.000
1.500
2.000
2.500
3.000
3.500
4.000
Soma
Prof. André L. Santos
Frequencia
absoluta
100
100
200
400
300
300
200
1600
Frequencia
acumulada
100
200
400
800
1100
1400
1600
www.passeicursos.com.br
Frequencia acumulada
relativa
6%
13%
25%
50%
69%
88%
100%
45
ESTATÍSTICA PARA O ISS-Teresina
AULA 0
Ora, até R$ 3000 temos 69%, mas depois de R$ 1500 temos
valores acima de 13%. Fazendo graficamente:
1500
3000
13%
69%
Diferença 69%-13%=43%
b) mais de 30% dos valores são maiores ou iguais a R$ 2 500,00 e
menores que R$ 3 500,00. – CORRETA. Veja por quê:
Limite
Inferior
500
1.000
1.500
2.000
2.500
3.000
3.500
Limite
superior
1.000
1.500
2.000
2.500
3.000
3.500
4.000
Soma
Frequencia
absoluta
100
100
200
400
300
300
200
1600
Frequencia
acumulada
100
200
400
800
1100
1400
1600
Frequencia acumulada
relativa
6%
13%
25%
50%
69%
88%
100%
2500
3500
50%
88%
Diferença 88%-50%=38%
c) a porcentagem dos valores iguais ou superiores a R$ 3 500,00 é
maior que a porcentagem dos valores inferiores a R$ 1 500,00. –
ERRADA. Vamos diretamente a nossa régua:
3500
4000
88%
100%
Diferença 100%-88%=12%
Prof. André L. Santos
www.passeicursos.com.br
46
ESTATÍSTICA PARA O ISS-Teresina
0
AULA 0
1500
0%
13%
Diferença 13%-0%=13%
12% (>=3500) é MENOR que 13% (<=1500).
d) a frequência relativa de valores inferiores a R$ 1 500,00 é
menos que 10%. – ERRADA. Pela coluna das frequências relativas já se
vê que é 13%
e) a amplitude da amostra é igual a R$ 4 000,00. – ERRADA.
Amplitude é máximo – mínimo
Amplitude = Max – Min = 4000-500= R$ 3.500 <> R$ 4.000
GABARITO:B
FCC/Analista FHEMIG/2013
conjunto de dados,
8.
-
Na
análise
descritiva
de
um
a) a média corresponde sempre ao valor que divide os dados
ordenados ao meio.
b) o desvio padrão representa uma medida de tendência central.
c) se existem valores diferentes uns dos outros em um conjunto de
dados, sempre teremos valores abaixo e acima da média.
d) a mediana é sempre diferente da média.
e) o desvio padrão corresponde ao quadrado da variância.
a) a média corresponde sempre ao valor que divide os dados
ordenados ao meio. – ERRADA. Esta é a definição de mediana.
b) o desvio padrão representa uma medida de tendência central. –
ERRADA. O desvio-padrão é uma medida de dispersão.
c) se existem valores diferentes uns dos outros em um conjunto de
dados, sempre teremos valores abaixo e acima da média. – CORRETA.
Nem precisa saber estatística para acertar esta. O nome até já diz
“média“. Quem está “na média” está “no meio”, mas NÃO É
EXATAMENTE O MEIO COMO É A MEDIANA!!!
d) a mediana é sempre diferente da média. – ERRADA. Em
distribuições simétricas ela é igual à média.
Prof. André L. Santos
www.passeicursos.com.br
47
ESTATÍSTICA PARA O ISS-Teresina
AULA 0
e) o desvio padrão corresponde ao quadrado da variância. –
ERRADA. É ao contrário. A variância é o quadrado do desvio-padrão.
GABARITO:C
FCC/Analista FHEMIG/2013 - A respeito do boxplot é correto
afirmar:
9.
a) Medidas descritivas como a mediana e o intervalo interquartil
são utilizadas para se obter o gráfico, entre outros elementos.
b) Entre os percentis 25% e 50% há metade dos valores do
conjunto de dados representado.
c) O intervalo interquartil é construído a partir do 1o e 2o quartis.
d) É usual se considerar um valor aberrante àquele que exceda 2
intervalos interquartis, para cima ou para baixo dos limites
da caixa definida pelo intervalo interquartil.
e) Não se permite a visualização da variabilidade dos dados
Vamos relembrar o boxplot:
Exemplo de Boxplot
250
Os pontos avulsos são "Outliers"
Valores extremos acima ou abaixo
dos limites
Limite superior = Q3 + 1.5 (Q3 - Q1)
200
150
Q3
100
Distância
interquartílica
50
0
Prof. André L. Santos
mediana
Q1
Limite inferior = Q1- 1.5 (Q3 - Q1)
www.passeicursos.com.br
48
ESTATÍSTICA PARA O ISS-Teresina
AULA 0
a) Medidas descritivas como a mediana e o intervalo interquartil
são utilizadas para se obter o gráfico, entre outros elementos. –
CORRETA – Sim. Basta ver o gráfico.
b) Entre os percentis 25% e 50% há metade dos valores do
conjunto de dados representado. – ERRADA – Há na verdade um
quarto. Abaixo de 50% (a mediana) que há metade
c) O intervalo interquartil é construído a partir do 1º e 2º quartis.
– ERRADA – É construído a partir do 3º e 1º quartis
d) É usual se considerar um valor aberrante àquele que exceda 2
intervalos interquartis, para cima ou para baixo dos limites da caixa
definida pelo intervalo interquartil. – ERRADA – Esta não é a definição
de outlier, que fica nos 10% finais (ie, o 90%-ésimo)
e) Não se permite a visualização da variabilidade dos dados –
ERRADA – Como não? Um boxplot bem espalhado fala muito sobre a
variabilidade!
GABARITO:A
FCC/Analista
Legislativo/Contador
da
Câmara
dos
Deputados/2007 - Se a média e a variância da variável aleatória X são
12 e 80 respectivamente, então a média e a variância da variável
aleatória Y = X/4 + 1 são dadas respectivamente por
10.
a) 4 e 20
b) 4 e 5
c) 3 e 20
d) 4 e 21
e) 3 e 5
Questão clássica de propriedades da média (𝑥𝑥̅ =12) e variância (s2=80).
Temos em Y uma multiplicação por constante (ie, dividir por 4 é
multiplicar por 1/4=0,25) e uma soma por constante.
Vamos relembrar as propriedades da média:
Prof. André L. Santos
www.passeicursos.com.br
49
ESTATÍSTICA PARA O ISS-Teresina
AULA 0
Somando-se uma constante a todos os valores de uma variável, a
média do conjunto fica acrescida dessa constante
Multiplicando-se todos os valores de uma variável por uma
constante, a média do conjunto fica multiplicada por esta constante;
Ora, Y é X multiplicado por ¼ e somado 1. Então a nova média terá
estas mesmas operações
𝑥𝑥̅𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛 =
𝑥𝑥�
12
+1=
+1=3+1=4
4
4
Vamos relembrar as propriedades da variância:
Somando-se uma constante a todos os valores de uma variável, a variância não
se altera
Multiplicando-se todos os valores de uma variável por uma constante, a
variância do conjunto fica multiplicada pelo quadrado desta constante
Portanto a única operação que mudará a variância será a multplicação
por ¼, que na variância será a multiplicação por 1/16
1 2
1
2
𝑠𝑠𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛
=𝑠𝑠 2 . � � = 𝑠𝑠 2 . =80/16=5
4
16
GABARITO: B
FCC/Analista
Legislativo
&
Contador
da
Câmara
dos
Deputados/2007 - Para se estudar o desempenho das corretoras de
ações A e B, selecionou-se de cada uma delas amostras aleatórias das
ações negociadas. Para cada ação selecionada computou-se a
porcentagem de lucro apresentada durante o período de um ano. Os
gráficos a seguir apresentam os desenhos esquemáticos relativos à
porcentagem de lucro das amostras de A e B durante o período citado.
11.
Prof. André L. Santos
www.passeicursos.com.br
50
ESTATÍSTICA PARA O ISS-Teresina
Relativamente à porcentagem
corretoras pode-se afirmar que
de
lucro
AULA 0
obtida
por
essas
a) exatamente 25% dos valores de A são inferiores a 55.
b) menos de 50% dos valores de B são superiores a 55.
c) o maior valor de A é 60.
d) os valores de A apresentam maior variabilidade que os de B.
e) os valores de B apresentam assimetria positiva.
Vamos relembrar:
Valor
máximo
Mediana
Q3
quartil
–
terceiro
Q1
til
–
primeiro
Valor
mínimo
Prof. André L. Santos
www.passeicursos.com.br
51
ESTATÍSTICA PARA O ISS-Teresina
AULA 0
 Até o Q1;
temos 25% dos valores
 Até a mediana (seria o Q2); 50% dos valores
 Até o Q3;
75% dos valores
a) exatamente 25% dos valores de A são inferiores a 55. –
ERRADA. Dá para ler no gráfico que Q1 de A está em +- 52
b) menos de 50% dos valores de B são superiores a 55. –
ERRADA. Dá para ver no gráfico que a mediana de B está em
+- 56/57
c) o maior valor de A é 60. – ERRADA. O maior valor de A é 70
d) os valores de A apresentam maior variabilidade que os de B. –
CERTA. Ainda que eu odeie o termo variabilidade solto assim,
os dados de A são mais espalhados
e) os valores de B apresentam assimetria positiva. - ERRADA Sem
entrar em muita conta, vemos que a assimetria de B está mais à
esquerda/inferior (negativa em relação à mediana) que a direita.
GABARITO: D
FCC/Analista Bacen/2006 - O histograma de frequências
absolutas a seguir foi elaborado com base nas informações contidas na
revista “O Empreiteiro”, de junho de 2005, que demonstra o
comportamento das empresas construtoras do ramo da construção
civil no Brasil que obtiveram faturamento em 2004 maior ou igual a 15
milhões de reais e menor ou igual a 120 milhões de reais
12.
Prof. André L. Santos
www.passeicursos.com.br
52
ESTATÍSTICA PARA O ISS-Teresina
AULA 0
Com base nestas informações, obteve-se a média aritmética do
faturamento das empresas deste estudo, considerando que todos os
valores incluídos num certo intervalo de classe são coincidentes com o
ponto médio deste intervalo. Com relação ao total de empresas deste
histograma, o valor encontrado para esta média pertence ao intervalo
de classe que contém
a) 24% das empresas.
b) 16% das empresas.
c) 9% das empresas.
d) 7% das empresas.
e) 5% das empresas.
Bem, vamos transformar este histograma em tabela?
Classes
Frequencia
Absoluta
15 - 30
31
30 - 45
24
45 - 60
16
60 - 75
9
75 - 90
5
90 - 105
7
105 - 120
8
O exercício diz que “todos os valores incluídos num certo intervalo de
classe são coincidentes com o ponto médio deste intervalo”. Portanto vamos
considerar os pontos médios para as classes
Prof. André L. Santos
Classes
Pontos Medios
Frequencia
Absoluta
15 - 30
22,5
31
30 - 45
37,5
24
45 - 60
52,5
16
60 - 75
67,5
9
75 - 90
82,5
5
90 - 105
97,5
7
105 - 120
112,5
8
www.passeicursos.com.br
53
ESTATÍSTICA PARA O ISS-Teresina
AULA 0
Agora há dois métodos para resolver. O simples e brutal, útil se você
tiver uma planilha Excel, que é o que é mostrado abaixo... mas, haja conta!
Você perderá minutos preciosos na prova!
Classes
Pontos Medios
Frequencia
Absoluta
x.f
15 - 30
22,5
31
697,5
30 - 45
37,5
24
900
45 - 60
52,5
16
840
60 - 75
67,5
9
607,5
75 - 90
82,5
5
412,5
90 - 105
97,5
7
682,5
105 120
112,5
8
900
100
5040
Σf
Σxf
�=Σxf/Σf
𝒙𝒙
50,4
�
E o método esperto e sem muita conta, que é útil numa prova de
concurso. Este método consiste em atribuir índices aos pontos médios, já que
os intervalos são naturalmente espaçados de 15 em 15.
(Veremos mais sobre escore z nas aulas 3 e 4)
Pontos Médios
ìndice Z
22,5
-3
37,5
-2
52,5
-1
67,5
0
82,5
1
97,5
2
112,5
3
Ou seja, quando x=67,5; z=0. Quando x=52,5; z=-1. E por simetria,
quando x=82,5, z=1
Na verdade, nosso histograma ficaria assim, o que é essencialmente o
mesmo:
Prof. André L. Santos
www.passeicursos.com.br
54
ESTATÍSTICA PARA O ISS-Teresina
AULA 0
35
30
25
20
15
10
5
0
-3
-2
-1
0
1
2
3
A diferença é que usamos o índice z. E como é o índice z?
z=(x-67,5)/15 onde 67,5 é o ponto escolhido para 0 e 15 a amplitude
das classes
Com o índice z fica facílimo fazer as contas na prova! Veja:
Pontos
Médios
Índice
Z
Frequencia
Absoluta
z.f
22,5
-3
31
-93
37,5
-2
24
-48
52,5
-1
16
-16
67,5
0
9
0
82,5
1
5
5
97,5
2
7
14
112,5
3
8
24
100
-114
Σf
Σzf
𝒛𝒛�=Σzf/Σf
-1,14
Opa, opa, opa, você deve estar dizendo. No método simples e brutal deu
50,4 e no índice z deu -1,14??? Claro, a média está expressa em índice z.
Vamos desconverter de volta para x
𝑧𝑧̅=(𝑥𝑥̅ -67,5)/15
-1,14 = (𝑥𝑥̅ -67,5)/15
𝑥𝑥̅ =-1,14*15+67,5
𝑥𝑥̅ =50,4
Ohhhh...
Prof. André L. Santos
www.passeicursos.com.br
55
ESTATÍSTICA PARA O ISS-Teresina
AULA 0
E onde está este 50,4 no Histograma?
A classe da média tem 16 empresas num universo de 100 (que é Σf).
Então 16/100=16%, nossa resposta.
GABARITO: B
FCC/ Analista Bacen/2006 - Em uma instituição bancária, o
salário médio dos 100 empregados do sexo masculino é de R$
1.500,00, com desvio padrão de R$ 100,00. O salário médio dos 150
empregados do sexo feminino é de R$ 1.000,00, com desvio padrão de
R$ 200,00. A variância em (R$)2 dos dois grupos reunidos é de:
13.
a) 25.600,00
b) 28.000,00
c) 50.000,00
d) 62.500,00
e) 88.000,00
Exercício de variância combinada
σ2 (𝐴𝐴 + 𝐵𝐵) =
(∑ 𝐴𝐴 + ∑ 𝐵𝐵)2
1
��� 𝐴𝐴2 + � 𝐵𝐵2 � −
�
𝑛𝑛𝐴𝐴 + 𝑛𝑛𝑏𝑏
𝑛𝑛𝑎𝑎 + 𝑛𝑛𝑏𝑏
O grande segredo aí é tentar obter as somatórias do enunciado
𝑥𝑥̅ℎ =1500; 𝑁𝑁ℎ =100
Prof. André L. Santos
www.passeicursos.com.br
56
ESTATÍSTICA PARA O ISS-Teresina
∑ 𝐻𝐻
�𝑁𝑁
ℎ
Ora, 𝑥𝑥̅ℎ =
1500 =
AULA 0
∑ 𝐻𝐻�
100
� 𝐻𝐻 = 150.000
De maneira análoga com as mulheres:
𝑥𝑥̅𝑚𝑚 =1000; 𝑁𝑁𝑚𝑚 =150 portanto ∑ 𝑀𝑀 = 150.000
Mas não temos as somatórias ao quadrado ainda. Porém temos as
variâncias individuais pelos desvios-padrão:
𝜎𝜎ℎ = 100 portanto 𝜎𝜎ℎ2 = 10000
2
𝜎𝜎𝑚𝑚 = 200 portanto 𝜎𝜎𝑚𝑚
= 40000
Agora usamos a seguinte equação da variância:
𝜎𝜎ℎ 2=10000 =
10000 =
σ2=𝑁𝑁1 �∑ 𝑥𝑥2 − (∑𝑁𝑁𝑥𝑥)
1
100
1
�∑ 𝐻𝐻2 −
100
(∑ 𝐻𝐻)
100
2
2
�
(150000)
2
�� 𝐻𝐻 −
2
1
(150000)
�∑ 𝐻𝐻2 −
�=100
100
100
2
� 𝐻𝐻 2 = 226.000.000
�
�
De maneira análoga para as mulheres
2
𝜎𝜎𝑚𝑚 =40000 =
40000 =
1
150
1
�∑ 𝑀𝑀2 −
150
2
2
(∑ 𝑀𝑀)
�� 𝑀𝑀 −
150
2
1
(150000)
�∑ 𝐻𝐻2 −
�=150
100
(150000)
100
� 𝑀𝑀2 = 156.000.000
2
�
�
Agora juntamos todos estes números na equação combinada e fazemos
uma tremenda calculeira:
Prof. André L. Santos
www.passeicursos.com.br
57
ESTATÍSTICA PARA O ISS-Teresina
σ
=
(300.000)2
250
2 (𝐻𝐻
1
100+150
�= 88.000
AULA 0
(∑ 𝐻𝐻 + ∑ 𝑀𝑀)2
1
2
2
��� 𝐻𝐻 + � 𝑀𝑀 � −
�
+ 𝑀𝑀) =
𝑛𝑛𝐻𝐻 + 𝑛𝑛𝑀𝑀
𝑛𝑛𝐻𝐻 + 𝑛𝑛𝑀𝑀
�(226.000.000 + 156.000.000) −
(150.000+150.000)2
100+150
�=
1
250
�(382.000.000) −
GABARITO: E
FCC – Analista Legislativo/Contador da Câmara dos Deputados
2007 – Numa pesquisa realizada com 300 famílias levantaram-se as
seguintes informações.
14.
Número de filhos
Proporção das famílias
0
0,17
1
0,20
2
0,24
3
0,15
4
0,10
5
0,10
6
0,04
Com base nestas informações, a média e a mediana do número
dos filhos são dadas, respectivamente, por:
a) 2,27 e 3
b) 3 e 2
c) 2,27 e 2
d) 2,5 e 3,5
e) 2,5 e 3
Como estamos lidando com proporções, a média desta distribuição não
será a média aritmética, mas a média ponderada (mais detalhes veremos na
aula de Distribuição de Probabilidades)
Média: 𝑥𝑥̅ =
∑ 𝑓𝑓.𝑥𝑥
∑ 𝑓𝑓
= ∑𝑥𝑥 . 𝑃𝑃 (𝑥𝑥)
Prof. André L. Santos
www.passeicursos.com.br
58
ESTATÍSTICA PARA O ISS-Teresina
AULA 0
Portanto vamos fazer uma nova tabela para calcular a média:
Número de filhos
x
Proporção das
famílias
P(X)
x . P(X)
0
0,17
0
1
0,20
0,2
2
0,24
0,48
3
0,15
0,45
4
0,10
0,4
5
0,10
0,5
6
0,04
0,24
Média= Σ x P(x)
2,27
Metade da questão foi resolvida. Agora vamos calcular a mediana. Para
calcular a mediana, o valor que divide a amostra/população ordenada
crescentemente em 50%, vamos calcular a frequência acumulada:
Número
de filhos
x
Proporção das
famílias
P(X)
P acumulada (X)
0
0,17
0,17
1
0,20
0,37
2
0,24
0,61
3
0,15
0,76
4
0,10
0,86
5
0,10
0,96
6
0,04
1,00
Ora, o valor de 50% só é alcançado em 2. Como estamos lidando com
uma tabela de frequência e números discretos, não podemos interpolar. Sendo
assim, por aproximação, a mediana é dois, 2.
GABARITO: C
Prof. André L. Santos
www.passeicursos.com.br
59
ESTATÍSTICA PARA O ISS-Teresina
AULA 0
15. CESPE/ Analista Superior Tribunal Militar - STM/2010 - A partir
do histograma mostrado na figura abaixo, é correto inferir que a
distribuição da variável X é simétrica.
Se a distribuição fosse simétrica, “um lado” é igual ao outro. Simples
assim.
Ponto médio
Se fosse
simétrico seria
assim
GABARITO: ERRADA
Para as duas questões a seguir, considere o seguinte conjunto de
dados composto por cinco elementos: {82,93; 94,54; 98,40; 115,41;
123,07}. Com base nesses dados, julgue os próximos dois itens
subsequentes (3 – 4) acerca das medidas de tendência central.
CESPE / Analista Superior Tribunal Militar / 2010 - A média do
conjunto de dados em questão é 102,87 e a mediana é 98,40. Se o
16.
Prof. André L. Santos
www.passeicursos.com.br
60
ESTATÍSTICA PARA O ISS-Teresina
AULA 0
valor 123,07 for alterado para 200, a média irá aumentar, mas a
mediana continuará sendo 98,40.
Ou seja, de:
82,93 94,54 98,40 115,41 123,07
Como já está ordenado, é fácil perceber que 98,40 é a mediana. Aliás o
exercício até já fala
Vira:
82,93 94,54 98,40 115,41 200,00
A média de fato muda, mas a mediana não sofre a influência de pontos
extremos. A mediana continua 98,40. Questão correta
GABARITO: CERTA
CESPE / Analista Superior Tribunal Militar / 2010 - Se o valor de
um dos elementos do conjunto não for fornecido, esse valor pode ser
determinado se a média do conjunto for conhecida, mas não será
possível obter esse valor conhecendo-se apenas a mediana.
17.
E então? Questão deveras interessante. Vamos tirar um elemento do
conjunto e chamar de incógnita Y
82,93
94,54
98,40
y
Ora, vamos aplicar a fórmula da média
123,07 com 𝑥𝑥̅ =102,87
(82,93+94,54+98,40+y+123,07)/5=102,87
𝑥𝑥̅ =
∑ 𝑥𝑥
𝑛𝑛
Uma equação e uma incógnita. Podemos resolvê-la:
398,94+y=514,35
y = 115,41
Portanto pudemos chegar ao elemento faltante tendo a média.
E no caso da mediana?
82,93
94,54
98,40
y
123,07 com 𝑥𝑥̇ =102,87
Vamos raciocinar indutivamente imaginando um y entre 98,40 e 123,07.
Se y=99
82,93 94,54 98,40 99
123,07 com 𝑥𝑥̇ =102,87
Se y=102
82,93 94,54 98,40 102
Prof. André L. Santos
123,07 com 𝑥𝑥̇ =102,87
www.passeicursos.com.br
OK
OK
61
ESTATÍSTICA PARA O ISS-Teresina
AULA 0
Então eis o ponto! A mediana não envolve fórmula, e sim posição do
elemento! Qualquer y tal que 98,40<y<123,07 faz uma mediana de 102,87.
Portanto de fato não é possível determinar o elemento faltante se a mediana
for dada.
GABARITO: CERTA
COPS/ICMS-PR/2013 - Os preços, em reais, de uma máquina de
lavar roupas e de um ferro de passar roupas de marcas e modelos
idênticos variam em sete lojas, conforme mostra a tabela a seguir.
18.
Em relação aos preços desses produtos, assinale a alternativa
correta.–
a) A mediana dos preços da máquina de lavar roupas é R$ 787,14.
b) A variabilidade dos preços é igual para os dois produtos.
c) A variabilidade dos preços da máquina de lavar roupas é maior do que
a variabilidade dos preços do ferro de
passar roupas.
d) A variabilidade dos preços da máquina de lavar roupas é menor do
que a variabilidade dos preços do ferro de passar roupas.
e) O escore padronizado, z, do maior preço do ferro de passar roupas é
0,208 e isso indica que o preço é excepcionalmente alto em relação aos preços
das demais lojas.
Vamos alternativa por alternativa:
a) A mediana dos preços da máquina de lavar roupas é R$ 787,14. ERRADA
Basta ordenar os preços e tirar a mediana. Como há sete preços, a
mediana será o quarto preço.
Posição
Preço
1
750,00
2
760,00
Prof. André L. Santos
www.passeicursos.com.br
62
ESTATÍSTICA PARA O ISS-Teresina
3
780,00
4 - MEDIANA
790,00
5
800,00
6
810,00
7
8200,00
AULA 0
b) A variabilidade dos preços é igual para os dois produtos. - ERRADA
c) A variabilidade dos preços da máquina de lavar roupas é maior do que
a variabilidade dos preços do ferro de passar roupas. . - ERRADA
d) A variabilidade dos preços da máquina de lavar roupas é menor do
que a variabilidade dos preços do ferro de passar roupas. - CERTA
Particularmente detestei estas alternativas e são dignas de recurso. A
banca chamou de variabilidade o coeficiente de variação que é dispersão
relativa. Mas o desvio-padrão mede a dispersão absoluta e desvio-padrão para
o ferro é menor que da máquina de lavar roupa. Se fosse por uma medida de
dispersão absoluta, ie, o desvio, a resposta correta seria a letra C. Quem foi
por esta interpretação errou sonoramente. Injusto.
CV máquina = s máquina / 𝑥𝑥̅ máquina = 25,63 / 1841 = 0,013
CV ferro = s ferro / 𝑥𝑥̅ ferro = 4,81 / 1841 = 0,098
Portanto é a alternativa D, já que o CV máquina < CV ferro
e) O escore padronizado, z, do maior preço do ferro de passar roupas é
0,208 e isso indica que o preço é excepcionalmente alto em relação aos preços
das demais lojas. - ERRADA
Blá, Blá, blá para enrolar o candidato. Veremos escore padronizado na
aula de distribuição normal. E daí que haja um preço excepcionalmente alto
em relação às outras lojas? Estatisticamente esta afirmação não tem
significado. Se se dissesse que é um “outlier” aí teria um certo significado
estatístico.
GABARITO: D
Prof. André L. Santos
www.passeicursos.com.br
63
ESTATÍSTICA PARA O ISS-Teresina
AULA 0
ESAF/Receita
Federal/2005
Para
dados
agrupados
representados por uma curva de frequências, as diferenças entre os
valores da média, da mediana e da moda são indicadores da assimetria
da curva. Indique a relação entre essas medidas de posição para uma
distribuição negativamente assimétrica.
19.
a) A média apresenta o maior valor e a mediana se encontra
abaixo da moda.
b) A moda apresenta o maior valor e a média se encontra
abaixo da mediana.
c) A média apresenta o menor valor e a mediana se
encontra abaixo da moda.
d) A média, a mediana e a moda são coincidentes em
valor.
e) A moda apresenta o menor valor e a mediana se encontra
abaixo da média.
Distribuição assimetricamente negativa.
Assimetria negativa ou “a esquerda”
 Mediana < Moda
E
 Média < Moda
Vamos retornar ao nosso exemplo de curva assimetricamente negativa.
Prof. André L. Santos
www.passeicursos.com.br
64
ESTATÍSTICA PARA O ISS-Teresina
AULA 0
Distribuição assimétrica a esquerda
8,98 9,29 9,8
1200
Moda 9,8
Mediana 9,29
Media 8,98
1000
Frequency
800
Assimetria a esquerda:
Moda > Mediana
Moda > media
600
400
200
0
1,2
2,4
3,6
4,8
6,0
7,2
8,4
9,6
d
a) A média apresenta o maior valor e a mediana se encontra
abaixo da moda. – ERRADA. Nas assimétricas negativas ou “a esquerda”
a média e a mediana estão a esquerda/abaixo da moda. Então não tem como a
média apresentar o maior valor.
b) A moda apresenta o maior valor e a média se encontra abaixo da
mediana. – ERRADA. Não necessariamente a media e mediana definem
assimetria.
c) A média apresenta o menor valor e a mediana se encontra abaixo da
moda. – CERTA. Pela definição de assimetria negativa ou “à esquerda”
Mediana < Moda
d) A média, a mediana e a moda são coincidentes em valor. – ERRADA.
Só seria verdade em distribuições simétricas
e) A moda apresenta o menor valor e a mediana se encontra abaixo da
média. – ERRADA. Pela definição, a moda é o valor mais frequente. Se a
curva é assimétrica à esquerda, a média e mediana estão abaixo da moda.
GABARITO: C
Prof. André L. Santos
www.passeicursos.com.br
65
ESTATÍSTICA PARA O ISS-Teresina
AULA 0
FGV/ICMS-AP/2011 - Os dados a seguir são as quantidades de
empregados de cinco pequenas empresas: 6, 5, 8, 5, 6. A variância da
quantidade de empregados dessas cinco empresas é igual a:
20.
a) 0,8.
b) 1,2.
c) 1,6.
d) 2,0.
e) 2,4.
Apesar de simples, aqui há um poço em que o aluno pode cair. Se ele
usar a variância de amostras (não é o caso) ele dividira por n-1, não n.
Vamos usar as duas fórmulas possíveis. Você concluirá sozinho qual é a
melhor de se usar na prova.
Fórmula clássica: σ2=
σ2=
(x-µ)2
6
0,16
5
1,96
8
2,56
5
1,96
8
2,56
32
n
5
µ
6,4
𝑁𝑁
9,2
∑(𝑥𝑥−µ)2
1,840=2
𝑁𝑁
2
Fórmula abreviada: σ2=𝑁𝑁1 �∑ 𝑥𝑥2 − ( 𝑁𝑁𝑥𝑥) �
∑
Prof. André L. Santos
x
Σx
Σ(x-µ)2
∑(𝑥𝑥−µ)2
x
x2
6
36
5
25
8
64
5
25
www.passeicursos.com.br
66
ESTATÍSTICA PARA O ISS-Teresina
8
Σx
Σx2
2
AULA 0
64
32
214
2
σ2=𝑁𝑁1 �∑ 𝑥𝑥2 − ( 𝑁𝑁𝑥𝑥) �=15 (214 − 325 )= 1,84 = 2 (o desvio deve ser expresso no mesmo
∑
número dos dados)
Veja que a tal “fórmula abreviada” é abreviada para calcular, não para se
expressar. É melhor na prova ir pela fórmula abreviada. Vejam como as contas
ficaram mais simples!
Ai algum aluno me dirá no fórum: “PROFESSOOOOR, EU FIZ NO EXCEL
PARA CONFERIR E NÃO DEU O MESMO VALOR. DEU 2,3 ”
Porque você usou VAR() ou VARA() que calculam a variância amostral
(divide por n-1). Neste caso é população, e tinha que ser a função VARP ().
GABARITO: B
FGV/ICMS-RJ/2011 - A respeito das técnicas de amostragem
probabilística, NÃO é correto afirmar que
21.
a) na amostragem por conglomerado a população é dividida em
diferentes grupos, extraindo-se uma amostra apenas dos conglomerados
selecionados.
b) na amostragem estratificada, se a população pode ser dividida
em subgrupos que consistem em indivíduos bastante semelhantes entre
si, pode-se obter uma amostra aleatória em cada grupo.
c) na amostragem aleatória simples se sorteia um elemento da
população, sendo que todos os elementos têm a mesma probabilidade de
serem selecionados.
d) na amostragem por voluntários a população é selecionada de
forma a estratificar aleatoriamente os grupos selecionados.
e) na amostragem sistemática os elementos da população se
apresentam ordenados, e a retirada dos elementos da amostra é feita
periodicamente.
a) na amostragem por conglomerado a população é dividida em
diferentes grupos, extraindo-se uma amostra apenas dos conglomerados
selecionados. – CORRETA. É a definição de amostragem por
conglomerados.
Prof. André L. Santos
www.passeicursos.com.br
67
ESTATÍSTICA PARA O ISS-Teresina
AULA 0
Uma amostragem por conglomerados é uma estratificada em que o
espaço amostral é um dos conglomerados/estratos.
b) na amostragem estratificada, se a população pode ser dividida
em subgrupos que consistem em indivíduos bastante semelhantes entre
si, pode-se obter uma amostra aleatória em cada grupo. – CORRETA
Uma amostragem estratificada é uma amostragem que a população é
subdividida em no mínimo duas subpopulações que compartilham das
mesmas características e em seguida se extrai uma amostra aleatória
de cada extrato. Por exemplo, os computadores da Receita Federal separam
as declarações de renda de pessoas físicas em faixas de renda e sorteiam
algumas de cada faixa para escrutínios dos fiscais.
c) na amostragem aleatória simples se sorteia um elemento da
população, sendo que todos os elementos têm a mesma probabilidade de
serem selecionados. – CORRETA. Nem há muito que comentar. Se um
elemento tivesse mais chance não seria aleatória.
d) “na amostragem por voluntários a população é selecionada de
forma a estratificar aleatoriamente os grupos selecionados” – ERRADA.
Ora, se são “voluntários” houve vontade e arbítrio de se “voluntariar”,
então não pode ser aleatório. Façamos um exemplo, suponha que algum
instituto de pesquisa eleitoral deseje fazer uma pesquisa eleitoral
baseada em voluntários. Ora, ela nunca seria válida nem representativa,
porque os partidários de algum candidato poderiam acorrer em massa
para se voluntariar e os resultados seriam favoráveis para seu candidato.
e) “na amostragem sistemática os elementos da população se
apresentam ordenados, e a retirada dos elementos da amostra é feita
periodicamente”. CORRETA. É uma paráfrase de nossa definição:
Uma amostragem sistemática escolhemos um ponto de partida e
selecionamos um elemento a cada determinada distância ou
frequência.
Exemplo, uma tecelagem extrai uma amostra para análise de fio a cada
10000m de fio produzido.
GABARITO: D
Prof. André L. Santos
www.passeicursos.com.br
68
ESTATÍSTICA PARA O ISS-Teresina
AULA 0
ESAF/ Receita Federal/2005 - Em uma determinada semana uma
empresa recebeu as seguintes quantidades de pedidos para os
produtos A e B:
22.
Produto A
Produto B
39 33
50 52
25
47
30
49
41
54
36
40
37
43
Assinale a opção que apresente os coeficientes de variação dos
dois produtos:
a) CVA = 15,1% e CVB = 12,3%
b) CVA = 16,1% e CVB = 10,3%
c) CVA = 16,1% e CVB = 12,3%
d) CVA = 15,1% e CVB = 10,3%
e) CVA = 16,1% e CVB = 15,1%
Este exercício pede o coeficiente de variação, que é a razão entre o
desvio-padrão e a média.
O pulo do gato é saber se a banca se refere ao desvio-padrão da
população ou da amostra. Faz toda a diferença porque no primeiro caso é
dividido por n, no segundo é n-1. A ESAF julgou que era o da amostra. Eu não
estou satisfeito, porque poderia ser considerada a população da semana, o
exercício dá a entender que é a totalidade dos pedidos. Cabia recurso, até
porque maquiavelicamente a alternativa que considera a população é a D,
enquanto a que foi o gabarito é a B, a da amostra. Cabia um belíssimo recurso.
CV=s/𝑥𝑥̅ .
Para a média
𝑥𝑥̅𝐴𝐴 =
𝑥𝑥̅𝐵𝐵 =
39+33+25+30+41+36+37
7
50+52+47+49+54+40+43
7
=34
=48
Agore use a fórmula que você achar melhor para a variância:
Variância de Populações
Prof. André L. Santos
Fórmula clássica
Fórmula abreviada
- Usa a média -
- Usa os quadrados -
∑(𝑥𝑥 − µ)
σ =
𝑁𝑁
2
2
1
σ2= �∑ 𝑥𝑥 2 −
𝑁𝑁
www.passeicursos.com.br
(∑ 𝑥𝑥)2
𝑁𝑁
�
69
ESTATÍSTICA PARA O ISS-Teresina
Variância de Amostras
s2=
∑(𝑥𝑥−𝑥𝑥̅ )2
AULA 0
s2=
𝑛𝑛−1
n�∑ x2 �−(∑ x)2
𝑛𝑛(𝑛𝑛−1)
Eu sempre prefiro a fórmula abreviada para a variância, mas nos exercícios
que se faz necessário calcular CV é melhor ir pela clássica, porque temos de
calcular a média de qualquer jeito, então na clássica passamos pela média
34
𝑥𝑥̅
48
m
50
B- 𝑥𝑥̅
2
(B- 𝑥𝑥̅ )2
2
52
4
17
-9
89
47
-1
1
30
-4
20
49
1
1
41
7
43
54
6
38
36
2
2
40
-8
62
37
3
7
43
-5
24
Σ
184
Σ
147
n
7
n
7
n-1
6
n
6
A
(A-𝑥𝑥̅ )
39
A- 𝑥𝑥̅
5
21
33
-1
25
s
2
s
2
B
5
2
31
s
6
s
24
5
Quer ainda assim calcular com a abreviada para ver? Vamos lá:
A
39
33
25
30
41
36
37
241
7
34
ΣΑ
n
�Α
𝑥𝑥
2
(ΣA)
Prof. André L. Santos
58081
A2
1521
1089
625
900
1681
1296
1369
Cálculo da Média
ΣΒ
n
�Β
𝑥𝑥
B
50
52
47
49
54
40
43
B2
2500
2704
2209
2401
2916
1600
1849
335
7
48
Cálculo da Variância
(BΣ)2
112225
www.passeicursos.com.br
70
ESTATÍSTICA PARA O ISS-Teresina
Σ(A2)
n-1
σ2
σ
8481
6
31
6
Σ(B2)
n-1
σ2
σ
AULA 0
16179
6
24
5
𝐶𝐶𝐶𝐶𝐴𝐴 =σ/µ=6/34=0,1765=17,6%
𝐶𝐶𝐶𝐶𝐵𝐵 =σ/µ=5/48=0,104=10%
Atenção! Aqui vai uma lição poderosa para você, candidato. A resposta é
letra D, mas vejam que por causa de meu arredondamento prematuro nas
médias e sigmas eu não cheguei exatamente à resposta pedida, CVA = 16,1%
e CVB = 10,3%. Só arredonde ao chegar ao fim!!!
Fazendo sem arredondar:
𝑥𝑥̅
A
39
33
25
30
41
36
37
Σ
n
s2
s
A-𝑥𝑥̅
4,6
-1,4
-9,4
-4,4
6,6
1,6
2,6
34,4
(A-𝑥𝑥̅ )2
20,9
2,0
88,9
19,6
43,2
2,5
6,6
183,7
7,0
30,6
5,5
𝐶𝐶𝐶𝐶𝐴𝐴 =σ/µ=5,5/34,4=0,1598=16,0%
Só de tira-teima, à alternativa se chega usando duas casas:
𝐶𝐶𝐶𝐶𝐴𝐴 =σ/µ=5,53/34,43=0,1606=16,1%
Temos que sempre chegar ao valor aproximado da alternativa. Mas fica a
cargo da consciência dos examinadores da ESAF quem no meio da prova vai
Prof. André L. Santos
www.passeicursos.com.br
71
ESTATÍSTICA PARA O ISS-Teresina
AULA 0
fazer divisões e raízes até a segunda decimal para chegar na alternativa, tsc,
tsc, tsc...
GABARITO: B
CESPE/Tecnologista Jr/ 2010 - Dado é definido como um valor
quantitativo referente a um fato ou circunstância, número bruto que
não sofreu qualquer espécie de tratamento estatístico ou a matériaprima da produção de informação.
23.
Um dado é uma unidade básica de informação, normalmente o resultado
da experiência ou observação.
Se o dado vem da experiência ou observação, ele não sofreu tratamento
de fato
GABARITO: CERTO
CESPE/Tecnologista Jr/ 201 - Entende-se como informação o
conhecimento obtido a partir dos dados, o dado trabalhado ou o
resultado da análise e combinação de vários dados, sem haver, no
entanto, nenhuma interferência por parte do analista.
24.
Uma informação é o conhecimento obtido pela comparação de diversos
dados
Em um experimento aplica-se determinado tratamento e passa-se a
observar seus efeitos a serem pesquisados.
Pode haver sim interferência,
Experimentos geram informação.
como
no
caso
de
experimentos.
GABARITO:ERRADA
Prof. André L. Santos
www.passeicursos.com.br
72
ESTATÍSTICA PARA O ISS-Teresina
AULA 0
CETRO/ISS-SP/2014 - Foram obtidos os seguintes dados para a
idade dos filhos de uma amostra aleatória de 50 pessoas:
25.
4, 5, 5, 6, 6, 6, 6, 7, 7, 7, 7, 7, 7, 8, 8, 8, 8, 8, 8, 8, 8, 8, 9, 9, 9, 9,
9, 9, 10, 10, 10, 10, 10, 10, 10, 10, 11, 11, 12, 12, 13, 13, 14, 15, 15,
15, 16, 16, 18, 23
Dessa amostra, conclui-se que a distribuição:
a) tem assimetria negativa.
b) indica subpopulações com assimetria negativa.
c) é simétrica.
d) tem assimetria positiva.
e) é parte assimétrica positiva e parte simétrica.
Vamos já descartar a alternativa E. Se é “A”-simétrico não pode ser
simétrico, é um paradoxo.
Bem, você pode desenhar um histogramazinho na sua prova
(logicamente não precisa ser tão bonito e caprichoso quanto este feito por
software):
Histogram of Questão Cetro 2014
16
14
Frequency
12
10
8
6
4
2
0
4
8
12
16
Questão Cetro 2014
20
Ou fazer uma tabela. Na prática você fará a tabela antes do histograma.
Valores Frequencia
4
1
5
2
Prof. André L. Santos
www.passeicursos.com.br
73
ESTATÍSTICA PARA O ISS-Teresina
6
7
8
10
11
12
13
14
15
16
18
23
AULA 0
4
6
9
8
2
2
2
1
3
2
1
1
Parece simétrico? Não, né? Simétrico tem os dois lados iguais. Elimina-se
a alternativa C
Histogram of Simetrico
6
Frequency
5
4
3
2
1
0
4
5
6
Simetrico
7
8
Finalmente há que se verificar se a distribuição é assimétrica à direta, ou
positiva, ou à esquerda, ou negativa. Você poderia calcular moda, a média e a
mediana para concluir. Mas isso dá muito trabalho. Ora, é só verificar no seu
histograma para onde a cauda da distribuição se estende. Dá para ver que ela
se estende para a direita, ou seja, é positiva. Nisso já se acerta a alternativa D
e se descaram as A e B
Prof. André L. Santos
www.passeicursos.com.br
74
ESTATÍSTICA PARA O ISS-Teresina
AULA 0
Histogram of Questão Cetro 2014
16
14
Frequency
12
10
8
6
4
2
0
4
8
12
16
Questão Cetro 2014
20
Nesta questão o que dá trabalho é fazer um histograma na prova, mas,
uma vez feito, a resposta é evidente. Na prova, apesar do tempo, certos
esforços valem a pena pela segurança e rapidez da resposta.
GABARITO: D
CETRO – Ministério das Cidades – Estatístico/ 2013 - Tomada
uma amostra de medidas de comprimento de um tipo de inseto,
obtiveram-se os resultados abaixo, em três medições: 2,21cm;
2,23cm; 2,26cm. Com base nesses dados, é correto afirmar que a
variância populacional da amostra é:
26.
a) 0,0015.
b) 0,00065.
c) 0,0011.
d) 0,0009.
e) 0,0007.
Prof. André L. Santos
Fórmula clássica
Fórmula abreviada
- Usa a média -
- Usa os quadrados
-
www.passeicursos.com.br
75
ESTATÍSTICA PARA O ISS-Teresina
Variância
Populações
de
Variância
Amostras
de
∑(𝑥𝑥 − µ)2
σ =
𝑁𝑁
2
s2=
AULA 0
1
σ2= �∑ 𝑥𝑥 2 −
𝑁𝑁
∑(𝑥𝑥−𝑥𝑥̅ )2
s2=
𝑛𝑛−1
(∑ 𝑥𝑥)2
𝑁𝑁
n�∑ x2 �−(∑ x)2
�
𝑛𝑛(𝑛𝑛−1)
Vamos lá. O enunciado pediu a variância populacional, atento para usar
a fórmula certa!
Como são apenas 3 elementos, preferi usar a fórmula clássica. Você
pode usar a fórmula abreviada
σ2 =
∑(𝑥𝑥 − µ)2
𝑁𝑁
Mas primeiro se calcula a média
µ=
σ2 =
∑ 𝑥𝑥
𝑁𝑁
=
2,21+2,23+2,26
3
=
6,7
3
= 2,23333 … = 2,23
∑(𝑥𝑥 − µ)2 (2,21 − 2,23)2 + (2,23 − 2,23)2 + (2,26 − 2,23)2
=
𝑁𝑁
3
(−0,02)2 + (0)2 + (0,03)2 0,0004 + 0,0009 0,0013
=
=
=
= 0,00065
3
3
3
Você pode usar a fórmula abreviada e se poupar de calcular a média
também:
1
σ2= �∑ 𝑥𝑥 2 −
𝑁𝑁
(∑ 𝑥𝑥)2
𝑁𝑁
1
� = 3 �(2,21)2 + (2,23)2 + (2,26)2 −
(2,21+2,23+2,26)2
3
� = 0,00065
Neste exercício em específico é melhor usar a fórmula clássica e se
poupar de calcular os quadrados que a mão são complicados. Em outros casos
a fórmula abreviada é melhor. Você ganhará experiência para decidir qual
fórmula usar apenas fazendo exercícios.
GABARITO: B
CETRO – Ministério das Cidades – Estatístico/ 2013 - Dada a
sequência de números: 71; 24; 36; 10; 12; 41; 52, o número que
define o 3º quartil é:
27.
a) 12
Prof. André L. Santos
www.passeicursos.com.br
76
ESTATÍSTICA PARA O ISS-Teresina
AULA 0
b) 24
c) 36
d) 41
e) 52
Basta ordenar os números e checar o que divide em (3:1)=(75%:25%) a
distribuição:
75%
25%
Terceiro Quartil
10
12
24
36
41
52
71
O terceiro quartil, o 75/100 número estaria entre 41 e 52, que deixa “5
pra lá e 2 pra cá”, um hipotético número que dividisse “6 pra lá e 2 pra cá”
seria maior que 41 e menor que 52. Porém esta é uma distribuição discreta e
questão não aceita quebrados. A banca arredondou a menor, para 41. Mas se
usarmos softwares estatísticos, eles optam pelo 52. Mesmo a função
QUARTIL.EXC do Excel programada para o 3º quartil. Penso que caberia
recurso.
GABARITO: D
28. FUNCAB/ Estatístico pref Serra-ES/2011 - A seguir estão os
valores das médias salariais anuais, em salários mínimos,
correspondendo a um período de 25 anos, para uma amostra de
funcionários aposentados de uma prefeitura.
12, 11, 19, 16, 22, 20, 14, 17, 14, 15, 21, 21,
16, 9, 15, 8, 13, 16, 17, 15, 26, 9, 20, 16, 18.
A mediana deste conjunto de números é:
a) igual à moda.
b) desconhecida.
c) um número primo.
d) maior que a média.
e) igual a 15.
Prof. André L. Santos
www.passeicursos.com.br
77
ESTATÍSTICA PARA O ISS-Teresina
AULA 0
Temos que ordenar os dados para chegar à mediana
4
5
6
7
8
9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25
Posição
1 2 3
Elemento
8 9 9 11 12 13 14 14 15 15 15 16 16 16 16 17 17 18 19 20 20 21 21 22 26
a) A mediana é 16. E é o elemento com maior ocorrência, 4, portanto é a
moda. A mediana é igual à moda. - CERTA
b) Não há como a mediana ser desconhecida se os elementos são
conhecidos. - ERRADA
c) 16 não é número primo, pois é divisível por 2,4 e 8. - ERRADA
d) A média é 16 que é igual à mediana e a moda, portanto não há como
sr maior. - ERRADA
e) A mediana é igual a 16, não 15. - ERRADA
GABARITO: A
FUNCAB/ Estatístico pref Serra-ES/2011 - Para os três conjuntos
de números a seguir, assinale a opção FALSA.
29.
X - 70, 70, 70, 70, 70
Y - 68, 69, 70, 71, 72
Z - 5, 15, 50, 120, 160
a) As médias dos três conjuntos são iguais.
b) As medianas são números pares.
c) As variâncias são desiguais.
d) Os conjuntos são unimodais.
e) As amplitudes são menores que 157.
a) “As médias dos três conjuntos são iguais”. – Fazendo as contas,
as médias são 70 mesmo - CERTA
b) “As medianas são números pares” – As medianas são 70,70 e
50- CERTA
c) “As variâncias são desiguais” – Nem perca tempo em fazer as
contas, a variância de Z é zero, e as de Y e Z nunca podem ser zero –
CERTA
Prof. André L. Santos
www.passeicursos.com.br
78
ESTATÍSTICA PARA O ISS-Teresina
AULA 0
d) “Os conjuntos são unimodais” – X é unimodal, mas Y e Z não
têm moda, porque todos os elementos tem o mesmo número de
frequência. - ERRADA
e) “As amplitudes são menores que 157” – A amplitude de X é
zero, a de Y é 4 e a de Z é 155 - CERTA
GABARITO: D
FUNCAB/ Estatístico pref Serra-ES/2011 - Após verificar que as
notas obtidas em sua última prova haviam sido muito baixas, um
professor do ginásio municipal resolveu desconsiderar cada questão
que não houvesse sido respondida corretamente por algum dos alunos.
Isto feito, ele percebeu que as notas foram todas aumentadas de 3
(três) pontos. Pode-se afirmar que:
30.
a) a média aritmética e a mediana das notas se alteraram.
b) somente a média aritmética das notas se alterou.
c) somente a mediana das notas se alterou.
d) nem a média, nem a mediana das notas se alteraram.
e) o efeito sobre as notas depende
Propriedades da média
Multiplicando-se todos os valores de uma variável por uma constante, a
média do conjunto fica multiplicada por esta constante
Somando-se ou subtraindo-se uma constante a todos os valores de uma
variável, a média do conjunto fica acrescida ou diminuída dessa constante
Ou seja, a média aumentou em 3 pontos.
E a mediana? É tentador responder que a mediana não se alterou, mas
lembro que em números absolutos, sendo a mediana um elemento do conjunto
na posição 50%-ésimo, como todos os membros do conjunto de notas
aumentou, a mediana aumentou também em 3 pontos.
GABARITO: A
Prof. André L. Santos
www.passeicursos.com.br
79
ESTATÍSTICA PARA O ISS-Teresina
AULA 0
ENUNCIADO DE EXERCÍCIOS
AGORA FAÇA VOCÊ
11.
ENUNCIADOS DE EXERCÍCIOS
1. FCC/ICMS-RJ/2014 - O Departamento de Pessoal de certo órgão
público fez um levantamento dos salários, em número de salários
mínimos (SM), dos seus 400 funcionários, obtendo os seguintes
resultados:
Sabe-se que a mediana dos salários desses funcionários
calculada por meio dessa tabela pelo método da interpolação linear é
igual a 8,8 SM. Nessas condições, o salário médio desses 400
funcionários, em número de salários mínimos, considerando que todos
os valores incluídos em um intervalo de classe são coincidentes com o
ponto médio do intervalo, é igual a
a) 8,54
b) 8,83
c) 8,62
d) 8,93
e) 8,72
2. FCC/ICMS-RO/2010 - Em uma cidade é realizado um
levantamento referente aos valores recolhidos de determinado
tributo estadual no período de um mês. Analisando os
documentos de arrecadação, detectou-se 6 níveis de valores
conforme consta no eixo horizontal do gráfico abaixo, em que as
colunas
representam
as
quantidades
de
recolhimentos
correspondentes.
Prof. André L. Santos
www.passeicursos.com.br
80
ESTATÍSTICA PARA O ISS-Teresina
AULA 0
Com relação às medidas de posição deste levantamento tem-se
que o valor da
a) média aritmética é igual a metade da soma da mediana e a
moda.
b) média aritmética é igual ao valor da mediana.
c) média aritmética supera o valor da moda em R$ 125,00.
d) moda supera o valor da mediana em R$ 500,00.
e) mediana supera o valor da média aritmética em R$ 25,00.
3. FCC/ICMS-SP/2013 - Considere:
I. O coeficiente de variação de uma variável é uma medida de
dispersão absoluta que é o resultado da divisão entre a média e o
desvio padrão da variável em questão.
II. Um dispositivo útil quando se deseja verificar se existe
correlação linear entre duas variáveis é o gráfico de colunas
justapostas.
III. O desvio padrão é mais apropriado do que o coeficiente de
variação quando se deseja comparar a variabilidade de duas variáveis.
IV. Na amostragem aleatória estratificada, a população é dividida
em estratos, usualmente, de acordo com os valores ou categorias de
uma variável, e, depois, uma amostragem aleatória simples é utilizada
na seleção de uma amostra de cada estrato.
Está correto o que se afirma APENAS em
a) I.
b) II.
Prof. André L. Santos
www.passeicursos.com.br
81
ESTATÍSTICA PARA O ISS-Teresina
AULA 0
c) III.
d) I e IV.
e) IV.
4. FCC/ISS-SP/2007 - No presente mês, o salário médio mensal
pago a todos os funcionários de uma firma foi de R$ 530,00.
Sabe-se que os salários médios mensais dos homens e mulheres
são respectivamente iguais a R$ 600,00 e R$ 500,00. No próximo
mês, todos os homens receberão um adicional de R$ 20,00 e
todas as mulheres um reajuste salarial de 10%, sobre os salários
atuais. Supondo que o quadro de funcionários não se alterou,
após esses reajustes o salário médio mensal de todos os
funcionários passará a ser igual a:
a) R$ 540,00
b) R$ 562,00
c) R$ 571,00
d) R$ 578,00
e) R$ 580,00
5. FCC/ISS-SP/2012 - Considere as seguintes afirmações:
I. Um dispositivo útil quando se quer verificar a associação entre
duas variáveis quantitativas é o gráfico de dispersão entre essas duas
variáveis.
II. O coeficiente de variação é uma medida de dispersão relativa
que depende da unidade de medida da variável que está sendo
analisada.
III. Dentre as medidas de posição central, a média é considerada
uma medida robusta pelo fato de não ser afetada por valores
aberrantes.
IV. Se o coeficiente de correlação linear de Pearson entre duas
variáveis for igual a zero, não haverá associação linear entre elas,
implicando a ausência de qualquer outro tipo de associação.
Está correto o que se afirma APENAS em
a) II e III.
b) I e II.
c) I e III.
Prof. André L. Santos
www.passeicursos.com.br
82
ESTATÍSTICA PARA O ISS-Teresina
AULA 0
d) II e IV.
e) I.
6. FCC/ICMS-RO/2010 - A média aritmética de todos os salários dos
funcionários em uma repartição pública é igual a R$ 1.600,00. Os
salários dos funcionários do sexo masculino apresentam um
desvio padrão de R$ 90,00 com um coeficiente de variação igual
a 5%. Os salários dos funcionários do sexo feminino apresentam
um desvio padrão de R$ 60,00 com um coeficiente de variação
igual a 4%. Escolhendo aleatoriamente um funcionário desta
repartição, a probabilidade dele ser do sexo feminino é igual a
a) 1/2
b) 1/3
c) 3/4
d) 3/5
e) 2/3
7. FCC/ICMS-BA/2004 - O gráfico abaixo é o histograma de
frequências absolutas de uma amostra de valores arrecadados de
determinado tributo em um município.
Com relação aos dados dessa amostra, é verdade que
a) 60% dos valores são maiores ou iguais a R$ 1 500,00 e
menores que R$ 3 000,00.
b) mais de 30% dos valores são maiores ou iguais a R$ 2 500,00 e
menores que R$ 3 500,00.
c) a porcentagem dos valores iguais ou superiores a R$ 3 500,00 é
maior que a porcentagem dos valores inferiores a R$ 1 500,00.
d) a frequência relativa de valores inferiores a R$ 1 500,00 é
menos que 10%.
e) a amplitude da amostra é igual a R$ 4 000,00.
Prof. André L. Santos
www.passeicursos.com.br
83
ESTATÍSTICA PARA O ISS-Teresina
8. FCC/Analista FHEMIG/2013
conjunto de dados,
-
Na
análise
AULA 0
descritiva
de
um
a) a média corresponde sempre ao valor que divide os dados
ordenados ao meio.
b) o desvio padrão representa uma medida de tendência central.
c) se existem valores diferentes uns dos outros em um conjunto de
dados, sempre teremos valores abaixo e acima da média.
d) a mediana é sempre diferente da média.
e) o desvio padrão corresponde ao quadrado da variância.
9. FCC/Analista FHEMIG/2013 - A respeito do boxplot é correto
afirmar:
a) Medidas descritivas como a mediana e o intervalo interquartil
são utilizadas para se obter o gráfico, entre outros elementos.
b) Entre os percentis 25% e 50% há metade dos valores do
conjunto de dados representado.
c) O intervalo interquartil é construído a partir do 1o e 2o quartis.
d) É usual se considerar um valor aberrante àquele que exceda 2
intervalos interquartis, para cima ou para baixo dos limites
da caixa definida pelo intervalo interquartil.
e) Não se permite a visualização da variabilidade dos dados
10.
FCC/Analista
Legislativo/Contador
da
Câmara
dos
Deputados/2007 - Se a média e a variância da variável aleatória
X são 12 e 80 respectivamente, então a média e a variância da
variável aleatória Y = X/4 + 1 são dadas respectivamente por
a) 4 e 20
b) 4 e 5
c) 3 e 20
d) 4 e 21
e) 3 e 5
11.
FCC/Analista Legislativo & Contador da Câmara dos
Deputados/2007 - Para se estudar o desempenho das corretoras
de ações A e B, selecionou-se de cada uma delas amostras
aleatórias das ações negociadas. Para cada ação selecionada
Prof. André L. Santos
www.passeicursos.com.br
84
ESTATÍSTICA PARA O ISS-Teresina
AULA 0
computou-se a porcentagem de lucro apresentada durante o
período de um ano. Os gráficos a seguir apresentam os desenhos
esquemáticos relativos à porcentagem de lucro das amostras de
A e B durante o período citado.
Relativamente à porcentagem
corretoras pode-se afirmar que
de
lucro
obtida
por
essas
a) exatamente 25% dos valores de A são inferiores a 55.
b) menos de 50% dos valores de B são superiores a 55.
c) o maior valor de A é 60.
d) os valores de A apresentam maior variabilidade que os de B.
e) os valores de B apresentam assimetria positiva.
12.
FCC/Analista Bacen/2006 - O histograma de frequências
absolutas a seguir foi elaborado com base nas informações
contidas na revista “O Empreiteiro”, de junho de 2005, que
demonstra o comportamento das empresas construtoras do ramo
da construção civil no Brasil que obtiveram faturamento em 2004
maior ou igual a 15 milhões de reais e menor ou igual a 120
milhões de reais
Prof. André L. Santos
www.passeicursos.com.br
85
ESTATÍSTICA PARA O ISS-Teresina
AULA 0
Com base nestas informações, obteve-se a média aritmética do
faturamento das empresas deste estudo, considerando que todos os
valores incluídos num certo intervalo de classe são coincidentes com o
ponto médio deste intervalo. Com relação ao total de empresas deste
histograma, o valor encontrado para esta média pertence ao intervalo
de classe que contém
a) 24% das empresas.
b) 16% das empresas.
c) 9% das empresas.
d) 7% das empresas.
e) 5% das empresas.
13.
FCC/ Analista Bacen/2006 - Em uma instituição bancária, o
salário médio dos 100 empregados do sexo masculino é de R$
1.500,00, com desvio padrão de R$ 100,00. O salário médio dos
150 empregados do sexo feminino é de R$ 1.000,00, com desvio
padrão de R$ 200,00. A variância em (R$)2 dos dois grupos
reunidos é de:
a) 25.600,00
b) 28.000,00
c) 50.000,00
d) 62.500,00
e) 88.000,00
14.
FCC – Analista Legislativo/Contador da Câmara dos
Deputados 2007 – Numa pesquisa realizada com 300 famílias
levantaram-se as seguintes informações.
Prof. André L. Santos
www.passeicursos.com.br
86
ESTATÍSTICA PARA O ISS-Teresina
Número de filhos
Proporção das famílias
0
0,17
1
0,20
2
0,24
3
0,15
4
0,10
5
0,10
6
0,04
AULA 0
Com base nestas informações, a média e a mediana do número
dos filhos são dadas, respectivamente, por:
a) 2,27 e 3
b) 3 e 2
c) 2,27 e 2
d) 2,5 e 3,5
e) 2,5 e 3
15.
CESPE/ Analista Superior Tribunal Militar - STM/2010 - A
partir do histograma mostrado na figura abaixo, é correto inferir
que a distribuição da variável X é simétrica.
Para as duas questões a seguir, considere o seguinte conjunto de
dados composto por cinco elementos: {82,93; 94,54; 98,40; 115,41;
123,07}. Com base nesses dados, julgue os próximos dois itens
subsequentes acerca das medidas de tendência central.
Prof. André L. Santos
www.passeicursos.com.br
87
ESTATÍSTICA PARA O ISS-Teresina
AULA 0
16.
CESPE / Analista Superior Tribunal Militar / 2010 - A média
do conjunto de dados em questão é 102,87 e a mediana é 98,40.
Se o valor 123,07 for alterado para 200, a média irá aumentar,
mas a mediana continuará sendo 98,40.
17.
CESPE / Analista Superior Tribunal Militar / 2010 - Se o
valor de um dos elementos do conjunto não for fornecido, esse
valor pode ser determinado se a média do conjunto for
conhecida, mas não será possível obter esse valor conhecendo-se
apenas a mediana.
18.
COPS/ICMS-PR/2013 - Os preços, em reais, de uma
máquina de lavar roupas e de um ferro de passar roupas de
marcas e modelos idênticos variam em sete lojas, conforme
mostra a tabela a seguir.
Em relação aos preços desses produtos, assinale a alternativa
correta.–
a) A mediana dos preços da máquina de lavar roupas é R$ 787,14.
b) A variabilidade dos preços é igual para os dois produtos.
c) A variabilidade dos preços da máquina de lavar roupas é maior do que
a variabilidade dos preços do ferro de
passar roupas.
d) A variabilidade dos preços da máquina de lavar roupas é menor do
que a variabilidade dos preços do ferro de passar roupas.
e) O escore padronizado, z, do maior preço do ferro de passar roupas é
0,208 e isso indica que o preço é excepcionalmente alto em relação aos preços
das demais lojas.
19.
ESAF/Receita Federal/2005 - Para dados agrupados
representados por uma curva de frequências, as diferenças entre
os valores da média, da mediana e da moda são indicadores da
assimetria da curva. Indique a relação entre essas medidas de
posição para uma distribuição negativamente assimétrica.
Prof. André L. Santos
www.passeicursos.com.br
88
ESTATÍSTICA PARA O ISS-Teresina
AULA 0
a) A média apresenta o maior valor e a mediana se encontra
abaixo da moda.
b) A moda apresenta o maior valor e a média se encontra
abaixo da mediana.
c) A média apresenta o menor valor e a mediana se
encontra abaixo da moda.
d) A média, a mediana e a moda são coincidentes em
valor.
e) A moda apresenta o menor valor e a mediana se encontra
abaixo da média.
20.
FGV/ICMS-AP/2011 - Os dados a seguir são as quantidades
de empregados de cinco pequenas empresas: 6, 5, 8, 5, 6. A
variância da quantidade de empregados dessas cinco empresas é
igual a:
a) 0,8.
b) 1,2.
c) 1,6.
d) 2,0.
e) 2,4.
21.
FGV/ICMS-RJ/2011
A
respeito
das
técnicas
amostragem probabilística, NÃO é correto afirmar que
de
a) na amostragem por conglomerado a população é dividida em
diferentes grupos, extraindo-se uma amostra apenas dos conglomerados
selecionados.
b) na amostragem estratificada, se a população pode ser dividida
em subgrupos que consistem em indivíduos bastante semelhantes entre
si, pode-se obter uma amostra aleatória em cada grupo.
c) na amostragem aleatória simples se sorteia um elemento da
população, sendo que todos os elementos têm a mesma probabilidade de
serem selecionados.
d) na amostragem por voluntários a população é selecionada de
forma a estratificar aleatoriamente os grupos selecionados.
e) na amostragem sistemática os elementos da população se
apresentam ordenados, e a retirada dos elementos da amostra é feita
periodicamente.
Prof. André L. Santos
www.passeicursos.com.br
89
ESTATÍSTICA PARA O ISS-Teresina
AULA 0
22.
ESAF/ Receita Federal/2005 - Em uma determinada semana
uma empresa recebeu as seguintes quantidades de pedidos para
os produtos A e B:
Produto A
Produto B
39 33
50 52
25
47
30
49
41
54
36
40
37
43
Assinale a opção que apresente os coeficientes de variação dos
dois produtos:
a) CVA = 15,1% e CVB = 12,3%
b) CVA = 16,1% e CVB = 10,3%
c) CVA = 16,1% e CVB = 12,3%
d) CVA = 15,1% e CVB = 10,3%
e) CVA = 16,1% e CVB = 15,1%
23. CESPE/Tecnologista Jr/ 2010 - Dado é definido como um valor
quantitativo referente a um fato ou circunstância, número bruto
que não sofreu qualquer espécie de tratamento estatístico ou a
matéria-prima da produção de informação.
24.
CESPE/Tecnologista Jr/ 201 - Entende-se como informação
o conhecimento obtido a partir dos dados, o dado trabalhado ou o
resultado da análise e combinação de vários dados, sem haver,
no entanto, nenhuma interferência por parte do analista.
25.
CETRO/ISS-SP/2014 - Foram obtidos os seguintes dados
para a idade dos filhos de uma amostra aleatória de 50 pessoas:
4, 5, 5, 6, 6, 6, 6, 7, 7, 7, 7, 7, 7, 8, 8, 8, 8, 8, 8, 8, 8, 8, 9, 9, 9, 9,
9, 9, 10, 10, 10, 10, 10, 10, 10, 10, 11, 11, 12, 12, 13, 13, 14, 15, 15,
15, 16, 16, 18, 23
Dessa amostra, conclui-se que a distribuição:
a) tem assimetria negativa.
b) indica subpopulações com assimetria negativa.
c) é simétrica.
d) tem assimetria positiva.
Prof. André L. Santos
www.passeicursos.com.br
90
ESTATÍSTICA PARA O ISS-Teresina
AULA 0
e) é parte assimétrica positiva e parte simétrica.
26.
CETRO – Ministério das Cidades – Estatístico/ 2013 Tomada uma amostra de medidas de comprimento de um tipo de
inseto, obtiveram-se os resultados abaixo, em três medições:
2,21cm; 2,23cm; 2,26cm. Com base nesses dados, é correto
afirmar que a variância populacional da amostra é:
a) 0,0015.
b) 0,00065.
c) 0,0011.
d) 0,0009.
e) 0,0007.
27.
CETRO – Ministério das Cidades – Estatístico/ 2013 - Dada a
sequência de números: 71; 24; 36; 10; 12; 41; 52, o número que
define o 3º quartil é:
a) 12
b) 24
c) 36
d) 41
e) 52
28.
FUNCAB/ Estatístico pref Serra-ES/2011 - A seguir estão os
valores das médias salariais anuais, em salários mínimos,
correspondendo a um período de 25 anos, para uma amostra de
funcionários aposentados de uma prefeitura.
12, 11, 19, 16, 22, 20, 14, 17, 14, 15, 21, 21,
16, 9, 15, 8, 13, 16, 17, 15, 26, 9, 20, 16, 18.
A mediana deste conjunto de números é:
a) igual à moda.
b) desconhecida.
c) um número primo.
d) maior que a média.
e) igual a 15.
Temos que ordenar os dados para chegar à mediana
Prof. André L. Santos
www.passeicursos.com.br
91
ESTATÍSTICA PARA O ISS-Teresina
AULA 0
29.
FUNCAB/ Estatístico pref Serra-ES/2011 - Para os três
conjuntos de números a seguir, assinale a opção FALSA.
X - 70, 70, 70, 70, 70
Y - 68, 69, 70, 71, 72
Z - 5, 15, 50, 120, 160
a) As médias dos três conjuntos são iguais.
b) As medianas são números pares.
c) As variâncias são desiguais.
d) Os conjuntos são unimodais.
e) As amplitudes são menores que 157.
30.
FUNCAB/ Estatístico pref Serra-ES/2011 - Após verificar
que as notas obtidas em sua última prova haviam sido muito
baixas, um professor do ginásio municipal resolveu desconsiderar
cada questão que não houvesse sido respondida corretamente
por algum dos alunos. Isto feito, ele percebeu que as notas foram
todas aumentadas de 3 (três) pontos. Pode-se afirmar que:
a) a média aritmética e a mediana das notas se alteraram.
b) somente a média aritmética das notas se alterou.
c) somente a mediana das notas se alterou.
d) nem a média, nem a mediana das notas se alteraram.
e) o efeito sobre as notas depende
Prof. André L. Santos
www.passeicursos.com.br
92
ESTATÍSTICA PARA O ISS-Teresina
12.
AULA 0
GABARITOS
Questão
Banca
Cargo/Órgão
Ano
Resposta
1
FCC
ICMS-RJ
2014
D
2
FCC
ICMS-RO
2010
E
3
FCC
ICMS-SP
2013
E
4
FCC
ISS-SP
2007
C
5
FCC
ISS-SP
2012
E
6
FCC
ICMS-RO
2010
E
7
FCC
ICMS-BA
2004
B
8
FCC
Analista FHEMIG
2013
C
9
FCC
Analista FHEMIG
2013
A
10
FCC
Analista Câmara
2007
B
11
FCC
Analista Câmara
2007
D
12
FCC
Analista Bacen
2006
B
13
FCC
Analista Bacen
2006
E
14
FCC
Analista Câmara
2007
C
15
Cespe
Analista Tribunal
Militar
2010
Errada
16
Cespe
Analista Tribunal
Militar
2010
Certa
17
Cespe
Analista Tribunal
Militar
2010
Certa
18
COPS
ICMS-PR
2013
D
19
ESAF
Receita federal
2005
C
20
FGV
ICMS-AP
2011
B
21
FGV
ICMS-RJ
2011
D
22
ESAF
Receita federal
2005
B
23
Cespe
Tecnologista
2010
Certo
24
Cespe
Tecnologista
2010
Errada
25
CETRO
ISS-SP
2014
D
26
CETRO
Ministério das
2013
B
Prof. André L. Santos
www.passeicursos.com.br
93
ESTATÍSTICA PARA O ISS-Teresina
AULA 0
Cidades
27
CETRO
Ministério das
Cidades
2013
D
28
FUNCAB
Pref. Serra-ES
2011
A
29
FUNCAB
Pref. Serra-ES
2011
D
30
FUNCAB
Pref. Serra-ES
2011
A
Prof. André L. Santos
www.passeicursos.com.br
94
ESTATÍSTICA PARA O ISS-Teresina
13.
AULA 0
FORMULÁRIO DESTA AULA
Somatória de um conjunto de valores
�x
x
Uma variável usada para representar valores individuais dos
dados
n
Número de valores de uma amostra
N
Número de valores de uma população
∑ 𝑥𝑥
𝑥𝑥̅ =
∑ 𝑥𝑥
µ=
𝑥𝑥̅ =
Média (aritmética) de um conjunto de valores de uma amostra
𝑛𝑛
Média (aritmética) de um conjunto de valores de uma população
𝑁𝑁
∑ 𝑥𝑥. 𝑃𝑃(𝑥𝑥)
∑ 𝑥𝑥
Média (ponderada) de uma tabela de frequências
Divide 50%/50%
Mediana 𝑥𝑥�
𝑥𝑥� =50%_ésimo valor
(Segundo Quartil)
Divide 25%/75%
Primeiro quartil
𝑄𝑄1 =25%_ésimo valor
Divide 75%/25%
Terceiro quartil
𝑄𝑄3 =75%_ésimo valor
Dinter=Q3-Q1
Distância interquartílica
Valor que ocorre com mais frequência
moda
𝐴𝐴𝐴𝐴𝐴𝐴𝐴𝐴𝐴𝐴𝐴𝐴𝐴𝐴𝐴𝐴𝐴𝐴 = 𝑀𝑀á𝑥𝑥 − 𝑀𝑀í𝑛𝑛
amplitude
𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃 𝑚𝑚é𝑑𝑑𝑑𝑑𝑑𝑑 = 𝐴𝐴𝐴𝐴𝐴𝐴𝐴𝐴𝐴𝐴𝐴𝐴𝐴𝐴𝐴𝐴𝐴𝐴/2
∑(𝑥𝑥−𝑥𝑥̅ )2
S2 =
𝑛𝑛−1
=
1
𝑁𝑁
2
𝑁𝑁
∑(𝑥𝑥−𝑥𝑥̅ )2
∑(𝑥𝑥−µ)2
𝑛𝑛−1
2
(∑ 𝑥𝑥)
𝑁𝑁
�
n(∑ x2 )−(∑ x)2
=�
=� �∑ 𝑥𝑥2 −
𝑁𝑁
Variância de um conjunto de valores de uma população
=
σ=√𝜎𝜎 2 =
1
Variância de um conjunto de valores de uma amostra
𝑛𝑛(𝑛𝑛−1)
�� 𝑥𝑥 −
s=√𝑆𝑆 2 =�
𝑁𝑁
n�∑ x2 �−(∑ x)2
∑(𝑥𝑥−µ)2
σ2=
Ponto médio
Desvio-padrão de um conjunto de valores de uma amostra
𝑛𝑛(𝑛𝑛−1)
(∑ 𝑥𝑥)
𝑁𝑁
Prof. André L. Santos
2
Desvio-padrão (sigma) de um conjunto de valores de uma
população
�
www.passeicursos.com.br
95
ESTATÍSTICA PARA O ISS-Teresina
AULA 0
Diferentes maneiras de calcular a variância
Variância de Populações
Variância de Amostras
Fórmula clássica
Fórmula abreviada
- Usa a média -
- Usa os quadrados -
∑(𝑥𝑥 − µ)2
σ =
𝑁𝑁
2
s2=
∑(𝑥𝑥−𝑥𝑥̅ )2
1
σ2= �∑ 𝑥𝑥 2 −
𝑁𝑁
s2=
𝑛𝑛−1
(∑ 𝑥𝑥)2
𝑁𝑁
n�∑ x2 �−(∑ x)2
�
𝑛𝑛(𝑛𝑛−1)
Assimetria
Assimétrica a
esquerda ou
negativamente
assimétrica
Simétrica
Assimétrica a direta
ou positivamente
assimétrica
Mediana < Moda
Moda = Média =
Mediana
Mediana > Moda
Média < Moda
Média > Moda
Propriedades da média (aritmética)
Multiplicando-se todos os valores de uma variável por uma constante, a média
do conjunto fica multiplicada por esta constante
Somando-se ou subtraindo-se uma constante a todos os valores de uma
variável, a média do conjunto fica acrescida ou diminuída dessa constante
Propriedades da Variância
Multiplicando-se todos os valores de uma variável por uma constante, a
variância do conjunto fica multiplicada pelo quadrado desta constante
Somando-se ou subtraindo-se uma constante a todos os valores de uma
variável, a variância não se altera. (Natural, porque a média se move, não a
dispersão dos valores)
σ2 (𝐴𝐴 + 𝐵𝐵) =
(∑ 𝐴𝐴 + ∑ 𝐵𝐵)2
1
��� 𝐴𝐴2 + � 𝐵𝐵2 � −
�
𝑁𝑁𝐴𝐴 + 𝑁𝑁𝑏𝑏
𝑁𝑁𝑎𝑎 + 𝑁𝑁𝑏𝑏
Equação da variância
combinada
Cuidado: 𝝈𝝈𝟐𝟐𝑨𝑨 + 𝝈𝝈𝟐𝟐𝑩𝑩 <> 𝝈𝝈𝟐𝟐𝑨𝑨+𝑩𝑩
Prof. André L. Santos
www.passeicursos.com.br
96
ESTATÍSTICA PARA O ISS-Teresina
14.
AULA 0
TIPOS DE GRÁFICOS VISTOS
Histograma
100
Histograma de clientes
80
80
60
40
20
20
5
0
Padrão
R$ 0
R$
PreferencialR$
Premium
R$
Histograma de frequência acumulada
Freq. Relativa Acumulada
1,00
0,80
0,60
0,40
0,20
0,00
Até R$ 100.000 Até R$ 200.000 Até R$ 300.000
Gráfico de Pareto
Gráfico de Pareto: Lançamentos por bairros paulistanos
160
100
120
100
60
80
60
40
20
0
bi ão ros na zes nia da kl in pa ma ntã ga de her
ô un o
La oe uta iran S aú O t
um laç ei r ia di
or so inh Ma Pe la S a F Bro
M B Ip
M on P a
V i arr
l
i
C
B
V
18 15 14 14 13 13 12 11 11 11 9 6 4
7
Lançamentos
11 9 9 9 8 8 8 7 7 7 6 4 3
4
Percent
11 21 30 39 47 55 63 70 77 84 89 93 96 100
Cum %
Bairros
Prof. André L. Santos
80
www.passeicursos.com.br
%
Lançamentos
140
40
20
0
97
ESTATÍSTICA PARA O ISS-Teresina
AULA 0
Gráfico de Pizza
Cores de automóveis vendidos
Vermelha; 130; 7%
Azul; 100; 5%
Outras; 5; 0%
Verde; 15; 1%
Prata
Marrom; 50; 2%
Preta
Branca; 200; 10%
Branca
Marrom
Verde
Azul
Vermelha
Outras
Preta; 500; 25%
Prata; 1000; 50%
Dispersão XY
Dispersão de A versus C
10
8
6
a
Aparentemente há
correlação
4
2
0
20
15
10
5
25
c
Boxplot
Exemplo de Boxplot
250
Os pontos avulsos são "Outliers"
Valores extremos acima ou abaixo
dos limites
Limite superior = Q3 + 1.5 (Q3 - Q1)
200
150
Q3
100
50
0
Prof. André L. Santos
Distância
interquartílica
mediana
Q1
Limite inferior = Q1- 1.5 (Q3 - Q1)
www.passeicursos.com.br
98
ESTATÍSTICA PARA O ISS-Teresina
15.
AULA 0
RESUMÃO DE CONCEITOS
Conceito
Definição
Ciência da Estatística
Ramo da Matemática que se preocupa com a
organização, descrição, análise e interpretação dos
dados experimentais.
População
Uma coleção completa de todos os elementos a
serem estudados
Censo
Uma coleção de dados relativos a todos os
elementos de uma população
Amostra
Uma subcoleção de elementos extraídos de uma
população
Parâmetro
Uma medida numérica que descreve uma
característica de uma população
estatística
Medida numérica que descreve uma característica
de uma amostra.
dado
uma unidade básica de informação
informação
conhecimento obtido pela comparação de diversos
dados
proposição
conjunto de palavras ou símbolos que exprimem
um pensamento ou juízo de sentido completo
Dados quantitativos
números que representam contagens ou medidas
Dados qualitativos / dados categóricos / dados
atributos
Dados separados em diferentes categorias que se
distinguem por alguma característica não-numérica
Dados discretos
Dados quantitativos que resultam de um conjunto
finito de valores possíveis
Dados contínuos
Dados quantitativos resultam de um número infinito
de valores possíveis que podem ser associados a
pontos em uma escala contínua de tal maneira que
não haja interrupções
Nível nominal de mensuração
Dados que consistem apenas em nomes, rótulos
ou categorias
Nível ordinal de mensuração
Dados que podem ser dispostos em alguma
ordem, mas as diferenças entre valores dos dados
não podem ser determinadas ou não tem sentido
Nível intervalar de mensuração
Dados que podem ser dispostos em alguma ordem
com a propriedade de que podemos determinar
diferenças significativas entre os dados. Não existe
um ponto de partida zero
Nível de razão de mensuração
Nível de intervalo modificado de modo a incluir o
ponto de partida zero inerente, onde zero significa
nenhuma quantidade presente
estudo observacional
Estudo em que se verificam e medem-se
características específicas, mas não se tenta
manipular ou modificar os elementos a serem
estudados
Prof. André L. Santos
www.passeicursos.com.br
99
ESTATÍSTICA PARA O ISS-Teresina
AULA 0
experimento
Aplicação de determinado tratamento para
observar seus efeitos a serem pesquisados
amostra aleatória
Amostra em que elementos da população são
escolhidos de tal forma que cada um deles tenha
igual chance de figurar na amostra
amostragem estratificada
Amostragem que a população é subdividida em no
mínimo duas subpopulações que compartilham das
mesmas características e em seguida se extrai
uma amostra aleatória de cada extrato
amostragem por conglomerados
a população é dividida em diferentes grupos,
extraindo-se uma amostra apenas dos
conglomerados selecionados
amostragem sistemática
Amostragem em que define-se um ponto de partida
e seleciona-se um elemento a cada determinada
distância ou frequência
erro amostral
Diferença entre os resultados amostrais e o
verdadeiro resultado populacional atribuido à
variação amostral aleatória
erro não amostral
Diferença entre os resultados amostrais e o
verdadeiro resultado populacional quando os
dados amostrais são coletados, registrados ou
analisados incorretamente
Prof. André L. Santos
www.passeicursos.com.br
100
Download