Apostila de Estatística Descritiva

Propaganda
Estatística Descritiva
www.profrichard.com.br
Aluno:
_____________________________________________
_____________________________________________
Instituição de Ensino:
_____________________________________________
Curso:
_____________________________________________
1
Estatística Descritiva
www.profrichard.com.br
2
“Sem entusiasmo não há matemática.” Novalis
“OS SINAIS + E - MODIFICAM A QUANTIDADE DIANTE DA QUAL SÃO COLOCADOS COMO O ADJETIVO
MODIFICA O SUBSTANTIVO.” (CAUCHY)
Módulo 1 – I N T R O D U Ç Ã O
A
ESTATÍSTICA
Estatística é a parte da Matemática Aplicada que fornece métodos para a coleta, organização,
apresentação, análise e interpretação de dados para a tomada de decisões.
Aplicações da estatística:
_ Um professor comunica que a nota média da classe foi 7;
_ O meteorologista informa que a probabilidade de chover hoje é de 30%;
_ Um fabricante testa a resistência à ruptura, de cintos de segurança de automóveis, sem
destruir toda a sua produção.
A Estatística é dividida nas principais partes:
Descritiva: resume os dados e descreve fatos. Exemplos: médias de estudantes, taxa de
desemprego, consumo médio de automóveis, índice pluviométrico, etc.
Probabilidade: analisa situações que envolvem o acaso. Exemplos: chance de vitória em uma
competição esportiva, decisão de imunizar ou não pessoas contra determinada doença, etc.
Indutiva: analisa através de amostras, uma parcela pequena de determinada “população” e
infere conclusões sobre a população toda. Exemplo: através do cálculo da idade média de
alguns alunos de uma faculdade, determina uma aproximação, para a idade média de todos
os alunos da faculdade.
Em estatística, população é um conjunto de elementos com pelo menos uma característica
em comum. É o conjunto universo que se pretende estudar, um conjunto de elementos com
alguma característica em comum. Uma população poderia ser, por exemplo, todos os
habitantes do seu município (população finita) ou, todas as orquídeas da Mata Atlântica
(população infinita – não temos como determinar). Quando uma população concentra um
grande número de elementos, seu estudo irá exigir grande dispêndio de tempo, material,
pesquisadores, recursos financeiros, etc. Neste caso, trabalha-se não com toda a população,
mas com uma parte chamada amostra, que é um subconjunto da população, ou seja, uma
parte da população retirada para ser analisada. O estudo desta parcela deverá permitir que
se conheça a população toda de forma geral. Resumidamente:
População: é o conjunto formado por todos os elementos (pessoas, objetos, etc.) que contém
pelo menos uma característica comum a qual temos interesse em estudar.
Amostra: é uma parte da população retirada para ser analisada, a qual permite que se
conheça tal população.
Técnica de Amostragem: é um procedimento para se obter uma amostra que seja
representativa de uma população. As técnicas usadas para obtenção de uma amostra podem
ser classificadas como amostragens probabilísticas ou não-probabilísticas.
Técnicas de amostragem não-probabilísticas são as que não permitem a retirada de uma
amostra de forma aleatória, pois em algumas situações a amostragem se torna obrigatória.
Dentre essas técnicas existe a amostragem por Conveniência.
Estatística Descritiva
www.profrichard.com.br
3
→ Amostragem por Conveniência: Ocorre quando o pesquisador seleciona os membros da
população dos quais é mais fácil se obter informações. Esse tipo de amostragem é muito
utilizado nas áreas de humanas e biológicas.
Amostragem probabilística é a técnica de seleção de uma amostra na qual cada elemento
da população tem probabilidade conhecida e diferente de zero, de pertencer à amostra. Os
principais tipos são:
→ Amostragem Casual Simples ou Aleatória: os elementos da população são escolhidos
ao acaso (sorte), é o processo mais elementar e frequentemente utilizado, embora não muito
confiável.
→ Amostragem Sistemática: os elementos da população são escolhidos a cada período, ou
seja, a seleção dos elementos que constituirão a amostra pode ser calculada por um fator de
sistematização ou feita por um sistema imposto pelo pesquisador, por exemplo, um policial
pode parar um veículo a cada dez, outro exemplo, uma embalagem de um produto de uma
linha de fabricação, pode ser retirada a cada 5 minutos.
→ Amostragem Estratificada: é uma técnica muito utilizada, que separa a população em
partes chamadas de estratos, por exemplo: sexo (masculino ou feminino), faixa etária, classe
econômica, etc. Os elementos que constituirão a amostra são retirados dos estratos, em
quantidade proporcional ao tamanho de cada estrato. Exemplificando, numa empresa onde
trabalham 1.000 pessoas (800 homens e 200 mulheres), deseja-se fazer uma pesquisa por
amostragem, com 100 funcionários, quantos homens e quantas mulheres serão
entrevistados? Como a amostra 100, corresponde a 10% da população de 1.000 funcionários,
devemos entrevistar 10% dos homens e 10% das mulheres, ou seja, serão entrevistados 80
homens e 20 mulheres.
Dados: os dados são as informações obtidas através de observações, medidas, respostas de
pesquisas ou contagens em geral. Os dados podem ser classificados em:
_ NUMÉRICOS ou QUANTITAVIVOS;
_ CATEGÓRICOS ou QUALITATIVOS.
A escolha do processo a utilizar na análise ou descrição de dados estatísticos depende do
tipo de dado considerado, após a classificação de suas variáveis.
As variáveis quantitativas podem ser contínuas ou discretas. E as variáveis qualitativas podem
ser nominais ou ordinais.
Variáveis Quantitativas Contínuas (QC): podem assumir qualquer valor numérico num
intervalo contínuo. Os dados referentes a tais variáveis dizem-se dados contínuos. Ou seja,
quando pode assumir qualquer valor dentro de dois limites definidos, números “quebrados”,
por exemplo: pesos de peças fabricadas, temperatura do corpo humano, etc.
Variáveis Quantitativas Discretas (QD): assumem valores numéricos inteiros. Os dados
discretos são o resultado da contagem do número de itens. Ou seja, quando só pode assumir
valores pertencentes a um conjunto enumerável, números inteiros, como por exemplo,
quantidade de peças fabricadas, número de filhos, etc.
Variáveis Qualitativas Ordinais (QO): consistem de valores relativos (numéricos ou não)
atribuídos para denotar ordem. Os dados referentes a tais variáveis dizem-se dados ordinais.
Ou seja, apresenta uma ordenação, por exemplo: grau de escolaridade (Fundamental, Médio,
Superior), nota obtida numa prova (de ZERO a DEZ ou de A até E ou de MB até I), etc.
Estatística Descritiva
www.profrichard.com.br
4
Variáveis Qualitativas Nominais (QN): referem-se a avaliações subjetivas. Os dados
referentes a tais variáveis dizem-se dados nominais. Ou seja, não apresentam ordem, nem
estrutura numérica, como por exemplo, religião, sexo, cor da pele, etc.
A dificuldade para classificar dados, se dá em função da fácil confusão gerada entre uma
variável quantitativa discreta e uma variável qualitativa ordinal.
Por exemplo, num questionário estatístico, a pergunta: grau de importância que você dá ao
seu curso (de 0 a 10) é uma variável qualitativa ordinal QO. Outro exemplo: soma da renda
familiar (até $ 1.000,00, entre $ 1.000,00 e $ 2.000,00, acima de $ 2.000,00), é variável
numérica, mas quando se pede para encaixar numa categoria, é classificada como variável
qualitativa ordinal QO.
Exemplo 1: Considere as afirmações a seguir e assinale a alternativa correta.
I. A qualidade de um produto, defeituoso ou não defeituoso, trata de um dado qualitativo.
II. A altura dos atletas do time de basquetebol da escola “Aprender”, trata de um dado
qualitativo.
III. O diâmetro dos parafusos produzidos por certa máquina trata de um dado quantitativo.
a) Todas as afirmações estão corretas.
b) Apenas a afirmação I está correta.
c) Apenas as afirmações I e III estão corretas.
d) Todas as afirmações estão incorretas.
e) Apenas a afirmação III está correta.
Resposta Correta: C a altura dos atletas do time de basquetebol da escola “Aprender” trata
de um dado QUANTITATIVO e não QUALITATIVO.
Exemplo 2: Classifique as variáveis abaixo em Qualitativa Nominal (N), Qualitativa Ordinal
(O), Quantitativa Discreta (D) e Quantitativa Contínua (C).
a) sexo (masculino ou feminino); b) idade; c) tempo de vida; d) peso; e) estado civil; f)
tipo de escola (pública/particular); g) número de alunos numa classe; h) disciplina que mais
gosta; i) rua de uma residência; j) número de uma residência.
Respostas: a)N b)D c)C d)C e)N f)N g)D h)N i)N j)O
EXERCÍCIOS
1. População é um conjunto de:
a) Pessoas. b) Elementos quaisquer. c) Pessoas com uma característica comum.
d) Elementos com pelo menos uma característica em comum.
e) Indivíduos de um mesmo município, estado ou país.
2. Uma parte da população retirada para ser analisada denomina-se:
a) Universo. b) Parte. c) Pedaço. d) Dados brutos. e) Amostra.
3. A parte da estatística que resume os dados e descreve fatos denomina-se:
a) Estatística da população. b) Estatística da amostra. c) Estatística Inferencial.
d) Estatística descritiva.
e) Estatística grupal.
4. A variável, cor dos olhos, pode ser classificada como:
a) Qualitativa nominal. b) Quantitativa discreta. c) Quantitativa contínua.
d) Qualitativa discreta. e) Qualitativa contínua.
5. A variável, número de filhos, pode ser classificada como:
a) Qualitativa ordinal. b) Quantitativa discreta. c) Quantitativa contínua.
d) Qualitativa discreta. e) Qualitativa contínua.
Estatística Descritiva
www.profrichard.com.br
5
6. A variável, peso, pode ser classificada como:
a) Qualitativa nominal. b) Quantitativa discreta.
d) Qualitativa discreta. e) Qualitativa contínua.
c) Quantitativa contínua.
7. A variável, tipo sanguíneo, pode ser classificada como:
a) Qualitativa nominal. b) Quantitativa discreta. c) Quantitativa contínua.
d) Qualitativa discreta. e) Qualitativa contínua.
8. A variável, sexo, pode ser classificada como:
a) Qualitativa nominal. b) Quantitativa discreta.
d) Qualitativa discreta. e) Qualitativa contínua.
c) Quantitativa contínua.
9. Identifique nos exemplos abaixo, qual o de tipo de dado:
a) nº de defeitos num carro. b) Salário (R$). c) Cor azul. d) muito dispendioso.
10. Numa empresa, para estudar a preferência em relação a sabores de sucos naturais,
sorteiam-se 150 funcionários, entre os 850 funcionários próprios (não terceirizados).
Responda: a) Qual a população envolvida na pesquisa? b) Que tipo de amostragem foi
utilizado? c) Qual é a amostra considerada?
Gabarito: 1)D 2)E 3)D 4)A 5)B 6)C 7)A 8)A 9)a)discreto b)contínuo c)nominal
d)ordinal 10)a)850funcionários b)aleatória c)150funcionários.
“Toda a educação científica que não se inicia com a Matemática é, naturalmente, imperfeita na sua base.”
(Auguste Conte)
“O CÉU DEVE SER NECESSARIAMENTE ESFÉRICO, POIS A ESFERA, SENDO GERADA PELA ROTAÇÃO
DO CÍRCULO, É, DE TODOS OS CORPOS, O MAIS PERFEITO.” (ARISTÓTELES)
Módulo 2 – O R G A N I Z A Ç Ã O
DE
DADOS
Quando os dados são coletados para uma pesquisa, são chamados de dados brutos. Um exemplo
de dado bruto corresponde ao valor médio (em dólares) de comercialização nos últimos 10 meses da saca de
soja, na Bolsa de Cereais, conforme apresentado abaixo:
9,0 - 8,0 - 8,0 - 2,0 - 6,3 - 6,5 - 6,8 - 7,0 - 7,1 - 7,1
Geralmente, este tipo de dado traz pouca ou nenhuma informação ao leitor, sendo necessário
organizar os dados, com o intuito de aumentar sua capacidade de informação.
Rol: A primeira forma de organização que vamos estudar é o Rol, que são os dados organizados em
ordem crescente ou decrescente.
2,0 – 6,3 – 6,5 – 6,8 – 7,0 – 7,1 – 7,1 – 8,0 – 8,0 – 9,0
Como podemos observar, a simples organização dos dados em um rol aumenta muito a capacidade
de informação destes. Pode-se verificar facilmente que o menor preço observado foi 2 dólares e o
maior, 9 dólares, o que nos fornece uma amplitude total de variação da ordem de 7 dólares.
Amplitude total corresponde à diferença entre o maior e o menor valor observado em um conjunto de
dados, simbolizado por A. Outra informação que podemos obter nos dados por meio da organização
em rol crescente, é que alguns preços, como 7,1 e 8,0, foram os mais freqüentes, ou seja, os mais
citados na pesquisa.
Tabela: Para organizar os dados de uma forma mais eficiente, na qual se possa apresentar uma
quantidade maior de informações, podemos usar as tabelas. Os elementos básicos de uma tabela são:
o título, o corpo e a fonte. Quando temos poucos valores, podemos agrupá-los numa tabela simples.
Por exemplo:
Estatística Descritiva
www.profrichard.com.br
6
Valor Médio da saca de soja
Valor
2,0
6,3
6,5
6,8
7,0
7,1
8,0
9,0
Frequência
1
1
1
1
1
2
2
1
Fonte: Bolsa de Cereais
Quando temos muitos valores, fica inviável a tabela simples, dessa forma, os agrupamos numa tabela
com intervalos de classe. Classes são intervalos nos quais os valores da variável analisada são
agrupados (linhas da tabela). Distribuindo-se os dados observados em classes e contando-se o
número de observações contidas em cada classe, obtém-se a freqüência de classe. A disposição
tabular dos dados agrupados em classes, juntamente com as freqüências correspondentes, se
denomina distribuição de freqüências. A partir dos dados do exemplo relativo ao preço da saca de
soja, vamos construir uma distribuição de freqüência:
Valor Médio da saca de soja
CLASSES
2├ 4
4├ 6
6├ 8
8 ├ 10
FREQUÊNCIA
1
0
6
3
Fonte: Bolsa de Cereais
Na tabela acima, dizemos que o limite inferior e o superior da segunda classe são 4 e 6. O ponto
médio (PM) da primeira classe é 3. O ponto médio é a média aritmética entre o Li: Limite inferior; e o
Ls: Limite superior.
TIPOS
DE
FREQUÊNCIA
Como já vimos, após a coleta dos dados, não temos informações claras. Ou seja, na tabela abaixo,
temos os dados brutos ou uma tabela primitiva, pois os dados não estão organizados.
5,1 4,9 4,9 5,1 4,7
5,0 5,0 5,0 5,1 5,4
5,2 5,2 4,9 5,3 5,0
4,5 5,4 5,1 4,7 5,5
4,8 5,1 5,3 5,3 5,0
Na tabela anterior, é difícil averiguar, qual o Menor valor, o Maior valor, a Faixa de valores, a Amplitude,
etc. Por isso, é melhor organizarmos a tabela acima, num rol.
4,5 4,7 4,7 4,8 4,9
4,9 4,9 5,0 5,0 5,0
5,0 5,0 5,1 5,1 5,1
5,1 5,1 5,2 5,2 5,3
5,3 5,3 5,4 5,4 5,5
Através do Rol, fica fácil averiguar, o Menor valor (4,5), o Maior valor (5,5), a Faixa de valores (4,5 a
5,5) e a Amplitude (1).
Estatística Descritiva
www.profrichard.com.br
7
Freqüência simples ou absoluta (f): É a quantidade de vezes que um dado aparece, ou seja, a
frequência absoluta, ou apenas frequência, de um valor é o número de vezes que uma determinada
variável assume esse valor. Ao conjunto das frequências dos diferentes valores da variável dá-se o
nome de distribuição da frequência (ou apenas distribuição). conforme tabela abaixo:
valor
4,5
4,6
4,7
4,8
4,9
5,0
5,1
5,2
5,3
5,4
5,5
total
F
1
0
2
1
3
5
5
2
3
2
1
25
Na tabela acima, temos uma observação direta, do número de vezes (frequência) que cada
valor aparece. Quando uma tabela possui muitas linhas, podemos transformá-la de simples
em intervalos de classe, conforme abaixo:
Valor
4,5 ├ 4,9
4,9 ├ 5,3
5,3 ├ 5,7
Total
frequência
(f)
4
15
6
25
OBS.: _ A escolha do intervalo de classe (0,4) geralmente é arbitrário, embora possa ser
definido por diferentes métodos de cálculo, como o método de Sturges.
_ O símbolo
significa intervalo fechado à esquerda e aberto à direita, ou seja:
4,5
4,9 significa 4,5  x < 4,9 ou [ 4,5 ; 4,9 [
_ Na tabela simples, percebe-se que não há nenhum resultado com 4,6, mas na tabela com
intervalos de classe, não observamos este detalhe. Ou seja, a tabela simples é mais detalhada
que a tabela com intervalos de classe.
Frequência relativa (fr): São os valores das razões entre as frequências simples e a frequência total
fr = f / f . Ou seja, a frequência relativa, é a porcentagem relativa à frequência. O propósito das
freqüências relativas é o de permitir a análise ou facilitar as comparações, pois multiplicando a
freqüência relativa por cem, temos o percentual de cada dado.
fr = f / f ↔ fr = 1 / 25 ↔ fr = 0,04
valor
4,5
4,6
4,7
4,8
4,9
f
1
0
2
1
3
fr
0,04
0
0,08
0,04
0,12
Estatística Descritiva
www.profrichard.com.br
8
5,0
5 0,20
5,1
5 0,20
5,2
2 0,08
5,3
3 0,12
5,4
2 0,08
5,5
1 0,04
total
25
1
Através da tabela acima e análise de dados, 8% das amostras apresentam o valor 5,2.
Frequência acumulada (F): também chamada de fa, é o total das freqüências de todos os
valores inferiores ao limite superior do intervalo de uma dada classe F = f . Ou seja, a
frequência acumulada de um valor, é o numero de vezes que uma variável assume um valor
inferior ou igual a esse valor.
F3 = f ↔ F = 1 + 0 + 2 ↔ F = 3
F6 = 1 + 0 + 2 + 1 + 3 + 5 ↔ F = 12
valor
f
4,5
1
4,6
0
4,7
2
4,8
1
4,9
3
5,0
5
5,1
5
5,2
2
5,3
3
5,4
2
5,5
1
total
25
Através da tabela acima e análise de dados,
resultados com valores  5.
fr
0,04
0
0,08
0,04
0,12
0,20
0,20
0,08
0,12
0,08
0,04
1
há 3
F
1
1
3
4
7
12
17
19
22
24
25
resultados com valores  4,7, há 12
Frequência acumulada relativa (Fr): É a porcentagem relativa à frequência acumulada. Ou
seja, a frequência relativa acumulada de uma classe é a freqüência acumulada da classe,
dividida pela freqüência total da distribuição Fr = F / f.
Fr1 = F / f ↔ Fr = 1 / 25 ↔ Fr = 0,04
Fr4 = 4 / 25 ↔ Fr = 0,16
valor
4,5
4,6
4,7
4,8
4,9
5,0
5,1
5,2
5,3
f
1
0
2
1
3
5
5
2
3
fr
0,04
0
0,08
0,04
0,12
0,20
0,20
0,08
0,12
F
1
1
3
4
7
12
17
19
22
Fr
0,04
0,04
0,12
0,16
0,28
0,48
0,68
0,76
0,88
Estatística Descritiva
www.profrichard.com.br
9
5,4
2 0,08 24 0,96
5,5
1 0,04 25
1
total
25
1
Através da tabela acima e análise de dados, 96% das amostras apresentam valores  5,4.
CONTRIBUIÇÕES
PERCENTU AIS
Note que f% = fr • 100 e F% = Fr • 100, pois se multiplicarmos a freqüência relativa por 100,
obtemos a mesma na forma percentual.
Uma tabela de freqüências, para variáveis quantitativas, apresenta, porém, outros conceitos
que permitem uma maior profundidade para análise e devem ser adicionadas. São eles o
PONTO MÉDIO (PM), a FREQUENCIA PERCENTUAL ACUMULADA (F%) e a FREQUENCIA
PERCENTUAL ACUMULADA INVERSA (F’%), onde:
PM é o valor médio de cada classe, ou intervalo, é o ponto médio de cada classe. Torna-se o
valor representativo de cada classe.
F% é a freqüência percentual acumulada, obtida repetindo-se o primeiro valor de f% e
somando aos demais.
F’% é a freqüência percentual acumulada inversa, será obtida atribuindo-se o total de f% (100)
na primeira linha e daí subtraindo os demais valores de f%.
Veja como exemplo, uma tabela de freqüências para a variável quantitativa “idades” de forma
completa:
Classes
PM
f
f%
F%
F’%
12 ├ 14
13
3
15
15
100
14 ├ 16
15
5
25
40
85
16 ├ 18
17
5
25
65
60
18 ├ 20
19
7
35
100
35
Total
20
100
Analisando F’% observamos que 85% dos adolescentes têm mais de 14 anos.
Amplitude em tabelas de freqüências: a amplitude de um rol é a diferença entre o maior e
o menor valor. Numa tabela de freqüências, temos a amplitude de cada classe, a amplitude
total das classes, a amplitude dos pontos médios e a amplitude das freqüências. Por exemplo,
na tabela acima, temos que a amplitude de cada classe é 14 – 12 = 2, a amplitude total das
Classes ou amplitude da distribuição é 20 – 12 = 8, a amplitude dos pontos médios é 19 – 13
= 6 e a amplitude das freqüências é 7 – 3 = 4.
Exemplo: um grupo de alunos foi consultado sobre o time paulista de sua preferência, e os
votos foram registrados assim: Santos: I I, Palmeiras: I I I I, Corinthians: I I I I I I I I, São Paulo:
I I I I I I. Construa a tabela de freqüência correspondente a essa pesquisa.
Times
Contagem
f
f%
F%
F’%
Santos
II
2
10
10
100
Palmeiras
IIII
4
20
30
90
Corinthians
IIIIIIII
8
40
70
70
São Paulo
IIIIII
6
30
100
30
Total
20
100
-
Estatística Descritiva
www.profrichard.com.br
10
EXERCÍCIOS
1) O que é rol?
a) sequência desordenada gerada a partir dos dados brutos.
b) sequência dos dados brutos.
c) dados brutos.
d) dados gerados a partir da pesquisa.
e) sequência ordenada gerada a partir dos dados brutos.
2) O que é freqüência?
a) dados apresentados em sequência.
b) fato que acontece em uma determinada coleta de dados.
c) quantidade de vezes que a pesquisa é realizada.
d) quantidade de vezes que um elemento ou fato acontece em uma determinada coleta de
dados.
e) coleta de dados.
3) De acordo com a tabela dada, responda:
a) Qual o número de classes.
b) Qual é o intervalo de classe.
c) Qual o intervalo que aparece a maior freqüência?
d) A estatura 176 cm ou 1,76 m, está na classe de qual freqüência?
ESTATURA DE 100 FUNCIONÁRIOS DE UMA EMPRESA
Estatura (cm) nº de funcionários (f)
150 ├ 155
2
155 ├ 160
5
160 ├ 165
11
165 ├ 170
39
170 ├ 175
32
175 ├ 180
10
180 ├ 185
1
4) Organizando os valores 89, 54, 34, 56, 56, 34, 80, 28 em um rol, temos:
a) 89, 54, 34, 56, 80, 28
b) 28, 34, 34, 54, 56, 56, 80, 89
c) 89, 80, 56, 54, 34, 28
d) 28, 34, 54, 34, 80, 56, 56, 89
5) Nas séries de valores: A: 2; 4; 5; 8; 9
B: 35; 17; 22; 46; 15; 26
C: 16,1; 21,3; 25,6; 45,2
Assinale a alternativa correta:
a) A maior amplitude é da seqüência C.
b) A maior amplitude é da seqüência A.
c) A maior amplitude é da seqüência B.
d) As seqüências A e B possuem amplitudes iguais.
e) As seqüências A e C possuem amplitudes iguais.
6) Calcule a amplitude total dos conjuntos de dados:
a) 1, 3, 5, 9
b) 20, 14, 15, 19, 21, 24, 20
c) 17,9; 22,5; 13,3; 16,8; 15,4; 14,2
d) 100 |— 150, 150 |— 200, 200 |— 250, 250 |— 300,
e) -2, -1, 0, 1, 2, 3
300 |— 350,
350 |— 400
Estatística Descritiva
www.profrichard.com.br
11
7) Os dados a seguir referem-se ao número de livros adquiridos, no ano passado, pelos 40
alunos de uma turma de curso técnico, em São José do Rio Pardo:
4
2
1
0
3
1
2
0
2
1
0
2
1
1
0
4
3
2
3
5
8
0
1
6
5
3
2
1
6
4
3
4
3
2
1
0
2
1
0
3
Com relação a esses valores, pede-se:
a) Organize os dados em uma tabela sem intervalos de classe.
b) Responda: qual o percentual de alunos que adquiriram menos de 4 livros?
8) A tabela abaixo apresenta a comissão recebida pelos funcionários de uma empresa.
Comissões (R$)
nº de funcionários
100 ├ 150
4
150 ├ 200
8
200 ├ 250
16
250 ├ 300
24
300 ├ 350
20
350 ├ 400
8
Total
80
Quantos funcionários ganham comissão inferior a R$ 300,00?
a) 20 funcionários b) 28 funcionários c) 52 funcionários d) 38 funcionários
9) Os dados da tabela a seguir, referem-se ao consumo familiar anual (kg) de um gênero
alimentício. Complete a tabela.
Peso
f
f%
42 ├ 54
6
9
19
11
5
Total
10) Em um escritório trabalham 40 pessoas cujas idades, em anos, são dadas em ordem
crescente:
18 - 19 - 20 - 20 - 20 - 24 - 24 - 24 - 24 – 24 - 28 - 28 - 28 - 30 - 30 - 30 - 30 - 30 - 32 - 32 35 - 35 - 35 - 35 - 36 - 36 - 36 - 36 - 36 – 40 - 40 - 40 - 42 - 45 - 45 - 48 - 48 - 50 - 50 – 60
Observe que a tabela seguinte está parcialmente preenchida com as idades agrupadas em
intervalos (classes) que devem ter o mesmo comprimento
Idade (anos)
nº de funcionários (f)
18 ├ 25
10
25 ├ 32
8
?
11
?
6
?
4
53 ├ 60
1
Total
40
Pergunta-se: a) A classe que corresponde a 6 funcionários é:
a) 35 ├ 42 b) 37 ├ 45 c) 39 ├ 46 d) 46 ├ 49 e) 50 ├ 60
b) Relativamente ao total de funcionários desse escritório, a porcentagem dos que têm
idades inferiores a 32 anos é: a) 45%
b) 38%
c) 37,5%
d) 25%
e) 12%
Estatística Descritiva
www.profrichard.com.br
12
11) Ao se lançar 24 vezes um dado de 10 lados (decaedro), obteve-se os seguintes
resultados:
4
2
6
1
2
3
5
6
3
4
2
1
1
6
5
4
5
6
8
7
10
9
7
8
Para os valores acima, construa uma tabela sem intervalos de classe e outra com intervalos
de classe de amplitude 2.
12) Complete a tabela abaixo:
Nacionalidade
Brasileira
Espanhola
Argentina
Total
F
6
3
1
f%
fr
F
Fr
F%
-
-
-
Gabarito: 1)e 2)d 3)a)7 b)5 c)165├170 d)10 4)b 5)c 6)a)8 b)10 c)9,2 d)300 e)5
7)a)
9)
valor
f
Peso
42 ├ 54
54 ├ 66
66 ├ 78
78 ├ 90
90 ├ 102
Total
0
7
1
9
f
6
9
19
11
5
50
2
8
3
7
f%
12
18
38
22
10
100
4
4
5
2
6
2
7
0
8
1
total
40
b)77,5%. 8)c
10)a)C b)A
11)
VALORES FREQUÊNCIA
1
3
2
3
3
2
4
3
5
3
6
4
7
2
8
2
9
1
10
1
12)
Nacionalidade
f
Brasileira
6
Espanhola
3
Argentina
1
Total
10
VALORES FREQUÊNCIA
1├3
6
3├5
5
5├7
7
7├9
4
9 ├ 11
2
fr
0,6
0,3
0,1
1
f%
F
Fr
F%
60
30
10
100
6
9
10
-
0,6
0,9
1
-
60
90
100
-
Estatística Descritiva
www.profrichard.com.br
13
“O ESPAÇO É O OBJETO QUE O GEÔMETRA DEVE ESTUDAR.” (POINCARÉ)
“A natureza está escrita em linguagem matemática.” (Galileu)
Módulo 3 – R E P R E S E N T A Ç Õ E S
GRÁFICAS
Os resultados de uma pesquisa estatística podem ser apresentados em forma de ROL, de TABELA ou
de GRÁFICO.
Os Gráficos Estatísticos são importantes ferramentas para analisar e interpretar dados
numéricos relativos a uma pesquisa, possibilitando melhor visualização.
Uma tabela de distribuição de frequência pode ser representada através de um gráfico chamado
Histograma, conforme abaixo:
valor
4,5 ├ 4,9
4,9 ├ 5,3
5,3 ├ 5,7
total
frequência
(f)
4
15
6
25
Polígono de frequências: é um gráfico em linha, obtido unindo-se por segmentos de reta os
pontos médios das bases superiores dos retângulos de um histograma. Para realmente
obtermos um polígono (linha poligonal fechada) devemos completar a figura, ligando os
extremos da linha obtida aos pontos médios da classe anterior à primeira e da posterior à
última, da distribuição. O polígono do histograma será usado em assuntos posteriores.
Principais Tipos de Gráficos Estatísticos: os principais tipos de gráficos são:
_ Gráfico em linha ou em curva;
_ Gráfico em colunas ou em barras;
_ Gráfico em colunas ou em barras múltiplas;
_ Gráfico em setores.
Veja os exemplos a seguir:
Estatística Descritiva
www.profrichard.com.br
14
Em linha:
Em colunas:
Em barras:
Em colunas múltiplas:
Em barras múltiplas:
Em setores circulares:
EXERCÍCIOS
1) Com a tabela de distribuição de
frequência abaixo, foi construído ao lado
o
histograma
dessa
distribuição.
Complete no eixo nº de estudantes (f), os
valores correspondentes às classes.
Altura (cm)
frequência
[ 150 ; 157 [
3
[ 157 ; 164 [
9
[ 164 ; 171 [
15
[ 171 ; 178 [
7
[1 78 ; 185 ]
6
Estatística Descritiva
www.profrichard.com.br
2) O gráfico representativo ao lado é um
gráfico:
a) de setores;
b) de barras;
c) de colunas;
d) em forma de histograma;
e) em forma de polígono de freqüência.
3) O gráfico representativo ao lado é
um gráfico:
a) de setores;
b) de barras;
c) de colunas;
d) em forma de histograma;
e) em forma de polígono de freqüência.
4) De acordo com o gráfico ao lado
e sabendo que a região total
descrita por ele equivale a uma área
de 100 km², responda qual a área
ocupada por Matas.
5) Em 1995, o controle acionário da
empresa Estatal CPFL (Companhia
Paulista de Força e Luz), encontrase descrito no gráfico de setores
(pizza), ao lado. Sabendo-se que a
área total de concessão da
companhia era de 90.691 Km,
determine qual era a área de
concessão, sob responsabilidade
das prefeituras.
6) O gráfico a seguir, mostra
as porcentagens, investidas
em cada uma das Áreas de
atuação da ex-Estatal e
atualmente
empresa
privada CPFL, em 1995.
Sabendo-se que o total
anual da verba destinada a
investimentos era de 8
bilhões de reais, determine
15
Estatística Descritiva
www.profrichard.com.br
16
quanto a empresa investia
anualmente em usinas de
geração de energia elétrica.
7) O dono de uma loja de artigos para
costureiras fez o levantamento dos botões
em estoque e organizou os dados obtidos
na tabela seguinte. O gráfico que melhor
representa os dados dessa tabela é:
8) Numa determinada cidade, pesquisouse durante um ano a ocorrência do
número de casos de certa doença,
encontrando-se os dados representados
no gráfico ao lado. É verdade que:
(A) O total de casos registrados no 2º
semestre foi de 4000.
(B) A maior variação entre dois meses
consecutivos ocorreu de Agosto a
Setembro.
(C) No último trimestre, o número de
casos registrados foi de 2500.
(D) Os períodos de crescimento e os
períodos de decrescimento do número de
casos
registrados
foram
sempre
crescentes.
9) O gráfico abaixo, apresenta dados De acordo com o gráfico, no período
referentes a faltas por dia em uma classe, observado, ocorreram:
durante um certo período de tempo.
(A) 15 faltas em 8 dias.
(B) 2 faltas por dia.
(C) 6 faltas no terceiro dia.
(D) 52 faltas em 27 dias.
(E) 2 faltas a cada quatro dias.
Gabarito: 1)3-6-7-9-15 2)c 3)b 4)10 5)816,22 6)160.000.000 7)d 8)c 9)d
Estatística Descritiva
www.profrichard.com.br
17
“A NOÇÃO DE INFINITO, DE QUE É PRECISO SE FAZER UM MISTÉRIO EM MATEMÁTICA, RESUME-SE
NO SEGUINTE PRINCÍPIO: DEPOIS DE CADA NÚMERO INTEIRO EXISTE SEMPRE UM OUTRO.”
(TANNERY)
“Tudo são números.” (Ditos Pitagóricos)
Módulo 4 – M E D I D A S
DE
TENDÊNCIA
CENTRAL
As Medidas de Posição, também denominadas de medidas de tendência central, são as medidas
que representam os fenômenos pelos seus valores médios, em torno dos quais tendem a concentrarse os dados. São usadas para indicar um valor que resume um conjunto de números. As mais utilizadas
são a média, a mediana e a moda.
Média Aritmética (µ ou 𝑥̅ ): É a soma de todos os resultados obtidos dividido pela quantidade de
valores. Utiliza-se a letra grega mu “µ” (leia-se “mi”) para a média de uma população de N elementos.
E, a média de uma amostra de n elementos é representada pelo símbolo “𝑥̅ ” (leia-se “xis barra”).
Fórmulas:
𝑥̅ =
∑𝑥
𝑛
𝜇=
∑𝑥
𝑁
Quando o exercício não mencionar se os dados são amostrais ou populacionais, usaremos o símbolo
𝑥̅ , pois quase a totalidade das estatísticas são feitas através de dados amostrais.
A média possui várias propriedades matemáticas, a que considero mais interessante é: “somando-se
uma constante a cada valor, a média ficará aumentada do valor dessa constante. O mesmo ocorre
com as operações de subtração, multiplicação e divisão.”
Exemplo 1: Determinar a média aritmética dos valores amostrais: 5, 8, 10, 12 e 15.
→
Exemplo 2: Em uma empresa de componentes eletrônicos, a exportação nos últimos 4 anos, em
milhares de dólares, foi US$ 800,00; US$ 880,00; US$ 760,00 e US$ 984,00. Determine a média de
exportações dessa empresa.
→
Média Aritmética Ponderada (µp ou 𝑥̅ p): A fórmula anterior para calcular a média aritmética supõe
que cada observação tem a mesma importância. A Média ponderada é uma média aritmética na qual
será atribuído um peso a cada valor da série.
n
Xp
 xi . p i
i 1
n
 pi
i 1
Estatística Descritiva
www.profrichard.com.br
18
Exemplo 1: Um professor de Matemática adotou para 2013 os seguintes pesos para as notas
bimestrais:
1° bimestre: peso 1
3° bimestre: peso 3
2° bimestre: peso 2
4° bimestre: peso 4
Qual será a média de um aluno que obteve as seguintes notas: 5, 4, 3 e 2 nos respectivos bimestres?
Xp 
5 .1  4 . 2  3. 3  2 . 4  5  8  9  8  30  3
10
10
10
Mediana (Me ou Md): É o valor que ocupa a posição central de um conjunto de dados, desde que
estejam colocados ordenadamente, seja em ordem crescente ou em ordem decrescente.
Exemplo 1: Calcular a mediana dos dados: 5 ; 8 ; 4 ; 6 ; 7 ; 3 ; 4.
OBS.: Quando a quantidade de dados for ímpar, o valor da mediana será dado pelo valor
central da série de dados.
.
Exemplo 2: Calcular a mediana dos dados: 8 – 0 – 7 – 4 – 7 – 10 – 6 – 5.
OBS.: Quando a quantidade de dados for par, o valor da mediana será dado pela média dos
dois valores centrais da série de dados.
Moda (Mo): É o valor que ocorre com maior freqüência nos dados de uma pesquisa. Ou seja,
É o valor que aparece a maior quantidade de vezes. É a única que pode ser usada para dados
nominais.
Exemplos 1: Determinar a moda dos dados: 4
4
5
5
5
6
7
8
9
Estatística Descritiva
www.profrichard.com.br
19
No grupo de dados acima, o valor que mais aparece é o valor 5, então, a moda vale 5. Mo =
5, nesse caso dizemos que a série é unimodal.
Exemplos 2: Determinar a moda dos dados: 10 10 10 15 15 15 17 18
19
19
No grupo de dados acima, os valores que mais aparecem são o 10 e o 15, então, a moda vale
10 e 15. Mo = 10 e 15, nesse caso dizemos que a série é bimodal.
Exemplos 3: Determinar a moda dos dados: 100
200
300
400
500
600
700
No grupo de dados acima, não há repetição de valores, então não existe moda, nesse caso
dizemos que a série é amodal.
OBS.: Uma série pode ser: amodal, unimodal, bimodal, trimodal e acima disso,
polimodal.
COMPARAÇÃO
Medida Central
Vantagens
Média
Reflete todos os valores.
Insensível a valores
Mediana
extremos.
Indica o valor “típico” em
Moda
termos da maior
ocorrência.
Limitações
É influenciada por valores extremos.
Difícil de determinar para grandes
quantidades de valores.
Quando todos ou quase todos os valores
ocorrem aproximadamente com a mesma
frequência, a moda nada acrescenta.
Das três medidas, a média é a mais utilizada e a moda é a menos utilizada. Dados sobre renda
pessoal ou valor de residências tem na mediana um valor mais adequado que na média, pois
basta um valor muito alto, para inflacionar a média.
Exercício Resolvido: um empresário realiza uma determinada operação comercial que, em
função de suas especificidades, pode apresentar três resultados possíveis: sucesso absoluto,
sucesso parcial e insucesso. Quando ele obtém sucesso absoluto, a operação rende para ele
R$ 2.500,00 de lucro; quando o sucesso é parcial, o lucro cai para R$ 1.200,00; e o fracasso
lhe traz um prejuízo de R$ 1.800,00. A tabela de frequências a seguir relaciona o número de
ocorrências de cada tipo ao longo do último ano. Qual é o lucro médio do empresário nesse
ano?
Ocorrências
Classes
Lucro
Valor
xi
Número de operações comerciais
frequencia simples
fi
fi . xi
Sucesso absoluto
2.500,00
42
105.000,00
Sucesso parcial
1.200,00
24
28.800,00
- 1.800,00
12
- 21.600,00
78
112.200,00
Fracasso
Totais
Ou seja, lucro de R$ 112.200,00 em 78 prestações, portanto o lucro médio foi de:
∑ 𝑥 112200
𝑥̅ =
=
= 1438,46
𝑛
78
Estatística Descritiva
www.profrichard.com.br
20
EXERCÍCIOS
1) Dados os valores a seguir, 9 – 6 – 5 – 4 – 8 – 9 – 10 – 4 – 7 – 8 – 5 – 6 – 10, determinar a
média aritmética dos mesmos.
2) Dados os valores a seguir, 10 – 10 – 11 – 11 – 11 – 11 – 12 – 12 – 12 – 13 – 13 – 13 – 14,
determinar a moda dos mesmos.
3) Dados os valores a seguir, 9 – 6 – 5 – 4 – 8 – 9 – 10 – 4 – 7 – 8 – 5 – 6 – 10, determinar a
mediana dos mesmos.
4) Dados os valores a seguir, 9 – 5 – 4 – 9 – 10 - 7 – 4 – 5 – 10 – 3 - 3 – 9 – 10 - 6, determinar
a mediana dos mesmos.
5) Para a série de valores abaixo, calcule a média, a moda e a mediana.
50 60 40 70 60 40 70 40 60 50 60 50
6) A moda para a seqüência numérica 4, 8, 8, 4, 9, 10, 8, 10, 4 e 11 é:
7) Um aluno, nos três primeiros bimestres letivos do ano, obteve as seguintes notas em
matemática: 4,5; 8,0 e 6,5. Quanto precisará de nota no 4° bimestre, para alcançar a média
final 7,0 ?
8) Considere os dados apresentados na tabela e assinale a alternativa correta:
Peça
A
B
C
D
E
F
G
H
I
J
Massa (kg)
1,9
1,8
1,5
1,5
2,2
1,8
1,8
2,0
1,1
1,7
a) A média amostral é de 1,7 kg.
b) A série é bimodal.
c)O valor da mediana é 3,6 kg.
d) O valor da moda é 1,5 kg.
e) O valor da mediana é 1,8 kg.
9) Considere os aspectos teóricos envolvidos nas medidas de tendência central e assinale a
alternativa correta:
a) A média aritmética amostral é indicada pela letra µ.
b) O valor da média sempre coincide com o valor da mediana.
c) A mediana é indicada por Mo.
d) A moda é o valor mais freqüente.
e) O valor da moda sempre coincide com o valor da mediana.
10) A média das idades dos 11 funcionários de uma empresa era de 40 anos. Um dos
funcionários se aposentou com 60 anos, saindo da empresa. A média de idade dos 10
funcionários restantes passou a ser de quanto?
11) Num colégio, a nota de Matemática do 2º ano é obtida calculando a média ponderada das notas
de Álgebra, Geometria e Trigonometria com pesos 3, 2 e 2, respectivamente. Qual a nota obtida por
um aluno que teve 7,5 em Álgebra, 6,0 em Geometria e 5,5 em Trigonometria?
Estatística Descritiva
www.profrichard.com.br
21
Gabarito: 1)7 2)11 3)7 4)6,5 5)X = 54,17; Me = 55 e Mo = 60 6)4 e 8 7)9,0 8)E 9)D
10)38 anos 11)6,5
“Um belo Teorema vale uma bela obra de arte.” Amoroso Costa
“Aquele que deseja estudar ou exercer a Magia deve cultivar a Matemática.” (Matila Ghyka)
Módulo 5 – Medidas Centrais (Dados Agrupados SEM Intervalos de Classes)
Moda: A Moda para dados agrupados sem intervalos de classes, é calculada observando-se o maior
valor da freqüência.
Exemplo: Calcular a moda dos valores representados na distribuição de freqüências:
Média: A Média para dados agrupados sem intervalos de classes, é calculada de maneira análoga a
média ponderada.
Exemplo: Calcular a média das idades representadas na distribuição de freqüências:
Mediana: Para dados agrupados sem intervalos de classe, identifica-se a freqüência acumulada
imediatamente superior à metade da soma das freqüências. A mediana será o valor da variável que
corresponde a tal freqüência acumulada.
Exemplo: Calcular o valor da mediana da distribuição dada:
Estatística Descritiva
www.profrichard.com.br
22
Como existem 34 valores, a mediana é calculada através do 17° e do 18° valor, observe que ambos
aparecem na variável 2, logo Me = 2 . Para facilitar a compreensão, vou detalhar o procedimento:
Medidas Centrais (Dados Agrupados COM Intervalos de Classes)
Média: A média para dados agrupados com intervalos de classes é calculada de maneira análoga a
média ponderada, utilizando-se os pontos médios.
Exemplo:Calcular a média das idades representadas na distribuição de frequências:
Estatística Descritiva
www.profrichard.com.br
23
Moda Bruta e Classe Modal: A classe que apresenta a maior freqüência é denominada classe modal,
uma vez agrupados os dados, é possível determinar imediatamente a classe modal, basta fixar o valor
da variável de maior freqüência.
Exemplo: A tabela abaixo mostra os pesos das crianças em uma classe. Usando esta informação,
encontre a classe modal e a moda bruta.
Kg de massa (m)
Freqüência
30 ≤ m < 40
7
40 ≤ m < 50
6
50 ≤ m < 60
8
60 ≤ m < 70
4
A classe modal é a classe que tem a maior
freqüência. Neste caso a classe modal é 50
≤ m < 60. O método mais simples para o
cálculo da moda consiste em tomar o ponto
médio da classe modal. Damos a esse valor
a denominação de moda bruta, no caso,
Mo = 55.
Mediana Bruta e Classe Mediana: A classe que apresenta o valor central das freqüências é
denominada classe mediana, uma vez agrupados os dados, é possível determinar imediatamente a
classe mediana, por observação e contagem das freqüências acumuladas, conforme já foi visto.
Exemplo: A tabela abaixo mostra os pesos das crianças em uma classe. Usando esta informação,
encontre a classe mediana e a mediana bruta.
Kg de massa (m)
Freqüência
30 ≤ m < 40
7
40 ≤ m < 50
6
50 ≤ m < 60
8
60 ≤ m < 70
4
Como o total de crianças é 25, a classe
mediana é a classe que tem o 13° valor de
freqüência. Neste caso a classe mediana é 40
≤ m < 50. O método mais simples para o cálculo
da mediana consiste em tomar o ponto médio
da classe mediana. Damos a esse valor a
denominação de mediana bruta, no caso, Me
= 45.
Estatística Descritiva
www.profrichard.com.br
24
A moda bruta é o ponto médio da classe de maior freqüência e a mediana bruta é o ponto médio da
classe da frequência mediana. Para se obter uma moda e uma mediana mais precisa, para dados
agrupados, existem várias fórmulas, de matemáticos como KING e CZUBER, essas fórmulas não
serão estudadas nesse curso.
EXERCÍCIOS
1) Calcular o valor da mediana da
distribuição dada ao lado:
2) (UFPel-RS) Na busca de solução para o problema da gravidez na adolescência, uma equipe de
orientadores educacionais de uma instituição de ensino pesquisou um grupo de adolescentes de uma
comunidade próxima a essa escola e obteve os seguintes dados:
Com base nos textos e em seus conhecimentos, é correto afirmar, em relação às idades das
adolescentes grávidas, que:
a) a média é 15 anos.
b) a mediana é 15,3 anos. c) a mediana 16,1 anos.
d) a moda é 16 anos.
e) a média é 15,3 anos.
3) (Unimontes-MG) O serviço meteorológico registrou, em alguns estados brasileiros, as
seguintes temperaturas:
A moda e a mediana dessas temperaturas são, respectivamente,
a) 39ºC e 24ºC
b) 8ºC e 39ºC
c) 8ºC e 21ºC
d) 21ºC e 8ºC
Estatística Descritiva
www.profrichard.com.br
25
4) Considere os faturamentos mensais das seguintes filiais de uma grande empresa (em
milhares de Reais)
Utilize a medida de posição MEDIANA para comparar o desempenho das filiais.
5) Na linha de produção de uma grande montadora de veículos, existem 7 diferentes testes no controle
de qualidade. Sorteamos alguns dias e observamos 6.934 automóveis, anotando o número de
aprovações que cada veículo recebeu.
Determine o número médio de aprovações por automóvel produzido.
6) Em uma pesquisa realizada numa Empresa quanto aos salários médios de seus funcionários,
verificou-se o seguinte resultado:
Baseado nesses resultados determine o salário médio desses funcionários.
7) Considere a tabela de distribuição das alturas, em cm, de 40 alunos de uma sala de aula.
Calcule a média das alturas.
8) Calcule a Moda da tabela ao lado para o dado qualitativo tipo
sanguíneo de alguns indivíduos.
9) Calcule a moda nas tabelas abaixo e diga qual o tipo de série modal.
Estatística Descritiva
www.profrichard.com.br
a)
26
b)
c)
10) Calcule a média, a moda bruta e a mediana bruta da tabela de distribuição das alturas, em cm, de
40 alunos de uma classe.
CLASSE (cm)
140 ├ 150
150 ├ 160
160 ├ 170
170 ├ 180
180 ├ 190
190 ├ 200
FREQUÊNCIA
3
3
11
6
11
6
Gabarito: 1) 15,5 2) E 3) C 4) 24 e 39,5 5)X = 6 6) 830,40 7) 170,50 8) Mo = tipo O 9)
a) Mo = 4,5 (série unimodal) b) Mo = 4,5 e Mo = 4,6 (série bimodal) c) Não há Mo (série amodal)
10)Ẍ = 174,25; Me = 175 e Mo = 165 e 185
“Arquimedes será lembrado enquanto Ésquilo foi esquecido, porque os idiomas morrem mas as
idéias matemáticas permanecem. "Imortalidade" pode ser uma idéia tola, mas provavelmente um
matemático tem a melhor chance que pode existir de obtê-la.” (G.H.Hardy)
Módulo 6 – Moda e Mediana através de fórmulas
Se os dados de uma variável quantitativa estão dispostos em uma tabela agrupada em
classes, e não há acesso aos dados originais, é possível encontrar a moda e a mediana por
vários procedimentos. Já vimos que a moda e a mediana bruta são simplesmente o ponto
médio da classe de maior freqüência, ou seja, a classe modal ou a classe mediana. No
entanto, para se obter uma moda mais exata, existem várias fórmulas.
Normalmente o cálculo através de fórmulas, é feito por três recomendações diferentes, que
são as formulas de Czuber, King e Pearson.
O termo recomendação, é usado por se tratar de resultados aproximados, diferente de
equacionamento matemático, pois decorre de estudos, normalmente empíricos, que
apresentam validade prática, mas não exatidão matemática.
Moda de King: O cálculo da moda, através da recomendação de king leva em conta a
influência das classes adjacentes à classe modal, "deslocando" a moda em direção aquelas.
A fórmula para cálculo da moda de King é:
Estatística Descritiva
www.profrichard.com.br
27
Li é o limite inferior da classe modal;
A é a amplitude das classes;
fpost é a freqüência da classe imediatamente posterior à
classe modal;
fant é a freqüência da classe imediatamente anterior à classe
modal.
Observações:
_ Quando a classe modal for a primeira basta fazer fant = 0 e, quando for a última devemos
fazer fpost = 0 e aplicar a fórmula;
_ A série pode ser plurimodal, para evitar esta ocorrência, o que deve ser bem recebido, é
tentar mudar a amplitude h dos intervalos e recalcular as novas frequências quando se tem o
rol.
Exemplo:
OBS.: Repare que o valor da moda bruta (28,5) foi deslocado para cima (28,7143) porque a
freqüência da classe imediatamente posterior à modal é maior do que a da classe
imediatamente anterior.
Fórmula da Mediana para Dados Agrupados com Intervalos de Classe
Se os dados de uma variável quantitativa
estão dispostos em uma tabela agrupada em
classes, e não há acesso aos dados originais,
é possível encontrar a mediana através de
uma fórmula.
Estatística Descritiva
www.profrichard.com.br
28
OBS.: Repare que o valor da mediana bruta (28,5) foi deslocado para cima (30) porque a
freqüência da classe imediatamente posterior à classe mediana é maior do que a da classe
imediatamente anterior.
Atividades do Módulo: 6 – Moda e Mediana através de fórmulas
1) Determinar, pela fórmula, a moda da distribuição apresentada a seguir.
2) Determinar, pela fórmula, a moda da distribuição apresentada a seguir.
Estatística Descritiva
www.profrichard.com.br
29
3) Determinar, pela fórmula, a mediana da distribuição apresentada a seguir.
4) Determinar, pela fórmula, a mediana da distribuição apresentada a seguir.
Respostas do Módulo 6: 1) 828,00 2) 34,29 3) 824,00 4) 35,45
“DEUS É O GEÔMETRA ONIPOTENTE PARA QUEM O MUNDO É IMENSO PROBLEMA MATEMÁTICO.”
(LEIBNIZ)
“Zero, esse nada que é tudo.” (LAISANT)
Módulo 7 – M E D I D A S
DE
DISPERSÃO
Vimos que um conjunto de valores pode ser convenientemente sintetizado, por meio de procedimentos
matemáticos, em poucos valores representativos, tais como: média aritmética, mediana e moda.
No entanto, quando se trata de interpretar dados estatísticos, mesmo aqueles já convenientemente
simplificados, é necessário ter-se uma idéia retrospectiva de como se apresentavam esses mesmos
dados nas tabelas.
Para qualificar os valores de uma dada variável, ressaltando a maior ou menor dispersão ou
variabilidade entre esses valores e a sua medida de posição, a Estatística recorre às medidas de
dispersão ou de variabilidade. Pois são necessários dois tipos de medidas para descrever
adequadamente um conjunto de dados. Além da informação quanto ao “meio” de um conjunto de
números (estudado em medidas de tendência central), precisamos saber também a dispersão desses
dados. As medidas de dispersão indicam se os valores estão relativamente próximos uns dos outros,
ou separados. Essas dispersões tem como ponto de referência as medidas de tendência central. O
valor zero indica a ausência de dispersão e quanto maior o valor, maior a dispersão.
Ou seja, as medidas de dispersão ou de afastamento são medidas estatísticas utilizadas para verificar
o quanto os valores encontrados em uma pesquisa estão dispersos ou afastados em relação à média
ou em relação à mediana. Para avaliar o grau de variabilidade ou de dispersão são utilizadas as
chamadas medidas de dispersão. Dessas medidas, estudaremos a amplitude, a variância, o desvio
padrão e o coeficiente de variação.
Estatística Descritiva
www.profrichard.com.br
30
Amplitude Total (A): é a diferença entre o maior e o menor valor de uma série de dados. Quanto maior
a amplitude total, maior a dispersão ou variabilidade dos valores da variável.
Exemplo: No conjunto de números 4 , 6 , 8 , 9 , 12 , 17, 20, calcule a Amplitude.
A = maior valor – menor valor
A = 20 – 4
A = 16
Alternativamente, pode-se dizer que o intervalo de valores vai de 4 a 20.
No caso de termos uma distribuição de frequência com intervalos de classe, calculamos a Amplitude
total, pela diferença entre o limite superior da última classe e o limite inferior da primeira classe.
O fato do intervalo só levar em conta dois valores extremos de um conjunto, nada informando quanto
aos outros valores, torna sua utilização bastante limitada.
Embora não faça parte do programa desse curso, vou falar um pouco sobre Desvio Médio (Dm) ou
Desvio Médio Absoluto (DMA): É a média dos desvios dos valores a contar da média aritmética,
ignorando-se o sinal de diferença, é uma dispersão calculada em relação a todos os valores, sem
exceção. É calculado por meio da fórmula:
O desvio médio tem algumas aplicações no controle de inventários, mas também não é muito utilizado,
pois não apresenta propriedades matemáticas muito interessantes.
Variância: É a média dos quadrados dos desvios dos valores a contar da média. Utiliza-se a letra
grega sigma minúsculo elevado a 2 “σ²” para a variância de uma população de N elementos. E, a
variância de uma amostra de n elementos é representada pela letra esse minúscula elevado a 2 “s²”.
O símbolo da variância é elevado a 2, porque essa medida de dispersão exprime em quadrados de
unidades os valores observados e a média deles, ou seja, se estivermos calculando uma dispersão de
comprimento em cm, a variância será obtida em cm². Por isso, também não é muito utilizada como
medida de dispersão, mas o cálculo da variância é usado para se obter o desvio padrão, que é a
medida de dispersão mais utilizada. Fórmula para a variância amostral:
𝑠2 =
∑(𝑥𝑖 − 𝑥̅ )2
𝑛−1
Estatística Descritiva
www.profrichard.com.br
31
Substitui-se “n-1” por “n” no denominador para a variância da população, ou quando a finalidade é
apenas descrever os dados e não fazer uma inferência sobre uma população. Nesse curso, usaremos
“n”, somente quando o exercício mencionar que os dados são populacionais, ou seja, quando o
exercício não mencionar se os dados são populacionais ou amostrais, vamos considerá-los amostrais
e usar n-1.
Exemplo 1: Calcule a variância para os valores amostrais 5; 7 e 9.
Primeiro calculamos a média aritmética entre os valores:
𝑥̅ =
∑𝑥
→ 𝑥̅ =
𝑛
5+7+9
3
=7
Em seguida aplicamos a fórmula da variância:
𝑠2 =
∑(𝑥𝑖 − 𝑥̅ )2 (5 − 7)2 + (7 − 7)2 + (9 − 7)2 4 + 0 + 4 8
=
=
= =4
𝑛−1
3−1
2
2
Resposta: A variância entre os valores 5; 7 e 9 é 4.
Exemplo 2: Calcule a variância para a distribuição de frequência abaixo:
Valor
3
5
9
Total
f
6
11
3
20
Primeiro calculamos a média aritmética entre os valores:
𝑥̅ =
∑(𝑥𝑖∙𝑓𝑖)
∑ 𝑓𝑖
→ 𝑥̅ =
(3∙6)+(5∙11)+(9∙3)
20
=
18+55+27
20
=
100
20
=5
Em seguida aplicamos a fórmula da variância para a distribuição de frequência:
∑(𝑥𝑖 − 𝑥̅ )2 𝐹𝑖 (3 − 5)2 ∙ 6 + (5 − 5)2 ∙ 11 + (9 − 5)2 ∙ 3 4 ∙ 6 + 0 ∙ 11 + 16 ∙ 3
𝑠 =
=
=
∑ 𝑓𝑖 − 1
20 − 1
19
2
=
24 + 0 + 48 72
=
= 3,79
19
19
Se a tabela for com intervalo de classe, basta usar os valores dos pontos médios.
Exemplo 3: Calcule a variância para a distribuição de frequência abaixo:
(3∙6)+(7∙11)+(11∙3)
∑(𝑃𝑀∙𝑓𝑖)
Valor
f
Primeiro calculamos a média: 𝑥̅ = ∑ 𝑓𝑖
→ 𝑥̅ =
=
20
1├5
6
18+77+33
128
5├9
11
=
= 6,4
20
20
9 ├ 13
3
Em seguida, calculamos a variância:
Total
20
∑(𝑃𝑀 − 𝑥̅ )2 𝐹𝑖 (3 − 6,4)2 ∙ 6 + (7 − 6,4)2 ∙ 11 + (11 − 6,4)2 ∙ 3 69,36 + 3,96 + 63,48 136,8
2
𝑠 =
=
=
=
∑ 𝑓𝑖 − 1
20 − 1
19
19
= 7,2
Estatística Descritiva
www.profrichard.com.br
32
A variância baseia-se nos desvios em torno da média aritmética, porém determinando a média
aritmética dos quadrados dos desvios. Ela é um número em unidade quadrada em relação à
variável em questão, o que, sob o ponto de vista prático, é um inconveniente. Por isso, imaginou-se
uma nova medida que tem utilidade e interpretação práticas, denominada desvio padrão.
Desvio Padrão: Utiliza-se a letra grega sigma minúsculo “σ” para o desvio padrão de uma população
de N elementos. E, o desvio padrão de uma amostra de n elementos é representada pela letra esse
minúscula “s”. O desvio padrão é simplesmente a raiz quadrada da variância.
𝑠 = √𝑠 2
O desvio padrão é a medida de dispersão mais utilizada, desempenha papel relevante em toda a
estatística e a sua unidade é a mesma da média. O desvio padrão dá uma idéia de como os valores
de uma amostra estão dispersos em relação à média. Quanto maior o desvio padrão, maior é a
dispersão dos valores em relação à média. Um desvio padrão igual a zero indica que todos os valores
são iguais à média.
Se você já leu um artigo científico com certeza deve ter percebido que os resultados
geralmente são apresentados por meio da média aritmética. E logo em seguida a média, é
apresentado um outro número, que curiosamente é precedido pelo símbolo de "mais ou
menos". Exatamente como na tabela abaixo:
Pois bem, este número depois do "mais ou menos" é o Desvio Padrão, que indica a dispersão
dos dados dentro da amostra. Isto é: o quanto os resultados diferem da média. Por isso que
ele sempre é apresentado junto da média. Um não faz sentido sem o outro.
É importante ter em mente que quanto menor o desvio padrão, mais homogênea é a minha
amostra. Em termos de pesquisas científicas, é isso que desejamos em nossos resultados.
Na tabela acima, a média da velocidade da marcha dos homens foi de 1,1m/s e o Desvio
Padrão foi de 0,13m/s. Isso significa que, no geral, boa parte da minha amostra caminha com
uma velocidade entre 0,97 m/s e 1,23 m/s. Enfim, quando eu adiciono o Desvio Padrão a
interpretação dos meus números, eu tenho idéia de quanto a velocidade da minha amostra
varia em torno da média.
Assumindo que nossa amostra possui uma distribuição normal e simétrica, (estudaremos isso
em distribuição normal de probabilidades), o desvio padrão dá uma ideia de quanto os valores
da amostra variam em torno da média, da seguinte maneira:
Se calcularmos 1 desvio padrão acima e abaixo da média da tabela: média = 1,1 m/s; 1 desvio
padrão abaixo da média = 0,97m/s e 1 desvio padrão acima da média = 1,23m/s, Podemos
afirmar que aproximadamente 68% da minha amostra terá a velocidade da marcha dentro
deste intervalo.
Se eu quiser ir mais longe e calcular 2 desvios padrões, a porcentagem da minha amostra que
se encontra dentro do intervalo subirá para 95%.
Estatística Descritiva
www.profrichard.com.br
33
Se eu calcular 3 desvios, esse valor sobre para 99%, veja na figura abaixo. A linha central
simboliza a média e as áreas rachuradas os respectivos desvios padrão:
A figura acima da curva normal ou curva de Gauss será estudada na próxima aula.
Coeficiente de Variação (CV): O Índice de Variabilidade (IV) ou o Coeficiente de Variação
(CV) é a razão entre o desvio padrão e a média, o resultado normalmente é multiplicado por
100 para que o coeficiente seja dado em porcentagem. O CV é utilizado quando dois grupos
apresentam mesmo desvio padrão e médias diferentes, ou para se comparar duas ou mais
séries de valores, quanto a sua dispersão ou variabilidade, quando expressas em unidades
diferentes, ou ainda quando duas médias forem muito distantes.
O Coeficiente de Variação (CV), é uma medida relativa de dispersão, onde a variabilidade,
através do desvio padrão, é comparada com sua média, através da relação abaixo:
𝑠
CV= ∙ 100
𝑥̅
Onde s é o desvio padrão, 𝑥̅ é a média aritmética e o fator 100 é utilizado para apresentar a
resposta na forma percentual.
Normalmente, dizemos que um CV abaixo de 15% indica um grupo de dados com baixa
dispersão. Um CV acima de 30% representa uma alta dispersão dos dados e, entre esses
valores, o CV representa uma dispersão média.
Exemplo 1: A análise de dois grupos diferentes de dados foi realizada e eles apresentaram o
mesmo desvio padrão, mas valores médios diferentes:
Grupo 1: (3; 1 e 5) → 𝑥̅ = 3; s² = 4 e s = 2
Grupo 2: (55; 57 e 53) → 𝑥̅ = 55; s² = 4 e s = 2
Qual deles possui maior dispersão?
Estatística Descritiva
www.profrichard.com.br
34
Vamos obter as variabilidades com relação as médias, através do cálculo dos coeficientes de
variação para cada grupo:
2
Grupo 1: 𝐶𝑉 = 3 ∙ 100 = 66,7% (o desvio padrão é um percentual grande, comparado com o valor
médio)
2
Grupo 2: 𝐶𝑉 = 55 ∙ 100 = 3,64% (o desvio padrão é um percentual pequeno, comparado com o valor
médio)
Observe que:
_ Para o Grupo 1, o desvio padrão corresponde a 66,7% da média;
_ Para o Grupo 2, o desvio padrão corresponde a 3,64% da média;
Podemos concluir que:
O Grupo 1 possui maior dispersão do que o Grupo 2
Exemplo 2: (Grupos com unidades diferentes) Ao medir a variabilidade das alturas em cm e
comparar com a variabilidade das massas em kg dos alunos. Os resultados foram:
̅ = 165 cm
Alturas: s = 15 cm e 𝒙
̅ = 65 kg
Massas: s = 10 kg e 𝒙
Pela comparação direta dos desvios chegaríamos a conclusão que as alturas tem mais variabilidade
do que as massas. Mas obtendo o CV:
Alturas: CV = 9,1%
Massas: CV = 15,4%
Concluímos que:
As massas tem maior variabilidade que as alturas.
Exemplo 3: (Grupos com mesmas unidades, porém com médias distantes) Imagine que
desejamos comparar a variabilidade das massas de adultos com as de recém-nascidos:
̅ = 65 kg e CV = 15,4%
Adultos: s = 10 kg , 𝒙
̅ = 3 kg e CV = 33,3%
Recém-nascidos: s = 1 kg , 𝒙
Analogamente ao exemplo 2, a comparação das variabilidades através do desvio nos levaria a decisão
contrária, pois a maior variabilidade ocorreu entre os recém-nascidos.
EXERCÍCIOS
1) Calcule a amplitude, a variância e o desvio padrão dos valores: 4, 5, 6, 8, 9, 10
2) Calcule o desvio padrão para a tabela abaixo:
Idade
Freqüência
14 15
7 6
16
1
17 18 19 20
2 1 0 4
Estatística Descritiva
www.profrichard.com.br
35
3) Calcule a amplitude e o desvio padrão da tabela abaixo:
Estaturas (cm) Frequência
150 ├ 154
9
154 ├ 158
9
158 ├ 162
11
162 ├ 166
8
166 ├ 170
5
170 ├ 174
3
4) Em um treinamento de salto em altura, os atletas realizaram 4 saltos cada um. Veja as
marcas obtidas por três atletas e responda:
* atleta A: 148cm, 170cm, 155cm, 131cm.
* atleta B: 145cm, 151cm, 150cm, 152cm.
* atleta C: 146cm, 151cm, 143cm, 160cm.
a) Qual deles obteve a melhor média? b) Qual deles foi o mais regular?
5) Calcule o CV das medidas das estaturas e dos pesos do grupo de indivíduos abaixo e
responda qual apresenta o maior grau de dispersão.
Média
Desvio Padrão
ESTATURAS
175 cm
5 cm
MASSAS
68 kg
2 kg
6) Um grupo de 100 estudantes tem uma estatura média de 163,8 cm, com um coeficiente de
variação de 3,3%. Qual o desvio padrão desse grupo?
7) Uma distribuição apresenta as seguintes estatísticas: s = 1,5 e CV = 2,9%. Determine a
média da distribuição.
Gabarito: 1)A = 6, s² = 5,6 e s = 2,36 2)2,28 3)24 e 6,03 4)O atleta A obteve a maior
média, 151 cm. O atleta B foi o mais regular, pois seu desvio padrão é o menor,
aproximadamente 3,1 cm. 5)As massas apresentam maior grau de dispersão 2,94%, sendo
o das estaturas de 2,86% 6)5,41 7)51,72
“A MATEMÁTICA É A RAINHA DAS CIÊNCIAS. A ARITMÉTICA É A RAINHA DA MATEMÁTICA.” FRIDRICH
GAUSS
“Os cálculos substituem o pensamento, enquanto a geometria o estimula.” Jacob Steiner
Módulo 8 – P R O B A B I L I D A D E S
A probabilidade serve para calcular a chance de algo acontecer. Seu estudo, assim como o
da Análise Combinatória, teve origem nos jogos de azar, onde as pessoas queriam saber qual
o melhor modo de jogar, para aumentar sua chance de vitória.
Devido a essa origem, os exemplos e exercícios de probabilidade que encontramos nos livros
didáticos, envolvem moedas, dados e baralhos. Infelizmente ainda faltam livros com boa
quantidade de exercícios contextualizados nas situações reais do nosso dia a dia. Mas, as
regras aqui ensinadas através de exercícios de jogos de azar, são as mesmas utilizadas em
cálculos das áreas de Exatas, Biológicas e até de Humanas.
Os modelos probabilísticos são úteis em várias áreas do conhecimento humano e, atualmente
a probabilidade desempenha papel importante em muitas situações que envolvam uma
tomada de decisão.
Estatística Descritiva
www.profrichard.com.br
36
Aleatoriedade: Ao jogarmos uma moeda, não podemos prever o resultado, mas, ainda assim,
há um certo padrão regular nos resultados, padrão este que se evidencia somente após muitas
repetições. Por exemplo, a proporção de jogadas de uma moeda que dão “cara” varia quando
fazemos mais e mais jogadas, mas tende para 50% (0,5), que é a probabilidade de “cara”.
Este fato notável é o fundamento da idéia de probabilidade, veja:
_ O naturalista francês Conde de Buffon (1707-1788) jogou uma moeda 4.040 vezes.
Resultado: 2.048 caras, ou seja uma proporção de 2.048/4.040 = 0,5069 caras;
_ Quando estava prisioneiro dos alemães durante a 2ª guerra mundial, o matemático John
Kerrich jogou uma moeda 10.000 vezes. Resultado: 5.067 caras, ou seja uma proporção de
0,5067;
_ Por volta de 1900, o estatístico inglês Karl Pearson heroicamente jogou uma moeda 24.000
vezes. Resultado: 12.012 caras, ou seja uma proporção de 0,5005.
A teoria da probabilidade surgiu para tentar medir a “chance” de ocorrer um determinado
resultado, num experimento aleatório. Numa experiência com vários resultados possíveis,
todos com a “mesma chance”, dizemos que:
_ Ponto Amostral: é qualquer um dos resultados possíveis.
_ Espaço Amostral (S): é o conjunto de todos os resultados possíveis.
_ Evento (E): é qualquer subconjunto do espaço amostral.
Também dizemos que n(S) é o número de elementos de S. E n(E) é o número de elementos
de E.
Em quase tudo, em maior ou menor grau, vislumbramos o acaso. Fenômenos onde o resultado
final depende do acaso são chamados fenômenos aleatórios ou experimentos aleatórios.
Experimentos ou fenômenos aleatórios são aqueles que, mesmo repetidos várias vezes sob
condições semelhantes, apresentam resultados imprevisíveis, como por exemplo, o
lançamento de um mesmo dado repetidas vezes.
Espaço Amostral: A cada experimento correspondem, em geral, vários resultados possíveis.
Assim, ao lançarmos uma moeda, há dois resultados possíveis: ocorrer cara ou ocorrer coroa.
Já ao lançarmos um dado, há seis resultados possíveis: 1, 2, 3, 4, 5 ou 6.
Os dois experimentos citados têm os seguintes espaços amostrais:
- lançamento de uma moeda: S = {Ca, Co};
- lançamento de um dado: S = {1,2,3,4,5,6}.
Cálculo da Probabilidade: A probabilidade de ocorrer o evento E, representada por P(E), de
um espaço amostral S ≠ ᴓ, é o quociente entre o número de elementos de E e o número de
elementos de S. Simbolicamente:
𝒏(𝑬)
𝑷(𝑬) =
𝒏(𝑺)
Ou seja,
𝑷𝒓𝒐𝒃𝒂𝒃𝒊𝒍𝒊𝒅𝒂𝒅𝒆 𝒅𝒆 𝒏ú𝒎𝒆𝒓𝒐 𝒅𝒆 𝒄𝒂𝒔𝒐𝒔 𝒇𝒂𝒗𝒐𝒓á𝒗𝒆𝒊𝒔 𝒂 𝑬
=
𝒐𝒄𝒐𝒓𝒓𝒆𝒓 𝑬
𝒏ú𝒎𝒆𝒓𝒐 𝒅𝒆 𝒄𝒂𝒔𝒐𝒔 𝒑𝒐𝒔𝒔í𝒗𝒆𝒊𝒔 𝑺
Cada elemento de S que corresponde a um resultado recebe o nome de ponto amostral.
Probabilidade é a possibilidade de que certo caso aconteça, a qual é calculada em matemática
pela razão entre o número de casos favoráveis e o número total de casos possíveis.
Estatística Descritiva
www.profrichard.com.br
37
Eventos Complementares: Sabemos que um evento pode ocorrer ou não. Sendo A a
probabilidade de que ele ocorra (sucesso) e Ā a probabilidade de que ele não ocorra
(fracasso), para um mesmo evento existe sempre a relação:
P(A) + P(Ā) = 1  P(Ā) = 1 – P(A)
Assim, se a probabilidade de se realizar o evento é P(A) = 1/5, a probabilidade de que ele não
ocorra é P(Ā) = 4/5.
Sabemos que a probabilidade de tirar um 4 no lançamento de um dado é P(A) = 1/6. Logo, a
probabilidade de não tirar o 4 no lançamento de um dado é: P(Ā) = 1 – 1/6 = 5/6.
Eventos Independentes: Dizemos que dois eventos são independentes quando a realização
ou a não-realização de um dos eventos não afeta a probabilidade de realização do outro e
vice-versa. Por exemplo, quando lançamos dois dados, o resultado obtido em um deles
independe do resultado obtido no outro.
Se dois eventos são independentes, a probabilidade de que eles se realizem simultaneamente
é igual ao produto das probabilidades de realização dos dois eventos.
𝐏(𝐀 ∩ 𝐁) = P(A) • P(B)
Por exemplo, ao lançarmos dois dados. A probabilidade de obtermos 3 no primeiro dado é:
P(A) = 1/6. A probabilidade de obtermos 5 no segundo dado é: P(B) = 1/6. Logo, a
probabilidade de obtermos, simultaneamente, 3 no primeiro e 5 no segundo é: 𝐏(𝐀 ∩ 𝐁) = 1/6
• 1/6 = 1/36. Ou seja, a probabilidade de se tirar o 3 e o 5 é: 1/36. A probabilidade de que um
e outro se realize é igual ao produto das probabilidades de que cada um deles se realize.
Eventos mutuamente exclusivos: Dizemos que dois ou mais eventos são mutuamente
exclusivos quando a realização de um exclui a realização do(s) outro(s). Assim, no lançamento
de uma moeda, o evento “tirar cara” e o evento “tirar coroa” são mutuamente exclusivos, já
que, ao se realizar um deles, o outro não se realiza.
Se dois eventos são mutuamente exclusivos, a probabilidade de que um ou outro se realize é
igual à soma das probabilidades de que cada um deles se realize:
P(A U B) = P(A) + P(B)
Por exemplo, ao lançarmos um dado, a probabilidade de se tirar o 3 ou o 5 é: P(A U B) = 1/6
+ 1/6 = 2/6 = 1/3, pois, como vimos, os dois eventos são mutuamente exclusivos.
Eventos não mutuamente exclusivos: Como vimos anteriormente em Eventos mutuamente
exclusivos “ou” P(A U B) = P(A) + P(B), não existem elementos, que pertençam
simultaneamente a P(A) e a P(B). Quando existirem elementos que pertencerem
simultaneamente a P(A) e a P(B), devemos subtrair esses elementos (essa intersecção), para
não contá-los duas vezes, ou seja:
𝐏(𝐀 ∪ 𝐁) = 𝐏(𝐀) + 𝐏(𝐁) − 𝐏(𝐀 ∩ 𝐁)
Por exemplo, retirando uma carta de um baralho comum de 52 cartas, qual é a probabilidade
de ocorrer uma dama ou uma carta de ouros? Se A for o evento dama e B o evento carta de
ouros, temos: n(A) = 4, n(B) = 13, n(𝐀 ∩ 𝐁) = 1, pois existe apenas uma dama de ouros, a qual
deve ser subtraída nessa intersecção, para não ser contada duas vezes. Temos também que
n(S) = 52.
𝐏(𝐀 ∪ 𝐁) = 𝐏(𝐀) + 𝐏(𝐁) − 𝐏(𝐀 ∩ 𝐁)
Estatística Descritiva
www.profrichard.com.br
38
𝐏(𝐀 ∪ 𝐁) =
𝟒 𝟏𝟑
𝟏
𝟏𝟔
𝟒
+
−
=
=
𝟓𝟐 𝟓𝟐 𝟓𝟐
𝟓𝟐 𝟏𝟑
Probabilidade condicional: Dados dois eventos, A e B, a probabilidade de que o evento B
ocorra, dado que o evento A já ocorreu, é a probabilidade condicionada de B, escrita por
P(B/A). Similarmente, escrevemos a probabilidade da ocorrência de A, condicionada a
ocorrência de B, como P(A/B) (lê-se: probabilidade de A dado que B tenha ocorrido, ou
probabilidade A condicionada à ocorrência B).
Suponha que existam 10 rótulos de papel que podem ser distinguidos pelo número e pela cor:
Por exemplo, os rótulos numerados por 1, 2 e 3, são amarelos e os restantes, brancos. Se
todos forem colocados em uma urna e retirados ao acaso, a probabilidade de extrair um rótulo
particular é 1 / 10. Se, porém, após retirar um rótulo ao acaso, ele for amarelo, como calcular
a probabilidade de que um certo rótulo, por exemplo, aquele com o número 1, seja extraído?
Evidentemente, o número de acontecimentos favoráveis está agora reduzido de 10 para 3; em
outras palavras, o rótulo desejado deve ter o número 1 e ser amarelo. Calculamos a
probabilidade condicionada pela razão:
𝒏ú𝒎𝒆𝒓𝒐 𝒅𝒆 𝒄𝒂𝒔𝒐𝒔
𝒇𝒂𝒗𝒐𝒓á𝒗𝒆𝒊𝒔 𝒂𝒐𝒔 𝒆𝒗𝒆𝒏𝒕𝒐𝒔
𝟏
𝑷(𝒓ó𝒕𝒖𝒍𝒐 𝒏º𝟏/𝒂𝒎𝒂𝒓𝒆𝒍𝒐) = 𝒓ó𝒕𝒖𝒍𝒐 𝒏º 𝟏 𝒆 𝒂𝒎𝒂𝒓𝒆𝒍𝒐 =
𝒏ú𝒎𝒆𝒓𝒐 𝒅𝒆 𝒄𝒂𝒔𝒐𝒔
𝟑
𝒇𝒂𝒗𝒐𝒓á𝒗𝒆𝒊𝒔 𝒂𝒐𝒔 𝒆𝒗𝒆𝒏𝒕𝒐𝒔
𝒂𝒎𝒂𝒓𝒆𝒍𝒐
Para alguns fins, é mais conveniente exprimir a probabilidade condicionada, dividindo-se o
numerador e o denominador da fórmula anterior pelo número total de casos possíveis na
experimentação. No caso presente, são 10 rótulos diferentes e, portanto, 10 possíveis casos.
Assim:
𝟏
𝑷(𝒓ó𝒕𝒖𝒍𝒐 𝒏º 𝟏 𝒆 𝒂𝒎𝒂𝒓𝒆𝒍𝒐)
𝟏
𝟏𝟎
𝑷(𝒓ó𝒕𝒖𝒍𝒐 𝒏º𝟏/𝒂𝒎𝒂𝒓𝒆𝒍𝒐) =
=
=
𝟑
𝑷(𝒂𝒎𝒂𝒓𝒆𝒍𝒐)
𝟑
𝟏𝟎
De modo geral, dados dois eventos A e B, que não são independentes, a probabilidade condicionada
de A, dado B, ou de B dado A, é definida como:
𝑷(𝑨 /𝑩) =
RESUMO
𝑷(𝑨∩𝑩)
𝑷(𝑩)
GERAL
=
𝒏(𝑨∩𝑩)
DAS
𝒏(𝑩)
ou 𝑷(𝑩
REGRAS
/𝑨) =
DE
𝑷(𝑩∩𝑨)
𝑷(𝑨)
=
𝒏(𝑩∩𝑨)
𝒏(𝑨)
PROBABILIDADE
▪ Regra da Adição “ou”:
_ Para eventos mutuamente exclusivos (quando a realização de um exclui a realização do
outro): P(A ou B ocorrerá) → P(A U B) = P(A) + P(B)
_ Para eventos NÃO mutuamente exclusivos (é possível a realização conjunta de ambos
“A e B”): P(A ou B ou ambos ocorrerão) → 𝐏(𝐀 ∪ 𝐁) = 𝐏(𝐀) + 𝐏(𝐁) − 𝐏(𝐀 ∩ 𝐁)
▪ Regra da Multiplicação “e”:
_ Para eventos independentes (quando a ocorrência ou não de um evento, não influencia
na ocorrência do outro): P(A e B ocorrerá) → 𝐏(𝐀 ∩ 𝐁) = P(A) • P(B)
Estatística Descritiva
www.profrichard.com.br
39
▪ Regra para eventos dependentes “probabilidade condicional” (a probabilidade de que o
𝑃(𝐴∩𝐵)
evento A ocorra, dado que o evento B já ocorreu) → 𝑃 (𝐴 /𝐵 ) =
𝑃(𝐵)
EXERCÍCIOS
RESOLVIDOS
1. Ao girar a roleta ao lado, defina o espaço amostral S e os eventos A:
ocorrência do número 2; B ocorrência de número impar.
S = {1; 2; 3}
A = {2}
B = {1; 3}
2. No lançamento simultâneo de duas moedas distinguíveis, defina o espaço amostral e os
eventos A: ocorrência de exatamente uma cara; B: ocorrência de pelo menos uma cara; C:
ocorrência de coroa em ambas.
S = {(cara, cara); (cara, coroa); (coroa, coroa); (coroa, cara)};
A = {(cara, coroa); (coroa, cara)}
B = {(cara, cara); (cara, coroa); (coroa, cara)}.
C = {(coroa, coroa)};
3. Defina o espaço amostral e o número de elementos do espaço amostral do experimento
“retirar uma carta, ao acaso, de um baralho de 52 cartas” e os eventos A: ocorrência de ás; B:
ocorrência de ás de ouros; C: ocorrência do número 2 e, o número de elementos do evento
C.
S = {2c, 2o, 2e, 2p, 3c, 3o, 3e, 3p, ..., Ac, Ao, Ae, Ap}, em que c = copas, o = ouros, e =
espadas e p = paus.
n(S) = 52
A = {Ac, Ao, Ae, Ap}.
B = {Ao}.
C = {2c, 2o, 2e, 2p}
n(C) = 4
4. Considerando os resultados de 2 lançamentos de uma moeda honesta, responda:
a) Qual o número de elementos do espaço amostral? n(S) = 4
b) Descreva o espaço amostral? S = {(c, c), (c, k), (k, c), (k, k)} em que c = cara e k = coroa
c) Qual o número de elementos do evento F: ocorrer coroa em pelo menos um dos
lançamentos? n(F) = 3
d) Qual o número de elementos do evento E: ocorrer cara nos dois lançamentos? n(E) = 1
e) Qual a probabilidade de ocorrer o evento E? P(E) = ¼ = 0,25 = 25%
5. No lançamento simultâneo de 2 dados cúbicos honestos, determine:
a) O número de elementos do espaço amostral; n(S) = 36
b) O número de elementos do evento A: soma dos pontos igual a 4; n(A) = 3
c) A probabilidade de ocorrer o evento A. P(A) = 3/36 = 1/12 = 0,083... = 8,33%
6. No lançamento de um dado cúbico honesto, qual a probabilidade de obter na face superior:
a) número par? P = 3/6 = ½ = 50% (evento elementar)
b) número menor ou igual a 6? P = 6/6 = 1 = 100% (evento certo)
c) número 4? P = 1/6 = 0,16666... = 16,67% (evento elementar)
d) número maior que 6? (evento impossível)
7. A probabilidade de se realizar um evento é de 2/5, qual a probabilidade de que esse evento
não ocorra? 3/5 (evento complementar)
Estatística Descritiva
www.profrichard.com.br
40
8. No lançamento de 2 dados cúbicos honestos, determine a probabilidade de obtermos
simultaneamente, 1 no primeiro dado e 5 no segundo dado? P = 1/6 • 1/6 = 1/36 (eventos
independentes) o resultado obtido em um dado, independe do resultado obtido no outro.
9. No lançamento de 1 dado, qual a probabilidade de se tirar o 3 ou o 5? P = 1/6 + 1/6 = 2/6 =
1/3 (eventos mutuamente exclusivos) a realização de um evento, exclui a realização do outro.
10. Uma urna possui 10 bolas, sendo 3 brancas, 2 vermelhas e 5 verdes, retira-se ao acaso
duas bolas sem reposição. Qual é a probabilidade da primeira bola ser branca e da segunda
bola ser verde? p = 3/10 • 5/9 = 1/6 (denominador 9, pois a retirada é feita sem reposição de
bolas)
11. A cartela da loto fácil contém 25 números (do 1 ao 25) e o apostador pode marcar entre
15 e 18 números. Qual a probabilidade de acertar o resultado do sorteio da loto fácil com um
cartão onde se apostou em 15 números? Qual a chance do apostador não ganhar? O número
de resultados possíveis (combinações) é C25,15 = 3.268.760, logo p = 1/3.268.760 =
0,000031%. E, 100% - 0,000031% = 99,999969% Chance de não ganhar.
12. Em uma disputa final de torneio de tiro ao alvo, a probabilidade de Kendric acertar no alvo
é de ½ e a de Marcel atingir o mesmo alvo é de 3/5. Qual a probabilidade do alvo ser atingido,
se ambos atirarem nele? (eventos não mutuamente exclusivos, ambos podem acertar o alvo)
P(A ∪ B) = P(A) + P(B) − P(A ∩ B)
P(A ∪ B) = P(A) + P(B) − P(A) • P(B)
1 3 1 3 4
P(A ∪ B) = + − • = = 80%
2 5 2 5 5
13. Ao retirar uma carta de um baralho de 52 cartas, qual é a probabilidade de sair um ás
vermelho, sabendo que a carta sorteada é de copas?
(probabilidade condicionada) nesse caso temos:
evento A: {ás de copas, ás de ouros}, como a carta sorteada foi de copas, P(A ∩ B) = 1/52
evento B: {carta de copas}, P(B) = 13/52
𝑃(𝐴 /𝐵) =
𝑃(𝐴 ∩ 𝐵)
1/52
1
=
=
𝑃(𝐵)
13/52 13
14. Uma urna contém 5 bolas brancas e 3 vermelhas; uma outra urna contém 4 bolas brancas
e 5 vermelhas. É retirada uma bola de cada urna. Encontre a probabilidade delas serem:
a) da mesma cor; P(duas brancas) = 5/8(1ªurna) • 4/9(2ªurna) = 5/18; P(duas vermelhas) = 3/8(1ªurna) •
5/9(2ªurna) = 5/24.
b) de cores diferentes. Como a probabilidade de serem ambas da mesma cor é 5/18 + 5/24 =
35/72; logo, P(cores diferentes) = 1 – 35/72 = 37/72.
15. um empresário realiza uma determinada operação comercial que, em função de suas
especificidades, pode apresentar três resultados possíveis: sucesso absoluto, sucesso parcial
e insucesso. Quando ele obtém sucesso absoluto, a operação rende para ele R$ 2.500,00 de
lucro; quando o sucesso é parcial, o lucro cai para R$ 1.200,00; e o fracasso lhe traz um
prejuízo de R$ 1.800,00. Na tabela a seguir estão relacionadas as diversas probabilidades de
ocorrência de cada um desses resultados. Qual é o lucro médio esperado do empresário
nesse ano?
Estatística Descritiva
www.profrichard.com.br
Ocorrências
Classes
41
Lucro
Valor
xi
Probabilidade de ocorrência
pi . xi
pi
Sucesso absoluto
2.500,00
54%
1.350,00
Sucesso parcial
1.200,00
32%
384,00
- 1.800,00
14%
Fracasso
Totais
-
100%
252,00
1.482,00
Logo, o valor médio esperado é de R$ 1.482,00.
16. Um fabricante produz peças, e 15% delas são defeituosas. Se uma peça defeituosa for produzida,
o fabricante perderá R$ 10,00, enquanto uma peça não defeituosa lhe dará um lucro de R$ 56,00. Qual
é o lucro esperado por peça, a longo prazo?
Lucro
Probabilidade de ocorrência
Qualidade da
Valor
pi . xi
peça
xi
pi
Defeituosa
15%
10,00
1,50
Perfeita
56,00
Totais
85%
47,60
100%
46,10
Logo, o lucro esperado é de R$ 46,10.
17. Após testes estatísticos, definiu-se para uma máquina que a probabilidade para o número de
quebras semanais, segue a tabela abaixo:
Número de quebras semanais
0
1
2
3
4
5
Probabilidades em %
77,38% 20,36%
2,14%
0,11%
0,00%
0,00%
Sabendo que, se não ocorrerem quebras durante a semana, o lucro da fábrica será de R$ 560.000,00;
que, se ocorrerem três ou mais panes, o prejuízo será de R$ 980.000,00; e que, se ocorrerem uma ou
duas panes, o lucro será de apenas R$ 135.000,00, pergunta‑se: qual o lucro esperado nessas
circunstâncias?
Lucro
Número de
Probabilidade de ocorrência
quebras
Valor
pi . xi
semanais
xi
pi
0
560.000,00
1
135.000,00
2
135.000,00
77,38%
20,36%
2,14%
3
980.000,00
0,11%
4
980.000,00
0%
5
980.000,00
0%
Totais
Logo, o lucro esperado é de R$ 462.625,00
100%
433.328,00
27.486,00
2.889,00
1.078,00
462.625,00
Estatística Descritiva
www.profrichard.com.br
42
EXERCÍCIOS
PROPOSTOS
1) Qual a probabilidade de obter cara no lançamento de uma moeda?
2) Qual a probabilidade de sair um ás de ouros quando retiramos uma carta de um baralho de
52 cartas?
3) Qual a probabilidade de sair um rei quando retiramos uma carta de um baralho de 52 cartas?
4) Em um lote de 12 peças, quatro são defeituosas. Sendo retirada uma peça, calcule:
a) A probabilidade dessa peça ser defeituosa.
b) A probabilidade dessa peça não ser defeituosa.
5) No lançamento de dois dados, calcule a probabilidade de se obter soma igual a 5.
6) De dois baralhos de 52 cartas retiram-se, simultaneamente, uma carta do primeiro baralho
e uma carta do segundo. Qual a probabilidade de a carta do primeiro baralho ser um rei e a
do segundo ser o 5 de paus?
7) de um baralho de 52 cartas retiram-se, ao acaso, duas cartas sem reposição. Qual é a
probabilidade de a primeira carta ser o ás de paus e a segunda ser o rei de paus?
8) Qual a probabilidade de sair uma carta de copas ou de ouros quando retiramos uma carta
de um baralho de 52 cartas?
9) No lançamento de um dado, qual a probabilidade, de se obter um número não inferior a 5?
10) Qual a probabilidade de sair uma figura quando retiramos uma carta de um baralho de 52
cartas? (cartas com figura são: dama, valete e rei)
11) Uma urna A contém 3 bolas brancas, 4 pretas e 2 verdes. Uma urna B contém 5 bolas
brancas, 2 pretas e uma verde. Uma urna C contém 2 bolas brancas, 3 pretas e 4 verdes.
Uma bola é retirada de cada urna. Qual é a probabilidade de as 3 bolas retiradas da primeira,
segunda e terceira urnas serem, respectivamente, branca, preta e verde?
12) Qual a probabilidade de NÃO acertarmos o resultado da mega-sena com um único cartão
jogado de seis dezenas?
13) Ao se retirar uma carta de um baralho comum de 52 cartas, qual a probabilidade de ela
ser ou um ás ou uma carta de espadas?
14) Pesquisas de opinião apontam que 20% (20/100) da população é constituída de mulheres
que votam no partido X. Sabendo que 56% (56/100) da população são mulheres, qual é a
probabilidade de que uma mulher selecionada ao acaso da população vote no partido X?
Gabarito: 1)1/2 2)1/52 3)1/13 4)a)1/3 b)2/3
5)1/9 6)1/676 7)1/2652
9)1/3 10)3/13 11)1/27 12)1/50.063.860≅0,000002% 13)4/13 14) 5/14 ≅ 36%
8)1/2
“O orgulho no ofício obriga os matemáticos de uma geração a desembaraçar-se do trabalho inacabado dos
seus antecessores.” (E. T. Bell)
“NA MATEMÁTICA, PARA SABOREAR COM PRAZER O FRUTO É PRECISO CONHECER BEM AS SUAS
RAÍZES.” (Ditos Pitagóricos)
Módulo 9 – D I S T R I B U I Ç Ã O
DE
PROBABILIDADES
Estatística Descritiva
www.profrichard.com.br
43
Uma distribuição de probabilidades é um modelo matemático que estabelece a forma como
os valores de uma variável aleatória se distribuem no respectivo espaço amostral. Possibilitam
a obtenção de probabilidades associadas a valores obtidos em “n” testes, ou em intervalos de
tempo ou ainda ocorridos dentro de espaços. Os tipos de distribuição de probabilidade mais
usados são a Normal, a Poisson e a Binomial, para cada problema, precisamos decidir qual a
distribuição mais adequada, sendo que o resultado final não difere muito de uma para outra
e, essa diferença diminui, conforme n aumenta.
DISTRIBUIÇÃO
BINOMIAL
O nome Binomial deve-se a utilização do Binômio de Newton, visto em Análise Combinatória no Ensino
Médio, conforme abaixo:
(
𝒏!
𝒏
)=
𝒌
𝒌! (𝒏 − 𝒌)!
Recordando o Ensino Médio, o ponto de exclamação é o símbolo que denota o produto de números
naturais consecutivos, chamado fatorial (!).
O fatorial de um número natural n, representado pelo símbolo n! (lê-se: ene fatorial ou fatorial de ene),
é um número definido por recorrência, ou seja, cada fatorial é calculado com a utilização do fatorial
anterior.
Não existe fatorial de número negativo, dessa forma, dado um número natural qualquer n, sendo n ≥
0, temos:
0! = 1 (por definição)
1! = 1
2! = 2 ∙ 1 = 2
3! = 3 ∙ 2 ∙ 1 = 6
4! = 4 ∙ 3 ∙ 2 ∙ 1 = 24 e assim sucessivamente.
Ao desenvolver um fatorial, colocando os fatores em ordem decrescente, podemos parar onde for
conveniente, indicando os últimos fatores também na notação de fatorial. Ou seja:
8! = 8 ∙ 7 ∙ 6 ∙ 5 ∙ 4 ∙ 3 ∙ 2 ∙ 1 ou 8! = 8 ∙ 7! ou 8! = 8 ∙ 7 ∙ 6 ∙ 5!, etc...
Combinações Simples: Uma combinação simples de n elementos tomados k a k é dado por:
𝑪𝒏,𝒌 = (
𝒏!
𝒏
)=
𝒌
𝒌! (𝒏 − 𝒌)!
Exemplificando combinação, vamos calcular o número de combinações possíveis para o
sorteio da Mega-Sena. Observe que para calcular as probabilidades em loterias, usamos a
fórmula das combinações, pois não importa a ordem que os números são sorteados. Para
acertar as 6 dezenas da Mega-Sena no universo {1; 2; 3; ...; 58; 59; 60}, temos:
𝐶60,6 = (
60!
60 ∙ 59 ∙ 58 ∙ 57 ∙ 56 ∙ 55 ∙ 54! 36.045.979.200
60
)=
=
=
= 50.063.860
6
6! (60 − 6)!
6! ∙ 54!
720
Estatística Descritiva
www.profrichard.com.br
44
Distribuição Binomial de Probabilidades: descreve o comportamento de uma variável em amostras
aleatórias. O sexo, o tipo Rh, ser saudável ou doente, são exemplos de aplicações dessa distribuição,
onde há somente dois resultados possíveis que são classificados como sucesso ou fracasso, o que se
deve aos primeiros estudos feitos sobre probabilidades, que envolviam ganhos e perdas em jogos de
azar. Como macete, podemos pensar no termo Binomial de Bi (dois) “sucesso ou fracasso” de
acontecer algo. Logo, a distribuição binomial de probabilidades é adequada aos experimentos que
apresentam apenas dois resultados possíveis: sucesso ou fracasso.
Em geral, considera-se como sucesso o resultado de interesse do pesquisador, nem sempre
representando, este resultado, um sucesso social ou biológico, por exemplo, se o interesse é estudar
um tipo de alergia, considera-se "ser alérgico" como o sucesso.
Costuma-se denominar p a probabilidade do sucesso e q a do fracasso. Sabe-se então que p
+ q = 1, portanto, q = 1 – p.
Para poder utilizar este processo os experimentos devem satisfazer as condições abaixo:
1. O experimento é testado n vezes nas mesmas condições;
2. Os resultados dos testes são independentes, ou seja, o resultado de um não afeta o do
outro;
3. Cada teste admite apenas dois resultados: sucesso ou fracasso (mutuamente exclusivos).
4. As probabilidades de sucesso “p” e de insucesso “q” (q = 1 – p) se mantêm constantes
durante os testes, ou seja, o processo é estacionário.
A probabilidade de acontecer um evento x em n tentativas, isto é, de que haja x sucessos e n
– x insucessos, é dada por:
𝒏
𝑷(𝒙) = ( ) ∙ 𝒑𝒙 ∙ (𝟏 − 𝒑)𝒏−𝒙
𝒙
ou
𝑷(𝒙) = 𝑪𝒏,𝒙 ∙ 𝒑𝒙 ∙ 𝒒𝒏−𝒙
Onde:
p = probabilidade de sucesso;
q = probabilidade de insucesso ou fracasso;
Cn,x = possibilidades do evento: ocorrer x vezes em n tentativas.
Propriedades da Distribuição Binomial: conhecendo-se os valores de n, p e q; é possível calcular a
média, a variância e o desvio padrão da distribuição, através das fórmulas: 𝑥̅ = 𝑛 ∙ 𝑝
𝑠2 = 𝑛 ∙ 𝑝 ∙ 𝑞
𝑠 = √𝑠 2
Exemplo 1: Uma moeda é lançada 5 vezes seguidas e independentes. Calcule a probabilidade de
serem obtidas 3 caras.
n = 5 (número de tentativas); x = 3 (número de sucessos); p = ½ (probabilidade de sucesso “obter
cara”); q = ½ (probabilidade de insucesso ou fracasso “obter coroa”).
1 3
1 5−3
𝑃(𝑥) = 𝐶𝑛,𝑥 ∙ 𝑝 𝑥 ∙ 𝑞 𝑛−𝑥 → 𝑃(3) = 𝐶5,3 ∙ (2) ∙ (2)
𝑃(3) =
5!
1 3
∙( )
3!(5−3)!
2
1 2
2
∙ ( ) → 𝑃(3) =
5∙4∙3! 1 1
∙ ∙
3!∙2! 8 4
𝟓
𝟏𝟔
=
→
Estatística Descritiva
www.profrichard.com.br
45
Exemplo 2: Dois times de futebol, A e B, jogam entre si 6 vezes. Encontre a probabilidade de o time
A ganhar 4 jogos.
n = 6 (número de tentativas “jogos”); x = 4 (número de sucessos “vitórias”);
1 (𝑔𝑎𝑛ℎ𝑎𝑟)
p = 3 (𝑟𝑒𝑠𝑢𝑙𝑡𝑎𝑑𝑜𝑠 𝑝𝑜𝑠𝑠í𝑣𝑒𝑖𝑠:𝑔𝑎𝑛ℎ𝑎𝑟,
𝑝𝑒𝑟𝑑𝑒𝑟 𝑜𝑢 𝑒𝑚𝑝𝑎𝑡𝑎𝑟)
(probabilidade de sucesso em cada jogo “ganhar”); q =
2/3 (probabilidade de insucesso ou fracasso “perder ou empatar”).
1 4
2 6−4
𝑃(𝑥) = 𝐶𝑛,𝑥 ∙ 𝑝 𝑥 ∙ 𝑞 𝑛−𝑥 → 𝑃(4) = 𝐶6,4 ∙ (3) ∙ (3)
6!
1 4
2 2
𝑃(3) = 4!(6−4)! ∙ (3) ∙ (3) → 𝑃(3) =
EXERCÍCIOS
6∙5∙4! 1 4
∙ ∙
4!∙2! 81 9
→
𝟐𝟎
=𝟐𝟒𝟑
RESOLVIDOS
1) Ao jogar um dado cinco vezes, qual a probabilidade de sair o número 2 por três vezes?
n = 5 (número de tentativas “lançamentos do dado”); x = 3 (número de sucessos “resultado 2”); p = 1/6
(probabilidade de sucesso “obter resultado 2”); q = 5/6 (probabilidade de insucesso ou fracasso “obter
resultado ≠ 2”).
2) Se 18% das peças produzidas por uma máquina são defeituosas, qual é a probabilidade de que,
entre 10 peças escolhidas ao acaso:
a) duas peças sejam defeituosas?
x = 2; n = 10; p = 18% = 0,18 (probabilidade do sucesso “ser defeituosa”); q = 1 – 0,18 = 0,82
(probabilidade do fracasso “não ser defeituosa”)
b) no máximo duas serem defeituosas?
No máximo 2 serem defeituosas significa que poderá haver nenhuma (zero), uma ou duas
peças defeituosas. Logo, P(máximo duas peças defeituosas) = P(0) + P(1) + P(2).
Estatística Descritiva
www.profrichard.com.br
46
c) no mínimo duas peças defeituosas?
No mínimo 2 serem defeituosas significa 2, 3, 4,...10 peças defeituosas. Logo, P(mínimo 2
peças defeituosas) = P(2)+P(3)+P(4)+P(5)+...+P(10) ou
Exercício resolvido 2: Uma prova possui 10 questões com 5 alternativas cada. Se um aluno "chutar"
todas as respostas, qual a probabilidade dele acertar 5 questões da prova?
n = 10 (número de tentativas); x = 2 (número de sucessos); p = 1/5 (probabilidade de sucesso “acertar
cada questão”); q = 4/5 (probabilidade de insucesso ou fracasso “errar cada questão”).
1 5
4 10−5
𝑃(𝑥) = 𝐶𝑛,𝑥 ∙ 𝑝 𝑥 ∙ 𝑞 𝑛−𝑥 → 𝑃(5) = 𝐶10,5 ∙ (5) ∙ (5)
𝑃(5) =
10!
1 5
∙( )
5!(10−5)!
5
4 5
5
∙ ( ) → 𝑃(5) =
10∙9∙8∙7∙6∙5!
1
1024
∙
∙
5!∙5!
3125 3125
EXERCÍCIOS
→
𝟑𝟎.𝟗𝟔𝟓.𝟕𝟔𝟎
𝟏.𝟏𝟕𝟏.𝟖𝟕𝟓.𝟎𝟎𝟎
=
= 𝟐, 𝟔𝟒%
PROPOSTOS
1) A probabilidade do pouso de um avião ser bem-sucedido usando um simulador de vôo
dada por 0,70. Seis estudantes de pilotagem, escolhidos aleatoriamente
independentemente, são convidados a tentar voar no avião, usando o simulador. Qual
probabilidade de dois dos seis estudantes pousarem com sucesso o avião, usando
simulador? (Resp: 0,0595 ou 5,95%)
é
e
a
o
2) Um vendedor de carros novos sabe, de experiência anterior, que, em média, ele faz uma
venda para cerca de 20% de seus clientes. Qual é a probabilidade de que, em cinco clientes
aleatoriamente selecionados, ele fará uma venda:
a) Para exatamente três clientes? (Resp: 0,0512 ou 5,12%)
b) Para no máximo um cliente? (Resp: 0,737 ou 73,7%)
c) Para no mínimo um cliente? (Resp: 0,672 ou 67,2%)
Estatística Descritiva
www.profrichard.com.br
47
“Tomando a Matemática desde o início do mundo até o tempo de Newton, o que ele fez é de longe a melhor metade.”
(Leibniz)
“No que se refere à ciência, a autoridade de mil pessoas não vale o simples raciocínio de um indivíduo apenas.” (Galileu)
Módulo 10 – D I S T R I B U I Ç Ã O
DE
POISSON
A distribuição de Poisson trabalha com a probabilidade de acontecer um evento x, sabendo
que historicamente, acontece um valor médio µ. Enquanto a distribuição binomial é usada
para encontrar a probabilidade de um número de sucessos em n tentativas, a distribuição de
Poisson é usada para encontrar a probabilidade de sucessos por unidade de intervalo (tempo
ou espaço). Ou seja, A distribuição de Poisson é uma distribuição de probabilidades usada
para eventos que ocorrem em um intervalo de tempo ou de espaço (linear, quadrado ou
cúbico).
Na distribuição binomial, as coisas acontecem de forma estacionária (jogo uma moeda agora
e posso jogar a outra na sequência ou daqui a 2 horas, tanto faz). Na distribuição de Poisson,
não, as coisas acontecem continuamente e temos que estar observando-as também
continuamente.
As outras condições exigidas para se aplicar a distribuição Binomial são também exigidas para
se aplicar a distribuição de Poisson, isto é, devem existir somente dois resultados mutuamente
exclusivos, os eventos devem ser independentes e o número médio de sucessos por unidade
de intervalo deve permanecer constante. Ou seja, para poder utilizar a distribuição de Poisson
os experimentos devem satisfazer as condições:
1. O experimento consiste em contar o número de vezes, x, que um evento ocorre num
intervalo de tempo ou espaço;
2. A probabilidade de que o evento ocorra é a mesma para cada intervalo;
3. O número de ocorrências em um intervalo independe do número de ocorrências em outro.
A distribuição de Poisson é frequentemente usada em pesquisa operacional na solução de
problemas administrativos. Alguns exemplos são o número de chamadas telefônicas para a
polícia por hora, o número de clientes chegando a uma bomba de gasolina por hora, e o
número de acidentes de tráfego num cruzamento por semana.
A probabilidade de acontecer um evento: número de sucessos x, P(x), por unidade de
intervalo, é calculado pela fórmula:
µ𝒙 ∙ 𝒆−µ
𝑷(𝒙) =
𝒙!
Onde:
x = número de sucessos;
µ = número médio de sucessos por intervalo;
e = número irracional constante aproximadamente igual a 2,71828, é a base do logaritmo natural
(neperiano). Ao invés de substituir o “e” pelo valor numérico e elevá-lo ao expoente “-µ”, podemos
obter o resultado da potência, diretamente por uma tabela ou por uma função da calculadora
científica (mais recomendado).
Propriedades da Distribuição de Poisson:
_ O valor esperado de uma distribuição de Poisson é igual a média “µ”;
_ A variância de uma distribuição de Poisson é igual a média “µ”.
Exemplo 1: Um processo mecânico produz tecido para tapetes com uma média de 2 defeitos por jarda
quadrada. Determine a probabilidade de uma jarda quadrada ter exatamente 1 defeito. Dados µ=2, x=1
Estatística Descritiva
www.profrichard.com.br
48
µ = 2 e x = 1 → 𝑷(𝒙) =
µ𝒙 ∙𝒆−µ
𝒙!
→ 𝑷(𝟏) =
𝟐𝟏 ∙𝒆−𝟐
𝟏!
=
𝟐∙𝟎,𝟏𝟑𝟓𝟑𝟑𝟓𝟐
𝟏
= 𝟎, 𝟐𝟕 = 𝟐𝟕%
Exemplo 2: Um departamento de conserto de máquinas recebe uma média de 5 chamadas por hora,
qual a probabilidade de que, em uma hora, selecionada aleatoriamente, sejam recebidas exatamente
3 chamadas? Os dados são: µ = 5 e x = 3
𝑷(𝒙) =
µ𝒙 ∙𝒆−µ
𝒙!
→ 𝑷(𝟑) =
𝟓𝟑 ∙𝒆−𝟓
𝟑!
=
𝟏𝟐𝟓∙𝒆−𝟓
𝟔
= 𝟎, 𝟏𝟒𝟎𝟒 = 𝟏𝟒, 𝟎𝟒%
Exemplo 3: Num laboratório, passam em média, em um contador de partículas, 4 partículas radioativas
por milissegundos, qual a probabilidade de entrarem no contador, 6 partículas radioativas em
determinado milissegundo? Os dados são: µ = 4 e x = 6
𝑷(𝒙) =
µ𝒙 ∙𝒆−µ
𝒙!
→ 𝑷(𝟔) =
𝟒𝟔 ∙𝒆−𝟒
𝟔!
=
𝟒𝟎𝟗𝟔∙𝒆−𝟒
𝟕𝟐𝟎
= 𝟎, 𝟏𝟎𝟒𝟐 = 𝟏𝟎, 𝟒𝟐%
Exemplo 4: A experiência passada mostra que 1% das lâmpadas incandescentes produzidas numa
fábrica são defeituosas. Encontre a probabilidade de mais que uma lâmpada numa amostra aleatória
de 30 lâmpadas sejam defeituosas, usando:
a) A distribuição Binomial e b) A distribuição de Poisson.
Solução: a) Aqui n = 30, p = 0,01, e queremos encontrar P(X > 1). Então, P(2) + P(3) + P(4) + ... =
0,0328 + 0,0031 + 0,0002 = 0,0361 ou 3,61%.
b) Como n = 30 e p = 0,01, temos: µ = n • p = 30 • 0,01 = 0,3, podemos usar a aproximação de Poisson
da distribuição binomial, para encontrar P(X > 1) = 1 – P(X ≤ 1):
P(X ≤ 1) = P(1) + P(0) = 0,222246 + 0,74082 = 0,963066. Assim,
P(X > 1) = 1 – P(X ≤ 1) = 1 – 0,963066 = 0,036934 ou 3,69%
Quando n ficar maior, a aproximação entre as duas distribuições torna-se mais estreita.
Exemplo 5: Uma empresa recebe em média 12 e-mails a cada 10 minutos. Usando a distribuição de
Poisson, qual a probabilidade de:
a) em 2 minutos não chegar nenhum e-mail?
Solução: calculamos a média de e-mails para
2 minutos, usando a regra de 3:
Tempo ........................ média
10 .............................. 12
2 .............................. µ
µ = 2,4 e-mails
b) em 5 minutos chegar no máximo 1 e-mail?
Solução: calculamos a média de e-mails para
5 minutos, usando a regra de 3:
Tempo ........................ média
10 .............................. 12
5 .............................. µ
µ = 6 e-mails
EXERCÍCIOS
𝑃(0) =
2,40 ∙𝑒 −2,4
0!
= 0,0907 = 9,07%
P(máximo um e-mail) = P(0) + P(1)
= 0,0025 + 0,0149 =
= 0,0174 = 1,746%
PROPOSTOS
1) Uma equipe de manutenção em softwares atende em média cinco chamadas por hora.
Determinar a probabilidade de que, em uma hora selecionada aleatoriamente, sejam
recebidas exatamente quatro chamadas. 17,55%
Estatística Descritiva
www.profrichard.com.br
49
2) Sabe-se que, em média, três clientes procuram atendimento numa agência da previdência
no período das 16 às 17 horas. Determine a probabilidade de que, nesse período, apareçam
mais do que 2 clientes. 57,68%
3) O número médio de acidentes mensais em um determinado cruzamento é três. Qual é a
probabilidade de que em um determinado mês ocorram quatro acidentes no cruzamento? Qual
a probabilidade de que ocorram mais de quatro acidentes em um determinado mês? 16,8%;
18,47%
4) Em um supermercado, o número médio de atendimentos de um caixa por minuto é de
quatro pessoas. Qual a probabilidade de que, num minuto qualquer do dia,
a) seis pessoas sejam atendidas? 10,42%
b) no mínimo três pessoas sejam atendidas? 76,19%
5) Um grande furacão é aquele no qual a velocidade dos ventos é de 111 milhas por hora ou
mais (o que equivale a 177,6 km/h ou mais). De 1900 a 1999, o número médio de grandes
furacões que atingiram anualmente a porção continental dos Estados Unidos foi cerca de 0,6.
(Fonte: National Hurricane Center). Obtenha a probabilidade de que, em um determinado ano,
a) exatamente um grande furacão chegue à porção continental dos Estados Unidos. 32,93%
b) no máximo um grande furacão atinja a porção continental dos Estados Unidos. 87,81%
c) mais de um grande furacão cause devastação na porção continental dos Estados Unidos.
12,19%
6) Suponha que o número médio de acidentes com fogos de artifício ocorridos por ano, em
uma cidade, é de 5 por 100.000 pessoas. Determinar a probabilidade de que, em uma cidade
de 200.000 habitantes, haja:
a) nenhum acidente. 0,00454%
b) dois acidentes. 0,227%
c) mais de dois acidentes. 99,72%
Dica: Para uma cidade com 200.000 habitantes, a média será o dobro da média para uma
cidade com 100.000 habitantes.
7) O número de falhas em uma transmissão de dados é uma variável aleatória de Poisson,
com uma média de 0,5 falha por hora. Qual é a probabilidade de que:
a) não haja falhas de transmissão durante 5 horas? 8,21%
Dica: Para 5 horas de transmissão, a média será cinco vezes a média para uma hora.
b) ocorram no mínimo três falhas em um período de 12 horas? 93,80%
Dica: Para 12 horas de transmissão, a média será doze vezes a média para uma hora
“Para criar uma filosofia só é preciso renunciar à metafísica e tornar-se apenas um bom matemático.” (Bertrand
Russel)
“UMA VERDADE MATEMÁTICA NÃO É SIMPLES NEM COMPLICADA POR SI MESMA. É UMA VERDADE.”
(EMILE LEMOINE)
Módulo 11 – D I S T R I B U I Ç Ã O
NORMAL
A distribuição normal é a mais importante das distribuições, pois muitas variáveis aleatórias de
ocorrência natural ou de processos práticos obedecem a esta distribuição, a qual é representada por
uma curva em forma de sino, sendo também conhecida como curva de Gauss.
Inicialmente, supunha-se que todos os fenômenos da vida real devessem ajustar-se a uma curva em
forma de sino; caso contrário, suspeitava-se de alguma anormalidade no processo de coleta de dados.
Daí a designação de curva normal.
Estatística Descritiva
www.profrichard.com.br
50
Inúmeras variáveis contínuas que descrevem fenômenos naturais e sociais apresentam distribuições
de probabilidades próximas da distribuição normal, por isso ela é a distribuição de probabilidades mais
utilizada.
Ao representarmos de forma gráfica (histograma) um conjunto de dados quantitativos de uma
distribuição simétrica, chamada Normal ou Gaussiana, a maioria dos dados se encontra
próximo de um determinado valor central (média, moda ou mediana), os demais dados se
distribuem igualmente afastando-se dos valores centrais.
Por exemplo: segue abaixo a tabela de distribuição de frequências e o histograma das notas
obtidas em uma prova de estatística, por 118 alunos.
nota
nº de
alunos (f)
0├1
4
1├2
7
2├3
10
3├4
13
4├5
19
5├6
22
6├7
27
7├8
8
8├9
4
9├┤10
4
Total
118
Ao desenharmos o polígono de frequências, observamos que o mesmo se ajusta a uma curva
normal.
Estatística Descritiva
www.profrichard.com.br
51
Curva Normal
Características gerais da curva Gaussiana:
_ O gráfico da distribuição normal é uma curva em forma de sino, simétrica em torno da média
µ;
_ A área total da curva vale 1 ou 100%, porque corresponde à probabilidade de a variável
aleatória assumir qualquer valor real;
_ Como a curva é simétrica em torno da média, os valores maiores do que a média e os
valores menores do que a média têm a mesma probabilidade de ocorrer;
_ A configuração da curva é dada por dois parâmetros: a média, µ, e o desvio padrão, σ;
_ É uma curva unimodal (só uma moda) onde a moda, a mediana e a média tem o mesmo
valor;
_ A curva normal aproxima-se mais do eixo x à medida que se afasta da média em ambos os
lados, mas nunca toca o eixo.
Valores padronizados na curva de Gauss:
todas as curvas normais representativas de
distribuições de freqüências podem ser
transformadas em uma curva normal padrão
(com valores padronizados z). A Distribuição
Normal Padrão é caracterizada por média
igual a zero (µ = 0) e desvio padrão igual a 1
(σ = 1).
Cálculo da Distribuição Normal: Qualquer conjunto de valores x, normalmente distribuídos,
pode ser convertido em valores normais padronizados z pelo uso da fórmula:
Estatística Descritiva
www.profrichard.com.br
52
Na fórmula acima, o desvio padrão populacional σ, pode ser substituído pelo amostral s.
A tabela acima mostra os valores da metade positiva da curva. Os valores negativos são
obtidos por simetria.
Exemplo 1: Segundo um fabricante, a vida útil média de um tipo de lâmpada que ele produz é µ =
2.000 horas, com desvio padrão de σ = 200 horas. Qual é a probabilidade de que uma dessas
lâmpadas, escolhida aleatoriamente, dure entre 2.000 e 2.400 horas?
Para x = 2000, temos:
𝑧=
𝑥 − 𝜇 2000 − 2000
=
=0
𝜎
200
Para x = 2400, temos:
𝑥 − 𝜇 2400 − 2000
=
=2
𝜎
200
A figura acima retrata a curva de probabilidade (função densidade) para esse problema e
indica, também, a relação entre a escala de horas x e a escala da normal padronizada z.
Após calcularmos os valores de z (0 e 2), devemos consultar uma tabela de distribuição normal
reduzida, que mostra o lado direito da curva, ou seja, metade da curva, onde encontramos
para z = 2 o valor de 0,4772 (21ª linha e 1ª coluna), esse valor corresponde a área da curva
compreendida entre 0 e 2. Logo, podemos dizer que 47,72% das lâmpadas irão durar entre
2000 e 2400 horas. Nesse exemplo, como a área da curva corresponde a exatamente dois
desvios a partir da média, não era necessário o uso da fórmula.
𝑧=
Exemplo 2: Com os dados do exemplo anterior, qual é a probabilidade de que uma dessas
lâmpadas, escolhida aleatoriamente, dure mais do que 2200 horas?
Deseja-se a área da curva após o +1. O ponto em que z = 0 corresponde à metade da curva
normal. Logo, a área à direita da média é igual a 50% da área total. Portanto se determinarmos
a área entre 0 e +1, podemos subtrair esse valor de 50% (0,5) para obtermos a probabilidade
de que as x horas sejam maiores do que 2200. Consultando uma tabela de distribuição normal
reduzida, que mostra o lado direito da curva, ou seja, metade da curva, onde encontramos
para z = 1 o valor de 0,3413 (11ª linha e 1ª coluna), esse valor corresponde a área da curva
compreendida entre 0 e +1, como queremos a área após o +1, fazemos a subtração (0,5 –
0,3413) encontrando o valor 0,1587. Assim a probabilidade da lâmpada durar mais de 2200
horas é de 15,87%.
Exemplo 3: Os pesos dos alunos de determinada escola têm uma distribuição normal, com média de
50 kg e desvio-padrão de 5 kg. Qual é a porcentagem de alunos dessa escola com peso entre 48 kg e
58 kg?
Para x = 48, temos:
𝑧=
𝑥 − 𝜇 48 − 50
=
= −0,4
𝜎
5
Para x = 58, temos:
𝑧=
𝑥 − 𝜇 58 − 50
=
= 1,6
𝜎
5
Estamos interessados em saber o percentual abaixo da curva entre os valores z = –0,4 e z = 1,6.
Consultando a Tabela Normal, encontramos o valor 0,1554 para z = 0,4 (por simetria é igual ao valor z = –
Estatística Descritiva
www.profrichard.com.br
53
0,4) e o valor 0,4452 para z = 1,6. Logo, somando os dois intervalos temos: 0,1554 + 0,4452 = 0,6006 =
60,06% dos alunos pesam entre 48 kg e 58 kg.
Exemplo 4: A vida média da bateria tipo I da empresa “Dura Mais” é distribuída normalmente
com uma média de 600 dias e desvio padrão de 75 dias. Qual a probabilidade de uma bateria
retirada ao acaso da produção desta empresa durar: menos de 450 dias?
450 − 600
𝑧=
= −2
75
Valor na tabela: 0,4772
P(menos de 450 dias) = 0,5 - 0,4772 =
2,28%
Exemplo 5: Em um exame de estatística, a média foi 7,8 e o desvio padrão foi 1. Determine as notas
cujos escores padronizados (ou variáveis normais padronizadas) foram z = - 0,6 e z = 1,2.
Para z = - 0,6, o correspondente grau (nota “x”) é
𝑥−𝜇
𝑥 − 7,8
𝑧=
→ −0,6 =
→ 𝑥 = 7,2
𝜎
1,0
Para z = 1,2, o grau correspondente (nota “x”) é
𝑧=
𝑥−𝜇
𝑥 − 7,8
→ 1,2 =
→ 𝑥 = 9,0
𝜎
1,0
Exemplo 6: Segundo o manual de instruções, o tempo de montagem de certo produto é normalmente
distribuído, com uma média de 4 horas e um desvio padrão de 0,5 horas. Determine o intervalo no qual
caem 95% dos tempos de montagem.
Queremos o intervalo de 95% da curva, em torno da média, como a média divide a curva ao meio,
dividimos 95% por 2, obtendo 47,5% = 0,475 de cada lado da média. A tabela normal reduzida mostra
apenas o lado direito da curva (metade da curva), procurando o valor 0,475 no corpo da tabela,
obtemos z = 1,96, para o lado direito da curva e, por simetria, obtemos o valor -1,96 para o lado
esquerdo da curva, substituindo na fórmula, temos:
Para z = - 1,96:
Para z = 1,96:
𝑥−𝜇
𝑥−4
𝑧=
→ −1,96 =
→ 𝑥 = 3,02
𝜎
0,5
𝑧=
𝑥−𝜇
𝑥−4
→ 1,96 =
→ 𝑥 = 4,98
𝜎
0,5
Ou seja, 95% das montagens, gastam, aproximadamente, entre 3 e 5 horas.
EXERCÍCIOS
PROPOSTOS
1) Segundo o manual de instruções, o tempo de montagem de certo produto é normalmente
distribuído, com uma média de 4,2 horas e um desvio padrão de 0,3 horas. Determine o
percentual de montagens que estão entre os tempos de 3,6 e 4,8 horas. 95,44%
2) Numa empresa, sabe-se que os salários anuais estão normalmente distribuídos com média
R$ 20.000,00 e desvio padrão de R$ 4.000,00. Determine a probabilidade de um funcionário,
escolhido aleatoriamente, ter um salário anual situado entre R$16.000,00 e R$24.000,00.
68,26%
3) O tempo semanal que um estudante utiliza o laboratório de computação está normalmente
distribuído, com uma média de 6,2 horas e um desvio padrão de 0,9 horas. Você é o
responsável pelo planejamento da agenda para o laboratório de computação. De um total de
2.000 alunos, calcule o número de estudantes que usarão o laboratório durante um
determinado número de horas:
a) Menos de 5,3 horas. 317,4 alunos
b) Entre 5,3 horas e 7,1 horas. 1365,2 alunos
c) Mais de 7,1 horas. 317,4 alunos
Estatística Descritiva
www.profrichard.com.br
54
4) A duração de um pneu está normalmente distribuída com uma média de 48.000 quilômetros
e um desvio padrão de 3.200 quilômetros. Estime a probabilidade de que o tempo de vida do
pneu esteja entre 48.000 e 54.400 quilômetros. 47,72%
5) Um levantamento indica que, a cada ida ao supermercado, um comprador gasta uma média
de 45 minutos com um desvio padrão de 12 minutos. O período gasto no supermercado é
normalmente distribuído. Um comprador entra no supermercado. Obtenha a probabilidade de
que o comprador:
a) fique no supermercado entre 24 e 54 minutos. 73,33%
b) fique mais do que 39 minutos no supermercado. 69,15%
c) Se 200 compradores entram no supermercado, quantos você espera que estejam em seu
interior durante cada um dos intervalos de tempo das letras a) e b)? Aproximadamente a)147
compradores ; b) 138 compradores)
6) O número de horas semanais que os adultos norte-americanos gastam em frente ao
computador em casa é normalmente distribuído, com média de cinco horas e desvio padrão
de uma hora. Um adulto é selecionado ao acaso nos Estados Unidos. Obtenha a probabilidade
de que:
a) o número de horas gastas no computador pelo adulto seja inferior a 2,5 horas semanais.
0,62%
b) o número de horas gastas no computador pelo adulto esteja entre 2,5 e 7,5 horas semanais.
98,76%
c) o número de horas gastas no computador pelo adulto seja superior a 7,5 horas semanais.
0,62%
d) Se 150 adultos norte-americanos são selecionados ao acaso, quantos você espera que
afirmem que gastam menos de três horas semanais em um computador doméstico?
Aproximadamente 3 adultos (3,42)
Estatística Descritiva
www.profrichard.com.br
55
Tabela Estatística de Distribuição Normal Reduzida
Z
,00
,01
,02
,03
,04
,05
,06
,07
,08
,09
0,0
0,0000 0,0040 0,0080 0,0120 0,0160 0,0199 0,0239 0,0279 0,0319 0,0359
0,1
0,0398 0,0438 0,0478 0,0517 0,0557 0,0596 0,0636 0,0675 0,0714 0,0753
0,2
0,0793 0,0832 0,0871 0,0910 0,0948 0,0987 0,1026 0,1064 0,1103 0,1141
0,3
0,1179 0,1217 0,1255 0,1293 0,1331 0,1368 0,1406 0,1443 0,1480 0,1517
0,4
0,1554 0,1591 0,1628 0,1664 0,1700 0,1736 0,1772 0,1808 0,1844 0,1879
0,5
0,1915 0,1950 0,1985 0,2019 0,2054 0,2088 0,2123 0,2157 0,2190 0,2224
0,6
0,2257 0,2291 0,2324 0,2357 0,2389 0,2422 0,2454 0,2486 0,2517 0,2549
0,7
0,2580 0,2611 0,2642 0,2673 0,2704 0,2734 0,2764 0,2794 0,2823 0,2852
0,8
0,2881 0,2910 0,2939 0,2967 0,2995 0,3023 0,3051 0,3078 0,3106 0,3133
0,9
0,3159 0,3186 0,3212 0,3238 0,3264 0,3289 0,3315 0,3340 0,3365 0,3389
1,0
0,3413 0,3438 0,3461 0,3485 0,3508 0,3531 0,3554 0,3577 0,3599 0,3621
1,1
0,3643 0,3665 0,3686 0,3708 0,3729 0,3749 0,3770 0,3790 0,3810 0,3830
1,2
0,3849 0,3869 0,3888 0,3907 0,3925 0,3944 0,3962 0,3980 0,3997 0,4015
1,3
0,4032 0,4049 0,4066 0,4082 0,4099 0,4115 0,4131 0,4147 0,4162 0,4177
1,4
0,4192 0,4207 0,4222 0,4236 0,4251 0,4265 0,4279 0,4292 0,4306 0,4319
1,5
0,4332 0,4345 0,4357 0,4370 0,4382 0,4394 0,4406 0,4418 0,4429 0,4441
1,6
0,4452 0,4463 0,4474 0,4484 0,4495 0,4505 0,4515 0,4525 0,4535 0,4545
1,7
0,4554 0,4564 0,4573 0,4582 0,4591 0,4599 0,4608 0,4616 0,4625 0,4633
1,8
0,4641 0,4649 0,4656 0,4664 0,4671 0,4678 0,4686 0,4693 0,4699 0,4706
1,9
0,4713 0,4719 0,4726 0,4732 0,4738 0,4744 0,4750 0,4756 0,4761 0,4767
2,0
0,4772 0,4778 0,4783 0,4788 0,4793 0,4798 0,4803 0,4808 0,4812 0,4817
2,1
0,4821 0,4826 0,4830 0,4834 0,4838 0,4842 0,4846 0,4850 0,4854 0,4857
2,2
0,4861 0,4864 0,4868 0,4871 0,4875 0,4878 0,4881 0,4884 0,4887 0,4890
2,3
0,4893 0,4896 0,4898 0,4901 0,4904 0,4906 0,4909 0,4911 0,4913 0,4916
2,4
0,4918 0,4920 0,4922 0,4925 0,4927 0,4929 0,4931 0,4932 0,4934 0,4936
2,5
0,4938 0,4940 0,4941 0,4943 0,4945 0,4946 0,4948 0,4949 0,4951 0,4952
2,6
0,4953 0,4955 0,4956 0,4957 0,4959 0,4960 0,4961 0,4962 0,4963 0,4964
2,7
0,4965 0,4966 0,4967 0,4968 0,4969 0,4970 0,4971 0,4972 0,4973 0,4974
2,8
0,4974 0,4975 0,4976 0,4977 0,4977 0,4978 0,4979 0,4979 0,4980 0,4981
2,9
0,4981 0,4982 0,4982 0,4983 0,4984 0,4984 0,4985 0,4985 0,4986 0,4986
3,0
0,4987 0,4987 0,4987 0,4988 0,4988 0,4989 0,4989 0,4989 0,4990 0,4990
3,1
0,4990 0,4991 0,4991 0,4991 0,4992 0,4992 0,4992 0,4992 0,4993 0,4993
3,2
0,4993 0,4993 0,4994 0,4994 0,4994 0,4994 0,4994 0,4995 0,4995 0,4995
3,3
0,4995 0,4995 0,4995 0,4996 0,4996 0,4996 0,4996 0,4996 0,4996 0,4997
3,4
0,4997 0,4997 0,4997 0,4997 0,4997 0,4997 0,4997 0,4997 0,4997 0,4998
3,5
0,4998 0,4998 0,4998 0,4998 0,4998 0,4998 0,4998 0,4998 0,4998 0,4998
3,6
0,4998 0,4998 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999
3,7
0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999
3,8
0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999
3,9
0,5000 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000
Download