Adriane Guarienti

APOSTILA
Probabilidade e Estatística
Adriane Guarienti
[email protected]
[email protected]
2011
1
MÉTODOS ESTATÍSTICOS
1 – CONCEITO
1.1 - Estatística
A Estatística é um conjunto de métodos destinados à coleta, organização, resumo, apresentação e
análise de dados de observação, bem como da tomada de decisões razoáveis baseadas em tais
análises.
A Estatística é um conjunto de processos ou técnicas empregadas na investigação e análise de
fenômenos coletivos ou de massa.
1.2 – Divisão da Estatística
A Estatística divide-se em duas partes Geral e Aplicada.
Geral ou metodológica
Aplicada
– Descritiva
– Indutiva ou inferencial
– Biometria
– Econometria
– Mecânica estatística
– Demografia
– Psicometria
– Sociometria
1.2.1 Estatística geral ou metodológica
Visa elaborar métodos gerais aplicáveis a todas as fases do estudo dos fenômenos de massa. tendo
por finalidade o estudo das propriedades matemáticas desses fenômenos e a dedução e
demonstração rigorosa dos procedimentos e fórmulas usadas freqüentemente.
 Estatística Descritiva
Suponha que se tenha informações de um conjunto de notas de estudantes matriculados em
uma disciplina de Estatística. Na terminologia estatística, o conjunto de notas desses
estudantes é chamado de conjunto de dados, e a nota individual de cada estudante é
chamada de observação.
Dessa maneira reduz-se o conjunto de dados, tornando-o mais maleável, constituindo tabelas,
gráficos ou sumarizando os seus valores através de medidas descritivas, como a média. A
parte da estatística que nos ajuda neste tipo de análise é chamada de estatística descritiva.
 Estatística Inferencial
O conjunto de todos os elementos de interesse é chamado de população. A retirada de uma
parte dessa população é chamada de amostra.
2
A maior parte dos objetivos estatísticos, como decisões, inferências e previsões sobre
populações são baseadas em resultados obtidos de amostras.
A área da estatística que tem por objetivo tomar decisões, com base em amostras, é chamada
de estatística inferencial ou estatística indutiva.
1.2.2 Estatística aplicada
A diversidade de atuação é um dos grandes atrativos da Estatística, que pode promover a melhoria da
eficiência e também, a solução de vários problemas práticos importantes em quase todas as áreas do
saber: das Ciências Naturais às Sociais.
O que modernamente se conhece como Estatística, é um conjunto de técnicas e métodos de
pesquisa que, entre outros tópicos, envolve o planejamento do experimento a ser realizado, a coleta
qualificada dos dados, a inferência, o processamento e análise das informações e a disseminação
dessas informações.
O desenvolvimento e o aperfeiçoamento de técnicas estatísticas, de obtenção e de análise de
informações, permitem o controle e o estudo adequado de fenômenos, fatos, eventos e ocorrências,
em diversas áreas do conhecimento. A Estatística tem por objetivo fornecer métodos e técnicas para
lidarmos, racionalmente, com situações sujeitas a incertezas.
2 – DEFINIÇÕES
2.1 - População x Amostra

População (N): Conjunto de todos os elementos relativos a um determinado fenômeno que
possuem pelo menos uma característica em comum, a população é o conjunto Universo, podendo
ser finita ou infinita.


Finita - apresenta um número limitado de observações, que é passível de contagem.
Infinita - apresenta um número ilimitado de observações que é impossível de contar e geralmente
esta associada a processos.

Amostra (n): É um subconjunto da população e deverá ser considerada finita, a amostra deve ser
selecionada seguindo certas regras e deve ser representativa, de modo que ela represente todas
as características da população como se fosse uma fotografia desta.
2.2 - Censo x Amostragem

Pesquisa Estatística: É qualquer informação retirada de uma população ou amostra, podendo
ser através de Censo ou Amostragem.

Censo: É a coleta exaustiva de informações das "N" unidades populacionais.

Amostragem: É o processo de retirada de informações dos "n" elementos amostrais, no qual
deve seguir um método criterioso e adequado (tipos de amostragem).
2.3 - Parâmetros x Estatísticas

Parâmetros: são medidas populacionais quando se investiga a população em sua totalidade,
neste caso é impossível fazer inferências, pois toda a população foi investigada.
3

Estatísticas ou Estimadores: são medidas obtidas da amostra, torna-se possível neste caso
utilizarmos as teorias inferências para que possamos fazer conclusões sobre a população.
2.4 - Dado x Variável

Dados estatísticos: é qualquer característica que possa ser observada ou medida de alguma
maneira. As matérias-primas da estatística são os dados observáveis.

Variável: É aquilo que se deseja observar para se tirar algum tipo de conclusão, geralmente as
variáveis para estudo são selecionadas por processos de amostragem. Os símbolos utilizados
para representar as variáveis são as letras maiúsculas do alfabeto, tais como X, Y, Z, ... que pode
assumir qualquer valor de um conjunto de dados. As variáveis podem ser classificadas dos
seguintes modos:
- Qualitativas (ou atributos): São características de uma população que não pode ser medidas.
- Quantitativas: São características populacionais que podem ser quantificadas, sendo
classificadas em discretas e contínuas.
Discretas: são aquelas variáveis que pode assumir somente valores inteiros num
conjunto de valores. É gerada pelo processo de contagem, como o número de veículos
que passa em um posto de gasolina, o número de estudantes nesta sala de aula.
Contínuas: são aquelas variáveis que podem assumir um valor dentro de um intervalo
de valores. É gerada pelo processo de medição. Neste caso serve como exemplo o
volume de água em um reservatório ou o peso de um pacote de cereal.
2.5 - Arredondamento de Dados
1ª) Se o primeiro algarismo após aquele que formos arredondar for de 0 a 4, conservamos o
algarismo a ser arredondado e desprezamos os seguintes.
Ex.: 7,34856 (para décimos)  7,3
2ª) Se o primeiro algarismo após aquele que formos arredondar for de 6 a 9, acrescenta-se uma
unidade no algarismo a ser arredondado e desprezamos os seguintes.
Ex.: 1,2734 (para décimos)  1,3
3ª) Se o primeiro algarismo após aquele que formos arredondar for 5, seguido apenas de zeros,
conservamos o algarismo se ele for par ou aumentamos uma unidade se ele for ímpar,
desprezando os seguintes.
Ex.: 6,2500 (para décimos)  6,2
12,350 (para décimos)  12,4
Se o 5 for seguido de outros algarismos dos quais, pelo menos um é diferente de zero,
aumentamos uma unidade no algarismo e desprezamos os seguintes.
Ex.: 8,2502 (para décimos)  8,3
8,4503 (para décimos)  8,5
4
2.6 – Fases do método estatístico
O método estatístico abrange as seguintes fases:
a) Definição do Problema
Consiste na:
- formulação correta do problema;
- examinar outros levantamentos realizados no mesmo campo (revisão da literatura);
- saber exatamente o que se pretende pesquisar definindo o problema corretamente (variáveis,
população, hipóteses, etc.)
b) Planejamento
Determinar o procedimento necessário para resolver o problema:
- Como levantar informações;
- Tipos de levantamentos: Por Censo (completo); Por Amostragem (parcial).
- Cronograma , Custos, etc.
c) Coleta ou levantamento dos dados
Consiste na obtenção dos dados referentes ao trabalho que desejamos fazer.
A coleta pode ser: Direta - diretamente da fonte;
Indireta - feita através de outras fontes.
Os dados podem ser obtidos pela própria pessoa (primários) ou se baseia no registro de terceiros
(secundários).
d) Apuração dos Dados ou sumarização
Consiste em resumir os dados, através de uma contagem e agrupamento. É um trabalho de
coordenação e de tabulação.
Apuração: manual, mecânica, eletrônica e eletromecânica.
e) Apresentação dos dados
É a fase em que vamos mostrar os resultados obtidos na coleta e na organização.
Esta apresentação pode ser: Tabular ou Gráfica
f) Análise e interpretação dos dados
É a fase mais importante e também a mais delicada. Tira conclusões que auxiliam o pesquisador a
resolver seu problema.
5
3 – APRESENTAÇÃO DE DADOS
Quando se realiza um estudo e se quer apresentar os resultados, pode-se optar por três maneiras:
tabelas, quadros e/ou gráficos. Cada um destes tipos de apresentação possui suas características
próprias, as quais serão mostrados no decorrer do capítulo.
3.1 Apresentação tabular
Consiste em dispor os dados em linhas e colunas, distribuídas de modo ordenado. A elaboração de
tabelas obedece à Resolução n. 886, de 26 de outubro de 1966, do Conselho Nacional de Estatística.
As normas de apresentação são editadas pelo Instituto Brasileira de Geografia e Estatística (IBGE).
3.1.1 Representação
Exemplo:
Estrutura Empresarial, cidade de Santa Maria, ano de 2006
Ramo de Atividade
nº de unidades
Agricultura, pecuária, silvicultura e exploração florestal
Indústrias de transformação
Indústrias extrativas
Construção
Produção e distribuição de eletricidade, gás e água
Comércio, reparação de veículos, objetos pessoais e domésticos
Alojamento e alimentação
Transporte, armazenagem e comunicações
Intermediação financeira, seguros, previdência complementar
Atividades imobiliárias e serviços prestados às empresas
Administração pública, defesa e seguridade social
Educação
Saúde e serviços sociais
Outros serviços coletivos, sociais e pessoais
52
934
13
380
15
7485
813
521
163
1573
71
215
282
1007
Fonte: IBGE,Cadastro Central de Empresas 2006
3.1.2 Elementos de uma tabela

Título
Estrutura Empresarial, cidade de Santa Maria, ano de 2006
O título é a parte superior da tabela e deve conter um conteúdo suficiente para responder três
perguntas:
- O que? Assunto a ser representado: Estrutura Empresarial
- Onde? O lugar onde ocorreu o fenômeno: Santa Maria
- Quando? A época que ocorreu o fenômeno: 2006
 Cabeçalho
É a parte da tabela na qual se indica a natureza do conteúdo de cada coluna.
Ramo de Atividade
nº de unidades

Corpo
É a parte da tabela composta por linhas e colunas.

Casa ou célula
É a parte da tabela formada pelo cruzamento de uma linha com uma coluna.

Rodapé
6
É o espaço aproveitado abaixo na tabela, onde são colocados detalhes do conteúdo da tabela de
natureza informativo (fonte, notas de observações).
Fonte: IBGE,Cadastro Central de Empresas 2006
3.2 Distribuição de Freqüência
Os dados são colocados em classes pré calculadas, registrando a freqüência de ocorrência. Uma
distribuição de freqüência pode ser classificada em discreta (pontual) e intervalar.
3.2.1 Distribuição de Freqüência Discreta ou Pontual
É uma série de dados agrupados na qual o número de observações está relacionado com um número
real.
Idade de 15 alunos da ADM, 1º semetre da UNIFRA, 2010/1
Idade (xi)
Nº alunos (fi)
17
2
18
3
19
5
20
2
21
3
15

Fonte: Dados Hipotéticos
3.2.2 Distribuição de Freqüências Intervalar
Na distribuição de freqüência, os intervalos parciais deverão ser apresentados de maneira a evitar
dúvidas quanto à classe a que permanece determinado elemento.
O tipo de intervalo mais usado é do tipo fechado a esquerda e aberto a direita, representado pelo
símbolo: |---.
Altura dos dos Alunos da ADM, 1º semetre da UNIFRA, 2010/1
150
158
166
174
182
Altura (cm)
Ponto médio (xi)
|--158
154
|--166
162
|--174
170
|--182
178
|--190
186
---
Fonte: Dados Hipotéticos
nº alunos (fi)
4
12
20
13
5
54
Etapas para a construção de uma distribuição de freqüências:
1ª) Coleta dos dados
Consiste em obter os dados brutos, que são os dados coletados na ordem na qual aparecem e que
ainda não estão prontos para que se realize uma análise mais detalhada.
2ª) Formação do rol
É a organização dos dados brutos, em uma determinada ordem, que poderá ser crescente ou
decrescente.
7
3ª) Determinar o número de classes (k)
É aconselhável usar de 4 a 20 classes.
Para se determinar o número de classes (k), a partir do rol, usa-se a Fórmula de Sturges ou o Método
da Raiz.
Fórmula de Sturges
n > 40
k  1  3,3 log n
Método da Raiz
n ≤ 40
k n
onde n é o no de observações coletadas.
4ª) Amplitude do intervalo de classe
h
H
k
H = (X máximo – X mínimo) / k
onde: H = Maior valor coletado – menor valor coletado (amplitude total)
Obs.: A amplitude do intervalo de classe poderá sofrer um arredondamento adequado em função do
tipo de dado coletado. Esse valor geralmente será arredondado para cima, de preferência na
casa decimal dos dados. O intervalo de classe deverá ser preferencialmente constante em toda
a distribuição de freqüência.
5ª) Intervalo de classe
Consiste em definir a simbologia de representação do intervalo de classe, bem como os limites de
classe, em função do número de classes estabelecidas. (|--- , ---|, |---| e ---)
6ª) Ponto médio de classe (Xi)
É a média aritmética simples do limite inferior com o limite superior de uma mesma classe.
Xi 
li  Li
2
7ª) Freqüência absoluta (fi)
É a número de indivíduos por classe. Deve-se cuidar a contagem dos indivíduos nas classes, em
função do tipo de intervalo utilizado.
8ª) Freqüência absoluta acumulada (Fi)
É o somatório da freqüência absoluta da i-ésima classe com a freqüência absoluta das classes
anteriores, ou a freqüência acumulada da classe anterior.
9ª) Freqüência Relativa (fr):
É o quociente entre a freqüência absoluta da i-ésima classe pelo somatório das freqüências.
8
10ª) Freqüência Relativa Acumulada (Fr):
É o somatório da freqüência relativa da i-ésima classe com as freqüências relativas das classes
anteriores.
Lista de exercicios:
Faça uma tabela com intervalos de classe com a tabela primitiva abaixo:
166
162
155
154
160
161
152
161
161
168
163
156
150
163
160
172
162
156
155
153
160
173
155
157
165
160
169
156
167
155
151
158
164
164
170
158
160
168
164
161
1) Dado o rol do número de erros de impressão da primeira página de um jornal durante 50 dias,
obteve-se os seguintes resultados:
5
5
5
6
6
6
7
7
7
7
7
8
8
8
8
8
8
8
9
9
10
10
10
10
10
11
11
11
11
12
12
12
12
12
12
12
12
12
13
14
14
14
14
14
14
14
15
16
19
22
Complete a tabela de distribuição de freqüência:
Segundo nos mostra a tabela acima responda:
i)
ii)
iii)
iv)
v)
Qual o valor de k (número de classe)?
Qual o intervalo de cada classe (h)?
Qual o valor das freqüências acima pedidas?
Qual é a mediana?
Faça o hitosgrama da tabela encontrada.
2) Uma empresa automobilística selecionou ao acaso, uma amostra de 40 revendedores
autorizados em todo o Brasil e anotou em determinado mês o número de unidades adquiridas
por estes revendedores. Obteve os seguintes dados e monte a tabela de distribuição de
freqüência com intervalos
10 -15 -25 -21 -6 -23 -15 -21 -26 -32 -9 -14 -19 -20 -32 -18 -16 -26 -24 - 20 -7 -18 -17 -28 -3522 -19 -39 -18 -21 -15 -18 -22 -20 -25 -28 -30 1-6 -12 -20
3) Conhecidas as notas de 55 alunos: e monte a tabela de distribuição de freqüência com
intervalos.
33 -33 -35 -35 -39 -41 -41 -42 -45 -45 -47 -48 -50 -52 -53 -54 -55 -55 -56 -57-59 -60 -61 -64 65 -65 -65 -66 -67- 68 -68 -69 -71 -73 -73 -73 -74 -74 -76 -77-78 -80 -81 -84 -85 -85 -88 -89 91 -94 -94 -98 -98 -98 -98
4) Monte a tabela de distribuição de freqüência com intervalos com os resultados do lançamento
de um dado 50 vezes foram os seguintes:
6 -5 -2 -6 -4 -3 -6 -2 -6 -5 -1 -6 -3 -3 -5 -1 -3 -6 -3 -4 -5 -4 -3 -1 -3-5 -4 -4 -2 -6 -2 -2 -5 -2-5 -1 3 -6 -5 -1 -5 -6 -2 -4 -6 -1 -5 -2 -4 -3
9
5) Considerando as notas de um teste de inteligência aplicado a 55 alunos: Monte a tabela de
distribuição de freqüência com intervalos
64 -64 -64 -66 -66 -70 -70 -73 -73 -73 -73 -74 -75 -76 -76 -76 -78 -78 -78 -78-79 -80 -80 -81 82 -82 -83 -84 -84- 85 -85 -85 -85 -86 -86 -86 -86 -86 -86 -87-87 -89 -90 -90 -92 -92 -93 -95 98 -101 -102 -103 -103 -103 -103
3.3 Apresentação gráfica
A representação gráfica é uma forma de apresentação visual dos dados. Normalmente, contém
menos informações que as tabelas, mas são de fácil leitura. O tipo de gráfico depende da variável em
estudo.
a) Gráficos de Linhas
Serve para representar séries simples ou compostas, geralmente utilizado para ilustrar uma série
temporal. Quando se utiliza um gráfico de linhas compostas, ele servirá tanto para informação quanto
para se fazer comparações.
Exemplo 1:
Venda de Combustível Automotivo, cidade de Santa Maria,
período de 2001 à 2007
50.000.000
49.000.000
48.000.000
47.000.000
litros
46.000.000
45.000.000
44.000.000
43.000.000
42.000.000
41.000.000
40.000.000
2001
2002
2003
2004
2005
2006
2007
Fonte: www.fee.rs.gov.br
Exemplo 2:
Venda de Combustível Automotivo, cidade de Santa Maria e Passo Fundo,
período de 2001 à 2007
50.000.000
48.000.000
46.000.000
44.000.000
litros
42.000.000
40.000.000
38.000.000
36.000.000
34.000.000
32.000.000
30.000.000
2001
2002
2003
2004
Santa Maria
2005
Passo Fundo
Fonte: www.fee.rs.gov.br
2006
2007
10
b) Gráficos de Colunas
Os gráficos de colunas são formados por retângulos no eixo horizontal. Pode-se construir gráficos de
colunas simples, que serve para a representação de uma série simples e o gráfico de colunas
compostas, que é indicado para séries compostas, podendo ser de colunas justapostas ou
sobrepostas. Esses tipos de gráficos compostos são utilizados para ilustrar qualquer tipo de série e
também servem para comparação.
b.1) Colunas simples
Exemplo:2
Emprego no Brasil, jan/2009
45.000
nº de pessoas (1.000)
40.000
35.000
30.000
25.000
20.000
15.000
10.000
5.000
0
P o pulação em
P o pulação
Idade A tiva
Eco no micamente
A tiva
P o pulação
Ocupada
P o pulação
Deso cupada
P o pulação não
Eco no micamente
A tiva
Fonte: www.sidra.ibge.gov.br
As larguras das colunas devem ser todas iguais e não têm nenhum significado neste caso, podendo
ser adotada qualquer dimensão conveniente, desde que não se superponham.
b.2) Colunas justapostas
Exemplo:
Poupalçao em Idade Ativa e Economicamente Ativa no Brasil, jan/2009
Nº de pessoas (1.000)
25.000
20.000
15.000
Homem
10.000
Mulher
5.000
0
População em Idade Ativa
População Economicamente
Ativa
Fonte: www.sidra.ibge.gov.br
c) Gráfico de barras
As regras usadas para o gráfico de barras são iguais àquelas usadas no gráfico de colunas, porém
com a inversão dos eixos.
Exemplo: Estrutura Empresarial no município de Santa Maria – RS, 2006
11
Saúde e serviço s so ciais
Educação
A dministração pública, defesa e seguridade so cial
A tividades imo biliárias, aluguéis e serviço s prestado s às empresas
Intermediação financeira, seguro s, previdência co mplementar
Transpo rte, armazenagem e co municaçõ es
A lo jamento e alimentação
Co mércio , reparação de veículo s, o bjeto s pesso ais e do méstico s
Co nstrução
Indústrias de transfo rmação
A gricultura, pecuária, silvicultura e explo ração flo restal
Outro s serviço s co letivo s, so ciais e pesso ais
0
1000
2000
3000
4000
5000
6000
7000
8000
nº de unidades locais
2
Fonte: www.ibge.gov.br
d) Gráfico de setores (pizza)
É a representação gráfica da freqüência relativa (percentagem) de cada categoria dos dados. Este
gráfico é utilizado para variáveis nominais e ordinais. Poderá ser uma opção ao gráfico de barras,
quando se pretende dar ênfase à comparação das percentagens de cada categoria.
Exemplo:Tipo de Frota no município de Santa Maria – RS, 2007
Motocicleta
22%
Ônibus/Micro-ônibus
2%
Caminhonete
3%
Automóvel
73%
Fonte: www.ibge.gov.br
Características:
- A área do gráfico equivale à totalidade de casos (100%);
- Cada 'fatia' representa a percentagem de cada categoria representada.
e) Gráficos pictoriais
Tipo de gráfico cuja característica principal é a analogia entre o dado representado e o tipo de figura
utilizado na sua representação. É bastante utilizado na propaganda, fazendo o apelo visual e
percepção imediata do que se está falando. Tem por objetivo despertar a atenção do público em
geral. Muitos desses gráficos apresentam grande dose de originalidade e de habilidade na arte de
apresentação dos dados.
12
Evolução da frota nacional de carros a álcool,
de 1979 à 1987
3.631.647
1987
2.473.581
1985
1.277.107
1983
9.645
1979
Fonte: Anfavea
Os métodos mais eficientes para deixar de fumar segundo 30.000 fumantes
entrevistados no Canadá - 2000
Goma de mascar com nicotina
mais sessões de apoio psicológico
34%
Internamento em hospital
e uso de drogas relaxantes
30%
Acupuntura
Hipnose
Injeção de Clonidina, droga que
reduz os efeitos da abstinência
27%
19,5%
18,5%
Fonte: Sem origem da informação
Devastação Selvagem: extração de madeiras
no Brasil - 2000
Pinus
6,8%
Madeira
nativa
Eucalipto
24,4%
68,8%
Fonte: Sociedade Brasileira de Silvicultura
f) Histograma
Destina-se a representar uma distribuição de freqüência intervalar. Os dados são representados por
colunas justapostas. Onde a base representa os intervalos e altura apresenta as freqüências
absolutas ou freqüências relativas dentro de cada intervalo.
13
Altura dos dos Alunos da ADM, 1º semetre da UNIFRA, 2010/1
25
20
fi
15
10
5
0
150
158
166
174
182
190
Fonte: Dados Hipotéticos
3 - MEDIDAS ESTATÍSTICAS
Tem por objetivo descrever um conjunto de dados de forma organizada e compacta que possibilita a
visualização do conjunto estudado por meio de suas medidas estatísticas.
3.1 - Médias
São medidas descritivas que tem por finalidade representar um conjunto de dados.
3.1.1. - Média Aritmética
Símbolo: Amostral ( x ); Populacional ()
a) Dados Não Tabelados
n
X
x
i 1
N
i
n
ou  =
X
i 1
i
N
Exemplo:
Idade de cinco alunos da ADM, 1º semetre da UNIFRA, 2010/2:
19 22 20 16 26
b) Dados Tabelados
b.1) Tabela de frequências
Média Aritmética Ponderada ( x ), (onde fi é a frequencia)
n
X
X
i 1
i
fi
n
f
i 1
i
Exemplo: Altura dos dos Alunos da ADM, 1º semetre da UNIFRA, 2010/2
Altura (cm)
xi
fi
150
|--158
154
4
158
|--166
162
12
166
|--174
170
20
174
|--182
178
13
182
|--190
186
5
---54

Fonte: Dados Hipotéticos
14
b.1) Tabela com Valores Ponderados
Média Aritmética Ponderada ( X w ), (onde Wi é o peso)
n
Xw 
X
i 1
i
 Wi
n
W
i 1
i
Exemplo:
Nota do aluno "X" 1 semestre de 2008
Notas (Xi)
Pesos (W i)
7,8
2
8,3
3
9,2
2
5,8
3
10

Fonte: Dados Hipotéticos
Exercicios:
1) Considerando as distribuições de frequencia seguinte, ache a media aritmética:
i
PESOS (kg)
fi
1
40 |----- 44
2
2
44 |----- 48
5
3
48 |------52
9
4
52 |------56
6
5
56 |------60
4
= 26
i
2)
1
2
3
4
5
ESTATURAS
(cm)
150 |----- 156
156 |----- 162
162 |------168
168 |------174
174 |------180
fi
1
5
8
13
3
= 30
3)
ÁREAS (m2)
Nº de lotes
300 |---400 |---500 |---600 |---700 |---800 |---900 |---1000 |--- 1100 |---1200
14
46 58
76
68
62
48
22
6
15
4) Conhecidas as notas de 50 alunos:
68
71
80
41
94
85
35
61
55
98
33
81
41
78
66
52
50
91
48
66
65
35
55
69
73
77
64
73
85
42
84
74
59
67
65
65
47
53
39
94
74
54
77
60
88
57
68
45
76
89
Determine:
a) a distribuição de frequencia começando por 30 e adotando o intervalo de classe de amplitude
igual a 10;
b) as frequencias acumuladas
c) as frequencias relativas
d) o histograma
3- Separatrizes (Mediana)
São medidas de posição que divide o conjunto de dados em partes proporcionais, quando os mesmos
são ordenados.
a) Dados Não Tabelados
Antes de determinarmos a MEDIANA devemos em primeiro lugar encontrar a posição da mesma.
A Mediana será o elemento de ordem:
P(md ) 
n 1
2
Exemplos:
1) Idade de cinco alunos da ADM, 1º semetre da UNIFRA, 2010/1:
19 22 20 16 26
2) Idade de seis alunos da ADM, 1º semetre da UNIFRA, 2010/1:
19 22 20 16 26 23
b) Dados Tabelados
b.1) Distribuição de freqüências pontual
Segue a mesma regra usada para dados não tabelados.
Exemplo:
Idade de 15 alunos da ADM, 1º semetre da UNIFRA, 2010/1
Idade (xi)
Nº alunos (fi)
17
2
18
3
19
5
20
2
21
3
15

Fonte: Dados Hipotéticos
16
b.2) Distribuição de freqüências intervalar
n
P (md ) 
2
 fi

l * 
 F (ant ).h *
2



Mediana -> md 
f*
 fi

l * 
 F (ant ).h *
4
Quartil 1 -> q 


1
f*
Sendo: l* = limite inferior
L* = limite superior
F(ant) = freq. acumulada anterior
h*= amplitude de classe
f* = freqüência simples da classe
 3 fi

l * 
 F (ant ).h *
 4

Quartil 3 -> q 
3
f*
onde:
l md  limite inferior da classe que contém a separatriz;
n
 posição da separatriz;
2
Fant  freqüência acumulada da classe anterior a que contém a mediana;
f md  freqüência absoluta da classe que contém a mediana;
h
 amplitude do intervalo de classe;
Exemplo:
Altura dos dos Alunos da ADM, 1º semetre da UNIFRA, 2010/1
Altura (cm)
xi
fi
150
|--158
154
4
158
|--166
162
12
166
|--174
170
20
174
|--182
178
13
182
|--190
186
5
---54

Fonte: Dados Hipotéticos
3.3 - Moda (Mo)
É definida como sendo a observação de maior freqüência.
a) Dados Não Tabelados
Exemplo:
3 4 4 4 5 5 6 6 7 8 9
 Mo = 4 (unimodal)
 (amodal)
5 6 7 8 9 10 11 12 13
 Mo = 
1 1 2 2 3 3 3 4 5 5 5
 Mo1 = 3 Mo2 = 5 (bimodal)
 (amodal)
5 5 6 6 7 7 8 8
 Mo = 
5 5 6 6 7 7 8
 Mo1 = 5 Mo2 = 6 Mo3 = 7 (trimodal)
Obs.: Acima de 4 modas usamos o termo polimodal.
b) Dados Tabelados
b.1) Distribuição de freqüências pontual
17
Moda -> mo 
L * l *
2
- Moda Bruta (Mob): é o ponto médio da classe de maior freqüência
b.2) Distribuição de freqüências intervalar
- Moda de Czuber (Moc)
O processo para determinar a moda usado por Czuber leva em consideração as freqüências
anteriores e posteriores à classe modal.
 1  f Mo  f ant
 1 
.h  
Mo c  l Mo  
 1   2 
 2  f Mo  f pos
onde:
l Mo
fMo
h
fant
f pos
 limite inferior da classe modal;
 freqüência absoluta da classe modal;
 amplitude do intervalo de classe;
 freqüência absoluta da classe anterior a classe modal;
 freqüência absoluta da classe posterior a classe modal;
Exemplo:
Altura dos dos Alunos da ADM, 1º semetre da UNIFRA, 2011/1
Altura (cm)
xi
fi
150
|--158
154
4
158
|--166
162
12
166
|--174
170
20
174
|--182
178
13
182
|--190
186
5
---54

Fonte: Dados Hipotéticos
Exercicios sobre mediana e moda:
1) Ache a mediana e moda nas tabelas abaixo e seu histograma:
a) Um grau de nebulosidade, registrano em décimos, ocorre de acordo com a distribuição abaixo:
NEBUL
fi
0 |--- 0,5 |---1,5 |---2,5 |---3,5 |--- 4,5 |---5,5 |---6.5 |---7,5 |--- 8,5 |--- 9,5 |--- 10,5
320 125 75 65
45
45
55
65
90
145
676
18
b)
c)
d)
Peso
(Kg)
4,0
Freqüência
4,3
4,5
4,6
4,7
4,8
4,9
5,0
5,1
5,5
total
3
5
8
6
5
4
3
3
2
41
2
19
4 - MEDIDAS DE VARIABILIDADE OU DISPERSÃO
Visam descrever os dados no sentido de informar o grau de dispersão ou afastamento dos valores
observados em torno de um valor central (representativo) chamado média. Informa se um conjunto de
dados é homogêneo (pouca variabilidade) ou heterogêneo (muita variabilidade).
4.1 - Desvio Quadrático ou Variância - S2 (amostra) ou 2 (populacional)
a) para dados não tabelados: (Fórmula sem freqüência)
Variância -> s
2
x

  xi

 n

2
i
n
x
Desvio Padrão -> s 




2
  xi

 n

2
i
n




2
Exemplo:
Idade de cinco alunos da ADM, 1º semetre da UNIFRA, 2010/1:
19 22 20 16 26
Exercicios:
Ache a variância e o Desvio Padrão dos dados abaixo: Sem intervalo de freqüência.
a) 40 , 45, 48 , 52 , 54 , 62 , 70
b) 21,25, 28,29, 30, 33, 35, 40, 41, 50
c) 10,12,13,14,18,19,21,25
b)
para dados tabelados (Fórmula com freqüência)
Variância -> s
2
fx

Desvio Padrão -> s 
i
n
2
i
  f i xi

 n

fx
i
n
2
i




2
  f i xi

 n





2
Exemplo:
Altura dos dos Alunos da ADM, 1º semetre da UNIFRA, 2010/1
Altura (cm)
xi
fi
150
|--158
154
4
158
|--166
162
12
166
|--174
170
20
174
|--182
178
13
182
|--190
186
5
---54

Fonte: Dados Hipotéticos
20
Exercicio
1) A tabela abaixo apresenta a distribuição de freqüência dos salários mensais em reais, de 65
empregados da companhia P & R. Calcule a variancia e o desvio padrão.
Salários (R$)
5.000 ---- 6.000
6.000 ---- 7.000
Nº de Empregados
8
10
7.000 ---- 8.000
16
8.000 ---- 9.000
14
9.000 ---- 10.000
10
10.000 ---- 11.000
5
11.000 ---- 12.000
2
 65
Total
2) Foi feito um inquérito a 40 pessoas que compraram carro novo com o objetivo de se saber quantas
reparações, ou substituições de peças, foram feitas durante o primeiro ano utilização dos veículos.
Obtiveram:
1
3
5
2
4
2
1
1
1
3
2
1
2
1
4
3
2
0
2
1
3
1
1
0
3
2
3
4
2
7
1
2
1
4
0
3
2
3
1
5
Organize os dados numa tabela de freqüências. (freqüências absolutas, relativas, e freqüências
acumuladas, absolutas e relativas), ache a Mediana os Quartis (Q 1 e Q3) o desvio padrão e a
variância.
4.2 - Desvio Padrão [S (amostra) ou  (população)]
 ou S  Variância
Exemplos:
1) Idade de cinco alunos da ADM, 1º semetre da UNIFRA, 2009/1:
19 22 20 16 26
21
2) Altura dos dos Alunos da ADM, 1º semetre da UNIFRA, 2009/1
Altura (cm)
xi
fi
150
|--158
154
4
158
|--166
162
12
166
|--174
170
20
174
|--182
178
13
182
|--190
186
5
---54

Fonte: Dados Hipotéticos
4.3 - Medidas de Dispersão Relativa
4.3.1 - Coeficiente de Variação de Pearson
É a medida de variabilidade em geral expressa em porcentagem, e tem por função determinar o grau
de concentração dos dados em torno da média.
Obs.:
C.V . 

x 100

População
C.V . 
S
x 100
X
Amostra
0%  C.V.P.  100%
C.V.P  50%  a média é representativa
C.V.P.  0  é a maior representatividade da média (S = 0)
Exemplos:
1) Idade de cinco alunos da ADM, 1º semetre da UNIFRA, 2010/1:
19 22 20 16 26
2) Altura dos dos Alunos da ADM, 1º semetre da UNIFRA, 2010/1
Altura (cm)
xi
fi
150
|--158
154
4
158
|--166
162
12
166
|--174
170
20
174
|--182
178
13
182
|--190
186
5
---54

Fonte: Dados Hipotéticos
22
5 – NOÇÕES DE AMOSTRAGEM
5.1 - Conceitos em Amostragem
Inferência Estatística - é o processo de obter informações sobre uma população a partir de
resultados observados ma Amostra.
Amostragem - É o processo de retirada de informações dos "n" elementos amostrais, na qual deve
seguir um método adequado (tipos de amostragem).
FIGURA 1 – Inferência e amostragerm
5.2 - Plano de Amostragem
1º) Definir os Objetivos da Pesquisa
2º) População a ser Amostrada
Parâmetros a ser Estimados (Objetivos)
3º) Definição da Unidade Amostral
Seleção dos Elementos que farão parte da amostra
4º) Forma de seleção dos elementos da população
aleatória simples
sistemática

Tipo de Amostragem: 
estratificada
conglomerados
5º) Tamanho da Amostra
Exemplo: Moradores de uma Cidade (população alvo)
 própria

Objetivo: Tipo de Residência  alugada
emprestada

Unidade Amostral: Domicílios (residências)
Elementos da População: Família por domicílio
aleatória simples

Tipo de Amostragem: sistemática
estratificada

23
5.3 - Tipos de Amostragem
5.3.1 - Amostragem Simples ou Ocasional
É o processo mais elementar e freqüentemente utilizado. Todos os elementos da população tem igual
probabilidade de serem escolhidos. Para uma população finita o processo deve ser sem reposição.
Todos os elementos da população devem ser numerados. Para realizar o sorteio dos elementos da
população pode-se usar a Tabela de Números Aleatórios ou gerar números aleatórios por meio de um
software;
5.3.2 - Amostragem Sistemática
Trata-se de uma variação da Amostragem Aleatória Ocasional, conveniente quando a população está
naturalmente ordenada, como fichas em um fichário, lista telefônica, etc.
Ex.:
N = 500 (População)
n = 50 (Amostra)
então r 
N
 100 , (teremos uma Progressão Aritmética (PA) de razão 10)
n
Sorteia-se usando a Tabela de Números Aleatórios um número entre 1 e 10, (x=3), o número sorteado
refere-se ao 1o elemento da amostra, logo os elementos da amostra serão:
3
13
23
33
43
......
Para determinar qualquer elemento da amostra podemos usar a fórmula do termo geral de uma P.A.
an  a1  (n  1).r
5.3.3 - Amostragem Estratificada
É um processo de amostragem usado quando nos depararmos com populações heterogêneas, na
qual pode-se distinguir subpopulações mais ou menos homogêneas, denominados estratos.
Após a determinação dos estratos, seleciona-se uma amostra aleatória de cada uma subpopulação
(estrato).
As diversas subamostras retiradas das subpopulações devem ser proporcionais aos respectivos
números de elementos dos estratos, e guardarem a proporcionalidade em relação a variabilidade de
cada estrato, obtendo-se uma estratificação ótima.
Tipos de variáveis que podem ser usadas em estratificação: idade, classes sociais, sexo, profissão,
salário, procedência, etc.
5.3.4 - Amostragem por Conglomerados (ou Agrupamentos)
Algumas populações não permitem, ou tornam-se extremamente difícel que se identifiquem seus
elementos, mas podemos identificar subgrupos da população. Em tais casos, uma amostra aleatória
simples desses subgrupos (conglomerados) podem ser escolhida, e uma contagem completa deve
ser feita no conglomerado sorteado.
Agregados típicos são: quarteirões, famílias, organizações, agências, edifícios, etc.
24
5.4 – Tamanho da Amostra
5.4.1 - Introdução
Os pesquisadores de todo o mundo, na realização de pesquisas científicas, em qualquer setor da
atividade humana, utilizam as técnicas de amostragem no planejamento de seus trabalhos, não só
pela impraticabilidade de poderem observar, numericamente, em sua totalidade determinada
população em estudo, como devido ao aspecto econômico dessas investigações, conduzidos com um
menor custo operacional, dentro de um menor tempo, além de possibilitar maior precisão nos
respectivos resultados, ao contrário, do que ocorre com os trabalhos realizados pelo proceso
censitário.
A técnica da amostragem, a despeito de sua larga utilização, ainda necessita de alguma didática mais
adequada aos pesquisadores iniciantes.
Na teoria da amostragem, são consideradas duas dimensões:
1ª) Dimensionamento da Amostra;
2ª) Composição da Amostra.
Tabela utilizada para saber sem fazer calculos quantas amostras podemos utilizar para n
população:
25
Tamanho da Amostra
Obs.: um passo importante antes de iniciar o cálculo do tamanho da amostra é definir qual o erro
amostral tolerável para o estudo que será realizado.
Observe a seguinte fórmula:


, onde:
n0 é a primeira aproximação do tamanho da amostra
E0 é o erro amostral tolerável (Ex.: 2% = 0,02 )
, onde:
 N é o número de elementos da população
 n é o tamanho da amostra
Observe o seguinte exemplo para compreender melhor:
Exemplo
Em uma empresa que contém 2000 colaboradores, deseja-se fazer uma pesquisa de satisfação.
Quantos colaboradores devem ser entrevistados para tal estudo?
Resolução
N = 2000
Definindo o erro amostral tolerável em 2%
E0 = 0,02
n0 = 1 / (E0)2
n0 = 1 / (0,02)2
n0 = 2500
n = (N . n0) / (N + n0)
n = (2000 . 2500) / (2000 + 2500)
n = 1111 colaboradores
Com o erro amostral tolerável em 2%, 1111 colaboradores devem ser entrevistados para a
pesquisa.
Vamos repetir os cálculos, definindo o erro amostral tolerável em 4%.
N = 2000
E0 = 0,04
n0 = 1 / (E0)2
n0 = 1 / (0,04)2
n0 = 625
n = (N . n0) / (N + n0)
n = (2000 . 625) / (2000 + 625)
n = 476 colaboradores
Através deste segundo cálculo, é possível observar que, quando aumentamos a margem de erro,
o tamanho da amostra reduz.
E se houvesse 300.000 colaboradores na empresa?
N = 300.000
E0 = 0,04
n0 = 1 / (E0)2
n0 = 1 / (0,04)2
n0 = 625
n = (N . n0) / (N + n0)
n = (300.000 . 625) / (300.000 + 625)
n = 623 colaboradores
Observe que a diferença entre n e n0, neste último cálculo, é muito pequena.
Portanto: se o número de elementos da população (N) é muito grande, a primeira aproximação
do tamanho da amostra já é suficiente.
26
Arranjo
Arranjos simples de n elementos tomados s a s (s ≤ n) são os diferentes agrupamentos
ordenados que se podem formar com p dos n elementos dados. Indica-se por An,s ou
desses agrupamentos, que calculamos assim:
o total
Exemplos:
A8,4 (onde n = 8 e p = 4)
Exemplo 1: Calcular
A 6,2
a)
b)
A5, 4  A3, 2
A4, 2  A2,1
Exemplo 2: Calcular E = A7,3 + A3,2 – A5,4
Exemplo 3: Quantos números de 3 algarismos podemos formar com os algarismos 1, 2, 3, 4, 5 e 7 ,
sem repeti-los?
Exemplo 4: Quantos números pares de 4 algarismos podemos formar com os algarismos 0, 1, 2, 3, 4,
5 e 6, sem repeti-los?
27
Exemplo 5: Numa sala de 20 alunos, deseja-se formar grupos de estudos de três elementos, que
tenham projetos diferentes.
a) De quantos modos diferentes se podem escolher os alunos?
De quantas maneiras se podem escolher os alunos sabendo que dois dos alunos não podem
b)
pertencer ao mesmo grupo?
Exercícios:
Calcule:
1) Quantos números de 5 algarismos distintos podemos formar com os algarismos 1, 2, 3, 4, 5,
6, 7, 8 e 9?
2) Quantos números de 3 letras, sem repetição, podemos formar com as 9 primeiras letras do nosso
alfabeto?
3) Quantos números de 3 algarismos, sem repetição, podemos formar com os algarismos 1, 2, 3, 4,
5, 6, 7, 8 e 9, incluindo sempre o algarismo 4?
4) Quantos números de 4 algarismos distintos podemos formar com os algarismos 0,1, 2, 3, 4, 5, 6,
7, 8 e 9 ?
5) Quantos são os números compreendidos entre 2 000 e 3 000, formados por algarismos distintos
escolhidos entre 1, 2, 3, 4, 5, 6, 7, 8 e 9 ?
6) Cinco homens e uma mulher pretendem utilizar um banco de cinco lugares. De quantas maneiras
diferentes podem sentar-se,nunca fincando em pé a mulher?
28
Permutação
Quando k = n, isto é, quando os arranjos abrangem a totalidade dos elementos, temos o que se
chama PERMUTAÇÃO de n elementos, cuja representação simbólica é Pn.
Pn = n!
Exemplo:
Considere uma urna com 5 bolas numeradas de 1 a 5. De quantas maneiras diferentes
podemos retirar, sem reposição, as 5 bolas.
Solução:
Aqui teremos uma seqüência de 5 bolas numeradas onde cada seqüência nos fornece um número
diferente e o quantitativo de bolas selecionada é o quantitativo que se encontra na urna. Logo temos
uma permutação de 5 bolas ou um arranjo de 5 bolas tomadas 4 a 4:
P5 = 5 . 4 . 3 . 2 . 1 = 120 maneiras diferentes
Exercícios:
1) Calcular E, sendo E=
 P  P4 

P5  2. 6
 P2 
2) Quantos números de4algarismos distintos podem ser formados, usando-se os algarismos 1, 3, 5
e 7?
3) Considere os números obtidos do número 12345, efetuando-se todas as permutações de seus
algarismos. Colocando esses números em ordem crescente, qual o lugar ocupado pelo número
43521?
4) Formados e dispostos em ordem alfabética todos os anagramas da palavra ESAN, determine a
posição que ocupará apalavra NASE?
5) Calcule o número de permutação que podem ser feitas com as letras da palavra CAPITULO, de
forma que não fiquem juntas duas vogais e duas consoantes.
29
COMBINAÇÕES
Quando necessitamos formar conjuntos de k elementos não importando a ordem dos elementos, não
podemos utilizar a definição de arranjo onde a ordem é relevante.
Temos então a definição de combinação de n elementos tomados k a k, cuja definição é:
n!
n
C nK    
 k  k!(n  k )!
Exemplo:
Considere o lançamento de 6 moedas. De quantas maneiras diferentes podemos obter 4 caras?
Solução: Este experimento leva em consideração somente o total de caras e coroas, não importando
a ordem com que os resultados aparecem. Assim, estamos no âmbito das combinações, ou seja,
Exercícios:
1) De quantas maneiras podemos escalar um time de futebol de salão disposto de 8 jogadores?
2) Numa sala, temos 5 rapazes e6moças.quantos grupos podemos formar de 2 rapazes e 3 moças?
3) Numa classe de10 estudantes, um grupo de 4 será selecionada para uma excursão.De quantas
maneiras o grupo poderá ser formado se dois dos 10 são marido e mulher e só irão juntos?
4) Numa turma de 30 alunos, 9 tem motocicleta e outros 8 tem bicicleta.quantos grupos diferentes
de 7 alunos se podem formar naquela turma, de modo a haver em cada grupo 4 motocicletas e 2
bicicletas?
5) Num plano temos 16 pontos; 9 deles pertencem a uma reta. Quantas circunferências podem
passar por 3 quaisquer daqueles pontos?
30
6) Sobre uma reta, marcam-se 8 pontos e sobre uma outra reta, pararela a primeira marcam-se 5
pontos. Quantos triângulos obteremos unindo 3 quaisquer desses pontos?
Introdução à Probabilidade
As origens da probabilidade remontam ao século XVI. As aplicações iniciais referiam-se quase
todas, a jogos de azar. Os jogadores aplicavam o conhecimento da teoria das probabilidades para
planejar estratégias de apostas.
Atualmente a utilização das probabilidades ultrapassou de muito o âmbito desses jogos. Hoje
os governos, as empresas, as organizações profissionais incorporam a teoria das probabilidades em
seus processos diários de deliberações. Independentemente de qual seja a aplicação em particular, a
utilização das probabilidades indica que existe um elemento de acaso, ou de incerteza, quanto à
ocorrência ou não de um evento futuro. Assim é que, em muitos casos, pode ser virtualmente
impossível afirmar por antecipação o que ocorrerá, mas é possível dizer o que pode ocorrer.
Há numerosos exemplos de tais situações no campo dos negócios e do governo. A previsão
da procura de um novo produto, o cálculo dos custos da produção, a previsão das safras, a compra
de apólices de seguros, a avaliação da redução de impostos sobre a inflação. As probabilidades são
úteis, pois ajudam a desenvolver estratégias.
O ponto central em todas as situações é a possibilidade de quantificar quão provável é determinado
evento. As probabilidades são utilizadas para exprimir a chance de ocorrência de determinado evento.
O estudo das probabilidades é importante pois elas são a base para o estudo estatístico.
Experimento aleatório
Experimentos aleatórios são aqueles que, mesmo repetidos várias vezes sob condições
semelhantes, apresentam resultados imprevisíveis.
Características dos experimentos aleatórios:
1. Podem ser repetidos indefinidamente sob as mesmas condições.
2. Não se pode adiantar um resultado particular, mas podem-se descrever todos os resultados
possíveis.
3. Se repetidos muitas vezes apresentarão uma regularidade em termos de freqüência de resultados.
Exemplos: lançamento de uma moeda, lançamento de um dado, aposta na loteria, ....
Ao descrever um experimento aleatório deve-se especificar não somente que operação ou
procedimento deva ser realizado, mas também o que deverá ser observado. (Note a diferença entre o
2º e o 3º)
Joga-se um dado e observa-se o número obtido na face superior.
Joga-se uma moeda 4 vezes e o observa-se o número de caras obtido.
Joga-se uma moeda 4 vezes e observa-se a seqüência de caras e coroas.
Um lote de 10 peças contém 3 defeituosas. As peças são retiradas uma a uma
(sem reposição) até que a última defeituosa seja encontrada. Conta-se o número de peças retiradas.
Uma lâmpada nova é ligada e observa-se o tempo gasto até queimar.
Lança-se uma moeda até que ocorra uma cara e conta-se então o número de lançamentos
necessários.
Lançam-se dois dados e anota-se o total de pontos obtidos.
Lançam-se dois dados e anota-se o par obtido.
31
Espaço amostral
O espaço amostral (S) de um experimento aleatório é o conjunto de todos os possíveis resultados do
experimento.
n(S) é o número de elementos do conjunto S, ou o número de resultados possíveis.
Exemplo:
Um experimento é o lançamento de uma moeda. Os possíveis resultados são cara ou coroa, então,
S={cara, coroa}.
Em dois lançamentos de uma moeda, sendo interessante observar a ordem dos resultados, os
possíveis resultados são:
1) cara e cara, 2) cara e coroa, 3) coroa e cara e 4) coroa e coroa.
O espaço amostral é S={(Ca,Ca), (Ca,Co), (Co,Ca) e (Co,Co)}. n(S)=4
Eventos
Chama-se de evento qualquer subconjunto do espaço amostral S de um experimento aleatório, ou
seja, qualquer resultado do espaço amostral.
n(A) é o número de resultados associados ao evento A.
Exemplo: no lançamento de uma moeda S = {cara, coroa}. Um evento de interesse A pode ser “obter
cara no lançamento de uma moeda” e n (A) = 1.
No lançamento de um dado, o evento de interesse (A) pode ser obter face par e n(A)=3.
A probabilidade de um evento
Seja A um evento. A probabilidade de este evento ocorrer é dada por P(A), que é um número
entre 0 e 1. Quanto mais próxima a probabilidade estiver de 1, maior será sua chance de ocorrência.
A um evento impossível atribui-se probabilidade 0, enquanto que um evento certo tem probabilidade 1.
Há três maneiras diferentes de calcular ou estimar probabilidades: o método clássico, quanto o
espaço amostral tem resultados igualmente prováveis. O método empírico, que se baseiam na
freqüência relativa de ocorrência de um evento num grande número de provas repetidas e o método
subjetivo, que utiliza estimativas pessoais de probabilidade, baseadas num certo grau de crença. Em
geral vamos utilizar o método clássico de cálculo de probabilidades.Quando os resultados são
equiprováveis, a probabilidade de cada resultado é função do número de resultados possíveis:
P(A) =
número de resultados associados ao evento A
número total de resultados possíveis
Exemplo:
Experimento: lançar um dado e observar a face superior
Espaço amostral: S= {1,2,3,4,5,6} n(S) = 6
Evento A: face par n(A)=3
P(A)= 3/6 = ½ = 0,5 ou 50%
32
Exercícios
1) No lançamento de um dado, determinar a probabilidade de se obter:
a) o número 2
b) um número par
c) um número múltiplo de 3
2) De um baralho com 52 cartas tiram-se, sucessivamente, sem reposição, duas cartas. Determinar a
probabilidade dos eventos:
a) as duas cartas são “damas”,
b) as duas cartas são de “ouro”.
3) Complete a tabela com os valores calculados da probabilidade dos eventos ocorrerem.
Experimento
Evento
P(Evento)
Cara
Lançar uma moeda uma vez
Face 3
Lançar um dado uma vez
6 vermelho
Extrair uma carta de um baralho com 52
cartas
Valete de ouros
Extrair uma carta de um baralho de 52
cartas
Cálculo das probabilidades
Muitas aplicações da estatística exigem a determinação da probabilidade de combinações dos
eventos. Há duas características de combinações. Pode ser necessário determinar a probabilidade de
ambos os eventos acontecerem P(A e B) ou a probabilidade de um deles, A ou B, ou seja, P(A ou B).
Em um prédio com 2 elevadores, poderíamos perguntar: Qual a probabilidade de ambos elevadores
estarem em serviço? Ou então, Qual a probabilidade de um ou outro elevador estar em serviço?
Ambos implica P(A e B)
Um ou outro implica P(A ou B)
33
Regra da adição:
A regra da adição leva em conta a ocorrência do evento A ou do evento B ou de ambos os eventos e
é denotada por P(AUB).
P(A ou B) = P(A) + P(B) – P(A e B)
A
B
P(A U B) = P(A) + P(B) – P(A  B)
P(A  B)
Quando os eventos são mutuamente excludentes (não tem elementos em comum), então a
probabilidade de ambos é nula e o termo P(A e B) será zero.
Se A e B são mutuamente excludentes
P(A U B) = P(A) + P(B)
Exercícios:
1. Numa urna existem 10 bolas numeradas de 1 a 10. Retira-se uma bola ao acaso. Qual a
probabilidade do número ser par ou maior que 4?
2. Numa urna existem 10 bolas numeradas de 1 a 10. Retira-se uma bola ao acaso. Qual a
probabilidade do número ser um número primo ou maior que 8?
3.Qual a probabilidade de se jogar um dado e se obter o número 3 ou o numero ímpar?
4.Numa caixa estão 20 bolas numeradas de 1 a 20. Retira-se 1bolaao acaso.qual é a probabilidade de
se obter maior que o numero 16 ou um numero múltiplo de 4.
34
Eventos Complementares
Sabemos que um evento pode ocorrer ou não. Sendo p a probabilidade de que ele ocorra
(sucesso) e q a probabilidade de q ele não ocorra (insucesso), para que um mesmo evento existe
sempre a relação:
p + q = 1 => q = 1 – p
Assim, se a probabilidade de se realizar um evento é p=1/5, a probabilidade de que ele não
ocorra é:
q = 1 – p => q = 1 – (1/5) = 4/5
Sabemos que a probabilidade de tirar o 4 no lançamento de um dado é p = 1/6. logo a
probabilidade de não tirar o 4 no lançamento de um dado é:
q = 1 – (1/6) = >
q = 5/6
Outro modo de aplicarmos a probabilidade de um evento completar é quando que usar a fórmula de
COMBINAÇÃO para resolvermos o exercício:
Sejam A e A dois eventos de um espaço amostral U; sendo A o evento complementar de A, temos:
P(A) + P(A) = 1
A
U
A
A+A=U
n(A) + n(A) = n(U) =>
n( A) n( A) n(U )


 P( A)  P( A)  1
n(U ) n(U ) n(U )
Exemplo: Consideramos um conjunto de 10 frutas, das quais 3 estão estragadas. Escolhendose aleatoriamente 2 frutas desse conjunto, determinar a probabilidade de que: a) ambas não estejam
estragadas b)pelo menos uma esteja estragada
Resolução: a) Calculo do número de maneiras pelas quais duas frutas podem ser escolhidas:
Cálculo do número de maneiras pelas quais duas frutas podem se ser escolhidas sem
estarem estragadas:
b) A é o evento: pelo menos uma fruta esta estragada
Exercícios:
1)De um lote de 14 peças, das quais 5 são defeituosas, escolhemos 2, aleatoriamente.
Determine:
a) a probabilidade de que ambas sejam defeituosas;
b) a probabilidade de que ambas não sejam defeituosas;
c) a probabilidade de que uma seja defeituosa.
35
2) Uma urna contém 3 bolas brancas e 4 pretas. Tiramos, sucessivamente, 2 bolas.
Determine a probabilidade de:
a) as bolas terem a mesma cor;
b) as bolas terem cores diferentes.
Eventos Independentes
Dizemos que dois eventos são independentes quando a realização ou a não realização de um
dos eventos afeta a probabilidade de realização do outro e vice-versa.
Por exemplo, quando lançamos dois dados, o resultado obtido em um deles independe do
resultado obtido no outro.
Se dois eventos são independentes, a probabilidade de que eles se realizem simultaneamente
é igual ao produto das probabilidades de realização dos dois eventos.
Assim, sendo p1, a probabilidade de realização do primeiro evento e p2 a probabilidade de
realização do segundo evento, a probabilidade de que tais eventos se realizem simultaneamente é
dada por:
p = p1 x p2
Exemplo: Lançamento de dois dados. A probabilidade de obtermos 1 no primeiro dado é:
p1=1/6. A probabilidade de obtermos 5 no segundo dado é: p2 = 1/6
Logo a probabilidade de obtermos simultaneamente, 1 no primeiro e 5 no segundo é: p =
1 1 1
x 
6 6 36
Eventos Mutuamente Exclusivos
Dizemos que dois ou mais eventos são mutuamente exclusivos quando a realização de um
exclui a realização do(s) outro(s).
Assim, no lançamento de uma moeda, o evento “tirar cara” e o evento “tirar coroa”, são
mutuamente exclusivos, já que, ao se realizar um deles, o outro não se realiza. Se dois eventos são
mutuamente exclusivos, a probabilidade de que um ou outro se realize é igual à soma das
probabilidades de que cada um deles se realize:
p = p 1 + p2
Exemplo: Lançamos um dado. A probabilidade de se tirar o 3 ou o 5 é:
p=
1 1 2 1
   , pois, como vimos dois eventos são mutuamente exclusivos.
6 6 6 3
Exercícios:
1) De dois baralhos de 52 cartas retiram-se, simultaneamente, uma carta do primeiro baralho e uma
carta do segundo. Qual a probabilidade de a carta do primeiro baralho ser um rei e a segunda carta
ser 5 de paus?
36
2) Uma urna A contém: 3 bolas brancas, 4 pretas, 2 verdes; uma urna B contém: 5 bolas brancas, 2
pretas, 1 verde; uma urna C contém: 2 bolas brancas, 3 pretas, 4 verdes. Uma bola é retirada de cada
urna. Qual a probabilidade de as três bolas retiradas da primeira, segunda e terceira urnas serem,
respectivamente, branca , preta e verde?
3) No lançamento de um dado, qual a probabilidade de se obter um numero não inferior a 5?
4) São dados dois baralhos de 52 cartas. Tiramos, ao mesmo tempo, uma carta do primeiro baralho e
uma carta do segundo. Qual a probabilidade de tirarmos uma dama e um rei, não necessariamente
nessa ordem?
5) Dois dados são lançados conjuntamente. Determine a probabilidade de soma ser 10 ou mais que
10.
6) Uma moeda é lançada 4 vezes. Qual a probabilidade de que apareça coroa nas quatro vezes?
7) Retirando-se duas cartas ao acaso, sem reposição, de um baralho de 52 cartas, qual a
probabilidade de ser a primeira de paus e a segunda de copas?
8) Considerem-se duas caixas, I e II. Na caixa I, há 4 bolas pretas e 6 bolas azuis, e na caixa II, há 8
bolas pretas e 2 bolas azuis. Escolhe-se ao acaso, uma caixa e, em seguida, dela se tira uma bola.
Qual a probabilidade de que esta bola seja : a) preta? b) azul?
37
Distribuições Discretas mais Importantes
As principais distribuições discretas são: Distribuição Binomial e Distribuição Poisson e Distribuiç.
Distribuição Binomial
Seja um processo composto de uma seqüência de observações independentes, onde o resultado de
cada observação pode ser um sucesso ou uma falha. Se a probabilidade de sucesso é constante e
igual a p, a distribuição do número de sucessos seguirá o modelo Binomial.
A distribuição Binomial é usada com freqüência no controle de qualidade. É o modelo apropriado
quando a amostragem é feita sobre uma população infinita ou muito grande.
A distribuição binomial possui quatro propriedades essenciais:
1. As observações possíveis podem ser obtidas através de dois diferentes métodos de amostragem.
Cada observação pode ser considerada como se tivesse sido selecionada a partir de uma população
infinita sem reposição ou a partir de uma população finita com reposição.
2. Cada observação pode ser classificada em uma de duas categorias mutuamente excludentes e
coletivamente exaustivas, usualmente chamadas sucesso ou falha.
3. A probabilidade de uma observação ser classificada como sucesso (p) é constante de observação
para observação. Assim sendo, a probabilidade de fracasso 1-p também é constante.
4. O resultado (isto é, sucesso ou fracasso) de qualquer observação independe do resultado de
qualquer outra observação.
Em aplicações de controle da qualidade, x em geral representa o número de defeituosos observados
em uma amostra de n itens.
2. Cada observação pode ser classificada em uma de duas categorias mutuamente excludentes e
coletivamente exaustivas, usualmente chamadas sucesso ou falha.
3. A probabilidade de uma observação ser classificada como sucesso (p) é constante de observação
para observação. Assim sendo, a probabilidade de fracasso q =1-p também é constante.
4. O resultado (isto é, sucesso ou fracasso) de qualquer observação independe do resultado de
qualquer outra observação.
Em aplicações de controle da qualidade, x em geral representa o número de defeituosos observados
em uma amostra de n itens.
n
  , representa o número de combinações de n objetos tomados x de cada vez.
x
P(x) = probabilidade de x sucessos uma vez que n e p são conhecidos
n = tamanho da amostra
p = probabilidade de sucesso => 1-p = probabilidade de falha
x = número de sucessos na amostra (x=0, 1, 2, ..., n)
Essa expressão é conhecida como lei binomial das probabilidades. Só pode ser aplicada a
experiências aleatórias com as seguintes características:
1º) A experiência é repetida um número n de vezes, nas mesmas condições.
2º) Após cada experiência ocorre evento A (sucesso) ou evento A (fracasso).
3º) p é constante em todas as n experiências.
4º) As experiências são independentes uma da outra.
Exemplo:
1)Um dado é lançado 6 vezes. Calcular a probabilidade de ocorrer um 3 ou um 4 duas vezes.
Resolução: Quando lançamos um dado podemos obter 6 resultados possíveis: 1,2,3,4,5 ou 6. a
probabilidade de ocorrer um 3 ou um 4 em cada lançamento é:
P=
2 1
 .
6 3
38
A probabilidade de não ocorrer um 3 ou um 4 é q = 1-
1 2
 . O numero de sucessos é x=2 logo: =>
3 3
P(x) =
2
4
80
 6  1   2 
P(x) =    .  
ou p= 32,92%
243
 2  3   3 
2) Um jogador de xadrez tem 2/5 de probabilidade de vitória quando joga. Na realização de cinco
partidas, determinar a probabilidade de esse jogador vencer:
a) duas partidas
b) mais que a metade das partidas
3) Um processo industrial opera com média de 1% de defeituosos. Baseado em amostras de 100
unidades, calcule as probabilidades de uma amostra apresentar 0, 1, 2, 3 e 4 defeituosos. Plote a
distribuição de probabilidade correspondente.
4)Um processo opera segundo uma chance de falha de 2%. Coletando amostras de 25 unidades, qual
a probabilidade de uma amostra selecionada apresentar 2 defeituosos ou menos.
5) Imagine que para o processo anterior, fossem coletadas amostras de 50 unidades e o critério para
parar o processo e procurar causas especiais fosse x = 1 ou mais. Calcule a percentagem de vezes
que o processo seria interrompido logo após a amostragem.
39
Distribuição de Poisson
A aplicação típica da distribuição de Poisson no controle da qualidade é como um modelo para o
número de defeitos (não-conformidades) que ocorre por unidade de produto (por m 2, por volume ou
por tempo).
Diz-se que existe um processo de Poisson se pudermos observar eventos discretos numa área de
oportunidade – um intervalo contínuo (de tempo, de comprimento, de área,...) de maneira tal que, se
encurtarmos a área de oportunidade ou intervalo suficientemente:
1. A probabilidade de se observar exatamente um sucesso no intervalo é estável;
2. A probabilidade de se observar mais de um sucesso no intervalo é zero;
3. A ocorrência de um sucesso em qualquer intervalo é estatisticamente independente da ocorrência
em qualquer outro intervalo.
A distribuição de Poisson tem um parâmetro  (lambda) que é a média ou o número esperado de
sucessos por unidade. A variância desta distribuição é s2 =  . O número de sucessos x da variável
aleatória de Poisson varia de 0 a  .
A expressão matemática para a distribuição de Poisson para se obterem x sucessos, dado que 
sucessos são esperados é:
P( x) 
e   . x
x!
onde x = 0,1,2,....
Sendo que:
P(x) = probabilidade de x sucessos, dado o conhecimento de
 = número esperado de sucessos
e = constante matemática (aproximadamente 2,71828)
x = número de sucessos por unidade
.
Exemplos:
1) Suponha que o número de defeitos no cordão de solda de uma carroceria siga uma distribuição de
Poisson com  = 2. Então a probabilidade de uma carroceria apresentar mais de 3 defeitos será:
Então a probabilidade de uma carroceria apresentar mais de 3 defeitos será:
P( x> 3) = 1 – P( x < 3) = 1-[ P(x= 0) + P(x= 1) + P(x= 2) + P(x= 3)]
2) Se chegam em média 2 carros por minuto em um posto de gasolina, qual a probabilidade de que
cheguem exatamente 5 carros em dois minutos?
Neste caso o tempo é diferente do tempo correspondente ao l. Então se deve transformar o  para
que ele corresponda ao tempo de 2 minutos. Chegam em média 2 carros por minuto => chegam em
média 4 carros em 2 minutos.
40
Exercícios:
1. O setor financeiro de uma loja de departamentos está tentando controlar o número de erros
cometidos na emissão das notas fiscais. Suponha que esses erros sigam o modelo de Poisson com
média l = 0,03. Qual a probabilidade de uma nota selecionada ao acaso conter 1 ou mais erros?
2. Em uma indústria automotiva, defeitos superficiais de pintura ocorrem a uma taxa de 0,15
defeitos/unidade. Encontre a probabilidade que uma unidade escolhida ao acaso apresente 1 ou mais
defeitos superficiais.
3. Em uma empresa industrial ocorrem, em média, 3 acidentes por mês. Qual a probabilidade de que
em um determinado mês, ocorra apenas um acidente?
4. Dez por cento das ferramentas produzidas por um certo processo de fabricação revelaram-se
defeituosas. Determinar a probabilidade de, em uma amostra de 10 ferramentas escolhidas ao acaso,
exatamente duas serem defeituosas mediante o emprego da distribuição de Poisson.
5. Se a probabilidade de um indivíduo sofrer uma reação nociva, resultante da injeção de um
determinado soro é 0,001, qual a probabilidade de, entre 2000 indivíduos:
a) exatamente 3 sofrerem aquela reação?
b) Mais de 2 sofrerem a reação?
41
Distribuição Normal
A distribuição Normal é a mais familiar das distribuições de probabilidade e também uma das mais
importantes em estatística. Esta distribuição tem uma forma de sino.
A equação da curva Normal é especificada usando 2 parâmetros: a média populacional
desvio padrão populacional
, ou equivalentemente a variância populacional
, e o
. Denotamos
N(
) à curva Normal com média e variância
. A média refere-se ao centro da distribuição e
o desvio padrão ao espalhamento de curva. A distribuição normal é simétrica em torno da média o
que implica que e média, a mediana e a moda são todas coincidentes. Para referência, a equação da
curva é
Felizmente, você não tem que memorizar esta equação. O importante é que você entenda como a
curva é afetada pelos valores numéricos de
e
. isto é mostrado no diagrama abaixo.
42
A área sob a curva normal (na verdade abaixo de qualquer função de densidade de probabilidade) é
1. Então, para quaisquer dois valores específicos podemos determinar a proporção de área sob a
curva entre esses dois valores. Para a distribuição Normal, a proporção de valores caindo dentro de
um, dois, ou três desvios padrão da média são:
Range
Proportion
68.3%
95.5%
99.7%
Este resultado é usado da seguinte maneira. Suponha que os comprimentos de um particular tipo de
peixe podem ser descritos por uma distribuição normal, com média 140mm e desvio padrão 15mm.
Podemos calcular a proporção dos peixes que têm comprimentos entre 110 e 170mm, por exemplo,
como a proporção da área sob a curva entre 110 e 170mm.
Então em nosso exemplo, cerca de 95% dos peixes tem comprimentos entre 110mm e 170mm.
Na prática desejamos calcular probabilidades para diferentes valores de
e
. Para isso, a variável
cuja distribuição é
é transformada numa forma padronizada
com distribuição
(distribuição normal padrão) pois tal distribuição é tabelada. A quantidade
é dada por:
Exemplo:
A concentração de um poluente em água liberada por uma fábrica tem distribuição N(8,1.5). Qual a
chance, de que num dado dia, a concentração do poluente exceda o limite regulatório de 10 ppm?
A solução do problema resume-se em determinar a proporção da distribuição que está acima de 10
ppm, ie
. Usando a estatística z temos:
Portanto, espera-se que a água liberada pela fábrica exceda os limites regulatórios cerca de 9% do
tempo.
43
Exercício:
A concentração de cadmio em cinzas de um certo lixo radioativo tem distribuição N(1,0.72). Quais são
as chances de que uma amostra aleatória das cinzas tenha uma concentração de cadmio entre 0.5 e
1.75 ppm?
Aplicação
Ainda na Escala de X, o tempo central é a média de 75 segundos Na Escala de Z, a média é 0 e os
intervalos tem como base o desvio padrão. Mas, assim como X, a varivél Z é contínua
•Pergunta: como 87, na Escala de X, pode ser relacionado a 2σ, na Escala de Z?
este deslocamento é annálogo (75+2*6=87)
•Outra forma de relacionar estes valores ・através
anteriormente:
da fórmula de transforma鈬o apresentada
Suponha agora, que o consultor queira saber qual a probabilidade de um trabalhador levar um tempo
entre 75 e 81 segundos para montar uma pe軋, ou seja, P(75≤X≤81). Como proceder?
➔Transformar as variáveis X em vari疱eis normais padronizadas Z:
44
Logo temos a probabilidade P(0≤Z≤1), que é ilustrada a seguir, e cujo valor é determinado
consultando a tabela:
45
Em anexo mais exercícios das Distribuições Binomial, Poisson e Normal.