Estatística - Páginas Pessoais

Propaganda
Ministério da Educação
Universidade Tecnológica Federal do Paraná
Campus Curitiba
Gerência de Ensino e Pesquisa
Departamento Acadêmico de Matemática
ESTATÍSTICA
Notas de Aula para o curso de Tecnologia
Prof.a Paula Francis Benevides
Prof a Paula Francis Benevides
Estatística
Conteúdo
AULA 1 .................................................................................................................................... 7
1. CONCEITOS PRELIMINARES: .............................................................................................. 7
1.1
MÉTODO ESTATÍSTICO .......................................................................................................... 7
1.1.1 O método experimental: ........................................................................................ 7
1.1.2 O método estatístico:............................................................................................. 7
2. A ESTATÍSTICA .................................................................................................................. 7
3. FASES DO MÉTODO ESTATÍSTICO ...................................................................................... 7
3.1
COLETA DE DADOS: .............................................................................................................. 7
3.2
CRÍTICA DE DADOS:............................................................................................................... 8
3.3
APURAÇÃO DOS DADOS: ........................................................................................................ 8
3.4
EXPOSIÇÃO OU APRESENTAÇÃO DOS DADOS:.............................................................................. 8
3.5
ANÁLISE DOS RESULTADOS: .................................................................................................... 8
4. VARIÁVEIS ........................................................................................................................ 9
5. POPULAÇÃO E AMOSTRA.................................................................................................. 9
6. AMOSTRAGEM ............................................................................................................... 10
6.1
AMOSTRAGEM CASUAL OU ALEATÓRIA SIMPLES: ....................................................................... 10
6.2
AMOSTRAGEM PROPORCIONAL ESTRATIFICADA: ....................................................................... 12
SEXO ................................................................................................................................. 12
POPULAÇÃO ..................................................................................................................... 12
AMOSTRA......................................................................................................................... 12
Total................................................................................................................................................................................ 12
6.3
AMOSTRAGEM SISTEMÁTICA: ............................................................................................... 12
7. TENDENCIOSIDADE DA AMOSTRA .................................................................................. 13
AULA 2 .................................................................................................................................. 16
8. DISTRIBUIÇÃO DE FREQÜÊNCIA ...................................................................................... 16
2
Estatística
Prof a Paula Francis Benevides
9. ELEMENTOS DE UMA DISTRIBUIÇÃO DE FREQÜÊNCIA..................................................... 17
9.1
CLASSE:............................................................................................................................ 17
9.2
LIMITE DE CLASSE:.............................................................................................................. 18
9.3
AMPLITUDE DE UM INTERVALO DE CLASSE: ............................................................................. 18
9.4
AMPLITUDE TOTAL DA DISTRIBUIÇÃO: .................................................................................... 18
9.5
AMPLITUDE AMOSTRAL: ...................................................................................................... 18
9.6
PONTO MÉDIO DE UMA CLASSE: ........................................................................................... 19
9.7
FREQÜÊNCIA SIMPLES OU ABSOLUTA ..................................................................................... 19
9.8
FREQUÊNCIA ABSOLUTA ACUMULADA .................................................................................... 20
9.9
FREQÜÊNCIA RELATIVA........................................................................................................ 20
AULA 3 .................................................................................................................................. 25
10. REPRESENTAÇÃO GRÁFICA ............................................................................................. 25
10.1 GRÁFICO DE BARRAS:.......................................................................................................... 25
10.2 GRÁFICO DE SETORES (PIZZA): .............................................................................................. 26
10.3 DIAGRAMAS DE DISPERSÃO: ................................................................................................. 26
10.4 HISTOGRAMA (OU OGIVA DE GALTON): ................................................................................. 28
10.5 DIAGRAMA DE PARETO: ...................................................................................................... 29
10.6 GRÁFICO POLÍGONO DE FREQÜÊNCIA: .................................................................................... 30
Tabela 10.4 – PONTOS MÉDIOS DOS INTERVALOS DE CLASSE E FREQUENCIAS PARA
ESTATURA DOS ALUNOS DA TURMA A-51 .................................................................................. 30
10.7 GRÁFICO POLÍGONO DE FREQUÊNCIA ACUMULADA (OU OGIVA): ................................................ 31
10.8 PICTOGRAMA: ............................................................................................................... 32
TOTAL ................................................................................................................................... 33
AULA 4 .................................................................................................................................. 36
11. MEDIDAS DE POSIÇÃO .................................................................................................... 36
11.1 MÉDIA ARITMÉTICA ( x ):..................................................................................................... 36
11.1.1 Dados não Agrupados:....................................................................................... 36
11.1.2 Desvio em relação à média: ............................................................................... 37
11.1.3 Propriedades da média: ..................................................................................... 37
11.1.4 Dados Agrupados:.............................................................................................. 38
3
Prof a Paula Francis Benevides
Estatística
11.1.4.1
Sem intervalo de classe: .............................................................................................................................. 38
11.1.4.2
Com intervalos de classe: ............................................................................................................................ 39
11.2 A MODA (MO) ................................................................................................................. 40
11.2.1 Dados não agrupados: ....................................................................................... 40
11.2.2 Dados agrupados: .............................................................................................. 41
11.2.2.1
Sem intervalo de classe: .............................................................................................................................. 41
11.2.2.2
Com intervalo de classe: ............................................................................................................................. 41
11.3 A MEDIANA (MD): ............................................................................................................ 41
11.3.1 Dados não agrupados: ....................................................................................... 41
11.3.2 Dados Agrupados:.............................................................................................. 42
11.3.2.1
Sem intervalo de classes: ............................................................................................................................ 43
11.3.2.2
Com intervalos de Classe: ........................................................................................................................... 44
11.4 POSIÇÃO RELATIVA DA MÉDIA, MEDIANA E MODA:.................................................................. 46
AULA 5 .................................................................................................................................. 51
11.5 AS SEPARATRIZES: .............................................................................................................. 51
11.5.1 Os Quartis: ......................................................................................................... 51
11.5.2 Os Percentis: ...................................................................................................... 52
AULA 6 .................................................................................................................................. 55
12. MEDIDAS DE DISPERSÃO OU DE VARIABILIDADE ............................................................ 55
12.1 AMPLITUDE: ..................................................................................................................... 55
12.2 DESVIO MÉDIO:................................................................................................................. 55
12.3 DESVIO PADRÃO: ............................................................................................................... 57
12.3.1 Propriedades do Desvio Padrão ......................................................................... 58
12.3.2 Dados não- agrupados:...................................................................................... 58
12.3.3 Dados agrupados: .............................................................................................. 58
12.3.3.1
Sem intervalo de Classe: ............................................................................................................................. 58
12.3.3.2
Com intervalo de classe: ............................................................................................................................. 59
12.4 VARIÂNCIA:....................................................................................................................... 60
12.5 COEFICIENTE DE VARIAÇÃO:.................................................................................................. 60
AULA 7 .................................................................................................................................. 64
13. MEDIDAS DE ASSIMETRIA: .............................................................................................. 64
13.1 DISTRIBUIÇÃO DE FREQÜÊNCIA SIMÉTRICA: ............................................................................. 64
4
Estatística
Prof a Paula Francis Benevides
13.2 DISTRIBUIÇÃO DE FREQÜÊNCIA ASSIMÉTRICA: .......................................................................... 64
13.3 COEFICIENTE DE ASSIMETRIA: ............................................................................................... 66
14. MEDIDAS DE CURTOSE: .................................................................................................. 68
14.1 COEFICIENTE DE CURTOSE: ................................................................................................... 68
AULA 8 .................................................................................................................................. 72
15. PROBABILIDADE: ............................................................................................................ 72
15.1 INTRODUÇÃO: ................................................................................................................... 72
15.2 EXPERIMENTO ALEATÓRIO: .................................................................................................. 72
15.3 ESPAÇO AMOSTRAL: ........................................................................................................... 72
15.4 EVENTOS: ......................................................................................................................... 73
15.5 PROBABILIDADE: ................................................................................................................ 74
15.6 EVENTOS COMPLEMENTARES: .............................................................................................. 75
15.7 PROBABILIDADE COM REUNIÃO E INTERSECÇÃO DE EVENTOS: ...................................................... 76
15.8 EVENTOS INDEPENDENTES: .................................................................................................. 77
15.9 EXPERIMENTOS NÃO EQUIPROVÁVEIS: .................................................................................... 78
AULA 9 .................................................................................................................................. 80
15.10 PROBABILIDADE CONDICIONADA: .......................................................................................... 80
15.11 DISTRIBUIÇÃO BINOMIAL: .................................................................................................... 81
AULA 10 ................................................................................................................................ 84
16. DISTRIBUIÇÕES DE PROBABILIDADES DE VARIÁVEIS ALEATÓRIAS DISCRETAS: ................ 84
16.1 INTRODUÇÃO: ................................................................................................................... 84
16.2 VARIÁVEIS ALEATÓRIAS: ...................................................................................................... 84
16.2.1 Variável aleatória discreta: ................................................................................ 84
16.2.2 Variável aleatória contínua: .............................................................................. 84
16.3 FUNÇÃO DE PROBABILIDADE:................................................................................................ 85
16.4 FUNÇÃO DE DISTRIBUIÇÃO ACUMULADA: ............................................................................... 86
16.5 VALOR ESPERADO OU MÉDIA DE UMA VARIÁVEL ALEATÓRIA DISCRETA: ....................................... 87
16.6 VARIÂNCIA E DESVIO PADRÃO DE UMA VARIÁVEL ALEATÓRIA DISCRETA: ...................................... 88
16.7 DISTRIBUIÇÃO BINOMIAL: .................................................................................................... 89
5
Estatística
Prof a Paula Francis Benevides
16.7.1 Medidas Características:.................................................................................... 89
16.8 DISTRIBUIÇÃO DE POISSON: ................................................................................................. 91
16.8.1 Hipótese do modelo de Poisson: ........................................................................ 92
16.9 APROXIMAÇÃO DAS PROBABILIDADES BINOMIAIS COMAS PROBABILIDADES DA DISTRIBUIÇÃO DE
POISSON:
...................................................................................................................................... 94
AULA 11 ................................................................................................................................ 96
17. DISTRIBUIÇÃO DE PROBABILIDADES DE VARIÁVEIS ALEATÓRIAS CONTÍNUAS:................ 96
17.1 DISTRIBUIÇÃO NORMAL: ..................................................................................................... 96
17.2 USO DA TABELA DA DISTRIBUIÇÃO NORMAL PADRONIZADA: ...................................................... 100
AULA 12 .............................................................................................................................. 104
17.3 DISTRIBUIÇÃO T DE STUDENT: ............................................................................................. 104
17.3.1 Uso da tabela da distribuição t de Student: .................................................... 105
17.4 DISTRIBUIÇÃO F: .............................................................................................................. 109
17.4.1 Uso da tabela da distribuição F: ...................................................................... 110
6
Prof a Paula Francis Benevides
Estatística
AULA 1
1. CONCEITOS PRELIMINARES:
1.1
1.1.1
MÉTODO ESTATÍSTICO
O MÉTODO EXPERIMENTAL:
Consiste em manter constantes todas as causas (fatores), menos uma, e variar esta causa de
modo que o pesquisador possa descobrir seus efeitos, caso existam.
É o método preferido no estudo da Física, da Química, etc.
1.1.2
O MÉTODO ESTATÍSTICO:
O método estatístico diante da impossibilidade de manter as causas constantes, admite
todas essas causas presentes variando-as, registrando essas variações e procurando determinar, no
resultado final, que influências cabem a cada uma delas.
2. A ESTATÍSTICA
A Estatística é uma parte da Matemática Aplicada que fornece métodos para a coleta,
organização, descrição, análise e interpretação de dados e para a utilização dos mesmo na tomada
de decisões.
A coleta, a organização e a descrição dos dados, estão a cargo da Estatística Descritiva,
enquanto a análise e a interpretação desses dados ficam a carga da Estatística Indutiva ou
Inferencial.
Em geral, as pessoas desconhecem que o aspecto essencial da Estatística é o de proporcionar
métodos inferenciais, que permitam conclusões que transcendam os dados obtidos inicialmente.
Assim, a análise e a interpretação dos dados estatísticos tornam possível o diagnóstico de
uma empresa (por exemplo, de uma escola), o conhecimento de seus problemas (condições de
funcionamento, produtividade), a formação de soluções apropriadas e um planejamento objetivo de
ação.
3. FASES DO MÉTODO ESTATÍSTICO
3.1
COLETA DE DADOS:
A coleta pode ser direta e indireta.
A coleta é direta quando feita sobre elementos informativos de registros obrigatórios
(nascimentos, casamentos e óbitos, importação e exportação de mercadorias), elementos pertinentes
7
Prof a Paula Francis Benevides
Estatística
aos prontuários dos alunos de uma escola, ou ainda, quando os dados são coletados pelo próprio
pesquisador através de inquéritos e questionários, como é o caso das notas de verificação e de
exames do censo demográfico, etc.
A coleta direta de dados podem ser classificadas relativamente ao fator tempo em:

contínua (registro) – quando feita continuamente, tal como a de nascimentos e
óbitos e a frequência dos alunos às aulas.

periódica – quando feita em intervalos constantes de tempo em tempo,como os
censos (de 10 em 10 anos) e as avaliações mensais dos alunos.

ocasional – quando feita extemporaneamente, a fim de atender a uma conjuntura ou
a uma emergência, como no caso de epidemias que assolam ou dizima rebanhos
inteiros.
A coleta se diz indireta quando é inferida de elementos conhecidos (coleta direta) e/ou do
conhecimento de outros fenômenos relacionados com o fenômeno estudado. Como por exemplo,
podemos citar a pesquisa sobre a mortalidade infantil, que é feita através de dados colhidos por uma
coleta direta.
3.2
CRÍTICA DE DADOS:
Externa: quando visa às causas dos erros por parte do informante, por distração ou má
interpretação das perguntas que lhe foram feitas.
Interna: quando visa observar os elementos originais dos dados da coleta.
3.3
APURAÇÃO DOS DADOS:
Pode ser manual, eletromecânica ou eletrônica.
3.4
EXPOSIÇÃO OU APRESENTAÇÃO DOS DADOS:
Os dados devem ser apresentados sob forma adequada (tabelas ou gráficos), tornando mais
fácil o exame daquilo que está sendo objeto de tratamento estatístico.
3.5
ANÁLISE DOS RESULTADOS:
Como já dissemos, o objetivo último da Estatística é tirar conclusões sobre o todo
(população) a partir de informações fornecidas por parte representativa do todo (amostra). Assim,
realizadas as fases anteriores (Estatística Descritiva), fazemos uma análise dos resultados obtidos
através dos métodos da Estatística Indutiva ou Inferencial, que tem por base a indução ou
inferência, e tiramos desses resultados conclusões e previsões.
8
Prof a Paula Francis Benevides
Estatística
4. VARIÁVEIS
Variável: conjunto de resultados possíveis de um fenômeno.
Cada fenômeno corresponde um número de resultados possíveis Assim por exemplo:

Para o fenômeno ―sexo‖ são dois os resultados possíveis: sexo masculino e sexo
feminino.

Para o fenômeno ―número de filho‖ há um número de resultados possíveis expresso
através dos números naturais: 0, 1, 2, 3, ...., n

Para o fenômeno ―estatura‖ temos uma situação diferente, pois os resultados podem
tomar um número infinito de valores numéricos dentro de um determinado intervalo.
Logo, as variáveis podem ser:
Qualitativa: se os valores tomados não são numéricos, como: raça, meio de transporte, sexo
do bebe, etc.
Quantitativa: se os valores tomados são numéricos, como altura, peso, preço de um produto,
etc. Variável quantitativa também se chama variável estatística ou simplesmente variável. Cada
valor que essa variável pode assumir chama-se dado estatístico.
As variáveis estatísticas podem ser:
Contínuas: quando podem assumir qualquer valor do intervalo de variação. Por exemplo, na
determinação das alturas dos adolescentes de uma escola, a variável ―altura‖ é continua.
Discretas: quando só podem assumir valores inteiros. Por exemplo, na determinação do
número de alunos de uma certa turma, a variável ―número de alunos‖ é discreta.
De um modo geral, as medições dão origem a variável contínuas e as contagens ou
enumerações, a variáveis discretas.
5. POPULAÇÃO E AMOSTRA
Entende-se por população o conjunto de elementos que tem, em comum, determinada
característica. As populações podem ser finitas, como, por exemplo, os alunos matriculados em
determinada escola, ou infinitas, como por exemplo, os resultados obtidos quando se joga um dado
sucessivamente. Existem populações que embora finita, são consideradas infinitas para qualquer
finalidade prática. Como exemplo, imagine o número de peixes que há no mar.
Entende-se por amostra qualquer conjunto de elementos, retirados da população, desde que
esse conjunto seja não-vazio e tenha menor número de elementos que a população. É um
subconjunto finito de uma população
9
Prof a Paula Francis Benevides
Estatística
6. AMOSTRAGEM
Existe uma técnica especial – amostragem – para recolher amostras, que garante, tanto
quanto possível, o acaso da escolha.
Dessa forma, cada elemento da população passa a ter a mesma chance de ser escolhido, o
que garante á amostra o caráter de representatividade, e isto é muito importante, pois, como vimos,
nossas conclusões relativas á população vão estar baseadas nos resultados obtidos nas amostras
dessa população.
Daremos, a seguir, três das principais técnicas de amostragem.
6.1
AMOSTRAGEM CASUAL OU ALEATÓRIA SIMPLES:
Este tipo de amostragem é equivalente a um sorteio lotérico.
Na pratica, a amostragem casual ou aleatória simples pode ser realizada numerando-se a
população de 1 a n e sorteando-se, a seguir, por meio de um dispositivo aleatório qualquer, k
números dessa sequência, os quais corresponderão aos elementos pertencentes a amostra.
Exemplo:
Vamos obter uma amostra representativa para a pesquisa da estatura de noventa alunos de
uma escola:

Numeramos os alunos de 01 a 90.

Escrevemos os números, de 01 a 90, em pedaços iguais de um mesmo papel,
colocando-os dentro de uma caixa. Agitamos sempre a caixa para misturar bem os
pedaços de papel e retiramos, um a um, nove números que formarão a amostra. Neste
caso, 10% da população.
Quando o número de elementos da amostra é grande, esse tipo de sorteio torna-se muito
trabalhoso. A fim de facilita-lo, foi elaborada uma tabela – Tabela de Números Aleatórios –
construída de modo que os dez algarismos (0 a 9) são distribuidos ao acaso nas linhas e colunas.
10
Prof a Paula Francis Benevides
Estatística
* TABELA DE NÚMEROS ALEATÓRIOS *
C1 C2 C3 C4 C5 C6 C7 C8 C9
L1
L2
L3
L4
L5
L6
L7
L8
L9
L10
L11
L12
L13
L14
L15
L16
L17
L18
L19
L20
L21
L22
L23
L24
L25
L26
L27
L28
L29
4
3
2
1
0
0
8
8
5
6
4
3
2
0
9
7
8
6
5
3
8
1
2
4
5
2
1
0
9
1
0
2
9
3
8
3
8
4
7
4
5
6
1
0
2
9
3
8
4
7
4
7
3
0
5
1
2
1
6
7
5
8
4
9
3
0
1
2
0
1
9
2
8
2
3
0
1
0
2
9
3
8
3
7
4
7
5
1
2
3
4
5
6
7
8
9
0
5
4
3
2
1
0
9
8
7
6
1
1
2
2
3
3
4
4
5
6
6
7
7
8
8
9
9
0
0
1
3
5
7
9
2
4
6
8
0
1
3
5
7
9
0
2
3
6
1
3
5
7
9
1
0
2
0
3
9
3
8
4
8
5
7
6
7
1
3
2
4
3
5
4
6
6
8
0
9
0
8
0
7
6
3
2
1
1
0
2
0
3
0
4
0
5
9
5
8
6
7
7
2
3
4
5
2
5
1
6
2
2
3
6
0
1
9
3
3
7
8
5
1
1
9
8
2
6
5
8
0
2
2
3
6
3
5
9
5
0
2
7
3
3
1
4
2
6
0
3
3
1
4
4
4
4
1
8
0
4
6
0
1
9
C1 C1 C1 C1 C1 C1 C1 C1 C1 C1 C2 C2 C2 C2 C2 C2 C2 C2 C2 C2
0 1 2 3 4 5 6 7 8 9 0 1 2 3 4 5 6 7 8 9
5 7 6 2 0 9 9 8 1 0 3 4 7 2 1 0 8 7 8 4
3 4 8 8 0 9 3 0 1 7 0 4 0 8 3 1 2 0 1 2
8 7 6 3 0 0 1 2 1 4 3 2 4 5 6 7 7 4 3 0
2 7 8 1 0 0 7 5 3 2 2 5 8 1 9 0 3 2 3 4
3 1 0 1 1 2 4 3 1 9 5 6 8 5 0 2 3 4 9 0
2 2 8 6 1 9 4 5 2 0 0 1 3 1 0 9 2 3 4 1
6 4 0 7 1 2 1 0 1 2 8 9 7 5 3 2 1 1 8 2
7 3 7 8 9 4 3 9 2 3 2 3 0 0 4 4 2 3 1 3
7 5 0 9 7 6 5 7 8 0 8 4 5 2 3 0 7 4 3 6
2 6 0 2 0 8 0 9 7 7 7 3 6 7 2 9 0 3 1 0
1 8 4 2 1 3 3 2 7 6 4 4 3 8 9 0 7 2 2 9
3 7 0 3 4 5 8 9 3 5 2 4 0 1 7 9 1 8 1 3
5 0 2 6 3 6 7 0 1 7 9 6 8 3 5 3 3 5 7 2
7 9 0 0 6 5 2 7 8 1 0 0 7 5 3 0 9 1 1 3
9 4 0 1 9 5 2 2 0 0 2 1 2 4 7 6 3 2 1 5
2 1 3 5 8 9 1 2 3 9 6 5 2 7 8 1 0 0 7 0
4 2 4 6 7 0 2 3 7 8 5 3 1 2 5 6 9 0 7 9
6 2 2 3 3 0 1 5 4 5 1 1 3 4 7 8 1 2 8 8
8 0 0 2 3 6 9 6 4 3 6 7 2 1 9 7 0 1 8 5
0 2 9 2 3 2 5 3 5 7 2 7 8 2 5 6 2 2 9 4
1 7 5 7 3 0 0 9 1 2 0 3 4 9 3 0 4 4 9 1
2 0 2 0 1 3 5 4 6 4 3 2 0 0 3 9 6 6 0 2
4 0 8 0 1 9 6 9 5 0 8 0 2 4 9 8 8 8 0 3
3 0 9 2 2 6 7 6 4 9 8 9 4 7 7 7 0 0 2 4
5 8 7 4 2 2 3 8 2 1 2 2 0 7 0 6 1 1 2 5
6 1 1 0 3 9 9 1 0 3 4 3 9 6 3 5 3 3 4 8
8 9 2 3 3 7 7 4 0 5 6 8 8 5 2 4 5 5 4 0
7 1 0 2 0 9 6 4 3 7 9 0 7 6 1 3 7 5 5 8
8 2 0 2 3 0 1 4 3 3 7 7 5 6 7 4 3 4 0 1
Para obtermos os elementos da amostra usando a tabela, sorteamos um algarismo qualquer
da mesma, a partir do qual iremos considerar números de dois, três ou mais algarismos, conforme
nossa necessidade. Os números assim obtidos irão indicar os elementos da amostra.
A leitura da tabela pode ser feita horizontalmente (da direita para a esquerda ou vice-versa),
verticalmente (de cima para baixo ou vice-versa), diagonalmente (no sentido ascendente ou
descendente) ou formando o desenho de uma letra qualquer. A opção porém, deve ser feita antes de
iniciado o processo.
Assim, para o nosso exemplo, considerando a 18 o linha, tomamos os números de dois
algarismo (tantos algarismos quantos formam o maior número da população, obtendo:
63 08 66 01 46 22 33 01 54 51 13 47 81 28
Evidentemente, se constasse um numeral maior que 90, este seria desprezado, pois não
consta da população, como será também abandonado um numeral que já tenha aparecido. Temos
então: 63 08 66 01 46 22 33 54 51
Medindo as alturas dos alunos correspondentes aos números sorteados obteremos uma
amostra das estaturas dos noventa alunos.
11
Prof a Paula Francis Benevides
Estatística
6.2
AMOSTRAGEM PROPORCIONAL ESTRATIFICADA:
Muitas vezes a população se divide em subpopulações – estratos.
Como é provável que a variável em estudo apresente de estrato, um comportamento
heterogêneo e, dentro de cada estrato, um comportamento homogêneo, convém que o sorteio dos
elementos da amostra leve em consideração tais estratos.
É exatamente isso que fazemos quando empregamos a amostragem proporcional
estratificada, que, além de considerar a existência dos estratos, obtém os elementos da amostra
proporcional ao número de elementos dos mesmos.
Exemplo:
Supondo, no exemplo anterior, que, dos noventa alunos, 54 sejam meninos e 36 meninas,
vamos obter a amostra proporcional estratificada.
São, portanto, dois estratos (sexo masculino e sexo feminino) e queremos uma amostra de
10% da população. Logo, temos:
SEXO
POPULAÇÃO
M
54
F
36
Total
90
10%
10  54
 5,4
100
10  36
 3,6
100
10  90
 9,0
100
AMOSTRA
5
4
9
Numeramos os alunos de 01 a 90, sendo que de 01 a 54 corresponde aos meninos e de 55 a
90, meninas. Tomando na Tabela de Números Aleatórios a primeira e a segunda coluna da
esquerda, de cima para baixo, obtemos os seguintes números:
41 30 22 19 03 08 83 88 54 67 44 35 26 01 90 72 89 63 58 34 87 14 27 43 50
25 11 02 91
Temos então:
41 30 22 19 03 – para os meninos
83 88 67 90 – para as meninas
6.3
AMOSTRAGEM SISTEMÁTICA:
Quando os elementos da população já se acham ordenados, não há necessidade de construir
o sistema de referências. São exemplos os prontuários médicos de um hospital, os prédios de uma
rua, as linhas de produção, etc. Nestes casos, a seleção dos elementos que constituirão a amostra
12
Estatística
Prof a Paula Francis Benevides
pode ser feita por um sistema imposto pelo pesquisador. A esse tipo de amostragem denominamos
sistemática.
Assim, no caso de uma linha de produção, podemos a cada dez itens produzidos, retirar um
para pertencer a uma amostra da produção diária. Neste caso, estaríamos fixando o tamanho da
amostra em 10% da população.
Exemplo:
Suponhamos uma rua contendo novecentos prédios, dos quais desejamos obter uma amostra
formada por cinquenta prédios. Podemos, neste caso, usar o seguinte procedimento: como 900/50 =
18, escolheremos por sorteio casual um número de 1 a 18 (inclusive), o qual indicaria o primeiro
elemento sorteado para a amostra; os demais elementos seriam periodicamente considerados de 18
em 18. Assim, se o número sorteado fosse o 4, tomaríamos, pelo lado direito da rua, o 4 o prédio, o
22o, o 40o etc, até voltarmos ao início da rua, pelo lado esquerdo.·.
7. TENDENCIOSIDADE DA AMOSTRA
Muitas vezes as amostras são constituídas por pessoas que devem executar algum tipo de
tarefa, com responder perguntas, preencher um questionário ou até mesmo testar um produto.
Algumas pessoas se recusam a cooperar. Nesses casos é preciso ter muito senso crítico para avaliar
se a amostra efetivamente utilizada é representativa da população. Sempre é possível que a amostra
obtida seja tendenciosa ou viciada, isto é, não representativa da população.
O senso crítico ainda é mais importante quando as amostrar são constituídas por voluntários.
Muitas vezes, o procedimento usado para solicitar voluntários conduz á formação de amostrar
tendenciosas. Como por exemplo, imagine que um professor de educação física peça que três alunos
da turma se apresentem como voluntários para apostar uma corrida. Ora, é bastante razoável
imaginar que, neste caso, se apresentarão como voluntários apenas os alunos que sabem ser bons
corredores. Então, os três alunos não constituirão uma amostra representativa da turma, mas uma
amostra tendenciosa ou viciada.
13
Prof a Paula Francis Benevides
Estatística
AULA 01 - EXERCICIOS
1) O método experimental é mais usados por ciências como:........
2) As ciências humanas e sociais, para obterem os dados que buscam, lançam mão de que método?
3) O que é Estatística?
4) Cite as fases do método estatístico.
5) Para você o que é coletar dados?
6) Para que serve a crítica dos dados?
7) O que é apurar dados?
8) Como podem ser apresentados os expostos os dados?
9) Cite três ou mais atividades do planejamento empresarial em que a Estatística se faz necessária.
10)Classificar as variáveis em qualitativas ou quantitativas (continuas e discretas):
a. População: os alunos de uma escola.
Variável: cor dos cabelos
b. P: casais residentes em uma cidade
V: número de filhos
c. P: as jogadas de um dado
V: o ponto obtido em cada jogada
d. P: peças produzidas por certas máquinas
V: número de peças produzidas por hora
e. P: peças produzidas por certa máquina
V: diâmetro externo
f. P: estação meteorológica de uma cidade
V: precipitação pluviométrica, durante um ano.
g. P: alunos de uma cidade
V: cor dos olhos
h. P: bolsa de valores de São Paulo
V: números de ações negociadas
i. P: funcionários de uma empresa
V: salários.
j. P: pregos produzidos por uma máquina
V: comprimento
k. P: propriedades agrícolas no Brasil
V: produção de algodão
l. P: segmento de reta
V: comprimento
m. P: biblioteca da cidade de Curitiba
V: número de volumes
14
Prof a Paula Francis Benevides
Estatística
n. P: indústrias de uma cidade
V: índice de liquidez.
11)A massa (em quilogramas) de 20 trabalhadores de uma empresa com 100 funcionários esta
registrada a seguir:
62 52 73 80 65 50 70
75 80 65 70 77 82 91
75 52 68 86 70 80
Com base nos dados obtidos, responda:
a.
b.
c.
Qual a população e a unidade estatística dessa pesquisa?
Qual é a sua amostra?
Qual é a variável nessa pesquisa? Ela é discreta ou contínua?
12) Uma população encontra-se dividida em três estratos, com tamanhos, respectivamente, n 1=40,
n2= 100 e n3= 60. Sabendo-se que, ao ser realizada uma amostragem estratificada proporcional,
nove elementos da amostra foram retirados do 3 o estrato, determine o número total de elementos da
amostra.
13) Mostre como seria possível retirar uma amostra de 32 elementos de uma população ordenada
formada por 2.432 elementos. Na ordenação geral, qual dos elementos abaixo seria escolhido para
pertencer à amostra, sabendo-se que o elemento de ordem 1.420 a ela pertence?
1648, 290, 725, 2025, 1120
15
Prof a Paula Francis Benevides
Estatística
AULA 2
8. DISTRIBUIÇÃO DE FREQÜÊNCIA
Tabela primitiva: tabela cujos elementos não foram numericamente organizados
Rol: Tabela obtida após a ordenação dos elementos da tabela primitiva
No exemplo em que trabalharemos, a variável em questão, nota, será observada e estudada
muito mais facilmente quando dispusermos valores ordenados em uma coluna e colocarmos, ao
lado de cada valor, o número de vezes que aparece repetido.
Denominamos de frequência o número de alunos que fica relacionado a um determinado
valor da variável. Obtemos assim, uma tabela que recebe o nome de distribuição de frequência.
Vamos analisar a seguinte situação:
Consideremos o quadro seguinte que mostra as notas de Cálculo dos alunos de uma classe
de 2o período de Eletrotécnica numa determinada Faculdade.
Turma: 2 o período
Disciplina: Cálculo
Número 1
Nota
2
3
4
5
6
7
8
9
10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25
5,0 4,0 6,0 8,0 3,0 5,0 7,0 6,0 8,0 4,0 6,0 9,0 7,0 5,0 7,0 5,0 6,0 8,0 7,0 9,0 4,0 6,0 6,0 8,0 7,0
Tabela 1
Nesse caso temos:
 População estatística: grupo de 25 alunos do segundo período
 Unidade estatística: cada aluno desse ano
 Variável estatística: as notas da prova de Cálculo
A partir desse conhecimento, elaboramos a seguinte tabela:
i
Notas
Número de alunos(fi)
1
0
0
2
1,0
0
3
2,0
0
4
3,0
1
5
4,0
3
6
5,0
4
7
6,0
6
8
7,0
5
9
8,0
4
10
9,0
2
11
10,0
0
Total: 25
Tabela 2
16
Prof a Paula Francis Benevides
Estatística
Mas o processo dado é ainda inconveniente, já que exige muito espaço, mesmo quando o
número de valores da variável (n) é de tamanho razoável. Sendo possível, a solução mais aceitável,
pela própria natureza da variável contínua, é o agrupamento de valores em vários intervalos.
Assim, se um dos intervalos for, por exemplo, 0| 4, 0, (é um intervalo fechado à esquerda
e aberto à direita, 0 x< 4,0) em vez de dizermos que a nota de nenhum aluno é 0 ou 1,0 ou 2,0 e de
1 aluno é 3,0, diremos que 1 aluno tem nota entre 0, inclusive, e 4,0.
Deste modo, estaremos agrupando os valores da variável em intervalos, sendo que, em
Estatística, preferimos chamar de classes.
Chamando de frequência de uma classe o número de valores da variável pertencentes à
classe, os dados da tabela 2, podem ser dispostos como na tabela 3, denominada distribuição de
frequência com intervalos de classe.
Notas
Frequência
0 | 2,0
0
2,0 | 4,0
1
4,0 | 6,0
7
6,0 | 8,0
11
8,0 | 11,0
6
Tabela 3
Ao agruparmos os valores da variável em classes, ganhamos em simplicidade, mas
perdemos em pormenores. Assim, na Tabela 2 podemos verificar facilmente, que 2 alunos têm nota
9,0 e que nenhum tem nota 10,0. Já na tabela 3 não podemos ver se algum aluno tem nota 10,0. No
entanto, sabemos com segurança, que onze alunos tem nota compreendida entre 6,0 e 8,0.
O que pretendemos com a construção dessa nova tabela é realçar o que há de essencial nos
dados e, também, tornar possível o uso de técnicas analíticas para sua total descrição, até porque a
Estatística tem por finalidade específica analisar o conjunto de valores, desinteressando-se por casos
isolados.
9. ELEMENTOS DE UMA DISTRIBUIÇÃO DE FREQÜÊNCIA
9.1
CLASSE:
Classes de frequência ou, simplesmente, classes são intervalos de variação da variável.
As classes são representadas simbolicamente por i, sendo i = 1, 2, 3,..., k (onde k é o número
total de classes da distribuição).
17
Prof a Paula Francis Benevides
Estatística
Assim, em nosso exemplo, o intervalo 2,0 | 4,0 define a segunda classe (i = 2). Como a
distribuição é formada de 5 classes, podemos afirmar que k = 5.
9.2
LIMITE DE CLASSE:
Denominamos de limite de classe os extremos de cada classe.
O menor número é o limite inferior da classe (  i ) e o maior número, o limite superior
da classe(Li).
Na segunda classe, por exemplo, temos:
 2 = 2,0 e L2 = 4,0
Obs.: Os intervalos de classe devem ser escritos, de acordo com a Resolução 886/66 do
IBGE, em termos de desta quantidade até menos aquela, empregando, para isso, o símbolo |
(inclusão de  i e exclusão de Li). Assim, o indivíduo com uma nota de 4,0 está incluído na
terceira classe (i = 3) e não na segunda.
9.3
AMPLITUDE DE UM INTERVALO DE CLASSE:
Amplitude de um intervalo de classe ou, simplesmente, intervalo de classe é a medida do
intervalo que define a classe.
Ela é obtida pela diferença entre os limites superior e inferior dessa classe e indicada por hi .
Assim:
hi = Li -  i
Na distribuição da tabela 3 temos:
h2 = 4,0 – 2,0 = 2,0
9.4
AMPLITUDE TOTAL DA DISTRIBUIÇÃO:
Amplitude total da distribuição (AT) é a diferença ente o limite superior da última classe
(limite superior máximo) e o limite inferior da primeira classe ( limite inferior mínimo).
AT = L(máx) –
 (mín)
Em nosso exemplo, temos: AT = 11,0 – 0 = 11,0
Obs.: É evidente que, se as classes possuem o mesmo intervalo, verificamos a relação:
AT
k
hi
9.5
AMPLITUDE AMOSTRAL:
Amplitude amostral (AA) é a diferença entre o valor máximo e o valor mínimo da amostra.
AA = x (max.) – x (min.)
18
Prof a Paula Francis Benevides
Estatística
Em nosso exemplo, temos: AA = 10,0 – 0 = 10,0
Observe que a amplitude total da distribuição jamais coincide com a amplitude amostral.
9.6
PONTO MÉDIO DE UMA CLASSE:
Ponto médio de uma classe (xi) é como o próprio nome indica o ponto que divide o intervalo
de classe em duas partes iguais.
Para obtermos o ponto médio de uma classe, calculamos a semissoma dos limites da classe
(média aritmética).
xi 
 i  Li
2
Assim, o ponto médio da segunda classe, em nosso exemplo é:
9.7
FREQÜÊNCIA SIMPLES OU ABSOLUTA
A primeira fase de um estudo estatístico consiste em recolher, contar e classificar os dados
pesquisados sobre uma população estatística ou sobre uma amostra dessa população.
Escolhida uma característica sobre os elementos de uma população, devemos elaborar uma
tabela de dados denominada distribuição estatística. Posteriormente, os resultados podem ser
interpretados por meio de um gráfico. Diversos tipos de gráficos são usados em Estatística: de
barras, de setores, por pontos, etc.
Na coluna ―Notas‖ aparecem os diferentes valores da variável estatística. Na coluna
―Número de alunos‖ está indicado o número de vezes que cada valor se repete é a coluna de
frequência absoluta (fi).
Logo, frequência absoluta (fi), simples, ou frequência de classe ou de um valor individual é
o número de observações correspondentes a essa classe ou a esse valor.
Utilizando o somatório (  ): O símbolo  é usado para escrever abreviadamente
expressões que envolvem adição. Assim, indicamos a adição dos termos f i, com i variando de 1 até
k (k  |N*), como:
K
f
i 1
i
ou
f
i
n
7
No exemplo das notas de Cálculo, o desenvolvimento do somatório do
f
i 1
i
é dado por:
7
f
i 1
i
= f 1 + f 2 + f 3 + f4 + f 5 + f 6 + f 7
i
= 0 + 0 + 0 + 1 + 3 + 4 + 6 = 14
7
f
i 1
19
Prof a Paula Francis Benevides
Estatística
9.8
FREQUÊNCIA ABSOLUTA ACUMULADA
A distribuição de frequência absoluta pode ser completada com mais uma coluna, chamada
de frequências absolutas acumuladas (fia), cujos valores são obtidos adicionando a cada frequência
absoluta os valores das frequências anteriores.
Veja como fica o quadro anterior:
i
Nota
fi
fia
1
0
0
0
2
1,0
0
0
3
2,0
0
0
4
3,0
1
1
5
4,0
3
1+3=4
6
5,0
4
4+4=8
7
6,0
6
8 + 6 = 14
8
7,0
5
14 + 4 = 19
9
8,0
4
19 + 4 = 23
10
9,0
2
23 + 2 = 25
11
10,0
0
25
N = 25
Pelo quadro e usando a frequência acumulada, podemos fazer algumas observações, tais
como:
 8 alunos não obtiveram nota superior a 5,0 nessa classe
 25 – 14 = 11 alunos obtiveram nota 7,0 ou acima de 7,0 nessa classe
 f6a =
6
f
i 1
9.9
i
=8
FREQÜÊNCIA RELATIVA
Chama-se frequência relativa (fr) do valor de xi da variável o quociente entre a frequência
absoluta (fi) e a frequência total (número de elementos n da amostra), ou seja:
fr 
fi
f
i
Observe o gráfico:
20
Prof a Paula Francis Benevides
Estatística
Devemos observar que se a frequência relativa (fr) é dada na forma de porcentagem, ela vai
tornar mais clara à análise de certos dados.
Se tomarmos como exemplo o quadro de frequência das notas de Cálculo de uma classe de
segundo período de Eletrotécnica, podemos, então, completar o quadro de distribuição de
frequência com mais duas colunas; a coluna das frequências relativas (fr) e a coluna das frequências
relativas acumuladas (fa).
xi
fi
fia
Fr (%)
Fra (%)
3,0
1
1
1/25 = 4%
4%
4,0
3
4
3/25 = 12%
16%
5,0
4
8
4/25 = 16%
32%
6,0
6
14
6/25 = 24%
56%
7,0
5
19
5/25 = 20%
76%
8,0
4
23
4/25 =16%
92%
9,0
2
25
2/25 = 8%
100%
Observando a tabela, temos:
 20% dos alunos obtiveram média 7,0
 56% dos alunos obtiveram média inferior a 7,0
 100% - 56% = 44% obtiveram média igual ou superior a 7,0
21
Prof a Paula Francis Benevides
Estatística
AULA 02 - EXERCÍCIOS
1) Numa pesquisa de opinião pública com 800 telespectadores sobre o programa de televisão de
sua preferência, obteve-se a seguinte tabela de frequências absolutas:
Programa de TV
Número de Telespectadores
Novela
360
Esportes
128
Filmes
80
Noticiário
32
Shows
200
Construa um quadro com distribuição de frequências absolutas acumuladas, frequências
relativas e frequências relativas acumuladas.
2) Um dado foi jogado 20 vezes. Em cada jogada foram obtidos os seguintes pontos:
1 5 6 5 2 2 2 4 6 5
2 3 3 1 6 6 5 5 4 2
a) Elabore um quadro com distribuição de frequências absolutas, frequências absolutas
acumuladas, frequências relativas e frequências relativas acumuladas.
b) Observando a tabela responda:
I. Quantas vezes o número 3 foi obtido no dado?
II. Quantas vezes o número obtido no dado foi menor que 5?
III. Qual o índice, em porcentagem, em que o número 6 foi obtido no dado?
IV. Qual o índice, em porcentagem, em que números maiores que 4 foram obtidos no
dado?
3) Veja os principais motivos alegados por 30 000 devedores, pesquisados em uma região
metropolitana, ao justificarem atrasos do crediário ou cheque sem fundo.
Com base nessa pesquisa, responda:
a) Qual a frequência relativa das pessoas que apresentam outras justificativas?
b) Quais as frequências absolutas para cada tipo de devedor?
22
Prof a Paula Francis Benevides
Estatística
4) Suponhamos termos feito uma coleta de dados relativos às estaturas de quarenta alunos, que
compõem uma amostra de alunos de um colégio A., resultando a seguinte tabela de valores:
166
160
161
150
162
160
165
167
164
160
162
161
168
163
156
173
160
155
164
168
155
152
163
160
155
155
169
151
170
164
154
161
156
172
153
157
156
158
158
161
Determine:
a) O rol da tabela primitiva acima.
b) A distribuição de frequência
c) Distribuição de frequência com intervalos de classe. (sugestão, de 4 em 4)
d) A segunda classe.
e) Os limites da segunda classe.
f) O intervalo (amplitude) da segunda classe.
g) A amplitude total da distribuição.
h) A amplitude amostral
i) O ponto médio da segunda classe.
j) A frequência absoluta da segunda classe.
5) A tabela abaixo apresenta as vendas diárias de um determinado aparelho elétrico, durante um
mês, por uma firma comercial:
14
12 11 13 14 13
12
14 13 14 11 12
12
14 10 13 15 11
15
13 16 17 14 14
Forme uma distribuição de frequência sem intervalos de classe.
6) Considerando as notas de um teste de inteligência aplicado a 100 alunos:
64 78 66 82 74 103 78 86 103 87
73 95 82 89 73 92 85 80 81 90
78 86 78 101 85 98 75 73 90 86
86 84 86 76 76 83 103 86 84 85
76 80 92 102 73 87 70 85 79 93
82 90 83 81 85 72 81 96 81 85
68 96 86 70 72 74 84 99 81 89
71 73 63 105 74 98 78 78 83 96
95 94 88 62 91 83 98 93 83 76
94 75 67 95 108 98 71 92 72 73
Forme a distribuição de frequência:
23
Prof a Paula Francis Benevides
Estatística
7) A tabela abaixo apresenta uma distribuição de frequência das áreas de 400 lotes:
Área
(m2)
300 |— 400 |— 500 |— 600 |— 700 |— 800 |— 900 |— 1.000 |— 1.100 |— 1.200
No DE
14
46
58
76
68
62
48
22
6
LOTES
Com referência a essa tabela, determine:
a)
b)
c)
d)
e)
f)
g)
h)
i)
j)
k)
l)
m)
a amplitude total;
o limite superior da quinta classe;
o limite inferior da oitava classe;
o ponto médio da sétima classe;
a amplitude do intervalo da segunda classe;
a frequência da quarta classe;
a frequência relativa da sexta classe;
a frequência acumulada da quinta classe;
o número de lotes cuja área não atinge 700 m 2;
o número de lotes cuja área seja maior ou igual a 900 m 2;
a percentagem dos lotes cuja área [e de 500 m 2, no mínimo, mas inferior a 1.000 m2;
a classe do 72o lote;
até que classe estão incluídos 60% dos lotes.
8) Complete a tabela abaixo:
i
CLASSES
fi
1
0 |— 8
4
2
8 |— 16
10
3
16 |— 24
14
4
24 |— 32
9
5
32 |— 40
3
fr
fia
fra
  40   1,00
24
Prof a Paula Francis Benevides
Estatística
AULA 3
10.REPRESENTAÇÃO GRÁFICA
Em muitos casos, uma representação gráfica de uma distribuição de frequência nos dá uma
ideia melhor de um levantamento estatístico do que um quadro com números.
Nesse item, estudaremos as representações gráficas mais usadas em Estatística.
10.1 GRÁFICO DE BARRAS:
Os gráficos de Barras ou colunas são gráficos que podem ser facilmente elaborados à mão
ou com uso de softwares específicos, tais como o software Excel ou outro programa gerador de
gráficos.
Como exemplo, considere-se uma pesquisa de opinião realizada em determinada
comunidade, para a qual os dados coletados indicaram o hábito dos moradores em assistir ou não
horário político televisivos. Tais informações constam na Tabela 10.1.
Tabela 10.1 - HÁBITO DE ASSISTIR O HORÁRIO POLÍTICO
HÁBITO
FREQUENCIA
PERCENTUAL
SIM
1150
31,5%
NÃO
2500
68,5%
TOTAL
3650
100%
A tabela 10.1 facilita a apresentação dos resultados e o entendimento do leitor sobre como
se comporta os moradores quanto ao hábito de assistirem ou não o horário político. Igualmente, o
gráfico de barras também se constitui em uma excelente forma de apresentação de tais informações.
GRÁFICO 10.1 – FREQUENCIA COMPORTAMENTAL DOS MEMBROS DE UMA COMUNIDADE
3000
2500
2500
2000
1500
1150
1000
500
31,50%
68,50%
0
SIM
NÃO
QUANTO AO HÁBITO DE ASSISTIR O HORÁRIO POLITICO TELEVISIVO
25
Prof a Paula Francis Benevides
Estatística
10.2 GRÁFICO DE SETORES (PIZZA):
O gráfico de setores pode ser utilizado tanto para variáveis quantitativas como para
variáveis qualitativas. Este gráfico também possui a peculiaridade de facilitar a visualização de
resultados, especialmente quando se trata de porcentagens.
GRÁFICO 10. 2 – PORCENTAGENS DOS MEMBROS DE UMA COMUNIDADE QUE POSSUEM O
HÁBITO DE ASSISTIR O HORÁRIO POLÍTICO TELEVISIVO
31,50%
68,50%
O Gráfico é construído com base em um círculo, e é empregado sempre que desejamos
ressaltar a participação do dado no total.
O total é representado pelo círculo, que fica dividido em tantos setores quantas são as partes.
Os setores são tais que suas áreas são respectivamente proporcionais aos dados da série.
Obtemos cada setor por meio de uma regra de três simples e direta, lembrando que o total da
série corresponde à 360o.
Temos
3650
- 3600
1150
-
x

x1 = 113,4 
x2 = 246,6
x1 = 113o
x2 = 247o
Notas:
 O gráfico em setores só deve ser empregado quando há, no máximo, sete dados.
 Se a série já apresenta os dados percentuais, obtemos os respectivos valores em graus
multiplicando o valor percentual por 3,6.
10.3 DIAGRAMAS DE DISPERSÃO:
Às vezes temos dados emparelhados de uma forma que associa cada valor de um conjunto
a um determinado valor de um segundo conjunto. Um diagrama de dispersão é um gráfico dos
dados emparelhados (x, y), com um eixo x horizontal e um eixo y vertical. Para construir
manualmente um diagrama de dispersão, traçamos um eixo horizontal para os valores da primeira
26
Prof a Paula Francis Benevides
Estatística
variável e um eixo vertical para os valores da segunda variável e marcamos os pontos. O padrão dos
pontos assim marcados costuma ajudar a determinar se existe algum relacionamento entre as duas
variáveis.
Exemplo: O gráfico de dispersão abaixo mostra a estatura de um grupo de alunos do Curso
Superior de Tecnologia de Alimentos do CEFET-PR, Unidade de Medianeira, em função da ordem
de coleta.
Tabela 10.2 - ESTATURA DOS ALUNOS DA TURMA A-51, DO CEFET-PR, UNIDADE MEDIANEIRA.
2o SEMESTRE 2003
ESTATURA
ALUNOS
1
178
10
160
2
165
11
167
3
168
12
173
4
169
13
167
5
165
14
174
6
168
15
160
7
183
16
160
8
175
17
160
9
167
18
166
estatura
ALUNOS
ESTATURA
185
180
175
170
165
160
155
0
5
10
15
20
alunos
O gráfico de dispersão é um importante instrumento de análise preliminar sobre o
comportamento de um conjunto de dados. No gráfico acima é possível visualizar, mesmo que
subjetivamente, como se comporta a variável estatura dos alunos da turma A-51.
27
Prof a Paula Francis Benevides
Estatística
10.4 HISTOGRAMA (OU OGIVA DE GALTON):
O histograma é um gráfico formado por um conjunto de colunas retangulares. No eixo das
abscissas marcamos as classes, cujas amplitudes correspondem às bases dos retângulos. No eixo das
ordenadas marcamos as frequências absolutas, que correspondem às alturas dos retângulos. Os
pontos médios das bases dos retângulos coincidem com os pontos médios dos intervalos de classes.
Os dados da Tabela 10.2 podem ser organizados em uma distribuição de frequência, tal
como na tabela abaixo.
Tabela 10.3 – DISTRIBUIÇÃO DE FREQUENCIA PARA ESTATURA DOS ALUNOS DA TURMA A-51
CLASSES
FREQUENCIAS
160 | 165
4
165 | 170
9
170 | 175
2
175 | 180
2
180 | 185
1
A organização dos dados como na Tabela 10.3 facilita a construção do histograma. Observe
que cada um dos intervalos deve-se construir um retângulo de área proporcional à frequência
absoluta respectiva.··.
28
Estatística
Prof a Paula Francis Benevides
10.5 DIAGRAMA DE PARETO:
Consideremos a afirmação: De 75.200 mortes por acidente nos EUA, em um ano recente,
43.500 foram causados por veículos motorizados, 12.200 por quedas, 6.400 por envenenamento,
4.600 por afogamentos, 4.200 por incêndios, 2.900 por ingestão de alimentos ou de um objeto, e
1.400 por armas de fogo (com base em dados do conselho de Segurança Nacional). O ponto fraco
dessa afirmação escrita é não caracterizar bem um relacionamento entre categorias diferentes de
dados qualitativos. Uma forma mais conveniente de indicar relações entre dados qualitativos é a
construção de um diagrama de Pareto.
Um Diagrama de Pareto é um gráfico em barras pra dados qualitativos, com as barras
ordenadas de acordo com a frequência. Tal como no caso dos histogramas, as escalas verticais em
um diagrama de Pareto podem representar frequências absolutas ou frequências relativas. A barra
mais alta fica à esquerda, e as barras menores na extrema direita. Dispondo as barras por ordem de
frequência, o diagrama de Pareto focaliza a atenção sobre as categorias mais importantes.
29
Prof a Paula Francis Benevides
Estatística
Segundo o gráfico construído acima, podemos ver que as mortes acidentais causadas por
veículos motorizados representam um problema muito mais sério do que as outras categorias.
Embora as mortes acidentais causadas por armas de fogo mereçam considerável atenção dos jornais,
elas constituem um problema relativamente pequeno quando comparadas com as outras categorias.
10.6 GRÁFICO POLÍGONO DE FREQÜÊNCIA:
O polígono de frequência também é estruturado a partir da tabela de frequência, tal qual o
histograma.
Define-se o gráfico polígono de frequência como um gráfico de linha, onde os pontos a
serem conectados pela linha são os pontos médios dos intervalos de classe para as abscissas com as
correspondentes frequências para as ordenadas.
TABELA 10.4 – PONTOS MÉDIOS DOS INTERVALOS DE CLASSE E FREQUENCIAS PARA ESTATURA
DOS ALUNOS DA TURMA A-51
PONTO MÉDIO DOS
FREQÜÊNCIAS
INTERVALOS DE CLASSES
160,0
0
162,5
4
167,5
9
172,5
2
177,5
2
182,5
1
185,0
0
30
Prof a Paula Francis Benevides
Estatística
10.7 GRÁFICO POLÍGONO DE FREQUÊNCIA ACUMULADA (OU OGIVA):
Trata-se de um gráfico importante na análise dos resultados de uma variável, uma vez que
em cada valor da abscissa a partir do valor mínimo, corresponde a frequência acumulada. Neste
caso também a construção de uma Tabela facilita a construção do gráfico.
O polígono de frequência acumulada pode ser definido como um dos gráficos de linhas,
ligadas aos pontos correspondentes ao limite superior dos intervalos de classes para as abscissas e
as frequências acumuladas para as ordenadas. Destaca-se que o primeiro ponto deve ser o valor
mínimo dos dados para a variável independente x e zero para a ordenada.
Tabela 10.5 – DISTRIBUIÇÃO DE FREQUENCIA ACUMULADA PARA ESTATURA DOS ALUNOS
DA TURMA A-51
CLASSES
FREQUENCIAS
FREQUENCIA ACUMULADA
160 | 165
4
4
165 | 170
9
13
170 | 175
2
15
175 | 180
2
17
180 | 185
1
18
31
Prof a Paula Francis Benevides
Estatística
10.8 PICTOGRAMA:
O gráfico que utiliza desenhos para representar um conjunto de dados é denominado
pictograma.
Os gráficos pictogramas são muitos usados na mídia, imprensa escrita e apresentações
visuais. Para elaboração desse tipo de gráfico, é comum a inserção de figuras relacionadas com a
variável em estudo, substituindo representando os elementos dos gráficos gerados.
- Pictograma do Histograma da Estatura dos alunos da turma A-51
AULA 3 - Exercícios
1) Pergunte aos colegas da sua turma de aula qual a disciplina que cada um mais gosta no semestre
e qual é a que cada um menos aprecia. Faça um gráfico de barras para representar os resultados.
2) Os alunos do primeiro ano do Ensino Médio do CEFET-PR, turma M12, fizeram uma prova de
Matemática e obtiveram as seguintes notas:
5
8
5
6
7
5
6
8
4
7
5
5
5
8
5
6
2
5
6
0
6
5
6
7
6
6
7
2
7
6
8
3
4
9
0
1
7
6
3
4
Construa a partir destas notas, os gráficos de:
a. Dispersão
b. Polígono de frequência
c. Frequência Acumulada
d. Histograma
3) Em um mercado de telefones celulares da Região Oeste do Paraná, considerando-se uma fatia de
mercado meramente ilustrativa, obtiveram-se os resultados conforme descritos na tabela abaixo:
32
Prof a Paula Francis Benevides
Estatística
MARCAS
PARTICIPAÇÃO NO MERCADO
Nokia
60%
Ericson
20%
Gradiente
15%
Motorola
5%
100%
TOTAL
Construa um gráfico de setores.
4) Baseando-se no gráfico, responda às questões a seguir:
a. Qual o assunto de que ele trata?
b. Quantas pessoas contaminadas pelo vírus da Aids morreram em 1995? E em 1999?
c. Em que ano se deu a maior contaminação pelo vírus da Aids? Qual o número de pessoas
contaminadas?
d. Qual a porcentagem de mulheres contaminadas pelo vírus da Aids de 1995 a 1999 em
relação ao total de pessoas contaminadas?
5) Analise o gráfico a seguir e responda:
a. De que trata o gráfico em questão?
b. A que tipo de informação o consumidor brasileiro tem menos acesso? Qual a
porcentagem correspondente?
6) O quadro mostra a distribuição dos salários mensais (agrupados em classes) de 40 empregados de
uma firma.
33
Prof a Paula Francis Benevides
Estatística
SALÁRIO (EM REAIS)
NÚMERO DE EMPREGADOS (fi)
800 | 900
4
900 | 1000
10
1000 | 1100
18
1100 | 1200
5
1200 | 1300
3
Nessas condições:
a. Qual é a amplitude do intervalo de classe?
b. Elabore um quadro de distribuição de frequências acumuladas, relativas e relativas
acumuladas. A seguir, construa o histograma de frequências.
c. Quantos empregados ganham menos que R$ 1.000,00 mensais?
d. Qual o índice, em porcentagem, de empregados que ganham R$ 1.000,00 mensais ou
mais.
e. Quantos empregados ganham entre R$ 800,00 (inclusive) e R$ 1200,00?
f. Qual é o índice, em porcentagem, de empregados que ganham menos que R$ 1 000,00?
7) No quadro a seguir estão registradas as massas, em quilogramas, de 50 pessoas que frequentam
uma academia de ginástica.
72 81 57 64 87 90 74 69 77 73
80 96 55 58 88 92 47 60 68 80
77 76 59 57 83 81 90 68 65 74
91 97 86 82 73 64 69 71 88 94
77 72 81 91 49 75 52 50 63 70
a. Escolha um intervalo com amplitude conveniente e elabore um quadro de distribuição de
frequências absolutas e relativas.
b. Construa o histograma para a distribuição.
c. Calcule os pontos médios dos intervalos e represente a distribuição por meio de um
polígono de frequências.
d. Represente essa distribuição por meio de um gráfico de setores com as respectivas
frequências relativas.
8) No laboratório de Eletromecânica, um aluno pesquisador testa cinco diferentes ligas metálicas
para resistência de tensores. O experimento foi efetuado com diversos ensaios relativos às diferentes
ligas. Os resultados obtidos constam da Tabela abaixo:
34
Prof a Paula Francis Benevides
Estatística
MATERIAL
TESTADO
RESULTADO DOS ENSAIOS
Liga metálica 1
12,4
19,8
15,2
14,8
18,5
Liga metálica 2
8,9
11,6
10
10,3
9,8
Liga metálica 3
10,5
13,8
12,1
11,9
12,6
Liga metálica 4
16,4
15,9
17,8
20,3
18,5
Liga metálica 5
12,8
14,2
15,9
14,1
14,8
Com base nos dados obtidos, construa:
a. Um gráfico de linhas que relacione os valores dos ensaios em funções das ligas.
b. Um gráfico de colunas para cada tipo de liga.
c. Um gráfico de dispersão dos resultados em função das ligas.
35
Prof a Paula Francis Benevides
Estatística
AULA 4
11.MEDIDAS DE POSIÇÃO
As medidas de posição permitem ao pesquisador verificar a distribuição e o
comportamento de dados no intervalo fechado [Valor mínimo; Valor máximo].
Entre as medidas de posição citam-se a média aritmética, a mediana e a moda, conhecidas
como medidas de tendência central. As separatrizes também são denominadas medidas de posição:
1o, 2o e 3o quartis, decis e percentis. O segundo quartil equivale à mediana.
11.1 MÉDIA ARITMÉTICA ( x ):
Média aritmética é o quociente da divisão da soma dos valores das variáveis pelo número
deles:
x
x
i
n
sendo:
x = a média aritmética
x i = os valores da variável
n = o número de valores.
11.1.1
DADOS NÃO AGRUPADOS:
Quando desejamos conhecer a média dos dados não agrupados, determinamos a média
aritmética simples.
Exemplo: Relacionam-se há seguir os tempos (em anos) que os 10 primeiros presidentes
americanos sobreviveram à posse. Calcule a média dessa amostra:
10 29 26 28 15 23 17 25 0 20
Solução:
 x = 10 + 29 + 26 + 28 + 15 + 23 + 17 + 25 + 0 + 20 = 193
x
193
 19,3
10
A média é 19,3 anos.
36
Prof a Paula Francis Benevides
Estatística
11.1.2
DESVIO EM RELAÇÃO À MÉDIA:
Denomina-se desvio em relação à média a diferença entre cada elemento de um conjunto
de valores e média aritmética.
Designando o desvio por di , temos:
d i  xi  x
Para o exemplo dado, temos:
11.1.3
di = 10 – 19,3 = - 9,3
d6 = 23 – 19,3 = 3,7
d2 = 29 – 19,3 = 9,7
d7 = 17 – 19,3 = - 2,3
d3 = 26 – 19, 3 = 6,7
d8 = 25 – 19,3 = 5,7
d4 = 28 - 19,3 = 8,7
d9 = 0 - 19,3 = - 19,3
d5 = 15 – 19, 3 = - 4,3
d10 = 20 – 19,3 = 0,7
PROPRIEDADES DA MÉDIA:
1a Propriedade: A soma dos desvios tomados em relação à média é nula.
n
d
i 1
i
0
No exemplo anterior, temos:
10
d
i 1
i
 - 9,3 + 9,7 + 6,7 + 8,7 + (- 4,3) + 3,7 + (- 2,3) + 5,7 + (- 19,3) + 0,7 = 0
2a Propriedade: Somando-se (ou subtraindo-se) uma constante (c) de todos os valores de
uma variável, a média do conjunto fica aumentada (ou diminuída) dessa constante.
y i  xi  c  y  x  c
Somando 2 a cada um dos valores da variável do exemplo dado, temos:
y1 = 12, y2 = 31, y3 28, y4 = 30, y5 = 17, y6 = 25, y7 = 19, y8 = 27, y9 = 2 e y10 = 22
10
y
i 1
i
 12 + 31 + 28 + 30 + 17 + 25 + 19 + 27 + 2 + 22 = 213
Como n = 10, vem: y 
213
 21,3  y  21,3  19,3  2  y  x  2
10
3a Propriedade: Multiplicando-se (ou dividindo-se) todos os valores de uma variável por
uma constante (c), a média do conjunto final fica multiplicado (ou dividido) por essa constante.
y i  xi  c  y  x  c
ou
yi 
xi
x
y
c
c
37
Prof a Paula Francis Benevides
Estatística
11.1.4
DADOS AGRUPADOS:
11.1.4.1 Sem intervalo de classe:
Consideremos a distribuição relativa a 34 famílias de quatro filhos, tomando para variável
o número de filhos do sexo masculino.
Tabela 11.1
No DE MENINOS
fi
0
2
1
6
2
10
3
12
4
4
= 34
Neste caso, como as frequências são números indicadores da intensidade de cada valor da
variável, elas funcionam como fatores de ponderação, o que nos leva a calcular a média aritmética
ponderada, dada pela fórmula:
x
x f
f
i
i
i
O modo mais prático de obtenção da média ponderada é abrir, na tabela, uma coluna
correspondente aos produtos xifi:
Tabela 11.2
xi
fi
xifi
0
2
0
1
6
6
2
10
20
3
12
36
4
4
16
 = 34
 = 78
Logo:
x
x f
f
i
i
i
x
78
 2,29  x  2,3 meninos
34
Nota:
38
Prof a Paula Francis Benevides
Estatística
 Sendo x uma variável discreta, como interpretar o resultado obtido, 2 meninos e 3 décimos
de menino?
O valor médio 2,3 meninos sugere, neste caso, que o maior número de famílias tem 2
meninos e 2 meninas, sendo, porém, a tendência geral de uma leve superioridade numérica
em relação ao número de meninos.
11.1.4.2 Com intervalos de classe:
Neste caso, convencionamos que todos os valores incluídos em um determinado
intervalo de classe coincidem com o seu ponto médio, e determinamos a média aritmética
ponderada por meio da fórmula:
x
x f
f
i
i
onde xi é o ponto médio da classe.
i
Consideremos a distribuição:
Tabela 11.3
i
ESTATURAS (cm)
fi
1
150 | 154
4
2
154 | 158
9
3
158 | 162
11
4
162 | 166
8
5
166 | 170
5
6
170 | 174
3
 = 40
Pela mesma razão do caso anterior, vamos, inicialmente, abrir uma coluna para os pontos
médios e outra para os produtos xifi:
Tabela 11.4
i
ESTATURAS (cm)
fi
xi
xifi
1
150 | 154
4
152
608
2
154 | 158
9
156
1404
3
158 | 162
11
160
1760
4
162 | 166
8
164
1312
5
166 | 170
5
168
840
6
170 | 174
3
172
516
 = 40
 = 6440
39
Prof a Paula Francis Benevides
Estatística
Logo:
x
x f
f
i
i
x
i
6440
 161  x  161 cm
40
11.2 A MODA (MO)
Denominamos moda o valor que ocorre com maior frequência em uma série de valores, ou
seja, é o valor de maior frequência absoluta.
Desse modo, o salário modal dos empregados de uma indústria é o salário mais comum,
isto é, o salário recebido pelo maior número de empregados dessa indústria.
11.2.1
DADOS NÃO AGRUPADOS:
Quando lidamos com valores não agrupados, a moda é facilmente reconhecida: basta, de
acordo com a definição, procurar o valor que mais se repete.
A série de dados:
7, 8, 9, 10, 10, 10, 10, 11, 12, 13, 15
tem moda igual a 10.
Podemos, entretanto, encontrar séries nas quais não exista valor modal, isto em nas quais
nenhum valor apareça mais vezes que outros. É o caso da série:
3, 5, 8, 10, 11, 13, 15
que não apresenta moda, então dizemos que é amodal.
Em outros casos, ao contrário, pode haver dois ou mais valores de concentração. Dizemos,
então, que a série tem dois ou mais valores modais. Na série:
2, 3, 4, 4, 4, 4, 5, 6, 7, 7, 7, 8, 9
temos duas modas: 4 e 7, o conjunto se diz bimodal.
Se mais de dois valores ocorrem com a mesma frequência máxima, cada uma deles é uma
moda, e o conjunto é multimodal.
40
Prof a Paula Francis Benevides
Estatística
11.2.2
DADOS AGRUPADOS:
11.2.2.1 Sem intervalo de classe:
Uma vez agrupado os dados, é possível determinar imediatamente a moda: basta fixar o
valor da variável de maior frequência.
Na distribuição da Tabela 11.1, à frequência máxima (12) corresponde o valor 3 da
variável. Logo:
Mo = 3
11.2.2.2 Com intervalo de classe:
A classe que apresenta a maior frequência é denominada classe modal. Pela definição,
podemos afirmar que a moda, neste caso, é o valor dominante que esta compreendido entre os
limites da classe modal.
O método mais simples para o cálculo da moda consiste em tomar o ponto médio da classe
modal.
Damos a esse valor a denominação de moda bruta.
Temos então:
Mo 
lL
, onde l é o limite inferior da classe modal e L é o limite superior.
2
Assim, para a distribuição da Tabela 11.3, temos que a classe modal é i = 3, l = 158 e L =
162.
Logo:
Mo 
158  162 320

 160
2
2
11.3 A MEDIANA (MD):
A mediana é outra medida de posição definida como o número que se encontra no centro de
uma série de números, estando estes dispostos segundo uma ordem. Em outras palavras, a mediana
de um conjunto de valores, ordenados segundo uma ordem de grandeza, é o valor situado de tal
forma no conjunto que o separa em dois subconjuntos de mesmo número de elementos.
11.3.1
DADOS NÃO AGRUPADOS:
Dada uma série de valores, como por exemplo:
5, 13, 10, 2, 18, 15, 6, 16, 9
41
Prof a Paula Francis Benevides
Estatística
de acordo com a definição de mediana, o primeiro passo a ser dado é o da ordenação (ordem
crescente ou decrescente) dos valores:
2, 5, 6, 9, 10, 13, 15, 16, 18
Em seguida, tomamos aquele valor central que apresenta o mesmo número de elementos à
direita e à esquerda. Em nosso exemplo, esse valor é 10, já que nessa série, há quatro elementos
acima dele e quatro abaixo. Temos então:
Md = 10
Se porém, a série dada tiver um número par de termos, a mediana será, por definição,
qualquer dos números compreendidos entre os dois valores centrais da série. Convencionou-se
utilizar o ponto médio
Assim, a série de valores:
2, 6, 7, 10, 12, 13, 18, 21
tem para mediana a média aritmética entre 10 e 12.
Logo:
Md 
10  12 22

 11  Md  11
2
2
Verificamos que, estando ordenados os valores de uma série e sendo n o número de
elementos da série, o valor mediano será:
o termo de ordem
n 1
, se n for ímpar
2
a média aritmética dos termos de ordem
n n
e  1 , se n for par.
2 2
Notas:
 A mediana e a média aritmética não tem necessariamente, o mesmo valor.
 A mediada, como vimos, depende da posição e não dos valores dos elementos na série
ordenada. Essa é uma diferença marcante entre a mediana e a média (que se deixa influenciar,
e muito, pelos valores extremos).
 A mediana designada, muitas vezes, por valor mediano.
11.3.2
DADOS AGRUPADOS:
Se os dados se agrupam em uma distribuição de frequência, o cálculo da mediana se
processa de modo muito semelhante aquele dos dados não agrupados, implicando porém, a
determinação prévia das frequências acumuladas. Ainda aqui, temos que determinar um valor tal
que divida a distribuição em dois grupos que contenham o mesmo número de elementos.
42
Prof a Paula Francis Benevides
Estatística
Para o caso de uma distribuição, porém, a ordem, a partir de qualquer um dos extremos, é
dada por:
f
i
2
11.3.2.1 Sem intervalo de classes:
Neste caso, é o bastante identificar a frequência acumulada imediatamente superior à metade
da soma das frequências. A mediana será aquele valor da variável correspondente a tal frequência
acumulada.
Tomemos a distribuição relativa a Tabele 11.1, completando-a com a coluna correspondente
à frequência acumulada:
Tabela 11.5
o
N DE MENINOS
fi
fia
0
2
2
1
6
8
2
10
18
3
12
30
4
4
34
= 34
Sendo:
f
2
i
=
34
 17
2
a menor frequência acumulada que supera esse valor é 18, que corresponde ao valor 2 da
variável, sendo este valor mediano. Logo, Md = 2 meninos
Nota:
f
 No caso de existir uma frequência acumulada (fia), tal que: f ia  2 i , a mediana será
dada pela média aritmética entre o valor da variável correspondente a essa frequência
acumulada e o seguinte.
Exemplo:
43
Prof a Paula Francis Benevides
Estatística
Tabela 11.6
xi
fi
fia
12
1
1
14
2
3
15
1
4
16
2
6
17
1
7
20
1
8
= 8
Temos:
8/2 = 4
Logo, Md 
15  16 31
  15,5
2
2
Md 
xi  xi 1
2
Onde:
Md = 15,5
11.3.2.2 Com intervalos de Classe:
Neste caso o problema consiste em determinar o ponto do intervalo em que esta
compreendida a mediana.
Para tanto, temos inicialmente que determinar a classe na qual se acha a mediana – classe
mediana. Tal classe será, evidentemente, aquela correspondente a
imediatamente superior a
f
2
i
frequência acumulada
.
Feito isso, um problema de interpolação (inserção de uma determinada quantidade de
valores entre dois números) resolve a questão, admitindo-se agora, que os valores se distribuam
uniformemente em todo o intervalo de classe.
Assim, considerando a distribuição da Tabela 11.3, acrescida das frequências acumuladas:
44
Prof a Paula Francis Benevides
Estatística
Tabela 11.7
i
ESTATURAS (cm)
fi
fia
1
150 | 154
4
4
2
154 | 158
9
13
3
158 | 162
11
24
4
162 | 166
8
32
5
166 | 170
5
37
6
170 | 174
3
40
 = 40
Temos:
f
2
i
=
40
 20
2
Como há 24 valores incluídos nas três primeiras classes da distribuição, a partir do início da
série, vemos que este deve estar localizado na terceira classe (i = 3), supondo que as frequências
dessas classes estejam uniformemente distribuídas.
Como há 11 elementos nessa classe e o intervalo de classe é igual a 4, devemos tomar, a
partir do limite inferior, à distância:
20  13
28
4
11
11
e a mediana será dada por:
Md  158 
28
 160,54
11
Logo, Md = 160,5 cm.
Na prática executamos os seguintes passo:
1o) Determinamos as frequências acumuladas
f
2o) Calculamos
i
2
3o) Marcamos a classe correspondente à frequência acumulada imediatamente
superior a
f
2
i
- classe mediana – e, em seguida, empregamos a fórmula:
45
Prof a Paula Francis Benevides
Estatística
 fi

 f ia (ant )  h

 2

Md  l 
fi
onde:
l é o limite inferior da classe mediana
fia(ant) é a frequência acumulada da classe anterior à classe mediana
fi é a frequência simples da classe mediana
h é a amplitude do intervalo da classe mediana.
11.4 POSIÇÃO RELATIVA DA MÉDIA, MEDIANA E MODA:
Quando uma distribuição é simétrica, as três medidas coincidem. Porém, a assimetria
torna-as diferente e essa diferença é tanto maior quanto maior é a assimetria. Assim, em uma
distribuição em forma de sino, temos:
x  Md  Mo , no caso da curva simétrica;
Mo  Md  x , no caso da curva assimétrica positiva;
x  Md  Mo , no caso da curva assimétrica negativa.
46
Prof a Paula Francis Benevides
Estatística
AULA 04 - Exercícios
1) Complete o esquema para o cálculo da média aritmética da distribuição de frequência.
CUSTO (R$)
450 | 550 | 650 | 750 | 850 | 950 | 1050 | 1150
8
fi
10
11
16
13
5
1
Temos:
1
xi
fi
xi fi
500
8
4000
2
10
3
11
4
16
5
13
6
5
7
1100
1
=
Logo:
x
.......
 .......
.......
=
onde x = R$ 755
2) No ano 2000, o número de nascimentos, por mês, em uma maternidade foi:
Jan
Fev
Ma
r
Ab
r
Ma
io
Jun
Jul
Ago
Set
Out
Nov
Dez
Mês
Nascimento 38
25
42
30
29
47
18
36
38
43
49
37
a) Calcule a média de nascimentos.
b) Em que meses o número de nascimentos ficou acima da média?
3) A classificação final para um determinado curso é a média ponderada das provas de capacidade
geral, com peso 3, e das provas de capacidade especifica, com peso 2. Nessas condições, qual é
a classificação final de um aluno que obteve 162 pontos na prova de capacidade geral e 147
pontos na prova de capacidade específica?
47
Prof a Paula Francis Benevides
Estatística
4) O quadro de distribuição de frequência representa os salários mensais de 40 empregados de
uma firma. Calcule o salário médio mensal dos empregados dessa firma.
CLASSE (em R$)
Ponto Médio da Classe
Frequência (fi )
180 | 200
190
4
200 | 220
210
18
220 | 240
230
10
240 | 260
250
5
260 |280
270
3
5) É dado um conjunto de 20 números cuja média aritmética é 64. Cada número desse conjunto é
multiplicado por 2 e, em seguida, acrescido de 5 unidades. Qual é a média aritmética dos 20
números assim obtidos?
6) A média das idades de um grupo de estudantes é 22 anos. Excluindo-se o mais novo deles, que
tem 17 anos, a média do novo grupo formado passa a ser 23 anos. Quantos estudantes há no
primeiro grupo?
7) Um comerciante mistura 4 kg do café tipo A, que custa R$ 6,00 o quilo; 10 kg do café B, que
custa R$ 5,60 o quilo; e 6 kg do café C, que custa R$ 5,00 o quilo. Qual o preço por quilo da
mistura?
8) Para ser aprovado em uma disciplina, o aluno precisa ter média maior ou igual a 5,0, obtida
num conjunto de cinco provas, sendo quatro parciais, com peso 1 cada, e uma prova-exame,
com peso 2. Um aluno obteve, nas quatro provas parciais, notas iguais a 3,0; 6,0; 5,0 e 7,0.
Calcule a nota mínima que esse aluno deverá obter na prova-exame para ser aprovado.
9) As marcas obtidas, em metros, pelos alunos numa prova de salto em distancia foram as
seguintes
2,20
2,28
2,23
2,20
2,35
2,28
2,25
2,30
2,37
Calcule a média, a mediana e a moda dessa distribuição.
10) O quadro de frequências a seguir, refere-se às idades dos jogadores de basquete de um clube.
ID
NÚMERO DE
ADE
JOGADORES
xi
fi
16
6
14
12
15
15
20
24
23
9
Qual será a mediana dos dados nesse caso?
48
Prof a Paula Francis Benevides
Estatística
11) Em uma casa de repouso, as pessoas internadas tem as seguintes idades:
67 68 74 67 68 84 75 80 75 84
75 73 67 74 78 77 75 80 74 77
85 85 68 74 72 73 71 73 71 85
68 84 80 77 78 75 71 72 73 84
Calcule a mediana e a moda dessa distribuição.
12) Complete o esquema para o cálculo da mediana das distribuições:
xi
2 4 6 8 10
fi
3
7
12
8
4
Temos:
xi
fi
2
3
4
7
6
12
8
8
10
4
fia
10
30
=
Como:
f
2
i

......
 .......... .
2
vem: Md=.................
13) Complete o esquema para o cálculo da mediana da distribuição de frequência:
CUSTO (R$) 450 | 550 | 650 | 750 | 850 | 950 | 1050 | 1150
fi
8
10
11
16
13
5
1
Temos:
i
CUSTOS (R$)
fi
fia
1
450 | 550
8
8
2
550 | 650
3
650 | 750
4
750 | 850
5
850 | 950
6
950 | 1050
7
1050 | 1150
18
=
49
Prof a Paula Francis Benevides
Estatística
f
i
2

......
 .......... .
2
l =................., fia (ant) = .................., fi = .................... e h = ......................
Logo:
Md  .......... . 
(........  .......... )......... .
..........
 .......... 
 .......... .  .......... ..  .......... ....
.......... .....
.........
isto é:
Md = R$ 769
50
Prof a Paula Francis Benevides
Estatística
AULA 5
11.5 AS SEPARATRIZES:
Como vimos, a mediana caracteriza uma série de valores devido à sua posição central. No
entanto, ela apresenta uma outra característica, tão importante quanto a primeira: ela separa a série
em dois grupos que apresentam o mesmo número de valores.
Assim, além das medidas de posição que estudamos, há outras que, consideradas
individualmente, não são medidas de tendência central, mas estão ligadas à mediana relativamente à
sua segunda característica, já que se baseiam em sua posição na série. Essas medidas – os quartis,
os percentis e os decis – são, juntamente com a mediana, conhecidas pelo nome genérico de
separatrizes.
11.5.1
OS QUARTIS:
Denominamos, quartis os valores de uma série que a dividem em quatro partes iguais.
Há portanto, três quartis:
a) O primeiro quartil (Q1) – valor situado de tal modo na série que uma quarte parte
(25%) dos dados é menor que ele e as três quartas partes restantes (75%) são
maiores.
b) O segundo quartil (Q2) – evidentemente, coincide com a mediana (Q2 = Md)
c) O terceiro quartil (Q3) – valor situado de tal modo que as três quartas partes (75%)
dos termos são menores que ele e uma quarta parte (25%) é maior.
Quando os dados são agrupados, para determinar os quartis usamos a mesma técnica do
cálculo da mediana, bastando substituir, na fórmula da mediana
 fi
2
por:
k  fi
4
sendo k o
número de ordem do quartil.
Assim temos:
 k  fi

 fia (ant )  h

4

Qk  l  
fi
Exemplo:
51
Prof a Paula Francis Benevides
Estatística
Tabela 11.8
ESTATURAS (cm)
fi
fia
150 | 154
4
4
154 | 158
9
13
158 | 162
11
24
162 | 166
8
32
166 | 170
5
37
170 | 174
3
4
← (Q1)
← (Q3)
 = 40
Primeiro Quartil
Terceiro Quartil
 f i  40  10
3 f i
4
4
4
Q1  154 
10  4 4  156,66
9
Q1  156,7cm
11.5.2

3  40
 30
4
Q3  162 
30  24 4  165
8
Q3  165cm
OS PERCENTIS:
Denominamos percentis os noventa e nove valores que separam uma série de 100 iguais.
Indicamos por P1, P2,....,P32,....,P99.
É evidente que:
P50 = Md, P25 = Q1 e P75 = Q3
O cálculo de um percentil segue a mesma técnica do cálculo da mediana, porém, a fórmula
 fi
2
será substituída por:
k  fi
100
sendo k o número de ordem do percentil.
 k  fi

 f ia (ant )  h

 100

Assim temos: Pk  l  
fi
Exemplo: Considerando a Tabela 11.8, temos para o oitavo percentil:
k 8
8 f i
100

8  40
 3,2
100
Logo: P8  150 
(3,2  0)  4
 153,2
4
52
Prof a Paula Francis Benevides
Estatística
AULA 05 - EXERCÍCIOS
1) Calcule do primeiro quartil, o terceiro quartil e o vigésimo percentil da distribuição de
frequência:
CUSTO (R$) 450 | 550 | 650 | 750 | 850 | 950 | 1050 | 1150
fi
8
10
11
16
13
i
CUSTOS (R$)
fi
1
450 | 550
8
8
2
550 | 650
10
18
3
650 | 750
11
29
4
750 | 850
16
45
5
850 | 950
13
58
6
950 |1050
5
63
7
1050 | 1150
1
64
5
1
fia
← (Q1)
← (Q3)
∑ = 64
2) Calcule a média aritmética, a mediana, a moda, o primeiro e o terceiro quartis, o 10 o, o 1o, o 23o,
o 15o e o 90o percentis das distribuições de frequência abaixo:
a)
b)
ESTATURAS (cm)
fi
5
150 | 158
5
2 | 4
8
158 | 166
12
4 | 6
14
166 | 174
18
6 | 8
10
174 | 182
27
8 | 10
7
182 | 190
8
NOTAS
fi
0 | 2
∑ = 44
∑= 70
53
Prof a Paula Francis Benevides
Estatística
c)
d)
SALÁRIOS (R$)
fi
PESOS (kg)
fi
500
| 700
18
145 |151
10
700
| 900
31
151 | 157
9
900
| 1100
15
157 | 163
8
1100 | 1300
3
163 | 169
6
1300 | 1500
1
169 | 175
3
1500 | 1700
1
175 | 181
3
1700 | 1900
1
181 | 187
1
∑ = 40
∑ = 70
3) Determine os desvios em relação à média dos seguintes dados: 6, 8, 5, 12, 11, 7, 4, 15. Qual a
soma dos desvios?
4) Em uma classe com 50 alunos, as notas obtidas formaram a seguinte distribuição:
Notas
2
3 4
5 6 7 8 9 10
NO DE ALUNOS
1
3
6
10
13
8
5
3
1
Calcule:
a) a nota média
b) a nota mediana
c) a nota modal
5) Considerando a distribuição abaixo:
xi
3
4
5
6
7
8
fi
4
8
11
10
8
3
Calcule:
a) a média
b) a mediana
c) a moda
6) Os salários-hora de cinco funcionários de uma companhia são: R$75, R$ 90, R$ 83, R$ 142 e R$
88. Determine:
a) a média dos salários-hora
b) o salário-hora mediano.
7) Considere o conjunto de dados:
a) 3, 5, 2, 6, 5, 9, 5, 2, 8, 6
b) 20, 9, 7, 2, 12, 7, 20, 15, 7
c) 51, 6; 48,7; 50,3; 49,5; 48,9
d) 15, 18, 20, 13, 10, 16, 14
Calcule:
I. a média
II. a mediana
III. a moda
54
Prof a Paula Francis Benevides
Estatística
AULA 6
12.MEDIDAS DE DISPERSÃO OU DE VARIABILIDADE
As medidas de dispersão medem a variabilidade dos dados em estudo. As medidas de
dispersão como amplitude, variância, desvio padrão e coeficiente de variação, permitem verificar se
o conjunto de dados é homogêneo ou heterogêneo.
12.1 AMPLITUDE:
Amplitude total ou máxima é a diferença entre o maior e o menor valor de um conjunto de
dados. O cálculo e a interpretação da amplitude máxima é muito fácil. Como no caso da estatura da
Tabela 11.4, a amplitude máxima é dada pela diferença entre 174 e 150cm, ou seja, 24 cm. Logo, a
estatura dos alunos em questão vaia de 24 cm.
A amplitude total tem o inconveniente de só levar em conta os dois valores extremos da
série, descuidando do conjunto de valores intermediários, o que quase sempre invalida a idoneidade
do resultado. Ela é apenas uma indicação aproximada da dispersão ou variabilidade.
Faz-se uso da amplitude total quando se quer determinar a amplitude da temperatura em um
dia ou no ano, no controle de qualidade ou como uma medida de cálculo rápido, e quando a
compreensão popular é mais importante que a exatidão e a estabilidade.
12.2 DESVIO MÉDIO:
A média aritmética dos valores absolutos dos desvios para a média é uma medida de
dispersão chamada desvio médio, que se indica por dm.
Quando os dados da distribuição estão agrupados, a fórmula para o cálculo do desvio médio
é:
n
dm 
 f i  xi  x
i 1
n
 fi
i 1
Exemplo:
1) A tabela abaixo mostra o total de pontos obtidos por dois times de futebol no período de 1996 a
2000.
1996
1997
1998
1999
2000
TIME A
7
12
20
16
10
TIME B
18
16
15
9
12
55
Prof a Paula Francis Benevides
Estatística
Qual o desvio médio de cada um desses times?
Time A:
Vamos calcular a média aritmética dos dados:
7  12  20  16  10
 13
5
x 
Vamos calcular os desvios para a média, ou seja x1- x
7 - 13 = - 6
16 – 13 = 3
12 – 13 = - 1
10 – 13 = - 3
20 – 13 = 7
Finalmente, vamos calcular o desvio médio:
| 6 |  | 1 |  | 7 |  | 3 |  | 3 |
 4
5
dm 
Logo, o desvio médio do time A é 4
Time B:
A média aritmética é igual a:
x 
18  16  15  9  12
 14
5
Os desvios para as médias são iguais a:
18 – 14 = 4
15 – 14 = 1
16 – 14 = 2
9 – 14 = - 5
12 – 14 = - 2
O desvio médio é igual a:
dm 
| 4 |  | 2 |  | 1 |  | 5 |  | 2 |
 2,8
5
Logo, o desvio médio do time A é 2,8
Qual o time mais regular nesse período?
Como o desvio médio do time B é menor que o desvio médio do time a (2,8 < 4), o time B é
o mais regular.
2) Considere a distribuição de frequência representada pelo quadro abaixo e determine:
a) a média aritmética
b) o desvio médio
I
Classe
fi
1
O | 4
2
2
4 | 8
6
3
8 | 12
8
4
12 | 16
3
5
16 | 20
1
56
Prof a Paula Francis Benevides
Estatística
Tomando como base essa distribuição, vamos fazer um quadro mais completo, que nos
permite calcular a média, os desvios em relação à média e o desvio médio.
i
Classe
Ponto médio da classe
fi
f i . xi
xi  x
f i xi  x
1
0 | 4
2
2
4
7
14
2
4 | 8
6
6
36
3
18
3
8 | 12
10
8
80
1
8
4
12 | 16
14
3
42
5
15
5
16 | 20
18
1
18
9
9
∑=20
∑= 180
5
x

i 1
5
fi xi

i 1
fi
5

180
9
20
dm 

i 1
f i  xi  x
5

i 1

fi
∑= 64
64
 3,2
20
Logo o valor da média aritmética é 9 e o desvio médio tem valor 3,2
12.3 DESVIO PADRÃO:
Ao iniciar as análises de um agrupamento de dados, a média permite que se estabeleça um
juízo sobre tal conjunto. Porém, não permite avaliar a dispersão, principalmente para conjunto de
dados numerosos.
O desvio padrão foge a falha que ocorre na amplitude, por levar em conta todos os valores
em questão. Portanto, o desvio padrão é muito mais conveniente no cálculo da dispersão.
O desvio padrão é definido como a raiz quadrada da média dos quadrados dos desvios.
 xi  x 
2
s
n
Se bem que a fórmula dada para o cálculo do desvio seja a que torna mais fácil a sua
compreensão, ela não é uma boa fórmula para fins de computação, pois, em geral, a média
aritmética ( x ) é um número fracionário, o que torna pouco prático o cálculo das quantidades
( xi  x ) 2 .
Para simplificar os cálculos , usamos a seguinte fórmula:
s
 xi2    xi 
n
2
 n 


57
Prof a Paula Francis Benevides
Estatística
12.3.1
PROPRIEDADES DO DESVIO PADRÃO
O desvio padrão goza de algumas propriedades, dentre as quais destacamos:
1a Propriedade: Somando-se (ou subtraindo-se) uma constante de todos os valores de uma
variável, o desvio padrão não se altera.
2a Propriedade: Multiplicando-se todos os valores de uma variável por uma constante
(diferente de zero), o desvio padrão fica multiplicado por essa constante.
12.3.2
DADOS NÃO- AGRUPADOS:
Tomemos, como exemplo, o conjunto de valores da variável x:
40
45
48
52
54
62
70
O modo mais prático para se obter o desvio padrão é formar uma tabela com duas colunas,
uma pra xi e outra para xi2.
Tabela 12.1
xi
xi2
40
1600
45
2025
48
2304
52
2704
54
2916
62
3844
70
4900
∑ = 371
∑= 20293
Como n = 7, temos:
2
s
20293  371 

  90  9,486
7
 7 
logo, s = 9,49
12.3.3
DADOS AGRUPADOS:
12.3.3.1 Sem intervalo de Classe:
Como, neste caso, temos a presença de frequências, devemos levá-las em consideração,
resultando a fórmula:
s
 f i xi2    f i xi 
n


n
2


58
Prof a Paula Francis Benevides
Estatística
Consideremos, como exemplo a seguinte tabela:
Tabela 12.2
xi
0
1
2
3
4
fi
2
6
12
7
3
O modo mais prático para se obter o desvio padrão é abrir, na tabela dada, uma colunapara
os produtos fixi e outra para fixi2, lembrando que para obter fixi2 basta multiplicar cada fixi pelo seu
respectivo xi. Assim:
Tabela 12.3
xi
fi
fixi
fixi2
0
2
0
0
1
6
6
6
2
12
24
48
3
7
21
63
4
3
12
48
∑ = 30
∑ = 63
∑ = 165
Logo:
2
165  63 
s
    1,09  1,044
30  30 
Daí: s = 1, 04
12.3.3.2 Com intervalo de classe:
Tomemos como exemplo a distribuição da seguinte Tabela 11.3.
Começaremos por abrir as colunas para xi (ponto médio), para fixi e para fixi2. Assim
Tabela 12.4
i
ESTATURAS (cm)
fi
xi
fixi
fixi2
1
150 | 154
4
152
608
92416
2
154 | 158
9
156
1404
219024
3
158 | 162
11
160
1760
281600
4
162 | 166
8
164
1312
215168
5
166 | 170
5
168
840
141120
6
170 | 174
3
172
516
88752
∑ = 6440
∑=
 = 40
1038080
59
Prof a Paula Francis Benevides
Estatística
Logo:
2
1038080  6440 
s

  31  5,567 daí: s = 5,57
40
 40 
12.4 VARIÂNCIA:
A variância nada mais é do que o quadrado do desvio padrão.
12.5 COEFICIENTE DE VARIAÇÃO:
O coeficiente de variação dá uma idéia da precisão de um experimento ou da dispersão de
um conjunto de dados. É definido como o quociente entre desvio padrão e a média, multiplicado por
100. Logo, o coeficiente de variação nada mais é do que o desvio padrão em porcentagem da média.
CV 
s
 100
x
Para a distribuição da tabela 12.4, obtemos x = 161 cm e s = 5,57 cm, logo
CV 
5,57
 100  3,459  3,5%
161
Exemplo:
Tomemos os resultados das medidas das estaturas e dos pesos de um mesmo grupo de
indivíduos:
ESTATURAS
PESOS
x
s
175 cm
5,0 cm
68 kg
2,0 kg
Temos:
CVE 
5
 100  2,85 %
175
e
CVP 
2
 100  2,94 %
68
Logo, nesse grupo de indivíduos, os pesos apresentam maior grau de dispersão que as
estuturas.
60
Prof a Paula Francis Benevides
Estatística
AULA 6 - Exercícios
1) As alturas dos jogadores de um time de basquete são, em centímetros, 195, 198, 201, 192 e 204.
Nessas condições, determine:
a) a média das alturas
b) o desvio médio
2) A tabela seguinte mostra o número de operários acidentados por mês numa fábrica, durante o ano
Fev.
Mar.
Abril.
Maio.
Junho
Julho
Agosto.
Set.
Out.
Nov.
Dez.
Mês
Jan.
de 2000.
4
8
3
6
7
7
3
8
4
4
3
3
Operários
Organize uma tabela de distribuição de frequências e determine:
a) a média aritmética dessa distribuição
b) o desvio médio
3) Determine a média aritmética e o desvio médio, dos valores apresentados na tabela seguinte:
xi
2
3
4
5
6
7
fi
5
10
15
12
5
3
4) A tabela a seguir mostra o número de votos por classe de dois candidatos que estão concorrendo
a uma vaga de representante no conselho da escola.
3A
3B
3C
3D
3E
3F
VITOR
12
15
12
16
14
15
RAFAEL
12
11
18
9
19
15
Calcule o desvio padrão de cada um desses candidatos.
Qual dos dois candidatos é o mais regular?
5) Calcule a variância e o desvio padrão da seguinte distribuição:
Classe
fi
O | 4
2
4 | 8
6
8 | 12
8
12 | 16
3
16 | 20
1
61
Prof a Paula Francis Benevides
Estatística
6) As velocidades máximas das cinco voltas dadas em um teste de Fórmula 1, em km/h, foram: 190,
198, 196, 204 e 202. Nessas condições, determine:
a) a média das velocidades
b) a variância
c) o desvio padrão
7) Dez canções concorrentes a um festival foram apreciadas por um júri que lhes atribuiu as
seguintes pontuações: 1, 5, 4, 3, 2, 1, 1, 1, 5, 2.
a) elabore uma tabela com as frequências e com os quadrados dos desvios para a média
b) calcule a moda e a mediana
c) desvio padrão
8) O tempo gasto por seis alunos para fazer um trabalho foi, em minutos, 6, 5, 5, 3, 3, 2. Nessas
condições, calcule a média aritmética, o desvio médio, a variância e o desvio padrão dessa
distribuição.
9) Complete o esquema para o cálculo do desvio padrão, dados os valores da variável: 8, 10, 11, 15,
16, 18
n=
xi
xi2
8
64
∑=
∑=
2
.....  ..... 
    .........  ........... isto é: s = 3,56
Logo: s 
.....  ..... 
10) Comprove a primeira propriedade do desvio padrão somando 5 a cada valor da variável do
exercício anterior.
11) Comprove a segunda propriedade do desvio padrão multiplicando por 2 cada valor da variável
do exercício 9.
12) Complete o esquema para o cálculo do desvio padrão da distribuição:
xi
1
2
3
4
5
6
fi
2
5
8
6
3
1
Temos:
62
Prof a Paula Francis Benevides
Estatística
xi
fi
fixi
fixi2
1
2
2
2
∑=
∑=
∑=
2
3
4
5
6
Logo:
2
.....  ..... 
s
    ......  (........) 2  .......  ........... isto é: s = 1,24
.....  ..... 
13) Calcule a amplitude total e os desvios padrões dos conjuntos de dados:
a) 1, 3, 5, 9
b) 20, 14, 15, 19, 21, 22, 20
c) 17,9; 22,5; 13,3; 16,8; 15,4; 14,2
d) – 10, - 6, 2, 3, 7, 9, 10
14) Calcule os desvios padrões e a amplitude total das distribuições:
a)
xi
2
3
4
5
6
7
8
fi
1
3
5
8
5
4
2
b)
Classes 1,5 | 1,6 | 1,7 | 1,8 | 1,9 | 2,0 | 2,1 | 2,2
fi
4
8
12
15
12
8
4
63
Prof a Paula Francis Benevides
Estatística
AULA 7
13.MEDIDAS DE ASSIMETRIA:
A medida de assimetria indica o grau de distorção da distribuição em relação e uma
distribuição simétrica.
13.1 DISTRIBUIÇÃO DE FREQÜÊNCIA SIMÉTRICA:
Uma distribuição é dita simétrica se existe um eixo de simetria no gráfico gerado pela tabela
de frequência. Esse eixo divide o gráfico em duas partes iguais, de modo que, se rebatermos uma na
outra, elas se sobrepõem completamente. Como mostra as figuras abaixo.
Sempre que os dados tiverem média, mediana e moda iguais, a distribuição será simétrica.
x =Md=Mo
13.2 DISTRIBUIÇÃO DE FREQÜÊNCIA ASSIMÉTRICA:
Se a distribuição não for simétrica, podemos ter dois casos de assimetria: assimetria positiva
e assimetria negativa.
A assimetria será negativa se a cauda da distribuição estiver do lado esquerdo do gráfico,
como mostra a figura 13.2a, e será positiva se a cauda da distribuição estiver do lado direito do
gráfico, como mostra a figura 13.2b. A assimetria geralmente ocorre devido à extensão de uma das
caudas da distribuição. Uma vez que os valores da cauda afetam muito a média, mas não a mediana
e a moda, a média sempre acompanha o lado da cauda da distribuição, como mostra a figura 13.1.
64
Prof a Paula Francis Benevides
Estatística
13.2 - Distribuições assimétricas
Das figuras 13.3a e 13.3b, podemos verificar que a distância da média em relação à moda e a
mediana será maior, quanto maior for a extensão da cauda da distribuição e, conseqüentemente,
maior será a assimetria da distribuição.
13.3 – Distribuições assimétricas positivas
Moda
Mediana
Média
Mo< Md < x
X< Md< Mo
A natureza da assimetria já foi estudada no capítulo 11, item 11.4, quando vimos que, sendo
a distribuição simétrica, a média e a moda coincidem; sendo a distribuição assimétrica à esquerda
ou negativa, a média é menor que a moda; e sendo assimétrica à direita ou positiva, a média é maior
que a moda.
Baseando-se nessas relações entre média e a moda, podemos empregá-las para determinar o
tipo de assimetria. Assim, assim calculando o valor da diferença:
x  Mo
se:
x - Mo = 0  assimetria nula ou distribuição simétrica
x - Mo < 0  assimetria negativa ou à esquerda
x - Mo > 0  assimetria positiva ou à direita
65
Prof a Paula Francis Benevides
Estatística
13.3 COEFICIENTE DE ASSIMETRIA:
A medida anterior, por ser absoluta, apresenta a mesma deficiência do desvio padrão, isto é,
não permite a possibilidade de comparação entre as medidas de duas distribuições. Por esse motivo,
daremos preferência ao coeficiente de assimetria de Pearson, dado por:
As 
3( x  Md )
s
ou As 
x  Mo
s
Dependendo do valor de As, podemos classificar a distribuição em:
 Simétrica, se |As| < 0,15
 Assimétrica moderada, se 0,15 ≤ |As| <1,0
 Assimétrica forte, se |As| ≥ 1,0
A análise da assimetria pode ser feita por outras expressões, como:
n
 ( xi  x ) 3
i 1
As 
n
s3
ou
As 
(Q3  mediana )  (mediana  Q1 )
(coeficiente de Bowley)
(Q3  mediana )  (mediana  Q1 )
Exemplo:
DISTRIBUIÇÃO A
Pesos(kg) fi
2 | 6
6
6 | 10
12
10 | 14
24
14 | 18
12
18 | 22
6
∑ = 60
x =12 kg
Md = 12 kg
Mo = 12 kg
s = 4,42 kg
66
Prof a Paula Francis Benevides
Estatística
DISTRIBUIÇÃO B
Pesos(kg)
fi
2 | 6
6
6 | 10
12
10 | 14
24
14 | 18
30
6
18 | 22
∑ = 78
x =12,9 kg
Md = 13,5 kg
Mo = 16 kg
s = 4,20 kg
Mo = 8 kg
s = 4,20 kg
DISTRIBUIÇÃO C
Pesos(kg)
fi
2 | 6
6
6 | 10
30
10 | 14
24
14 | 18
12
6
18 | 22
∑ = 78
x =11,1 kg
Md = 10,5 kg
Logo:
A: 12 – 12 = 0  a distribuição é simétrica
B: 12,9 – 16 = - 3,1  a distribuição é assimétrica negativa
C: 11,1 – 8 = 3,1  a distribuição é assimétrica positiva
Considerando os gráficos das distribuições anteriores, temos:
67
Prof a Paula Francis Benevides
Estatística
14.MEDIDAS DE CURTOSE:
Denominamos de curtose o grau de achatamento de uma distribuição em relação a uma
distribuição em relação a uma distribuição padrão, denominada curva normal (curva
correspondente a uma distribuição teórica de probabilidade).
Quando a distribuição apresenta uma curva de frequência mais fechada que a normal (ou
mais aguda em sua parte superior), ela recebe o nome de leptocúrtica.
Quando a distribuição apresenta uma curva de frequência mais aberta que a normal (ou mais
achatada na sua parte superior), ela é chamada de platicúrtica.
A curva normal, que é a nossa referencial, recebe o nome de mesocúrtica.
14.1 COEFICIENTE DE CURTOSE:
A curtose pode ser medida pela seguinte expressão:
c
Q3  Q1
2( P90  P10 )
Essa fórmula é conhecida como coeficiente percentílico de curtose.
Relativamente a curva normal, temos; c = 0,263
68
Prof a Paula Francis Benevides
Estatística
Assim:
C = 0,263  curva mesocúrtica
C < 0,263  curva leptocúrtica
C > 0,263  curva platicúrtica
Exemplo:
Sabendo-se que uma distribuição apresenta as seguintes medidas:
Q1 = 24,4 cm, Q3 = 41,2 cm, P10 =20,2 cm e P90 =49,4 cm, temos:
C 
41,2  24,4
16,8

 0,2866  C  0,287
2( 49,5  20,2)
58,5
Como: 0,287>0,263, concluímos que a distribuição é platicúrtica, em relação a normal.
AULA 07 - Exercícios
1) Uma escola faz uma pesquisa sobre o tempo, em horas, que os estudantes dedicam ao estudo
durante o dia, fora da aula. Com uma amostra aleatória de 60 estudantes, obtiveram-se os dados da
tabela de frequência a seguir. Calcule a média, a moda e o desvio padrão e classifique a assimetria
da distribuição de frequência obtida.
Horas de Estudo
No de alunos
0,5 | 1,5
25
1,5 | 2,5
17
2,5 | 3,5
10
3,5 | 5,5
6
5,5 | 8,5
2
2) Uma maternidade está analisando a idade das mulheres que tiveram o seu primeiro filho. Os
dados obtidos são:
25 23 21 28 41 18 19 23 20 22 23
Considerando os dados como amostrais, calcule a média, a mediana e o desvio padrão desses
dados. Classifique os dados em relação a assimetria.
69
Prof a Paula Francis Benevides
Estatística
3) O gasto mensal de energia elétrica de cada apartamento de um prédio esta tabelado a seguir:
Gasto Mensal
Número de apartamentos
5,00 | 10,00
10,00 | 15,00
15,00 | 20,00
20,00 | 30,00
30,00 |40,00
40,00 |60,00
60,00 | 90,00
90,00 | 120,00
120,00 | 150,00
4
9
18
26
18
11
8
4
2
Calcule a média e a moda dos dados.
Calcule o desvio padrão dos dados
Calcule a assimetria através do coeficiente de Pearson e classifique esta assimetria.
4) Considere os seguintes resultados relativos a três distribuições de frequência e determine o tipo
de assimetria de cada uma delas.
Distribuições
x
Mo
A
52
52
B
45
50
C
48
46
5) Uma distribuição de frequência apresenta as seguintes medidas: x = 48,1, Md = 47,9 e s = 2, 12.
Calcule o coeficiente de assimetria.
6) Observou-se o número dos 100 sapatos vendidos em uma loja de calçados. Os resultados obtidos
estão em forma de tabela, a seguir:
Número de sapato
Frequência
25 | 28
2
28 | 31
9
31 | 34
17
34| 37
35
37 | 40
40 | 43
43 |46
20
10
7
Calcule a média, a moda, a mediana, o desvio padrão e classifique a assimetria e a curtose
desses dados.
70
Prof a Paula Francis Benevides
Estatística
7) Um hospital observou o tempo, em minutos, que 100 pacientes tiveram que esperar até serem
atendidos por um médico. Os dados obtidos estão na tabela a seguir.
Tempo de espera
Número
de
pacientes
0 | 5
13
5 | 10
25
10 | 15
30
15 | 20
16
9
20 | 30
5
30 |45
2
45 | 60
Calcule a média, a moda, a mediana, o desvio padrão e classifique a assimetria e a curtose
desses dados.
8) Considere as seguintes medidas, relativas a três distribuições de frequência:
Distribuições
Qi
Q2
P10
P90
A
814
935
772
1012
B
63,7
80,3
55,0
86,6
C
28,8
45,6
20,5
49,8
Calcule os respectivos graus de curtose
Classifique cada uma das distribuições em relação à curva normal.
9) Determine o grau de curtose e classifique a distribuição em relação à curva normal:
Pesos (kg)
No de operários
50 | 58 | 66 | 74 | 82 | 90 | 98
10
15
25
24
16
10
71
Prof a Paula Francis Benevides
Estatística
AULA 8
15.PROBABILIDADE:
15.1 INTRODUÇÃO:
Embora o cálculo das probabilidades pertença ao campo da Matemática, sua inclusão nesta
matéria se justifica pelo fato de que a maioria dos fenômenos de que trata a Estatística ser de
natureza aleatória ou probabilística.
15.2 EXPERIMENTO ALEATÓRIO:
Todos sabemos de experimentos científicos e de engenharia. A experimentação é útil, pois
podemos assumir que, se executarmos certos experimentos sob condições quase idênticas,
chegaremos essencialmente aos mesmos resultados. Nestas circunstâncias, somos capazes de
controlar o valor das variáveis que afetam o resultado do experimento.
Entretanto, em alguns experimentos, não somos capazes de conhecer nem controlar o valor de
certas variáveis, pois os resultados irão variar de uma realização do experimento para outra, mesmo que as
condições, em sua maioria, sejam as mesmas. Estes experimentos são ditos aleatórios.
Experimentos ou Fenômenos aleatórios são aqueles que, mesmo repetidos várias vezes sob
condições semelhantes, apresentam resultados imprevisíveis.
Exemplo:

o lançamento de uma moeda

o lançamento de um dado
15.3 ESPAÇO AMOSTRAL:
A cada experimento correspondem, em geral, vários resultados possíveis. Assim, ao
lançarmos uma moeda, há dois resultados possíveis: ocorrer cara ou ocorrer coroa. Já ao lançarmos
um dado há seis resultados possíveis: 1, 2, 3, 4, 5 ou 6.
Ao conjunto desses resultados possíveis damos o nome de espaço amostral ou conjunto
universo, representado por S.
A cada um dos elementos de S que corresponde a um resultado recebe o nome de ponto
amostral.
Assim, no lançamento de um dado, 2  S  2 é um ponto amostral de S.
Se um espaço amostral tem um número finito de pontos é chamado de espaço amostral
finito. Se ele tem tantos pontos quanto no conjunto dos números naturais 1, 2, 3,..., é chamado de
espaço amostral infinito contável. Se ele tem tantos pontos quanto existem em algum intervalo
sobre o eixo x, tal como 0 ≤ x ≤ 1, ele é dito um espaço amostral infinito não contável. Um
72
Prof a Paula Francis Benevides
Estatística
espaço amostral finito ou infinito contável é dito espaço amostral discreto, enquanto que um
infinito não contável é dito espaço amostral não discreto.
15.4 EVENTOS:
Chamamos de evento qualquer subconjunto do espaço amostral S de um experimento
aleatório.
Considere o experimento aleatório: lançamento de dois dados, um branco e outro vermelho.
O espaço amostral que descreve essa experiência é:
S = {(1,1), (1,2), (1,3), (1,4), (1,5), (1,6),
(2,1), (2,2), (2,3), (2,4), (2,5), (2,6)
(3,1), (3,2), (3,3), (3,4), (3,5), (3,6)
(4,1), (4,2), (4,3), (4,4), (4,5), (4,6)
(5,1), (5,2), (5,3), (5,4), (5,5), (5,6)
(6,1), (6,2), (6,3), (6,4), (6,5), (6,6)}
O primeiro de cada par acima indica o resultado no dado branco, e o segundo número indica
o resultado no dado vermelho.
Por exemplo, (3,6) é 3 no dado branco e 6 no vermelho.
Considere, agora, os seguintes eventos:
A: a soma dos resultados nos dois dados é menor que 4
A = {(1,1), (1,2), (2,1)}
B: a soma dos resultados nos dois dados é menor que 1
B= 
Neste caso, quando o evento é o conjunto vazio, dizemos que o evento é impossível.
C: a soma dos resultados nos dois dados é igual a 12 ou menor que 12.
C=S
Neste caso, quando o evento é o próprio espaço amostral S, dizemos que o evento é
certo.
D: o resultado do primeiro dado é 5 e no segundo dado é 3
O evento, neste caso, é D = {(5,3)}
Quando o evento é um conjunto unitário, dizemos que o evento é simples ou
elementar.
E: o resultado no dado branco é um número impar
73
Prof a Paula Francis Benevides
Estatística
F: o resultado no dado branco é um número par
Então, E = {(1,1), (1,2), (1,3), (1,4), (1,5), (1,6), (3,1), (3,2), (3,3), (3,4), (3,5), (3,6),
(5,1), (5,2), (5,3), (5,4), (5,5), (5,6)}
F = {((2,1), (2,2), (2,3), (2,4), (2,5), (2,6), (4,1), (4,2), (4,3), (4,4), (4,5), (4,6),
(6,1), (6,2), (6,3), (6,4), (6,5), (6,6)}
Observe que E  F = S
Neste caso, dizemos que os eventos E e F são complementares.
Indicamos o complementar de um evento A por A´
G: a soma dos resultados é igual a 5
H: a soma dos resultados é menor ou igual a 3.
G = {((1,4), (2,3), (3,2), (4,1)}
H = {(1,1), (1,2), (2,1)}
Observe que G  H = 
Neste caso, dizemos que os eventos G e H são eventos mutuamente exclusivos.
I: nos dois dados, os resultados devem ser números ímpares.
J: a soma dos resultados nos dois dados devem ser um número par.
I = {(1,1), (1,3), (1,5), (3,1), (3,3), (3,5), (5,1), (5,3), (5,5)}
J = {(1,1), (1,3), (1,5), (2,2), (2,4), (2,6), (3,1), (3,3), (3,5), (4,2), (4,4), (4,6), (5,1), (5,3),
(5,5), (6,2), (6,4), (6,6)}
Observe que I  J
Neste caso, dizemos que o evento I implica no evento J.
15.5 PROBABILIDADE:
Dado um experimento aleatório, sendo S o seu espaço amostral, vamos admitir que todos os
elementos de S tenham a mesma chance de acontecer, ou seja, que S é um conjunto equiprovável.
Chamamos de probabilidade de um evento A (A  S) o número real P(A), tal que;
P( A) 
n( A)
n( S )
onde:
n(A) é o número de elementos de A
n(S) é o número de elementos de S.
74
Prof a Paula Francis Benevides
Estatística
Exemplo:
No lançamento de um dado, determinar a probabilidade de se obter:
o número 2
um número par
um número múltiplo de 3
a) O espaço amostral S = {1, 2, 3, 4, 5, 6}, portanto n(S) = 6
Ocorrência do número 2:
A = {2}, portanto n(A) = 1
P(A) = n(A)/n(S) = 1/6 = 0,1666 ou 16%
b) ocorrência de um número par:
B = {2, 4, 6}
P(B) = 3/6 = ½ = 0,5 ou 50 %
c) ocorrência de um número múltiplo de 3
C = {3, 6}, portanto n(C) = 2
P(C) = 2/6 = 1/3 = 0,3333 ou 33%
15.6 EVENTOS COMPLEMENTARES:
Sejam A e A´ dois eventos complementares de um espaço amostrar S, então:
P(A) + P(A´) = 1
Exemplo:
Considere um conjunto de 10 frutas em que 3 estão estragadas. Escolhendo-se
aleatoriamente 2 frutas desse conjunto, determinar a probabilidade de:
a) ambas não estarem estragadas
b) pelo menos uma estar estragada
a) Cálculo do número de maneiras de escolher duas frutas entre dez:
n(S) = C10,2 = 45
Seja A o evento ―ambas as frutas não estão estragadas‖.
Cálculo do número de maneiras de escolher duas frutas não estragadas entre sete.
n(A) = C7,2 = 21
75
Prof a Paula Francis Benevides
Estatística
Logo, a probabilidade desse evento é:
P(A) = n(A)/n(s) = 21/45 = 7/15
b) o evento B ―pelo menos uma esteja estragada‖ significa que uma fruta ou duas frutas
devem estar estragadas.
Esse evento B é o complementar A´ do evento A.
Logo P(A) + P(A´) = 1
1 – 7/15 = 8/15
15.7 PROBABILIDADE COM REUNIÃO E INTERSECÇÃO DE EVENTOS:
Algumas vezes necessitamos saber a probabilidade da ocorrência de duas condições e da
ocorrência dessas condições serem simultâneas.
Exemplo:
Numa pesquisa sobre a preferência em relação a dois jornais, foram consultadas470 pessoas
e o resultado foi o seguinte: 250 delas lêem o jornal A, 180 lêem o jornal B e 60 lêem os jornais A e
B. Escolhendo um dos entrevistados ao acaso, qual a probabilidade de que ele seja:
leitor dos jornais A e B
leitor do jornal A ou do jornal B?
a)
A
190
B
60
120
Como 60 pessoas lêem os jornais A e B, marcamos 60 na intersecção de A com B. Se 250
lêem o jornal A, marcamos 190 (250 – 60 = 190) na parte de A que não esta em B. se 180 lêem o
jornal B, marcamos 120 (180 – 60 = 120) na parte de B que não esta em A. Como foram
consultadas 470 pessoas e já marcamos 370 (190 + 60 + 120), concluímos que 100 pessoas não
lêem nenhum dos dois jornais. Assim a probabilidade de que a pessoa leia os dois jornais A e B, é:
P( A  B) 
n( A  b) 60
6


n( S )
470 47
76
Prof a Paula Francis Benevides
Estatística
b) Quando somamos o número de pessoas que lêem o jornal A com o número de pessoas
que lêem o jornal B, contamos duas vezes aquelas que lêem os dois jornais.
P(A  B) = P(A) + P(B) – P(A  B)
Portanto, a probabilidade de ocorrer um evento A ou um evento B é dada pela soma das
probabilidades de os dois eventos ocorrerem separadamente, menos à probabilidade deles
ocorrerem simultaneamente.
Logo, P(A  B) = 25/47 + 18/47 – 6/47 = 37/47
15.8 EVENTOS INDEPENDENTES:
Dizemos que dois eventos são independentes quando a realização ou não realização de um
dos eventos não afeta a probabilidade da realização do outro e vice versa.
Por exemplo, quando lançamos dois dados, o resultado obtido em um deles independe do
resultado obtido no outro.
Se dois eventos são independentes, a probabilidade de que eles se realizem
simultaneamente é igual ao produto das probabilidades de realização dos dois eventos.
Assim, sendo p1 a probabilidade de realização do primeiro evento e p2 a probabilidade de
realização do segundo evento, a probabilidade de que tais eventos se realizem simultaneamente é
dada por:
P = p1 x p2
Exemplos:
1) Retirando-se duas cartas ao acaso, sem reposição, de um baralho de 52 cartas, qual a
probabilidade do naipe da primeira ser de paus e da segunda ser de copas?
Das 52 cartas do baralho, 13 são de paus, 13 de copas, 13 de ouros e 13 de espadas. A
probabilidade de ocorrer o evento independente A: ―A primeira carta é de paus‖ é: 13/52 = ¼
Como a segunda carta é retirada sem reposição da primeira, restam 51 cartas no baralho
(retiramos uma carta de paus). A probabilidade de ocorrer o evento independente B: ―a segunda
carta é de copas‖ é; 13/51.
A probabilidade de a primeira carta ser de paus e a segunda ser de copas é dada pelo
produto:
1 13 13
P( A  B)  P( A).P( B)   
4 51 204
77
Prof a Paula Francis Benevides
Estatística
2) Uma moeda é lançada 4 vezes. Qual a probabilidade de sair pelo menos uma cara?
Neste problema vamos usar o conceito de eventos complementares, vamos calcular a
probabilidade de nenhuma ser cara e depois diminuir de 1(ou 100%).
P(A) = probabilidade de não sair nenhuma cara
P( A) 
1 1 1 1 1
   
2 2 2 2 16
cada multiplicação equivale a um lançamento
Portanto, a probabilidade de sair pelo menos uma cara é:
1 – P(A) = 1 – 1/16 = 15/16
15.9 EXPERIMENTOS NÃO EQUIPROVÁVEIS:
Um experimento é dito não equiprovável, quando os eventos elementares do espaço
amostrar não apresentam a mesma probabilidade de ocorrência.
Exemplo:
Numa moeda viciada, a chance de ocorrer cara num lançamento é igual a quatro vezes a
chance de ocorrer coroa. Calcular a probabilidade de ocorrer cara num lançamento dessa moeda.
Sejam os eventos:
C: ocorrer ―cara‖
K: ocorrer ―coroa‖
Com P(C) = 4P(K) e como os eventos são exclusivos e complementares, temos:
P(C) + P(K) = 1
P(C) + ¼ P(C) = 1
P(C) = 4/5
AULA 7 – Exercícios
1) Com os algarismos 3, 5 e 7 formamos todos os números de 3 algarismos possíveis, sem
repetição. Escolhendo um desses números ao acaso, qual a probabilidade dessa escolha recair em
um número:
a) múltiplo de 3? (100%)
b) par? (0%)
2) Numa gaveta há 3 canetas que escrevem em azul, 2 em preto, 4 em verde e 3 que não possuem
carga. Escolhendo ao acaso, uma dessas canetas, ache a probabilidade de que a caneta:
a) escreva (3/4)
b) não escreva (1/4)
c) escreva em azul (1/4)
3) Uma urna contém 500 bolas, cada uma delas identificada por um número; para essa identificação
foram utilizados todos os números da progressão aritmética (1, 3, 5, 7,...,999). Retirando-se
78
Estatística
Prof a Paula Francis Benevides
aleatoriamente da urna uma única bola, calcule a probabilidade, em porcentagem, de que o número
dessa bola tenha o algarismo das unidades igual a 3. (20%).
4) Numa máquina caça níquel, cada resultado é formado pr três quaisquer de cinco frutas diferentes,
podendo haver repetição. Calcule a probabilidade de um resultado ter duas frutas iguais e uma
diferente. (12/25)
5) Escolhendo aleatoriamente um natural no conjunto {1, 2,...,100} de naturais sucessivos, seja p a
probabilidade deste natural ser divisível por 2 ou por 3. Indique 100p. (67)
6) Dentro de um armário há 3 pares de sapatos de cores diferentes. Retiram-se ao acaso dois
sapatos. Qual a probabilidade de:
a) eles serem do mesmo par? (1/5)
b) um ser do pé direito e outro do pé esquerdo? (3/5)
7) Dois jogadores, Kleber e Arnaldo, lançam um dado uma única vez cada um. Vence o jogo quem
tirar o maior número. Sabendo que Kleber tirou 4, qual a probabilidade de:
a) Kleber vencer o jogo ( ½)
b) haver empate (1/6)
c) Arnaldo vencer o jogo? (1/3)
8) Uma moeda é lançada 4 vezes. Qual a probabilidade de sair pelo menos uma cara? (15/16)
9) Considere duas caixas, I e II. Na caixa I há 4 bolas pretas e 6 azuis e na caixa II há 8 bolas pretas
e 2 azuis. Escolhi ao acaso uma caixa e, em seguida, tirei uma bola. Qual a probabilidade desta bola
ser preta? (3/5)
10) Qual a probabilidade de um casal ter 4 filhos e todos do sexo feminino? (1/16)
11) Retiram-se duas cartas de um baralho de 52 cartas. Qual a probabilidade de que pelo menos
uma seja de ouros? ( 44,12%)
12) Num certo pais, 10% das declarações de imposto de renda são suspeitas e submetidas a uma
análise detalhada; entre estas verificou-se que 20% são fraudulentas. Entre as não suspeitas, 2% são
fraudulentas.
a) Se uma declaração é escolhida ao acaso, qual a probabilidade de ela ser suspeita e
fraudulenta? (2%)
b) Se uma declaração é fraudulenta, qual a probabilidade de ela ter sido suspeita?
(52,6%)
13) Três carros A, B e C participam de uma corrida. A tem duas vezes mais chances de ganhar do
que B, e B tem três vezes mais chances de ganhar de que C. Determine as probabilidades de vitória
de cada carro. (A=3/5, B = 3/10 e C = 1/10)
79
Prof a Paula Francis Benevides
Estatística
AULA 9
15.10 PROBABILIDADE CONDICIONADA:
Se a condição de independência estatística não for satisfeita, deve ser usada uma fórmula
mais geral, envolvendo probabilidades condicionadas. Dados dois eventos, A e B, e a
probabilidade de que o evento B ocorra, dado que o evento A já ocorreu, é a probabilidade
condicionada de B, escrita por P(B/A). Similarmente, escrevemos a probabilidade da ocorrência de
A, condicionada à ocorrência de B, como P(B/A) (lê-se probabilidade de A dado que B tenha
ocorrido, ou probabilidade de A condicionada à ocorrência de B).
Suponha que existam 10 rótulos de papel que podem ser distinguidos pelo número e pela
cor: por exemplo, os rótulos numerados por 1, 2 e 3 são amarelos e os restantes, brancos. Se todos
forem colocados em uma urna e retirados ao acaso, a probabilidade de se extrair um rótulo
particular é 1/10. Se, porém, após retirar um rótulo ao acaso, ele for amarelo, como calcular a
probabilidade de que um certo rótulo,por exemplo, aquele com o número 1, seja extraído?
Evidentemente, o número possível de acontecimentos favoráveis está agora reduzido de 10
para três, em outras palavras, o rótulo desejado deve ter o número 1 e ser amarelo. Calculamos a
probabilidade condicionada pela razão


P rótulo n o 1 / amarelo 
P(rótulo n o 1 e amarelo) 1 / 10 1


P(amarelo)
3 / 10 3
De modo geral, dados dois eventos a e B, que não são independentes, a probabilidade
condicionada de A, dado B, é definida como:
P( A / B) 
P ( A  B ) n( A  B )

P( B)
n( B )
Ou seja, como a razão entre a probabilidade e o evento conjunto A e B ocorrer e a
probabilidade da ocorrência de B.
Exemplos:
1) Uma carta é retirada de um baralho. Qual a probabilidade de ser um rei preto, dado que a carta
retirada foi uma ―figura‖ (valete, damas ou rei)?
Sejam:
A: rei preto
B: figura
2
Então:
P(A/B) =
52  2  1
12
12 6
52
80
Prof a Paula Francis Benevides
Estatística
Veja: no baralho, existem dois reis pretos, os quais também são figuras, portanto:
P(A∩B0 = 2/52
Doze cartas são figuras, logo P(B) = 12/52, Então a probabilidade de um rei preto,
condicionada a ocorrência de uma figura é 1/6 ou 17%.
2) Numa classe de 60 alunos, 40 estudam só Matemática, 10 estudam só Física e 5 estudam
Matemática e Física. Determine a probabilidade de um aluno que estuda Matemática, estudar
também Física.
F: estudam Física
M: estudam Matemática
n(F∩M) = 5
n(M) = 45 ( pois tem os que só estudam Matemática e mais os que estudam Matemática e
Física)
Logo, P(F/M) = 4/45 = 1/9
15.11 DISTRIBUIÇÃO BINOMIAL:
Neste item, vamos considerar experimentos que satisfaçam as seguintes condições:
a. O experimento dever ser repetido, nas mesmas condições, um número finito de vezes (n)
b. As provas repetidas devem ser independentes, isto é, o resultado de uma não deve afetar
os resultados das sucessivas.
c. Em cada prova deve aparecer um dos dois possíveis resultados: sucesso e insucesso.
d. No decorrer do experimento, a probabilidade p do sucesso e a probabilidade q
(q  1  p) do insucesso manter-se-ão constantes.
Resolveremos problemas do tipo: determinar a probabilidade de se obterem k sucessos em n
tentativas.
A probabilidade de que um evento se realize k vezes nas provas é dada pela função:
n
P    p k q n  k
k 
na qual:
p é a probabilidade de que o evento se realize em uma só prova – sucesso
q é a probabilidade de que o evento não se realize no decurso dessa prova – insucesso
n é o número de tentativas
k número de vezes que o evento deve ocorrer.
Exemplo:
81
Prof a Paula Francis Benevides
Estatística
1) Um dado é lançado cinco vezes. Calcular a probabilidade de ocorrer um 3 ou um 4 duas vezes.
Quando lançamos um dado podemos obter 6 resultados possíveis: 1, 2, 3, 4, 5, ou 6
A probabilidade de ocorrer um 3 ou um 4 em cada lançamento é p = 2/6 = 1/3
Logo:
n=5
k=2
p = 1/3
q = 2/3
 5  1   2 
80
P       
 33%
240
 2  3   3 
2
3
2) Um jogador de xadrez tem 2/5 de probabilidade de vitória quando joga. Na realização de cinco
partidas, determinar a probabilidade de esse jogador vencer:
duas partidas:
p = 2/5, q = 3/5, r = 2 e k = 5
substituindo na fórmula temos P = 216/625 = 34,56%
mais que a metade das partidas.
O jogador vence mais da metade das partidas se vencer 3, 4 ou 5 partidas, logo:
 5  2   3   5  2   3   5  2   3 
992 ~
                  
 31,74%
3125
 3  5   5   4  5   5   5  5   5 
3
Ptotal
2
4
1
5
0
AULA 8 - Exercícios
1) A probabilidade de se escolher uma peça defeituosa em uma loja é de 1/5. Calcule a
probabilidade de ao se escolher 4 peças, 3 delas sejam defeituosas. (2,56%)
2) A probabilidade de um atirador acertar o alvo em um único tiro é 0,25. Dando 4 tiros, qual a
probabilidade de acertar o alvo pelo menos duas vezes? (26,17%)
3) Uma prova do tipo múltipla escolha contém 10 testes, com 5 alternativas cada um. Somente uma
alternativa é correta para cada teste. Qual a probabilidade de um aluno, ―chutar‖ os dez testes,
acertar a metade das respostas? (2,64%)
4) Uma cadela teve cinco filhotes em uma ninhada, sendo três machos e duas fêmeas. Qual a
probabilidade de se obter uma ninhada como esta? (5/16)
82
Estatística
Prof a Paula Francis Benevides
5) Num jogo de basquete, a probabilidade de um jogador fazer a cesta a certa distância é 0,4. Ache a
probabilidade de que em 5 tentativas ele:
a) não faça nenhuma cesta (7,78%)
b) faça duas cestas (34,56%)
c) faça alguma cesta (92,22%)
6) Determine a probabilidade de um casal ter 6 filhos do sexo masculino. (1/64)
7) Numa caixa existem cinco cartões numerados de 1 a 5. Retirando-se dois cartões sucessivamente,
sem reposição do primeiro, determine a probabilidade de que os dois números retirados sejam
ímpares. (30%)
8) Em uma amostra de 500 peças, existem exatamente quatro defeituosas. Retirando-se, ao acaso,
uma peça dessa amostra, qual a probabilidade que ela seja perfeita? (99,2%)
9) O código de acesso de um cartão de crédito é formado por seis dígitos decimais. Cada dígito é
um número inteiro que pode assumir qualquer valor entre 0 e 9. Tendo extraviado seu cartão de
crédito, Tongomiro receia que um estranho o encontre e tente descobrir o código. Calcule a
probabilidade aproximada de alguém acertar o código do cartão de Tongomiro num total de 1000
tentativas aleatórias e distintas. (0,1%)
10) Ao lançar um dado muitas vezes, uma pessoa percebeu que a face 6 saia com o dobro de
frequência da face 1, e que as outras faces saíam com a frequência esperada em um dado não
viciado. Qual a frequência da face 1? (1/9)
11) Um dado honesto é lançado duas vezes. Encontre a probabilidade de obter 4, 5, ou 6 no
primeiro lançamento e 1, 2, 3, ou 4 no segundo lançamento. (1/3)
12) Roberto J., administrador recém formado, envia um currículo para duas empresas A e B, à
procura de emprego. A probabilidade de ser aceito pela empresa A é de 25% e a de ser aceito pela
empresa B é de 20%; a probabilidade de ser aceito por ambas é 8%.
a) Qual a probabilidade de ser aceito por ao menos uma das empresas? (37%)
b) Qual a probabilidade de ser aceito exatamente por uma empresa? (29%)
83
Prof a Paula Francis Benevides
Estatística
AULA 10
16.DISTRIBUIÇÕES DE PROBABILIDADES DE VARIÁVEIS ALEATÓRIAS
DISCRETAS:
16.1 INTRODUÇÃO:
Neste capítulo, são apresentadas as distribuições de probabilidade de populações. A
distribuição de frequência é uma amostra é uma estimativa de distribuição de probabilidade da
população correspondente. Se o tamanho da amostra for grande, podemos esperar que a distribuição
de frequência da amostra seja uma boa aproximação da distribuição de probabilidade da população.
As análises das distribuições de probabilidades possibilitam a construção de modelos que
nos auxiliam no entendimento de fenômenos do mundo real.
16.2 VARIÁVEIS ALEATÓRIAS:
Seja  um experimento aleatório e S o espaço amostral associado ao experimento. Uma
função X que associe a cada elemento s  S um número real X(s) é denominado variável aleatória.
Observe que, apesar do nome, variável aleatória é uma função cujo domínio é o conjunto S,
e o contradomínio o conjunto de todos os valores possíveis de X, os X(s).
16.2.1
VARIÁVEL ALEATÓRIA DISCRETA:
Seja X uma variável aleatória. Se o número de valores possíveis de X for finito ou infinito
numerável, denominaremos X de variável aleatória discreta.
16.2.2
VARIÁVEL ALEATÓRIA CONTÍNUA:
Seja X uma variável aleatória. Se o contradomínio de X é um intervalo, ou uma coleção de
intervalos, denominaremos X de variável aleatória contínua.
Neste capítulo iremos estudar as variáveis aleatórias discretas e, no próximo, as variáveis
aleatórias contínuas.
84
Prof a Paula Francis Benevides
Estatística
Exemplos:
a) X: número de caras obtidas no lançamento de duas moedas (variável aleatória)
Então:  = lançamento de duas moedas
S = {cc, ck, kc, kk}, c = cara e k = coroa
A variável X poderá assumir os valores, 0, 1 e 2
Assim: X = 0 corresponde ao resultado do evento kk (nenhuma cara)
X = 1 corresponde ao resultado ck ou kc (uma cara)
X = 2 corresponde ao resultado kk (duas caras)
(variável aleatória discreta)
b) X: altura dos alunos entre 1,60m e 1,70 m
(variável aleatória contínua)
16.3 FUNÇÃO DE PROBABILIDADE:
Seja X a variável aleatória discreta. Sejam x1, x2, x3,...seus possíveis valores. A cada
resultado de xi, associaremos um número p(xi) = P(X =xi), denominado probabilidade de xi, tal que:
a) p (xi) ≥ 0 para todos os xi

 p( x )  1
b)
i 1
i
Essa função é denominada função de probabilidade da variável aleatória X.
A distribuição de probabilidade de X é dada pelos pares [x i; p(xi)], i = 1, 2, 3,... e poderá ser
expressa por uma tabela, gráfico ou fórmula.
Exemplo:
Vamos encontrar a distribuição discreta de probabilidade da variável número de caras
encontradas no lançamento de três moedas.
Logo,  = lançamento de três moedas
S = {ccc, cck, ckc, kck, kcc, kkc, kkk}
X = número de caras = 0, 1, 2,...
X = 0 → kkk
X = 1 → kkc, kck, ckk
85
Prof a Paula Francis Benevides
Estatística
X = 2 → cck, ckc, kcc
X = 3 → ccc
Eis a distribuição de probabilidade expressa por uma tabela:
xi
0
1
2
3
p(xi)
1
8
3
8
3
8
1
8
16.4 FUNÇÃO DE DISTRIBUIÇÃO ACUMULADA:
Se X for uma variável aleatória discreta, define-se Função de Distribuição Acumulada em
um ponto x como a soma das probabilidades dos valores xi, menores ou iguais a x.
Isto é:
F ( x)   p ( x i )
xi  x
Exemplo:
Em uma caixa, tem-se cinco peças boas e quatro defeituosas. São retiradas aleatoriamente
três peças sem reposição. Façamos X a variável aleatória: número de peças boas entre as três peças
retiradas.
Logo, os valores de X são: 0 (nenhuma peça boa), 1, 2 e 3
Para a montagem da tabela de distribuição de probabilidade, necessitamos calcular as
p(xi).
n(S)= C9,3 = 84 (5 das peças boas + 4 das peças defeituosas)
p(x = 0) =
p(x = 1) =
p(x= 2) =
p(x = 3) =
C 4,3
84

4
4

84 21
C 4, 2  C 5,1
84
C 4,1  C 5, 2
84
C 5, 3
84


30 5

84 14

40 10

84 21
10 5

84 42
86
Prof a Paula Francis Benevides
Estatística
Portanto, a distribuição de probabilidade pode ser expressa pela tabela:
xi
0
1
2
3
p(xi)
4
84
30
84
40
84
10
84
Com referência à função acumulativa de probabilidade, temos os seguintes exemplos,
considerando os dados já calculados:
Observe a tabela anterior.
a)
b)
c)
d)
e)
f)
g)
F(-0,7) = 0
F(0,5) = 4/84
F(1) = 34/84
F(1,8) = 34/24
F(2,1) = 74/84
F(3) = 84/84 = 1
F(8) = 1
Quanto às probabilidades, temos:
a)
b)
c)
d)
P(2 ≤ x ≤ 3) = 50/84= 25/42
P(x< 1) = 4/84 = 1/21
P(x > 3) = 0
Probabilidade de pelo menos uma peça boa
P(x ≥ 1) = P(X = 1) + P(X = 2) + P(X = 3)= 30/84 + 40/84 + 10/84 = 80/84 = 20/21
Ou P(X ≥ 1) = 1 – P(x = 0) = 1 – 4/84 = 80/84 = 20/21
16.5 VALOR ESPERADO OU MÉDIA DE UMA VARIÁVEL ALEATÓRIA DISCRETA:
Seja X uma variável aleatória discreta, com valores x 1, x2, ..., xk, o valor esperado de X (ou
esperança matemática de x), ou simplesmente média de X é definida como:
k
 ( x )   [ x]   xi p( xi )
i 1
87
Prof a Paula Francis Benevides
Estatística
Exemplo: Considere um jogo no qual se lançam três moedas, não viciadas, e se recebe um
dólar por cada cara que apareça. Quanto se esperaria ganhar, se pudesse fazer o jogo apenas uma
vez? Ou de outra maneira: qual é o valor esperado de uma jogada?
A distribuição de probabilidade será:
0
1
2
3
Xi : valor a ser recebido ($) 0
1
2
3
3/8
3/8
Número de Caras
1/8
Probabilidades: p(xi)
1
8
3
8
3
8
1/8
1
8
 ( x )  [ x]  0   1   2   3   $1,50
O valor esperado é uma média a longo prazo. No caso, após várias jogadas se esperaria
ganhar $1,50.
16.6 VARIÂNCIA E DESVIO PADRÃO DE UMA VARIÁVEL ALEATÓRIA DISCRETA:
Como já vimos anteriormente, a variância é uma medida de dispersão – avalia o grau de
homogeneidade dos valores da variável em torno da média. A definição de variância de uma
variável aleatória discreta x é dada por:
s (2x )  [ x 2 ]   (2x )
onde:
k
k
[ x 2 ]   xi2 p( xi )
e
 ( x )   xi p( xi )
i 1
i 1
desvio padrão é igual à raiz quadrada positiva da variância:
s ( x )  s (2x )
Exemplo:
Suponha que um gerente de loja tenha construído a seguinte distribuição para as vendas de
fogões por semana:
xi (vendas)
p(xi)
0
1
2
3
4
0,20
0,30
0,30
0,15
0,05
88
Prof a Paula Francis Benevides
Estatística
O número esperado de venda semanal será:
 ( x )  [ x] = 0.(0,20) + 1.(0,30) + 2.(0,30) + 3.(0,15) + 4.(0,05) = 1,55 fogões
Quanto à variância:
E[x2] = 02.(0,20) + 12.(0,30) + 22.(0,30) + 32.(0,15) + 42.(0,05) = 3,65
s (2x )  [ x 2 ]   (2x ) = 3,65 – (1,55) = 1,25
2
E o desvio padrão será de: s ( x )  s (2x ) = 1,25  1,1180 =1,12 fogões
16.7 DISTRIBUIÇÃO BINOMIAL:
Como já foi visto na aula anterior, trata-se de um modelo que dá a probabilidade do número
de sucessos quando são realizadas n provas do mesmo tipo – o experimento é repetido n vezes.
Cada experimento admite dois resultados – sucesso ou fracasso – com probabilidade p de sucesso e
1 – p = q de fracasso, constantes em cada uma das provas.
Relembrando a fórmula para o cálculo da probabilidade de distribuição binomial:
n
P    p k q n  k
k 
16.7.1
MEDIDAS CARACTERÍSTICAS:
Média ou valor esperado:
 (k )  E[ k ] = np
Variância:
s2(k)=Var [ k ] = npq
Desvio padrão:
s ( k )  npq
Moda:
O valor mais provável (modal) de uma distribuição binomial é o número inteiro
compreendido entre np + p e np – p. A moda toma um valor próximo da média np. No caso
particular de p = q = ½ e n ímpar, os dois extremos np + p e np – p serão inteiros que diferem de 1;
neste caso, a distribuição será bimodal.
89
Prof a Paula Francis Benevides
Estatística
Exemplo:
Admite-se que uma válvula eletrônica, instalada em determinado circuito, tenha
probabilidade 0,3 de funcionar mais de 600h. Se ensaiarmos 10 válvulas, qual será a probabilidade
de que entre elas, exatamente 3 funcionem mais de 600 h? Determine também a média, a variância,
o desvio padrão e a moda.
Temos:
k = variável aleatória: número de sucessos nos 10 ensaios. Assim, k = 4
p = 0,3 probabilidade de sucesso de cada válvula funcionar mais de 600h
q = 1 – 0,3 = 0,7 probabilidade de fracasso de cada válvula funcionar menos de 600h
n = 10 ensaios
Então:
10 
P   (0,3) 3 .(0,7) 7 = 120 x 0,027 x 0,0823543 =0,2668
3
Média:
μ(k) = 10.(0,3) = 3
Variância:
s2 = 10.(0,3).(0,7) = 2,1
Desvio padrão:
s = √2,1 = 1,45
Moda:
np+p = 10.(0,3) + 3 + 3,3
np – p = 10.(0,3) – 0,3 = 2,7
Logo, Mo = 3 (inteiro entre 2,7 e 3,3)
90
Prof a Paula Francis Benevides
Estatística
Observações importantes:
1. Uma distribuição binomial fica caracterizada pelos parâmetros n e p.
2. Se n for pequeno, os cálculos serão relativamente fáceis. Contudo, se n for
relativamente grande, os cálculos tornam-se cansativos. Felizmente, dispomos de
calculadoras, tabelas apropriadas, e também poderemos aproximar a distribuição
binomial pela de Poisson, como veremos no próximo item.
3. Para qualquer n, a distribuição binomial será simétrica, se p = q = 0,5; será
assimétrica á direita se p > q, e assimétrica à esquerda, se p < q.
16.8 DISTRIBUIÇÃO DE POISSON:
A distribuição de Poisson representa um modelo probabilístico adequado para o estudo de
um grande número de fenômenos observáveis. Eis alguns exemplos:






Chamadas telefônicas por unidade de tempo.
Defeitos por unidade de área.
Acidentes por unidade de tempo.
Chegada de clientes a um supermercado por unidade de tempo.
Número de glóbulos sangüíneos visíveis ao microscópio por unidade de área.
Número de partículas emitidas por uma fonte de material radioativo por unidade de tempo.
Seja X uma variável aleatória igual ao número de ocorrências (sucessos) quando se realizam
(ou se observam) resultados de fenômenos semelhantes aos dos exemplos anteriores, X poderá
assumir os valores: 0, 1, 2, ...
Ao aplicar o modelo de Poisson, o interesse poderá ser, por exemplo, calcular a
probabilidade de receber cinco chamadas telefônicas, em três minutos, em dado aparelho: P(X = 5,3
minutos).
De início, poderíamos pensar no uso do modelo binomial, porém, não sabemos qual o
número de provas (n = ?), nem a quantidade de fracassos: quantos chamados não ocorreram?
Se adotamos algumas hipóteses quanto à taxa de frequência ( λ ) dessas ocorrências por uma
pequena unidade de tempo: ( Δt ), ou, conforme o caso: ( Δs ) = unidade de área..., e algumas outras
premissas, enunciadas a seguir, obtemos o modelo de Poisson como limite da distribuição binomial,
quando n tende ao infinito.
91
Prof a Paula Francis Benevides
Estatística
16.8.1
HIPÓTESE DO MODELO DE POISSON:
A expressão que dá a probabilidade de x sucessos em um intervalo t (tempo, área,...) é:
P ( X  x, t ) 
(t ) x .e t
x!
onde:
λ = coeficiente de proporcionalidade, ou taxa de frequência por unidade de tempo, área,
t = tempo, área,
e = base dos logaritmos naturais (2,71828)
x = número de ocorrências (sucessos)
Considerando que a média da distribuição é dada por λt, ou seja, μ = λt, temos
 x .e  
P ( X  x, t ) 
x!
A variância da distribuição também é dada por λt, ou seja: s2 = λt.
A moda corresponde ao maior inteiro contido em λt. Se λt for inteiro, então haverá duas
modas os pontos: x = λt e x – 1 = λt – 1.
Exemplo:
Experiências passadas indicam que, em média, há duas chamadas por hora em certo
telefone. Vamos calcular as probabilidades de, em uma hora, o telefone receber: nenhuma chamada,
uma, duas, três,...
Sabe-se que μ = λt, logo 2 = μ1, consequentemente, λ = 2, ou ainda μ = 2
Nenhuma chamada  P(X = 0,1h) =
Uma chamada  P(X = 1,1h) =
 x .e  
x!
=
2 0 .e 2
= 0,1353
0!
21.e 2
= 0,2706
1!
2 2 .e 2
Duas chamadas  P(X = 2,1h) =
= 0,1804
2!
Três chamadas  P(X = 3,1h) = 0,1804
92
Prof a Paula Francis Benevides
Estatística
Quatro chamadas  P(X = 4,1h) = 0,0902
Cinco chamadas  P(X = 5,1h) = 0,0361
Seis chamadas  P(X = 6,1h) = 0,0120
Sete chamadas  P(X = 7,1h) = 0,0034
Oito chamadas  P(X = 8,1h) = 0,0009
Nove chamadas  P(X = 9,1h) = 0,0002
A tabela de distribuição de probabilidade da variável X: número de chamadas telefônicas
será:
X
0
1
2
3
4
5
6
7
8
9
P(Xi)
0,1353 0,2706 0,2706 0,1804 0,0902 0,0361 0,0120 0,0034 0,0009 0,0002
Quanto às medidas de posição:
Média:
μ=2
Moda:
como λt = 2, inteiro, temos duas modas, M1 = 2 e M2 = 1
Quanto às medidas de dispersão:
Variância:
s2 = λt = 2
Desvio Padrão:
s =√2 = 1,4142
Coeficiente de variação:
CV 
s
 100
x
CV =
1,4142
 100 = 70,71%
2
93
Prof a Paula Francis Benevides
Estatística
16.9 APROXIMAÇÃO DAS PROBABILIDADES BINOMIAIS COMAS PROBABILIDADES
DA DISTRIBUIÇÃO DE POISSON:
Na aplicação do modelo de distribuição binomial, quando n for grande (n > 50) e np < 5, é
possível obter as probabilidades binomiais por meio do modelo de Poisson.
Exemplo:
Em um cruzamento de duas avenidas de tráfego intenso, a probabilidade de um carro sofrer
acidente é de 0,0001. Se entre as 17h e 19h passam 1000 veículos nesse cruzamento, qual é a
probabilidade de que dois ou mais acidentes ocorram durante esse período?
Solução pela distribuição binomial:
Temos:
p = 0,0001 n = 1000
q = 1 – 0,0001 = 0,9999
P(k ≥ 2) = 1 – [P(k = 0) + P(k = 1)] =
1000 

1000 
.(0,0001) 0 .(0,9999)1000  
.(0,0001)1 .(0,9999) 999 
= 1 - 
 1 
 0 

É evidente, o cálculo desse resultado cria sérias dificuldades.
Como n > 50 e np = 1000 =0,1 < 5, podemos obter o resultado desejado pelo modelo de
Poisson.
Assim, μ = np
μ = 1000 x 0,0001 = 0,1
P(k ≥ 2) = 1 – [P(x=0) + P(x = 1)]
(x = 0) =
0,10 .e 0,1
=0,905
0!
P(x=1) =
0,11.e 0,1
= 0,090
1!
P(k ≥ 2) = 1 – (0,905 + 0,090) = 0,00045
Ou seja, a probabilidade aproximada da ocorrência de dois ou mais acidentes é de 0,045%
94
Prof a Paula Francis Benevides
Estatística
AULA 9 – Exercícios
1) Faça X a variável aleatória soma dos pontos obtidos no lançamento de dois dados. Determine:
a) Tabela da distribuição de probabilidade de x
b) P(3 ≤ x ≤ 10) 8/9
c) P(x > 7) 5/12
d) P(x ≤ 5)
5/18
e) Probabilidade de soma máxima 6
5/36
f) Probabilidade de se obter pelo menos soma 3 35/36
g) F(4) 1/6
h) F(8)
13/18
i) F(15) 1
j) F(1)
0
k) F(5,5) 5/18
l) F(12)
1
2) Uma variável aleatória discreta pode assumir cinco valores, conforme a distribuição de
probabilidade:
1
2
0,20
0,25
3
4
5
X
p(x)
a)
b)
c)
d)
…
0,30
0,10
Encontre o valor de p(3) 0,15
Qual é o valor da função acumulativa para x = 5? 0,90
Encontre a média da distribuição
3,45
Calcule a variância e o desvio padrão 4,55 e 2,13
3) Uma moeda é jogada 10 vezes. Calcule as seguintes probabilidades:
a) de ocorrer seis caras; 105/512
b) de dar pelo menos duas caras; 1013/1024
c) de não dar nenhuma coroa; 1/1024
d) de dar pelo menos uma coroa; 1023/1024
e) de não dar 5 caras e 5 coroas; 193/256
4) O pessoal de inspeção de qualidade afirma que os rolos de fita isolante apresentam, em média,
uma emenda a cada 50 metros. Admitindo-se que a distribuição do número de emendas é dada pela
Poisson, calcular as probabilidades:
a) de nenhuma emenda em um rolo de 125 metros. 0,0821
b) de ocorrerem no máximo duas emendas em um rolo de 125 metros 0,5440
c) de ocorrer pelo menos uma emenda em um rolo de 100 metros 0,8647
5) Uma loja atende em média dois clientes por hora. Calcule a probabilidade de em uma hora:
a) atender exatamente dois clientes 0,27
b) atender três clientes 0,18
6) Suponha 400 erros de impressão distribuídos aleatoriamente em um livro de 500 páginas.
Encontre a probabilidade de que cada página contenha:
a) nenhum erro 0,449
b) exatamente dois erros 0,1437
95
Prof a Paula Francis Benevides
Estatística
AULA 11
17.DISTRIBUIÇÃO DE PROBABILIDADES DE VARIÁVEIS ALEATÓRIAS
CONTÍNUAS:
17.1 DISTRIBUIÇÃO NORMAL:
Entre as distribuições teóricas de variáveis aleatórias contínuas, uma das mais empregadas é
a distribuição normal.
Muitas das variáveis analisadas na pesquisa socioeconômicas correspondem à distribuição
normal ou delas se aproximam.
A distribuição normal é também conhecida como distribuição de Gauss, distribuição de
Laplace, ou ainda, distribuição de Laplace-Gauss.
A distribuição de Gauss constitui a base teórica de toda inferência estatística, além de sua
utilidade prática. O gráfico da distribuição normal assemelha-se muito a um sino, e seu formato
dependerá dos valores dos parâmetros  e s. Eis dois exemplos de gráficos da distribuição normal.
Figura 17.1 – Gráfico de distribuições normais.
Observando os gráficos, é possível identificar algumas características importantes das distribuições
normais:
 A variável aleatória X pode assumir todo e qualquer valor real.
 A representação gráfica da distribuição normal é uma curva em forma de sino, simétrica
em torno da média (  ), que recebe o nome de curva normal ou de Gauss.
 A área total limitada pela curva e pelo eixo das abscissas é igual a 1, já que essa área
corresponde à probabilidade de a variável aleatória X assumir qualquer valor real.
 A curva normal é assintótica em relação ao eixo das abscissas, isto é, aproxima-se
indefinidamente do eixo das abscissas, sem, contudo, alcança-lo.
 Como a curva é simétrica em torno de X, a probabilidade de ocorrer valor maior do que a
média é igual à probabilidade de ocorrer valor menor do que a média, isto é, ambas as
probabilidades são iguais a 0,5, assim: média = mediana = moda.
96
Prof a Paula Francis Benevides
Estatística
Quando temos em mão uma variável aleatória com distribuição normal nosso principal
interesse é obter a probabilidade de essa variável aleatória assumir um valor em um determinado
intervalo. Vejamos como proceder, por meio de um exemplo concreto.
Seja X a variável aleatória que representa os diâmetros dos parafusos produzidos por uma
certa máquina. Vamos supor que essa variável tenha distribuição normal com média  = 2 cm e
desvio padrão s= 0,04 cm.
Pode haver interesse em conhecer a probabilidade de um parafuso ter um diâmetro com
valor entre ―a‖ e ―b‖ cm.
É fácil notar que essa probabilidade, indicada por
P(a < x < b), corresponde à área
hachurada na figura abaixo.
Figura 17.2 – Ilustração: probabilidade de os valores de uma distribuição
Normal pertencerem a um intervalo específico
O valor numérico dessa área hachurada e o resultado da integral de f(x) entre a e b, isto é:
1  x 

2 
 
1
P ( a  x  b)  
 e 2
a
s 2
b
2
dx
Essa integração não pode ser calculada analiticamente e deve ser computada por métodos
numéricos (desenvolvimento de série). Entretanto, podemos contornar facilmente esse problema.
Basta aceitar, sem demonstração, que, se X é uma variável aleatória com distribuição normal de
média  e desvio padrão s, então a variável :
z
x
s
tem distribuição normal reduzida, isto é, tem distribuição normal de média 0 e desvio
padrão 1.
As probabilidades associadas à distribuição normal padronizada são encontradas em tabelas,
não havendo necessidade de serem calculadas
A tabela de distribuição normal padrão, nos dá a probabilidade de Z tomar qualquer valor
entre a média O e um dado valor z, isto é; P(0 < Z < z).
Temos, então, que se X é uma variável aleatória com distribuição normal de média  e
desvio padrão s, podemos escrever: P(  < X < x) = P() < Z <z), com z 
x
s
97
Prof a Paula Francis Benevides
Estatística
Voltemos então ao nosso problema:
Seja X a variável aleatória que representa os diâmetros dos parafusos produzidos por uma
certa máquina. Vamos supor que essa variável tenha distribuição normal com média  = 2 cm e
desvio padrão s= 0,04 cm. Queremos calcular a probabilidade de um parafuso ter um diâmetro com
valor entre 2 e 2,05 cm. P(2 < X < 2,05).
Para obter essa probabilidade, precisamos, em primeiro lugar, calcular o valor de z que
corresponde à x = 2,05. Temos então:
z
x   2,05  2 0,05
=

 1,25
s
0,04
0,04
donde:
P (2 < X < 2,05) = P(0 < Z < 1,25).
Procuremos agora na tabela o valor de z = 1,25.
Na primeira coluna encontramos o valor 1,2. Em seguida, encontramos na primeira linha o
valor 5, que corresponde ao último algarismo do número 1,25. Na intersecção da linha e coluna
correspondentes encontramos o valor 0,3944, o que nos permite escrever:
P(0 < Z < 1,25) = 0,3944
Assim a probabilidade de um parafuso fabricado por essa máquina apresentar um diâmetro
entre a média  = 2 e o valor x = 2, 05 é 0,3944.
Escrevemos então:
P(2 < X < 2,05) = P(0 < Z < 1,25) = 0,3944 ou 39,44%
A função densidade de probabilidade de uma variável X com distribuição normal é dada
por:
1  x  2

s 
 
1
f ( x) 
 e 2
s 2
1
 z
1
e 2
ou f ( x) 
s 2
2
sendo que;
e = 2,71828...
 = 3,14159...
 = média da população
s = desvio padrão da população
x = qualquer valor real da variável aleatória contínua
98
Prof a Paula Francis Benevides
Estatística
DEPARTAMENTO DE MATEMÁTICA
DISCIPLINA: ESTATÍSTICA – PROF.a PAULA
TABELA - Distribuição Normal Padrão Z~N(0,1)
P(0  Z  zc)
zc
0,00
0,01
0,02
0,03
0,04
0,05
0,06
0,07
0,08
0,09
0,0
0,0000
0,0040
0,0080
0,0120
0,0160
0,0199
0,0239
0,0279
0,0319
0,0359
0,1
0,0398
0,0438
0,0478
0,0517
0,0557
0,0596
0,0636
0,0675
0,0714
0,0753
0,2
0,0793
0,0832
0,0871
0,0910
0,0948
0,0987
0,1026
0,1064
0,1103
0,1141
0,3
0,1179
0,1217
0,1255
0,1293
0,1331
0,1368
0,1406
0,1443
0,1480
0,1517
0,4
0,1554
0,1591
0,1628
0,1664
0,1700
0,1736
0,1772
0,1808
0,1844
0,1879
0,5
0,1915
0,1950
0,1985
0,2019
0,2054
0,2088
0,2123
0,2157
0,2190
0,2224
0,6
0,2257
0,2291
0,2324
0,2357
0,2389
0,2422
0,2454
0,2486
0,2517
0,2549
0,7
0,2580
0,2611
0,2642
0,2673
0,2704
0,2734
0,2764
0,2794
0,2823
0,2852
0,8
0,2881
0,2910
0,2939
0,2967
0,2995
0,3023
0,3051
0,3078
0,3106
0,3133
0,9
0,3159
0,3186
0,3212
0,3238
0,3264
0,3289
0,3315
0,3340
0,3365
0,3389
1,0
0,3413
0,3438
0,3461
0,3485
0,3508
0,3531
0,3554
0,3577
0,3599
0,3621
1,1
0,3643
0,3665
0,3686
0,3708
0,3729
0,3749
0,3770
0,3790
0,3810
0,3830
1,2
0,3849
0,3869
0,3888
0,3907
0,3925
0,3944
0,3962
0,3980
0,3997
0,4015
1,3
0,4032
0,4049
0,4066
0,4082
0,4099
0,4115
0,4131
0,4147
0,4162
0,4177
1,4
0,4192
0,4207
0,4222
0,4236
0,4251
0,4265
0,4279
0,4292
0,4306
0,4319
1,5
0,4332
0,4345
0,4357
0,4370
0,4382
0,4394
0,4406
0,4418
0,4429
0,4441
1,6
0,4452
0,4463
0,4474
0,4484
0,4495
*0,4505
0,4515
0,4525
0,4535
0,4545
1,7
0,4554
0,4564
0,4573
0,4582
0,4591
0,4599
0,4608
0,4616
0,4625
0,4633
1,8
0,4641
0,4649
0,4656
0,4664
0,4671
0,4678
0,4686
0,4693
0,4699
0,4706
1,9
0,4713
0,4719
0,4726
0,4732
0,4738
0,4744
0,4750
0,4756
0,4761
0,4767
2,0
0,4772
0,4778
0,4783
0,4788
0,4793
0,4798
0,4803
0,4808
0,4812
0,4817
2,1
0,4821
0,4826
0,4830
0,4834
0,4838
0,4842
0,4846
0,4850
0,4854
0,4857
2,2
0,4861
0,4864
0,4868
0,4871
0,4875
0,4878
0,4881
0,4884
0,4887
0,4890
2,3
0,4893
0,4896
0,4898
0,4901
0,4904
0,4906
0,4909
0,4911
0,4913
0,4916
2,4
0,4918
0,4920
0,4922
0,4925
0,4927
0,4929
0,4931
0,4932
0,4934
0,4936
2,5
0,4938
0,4940
0,4941
0,4943
0,4945
0,4946
0,4948
0,4949
*0,4951
0,4952
2,6
0,4953
0,4955
0,4956
0,4957
0,4959
0,4960
0,4961
0,4962
0,4963
0,4964
2,7
0,4965
0,4966
0,4967
0,4968
0,4969
0,4970
0,4971
0,4972
0,4973
0,4974
2,8
0,4974
0,4975
0,4976
0,4977
0,4977
0,4978
0,4979
0,4979
0,4980
0,4981
2,9
0,4981
0,4982
0,4982
0,4983
0,4984
0,4984
0,4985
0,4985
0,4986
0,4986
3,0
0,4987
0,4987
0,4987
0,4988
0,4988
0,4989
0,4989
0,4989
0,4990
0,4990
3,10 ou +
0,4999
NOTA: Para valores de Z acima de 3,09, use 0,4999 como área.
99
Prof a Paula Francis Benevides
Estatística
17.2 USO DA TABELA DA DISTRIBUIÇÃO NORMAL PADRONIZADA:
Há vários tipos de tabelas que oferecem as áreas sob a curva normal padrão. O tipo mais
comum é a tabela de faixa central cuja cópia esta na página anterior.
A tabela de faixa central dá a área sob a curva normal padrão entre z = 0 e outros valores
positivos da variável Z. A simetria da distribuição Z em relação a sua média (z = 0) permite obter
áreas entre z = 0 e outros valores negativos da variável, já que a área entre z = 0 e z o será igual à
área entre – zo e z = 0. Veja o gráfico a seguir. A área hachurada é obtida na tabela.
Figura 17.3 – Área(probabilidade) obtida em uma tabela de faixa central
Assim, P(0 < z < 1,17) será obtida por meio da consulta à tabela.
Lembre-se: 1,17 = 1,1 + 0,07
Z
0,00
0,01
...
...
0,07
...
0,09
0,0
0,1

M
1,1

0,3790
M
Graficamente:
Figura 17.4 – Probabilidade de (0 < z < 1,17)
100
Prof a Paula Francis Benevides
Estatística
Exemplos:
1) Desejam-se as probabilidades:
a) P ( z > 1,17) = ?
Construindo o gráfico:
Como P(z > 0 ) = 0,5
P(z > 1,17) = 0,5 – 0,3790 = 0,1210 ou 12,10%
b) P (z < 1,17) = ?
Construindo o gráfico;
Como P( z < 0 ) = 0,5
P (z < 1,17) = 0,5 + 0,3790 = 0,8790 ou 87,90%
c) P(- 1,17 < z < 0) = ?
Construindo o gráfico:
Lembrando que:
P(0 < z < zo) = P( - zo < z < 0), devido à simetria, então:
101
Prof a Paula Francis Benevides
Estatística
P( - 1,17 < z < 0) = P(0 < z < 1,17) = 0,3790 ou 37,90%
d) P (2,05 < z < 2,93) = ?
Construindo o gráfico:
P(0 < z < 2,93) = 0,4983
P(0 < z < 2,05) = 0,4798
Portanto, P(2,05 < z < 2,93) = 0,4983 – 0,4798 = 0,0185 ou 1,85%
e) P(- 0,85 < z < 1,75) = ?
Construindo o gráfico :
P(- 0,85 < z < 0) = 0,3023
P(0 < z < 1,75) = 0,4599
Portanto, P(- 0,85 < z < 1,75) = 0,3023 + 0,4599 = 0,7622 ou 76,22%
2) Os salários semanais dos operários industriais são distribuídos normalmente, em torno da média
de R$500, com desvio padrão de R$40. Calcule a probabilidade de um operário ter um salário
semanal situado entre R$490 e R$520.
Devemos, inicialmente, determinar os valores de distribuição normal reduzida, assim:
z1 
490  500
 0,25
40
e
z2 
520  500
40  0,5
Logo, a probabilidade procurada é dada por:
P(490 < x < 520) = P(-0,25 < z< 0,5) = P(-0,25<z<0) + P(0<z<0,5) = 0,0987 + 0,1915 =
0,2902
É de se esperar que, em média, 29,02% dos operários tenham salários entre R$490 e R$520.
102
Prof a Paula Francis Benevides
Estatística
AULA 10 – Exercícios
1) Sendo Z uma variável com distribuição normal reduzida, calcule:
a) P(0 < z < 1,44)
b) P(-0,85 < z < 0)
c)
P(-1,48 < z < 2,05)
d) P(0,72 < z < 1,89)
e)
P(z > -2,03)
f)
P(z > 1,08)
g) P(z < - 0,66)
h) P(z < 0,60)
2) Um teste padronizado de escolaridade tem distribuição normal com média 100 e desvio padrão 10.
Determine a probabilidade de um indivíduo submetido ao teste ter nota:
a) maior de 120
b) maior que 80
c)
entre 85 e 115
d) maior que 100
3) Os pesos de 600 estudantes são normalmente distribuídos com média 65,3 kg e desvio padrão 5,5 kg.
Determine o número de estudantes que pesam:
a) entre 60 e 70 kg
b) mais que 63,2 kg
c)
menos que 68 kg
4) a duração de um certo componente eletrônico tem média de 850 dias e desvio padrão de 40 dias. Sabendo
que a duração é normalmente distribuída, calcule a probabilidade de esse componente durar:
a) entre 700 e 1000 dias
b) mais de 800 dias
c)
menos de 750 dias
103
Prof a Paula Francis Benevides
Estatística
AULA 12
17.3 DISTRIBUIÇÃO T DE STUDENT:
2,
Sejam Z e V variáveis aleatórias independentes com distribuições: N(0,1) e X 
respectivamente. Define-se distribuição t de Student com  graus de liberdade, como:
t 
Z
V

Onde:
 
Média da distribuição: E t   t   0
Variância da distribuição: Var t   s 2 (t ) 

  2'
2
gráfico da distribuição t é simétrico em relação a sua média. Assemelha-se à distribuição
Normal Padronizada: N(0,1). A distribuição t é mais dispersa do que a N(0,1). À medida que 
aumenta, a dispersão diminui, sendo que para valores de  > 30 temos praticamente iguais as
distribuições Normal Padronizada e de Student. Eis uma ilustração para  = 4
Lembre-se: a área sob cada uma dessas curvas vale 1, ou 100%
104
Prof a Paula Francis Benevides
Estatística
17.3.1
USO DA TABELA DA DISTRIBUIÇÃO T DE STUDENT:
A distribuição t esta tabelada. Encontram-se abscissas da distribuição, dado um parâmetro
 (grau de liberdade) e uma área  na cauda direita da curva. Assim:


0,25
........
.
.
.

.....
Valor da abscissa que deixa a probabilidade
na cauda à direita

.
105
Prof a Paula Francis Benevides
Estatística
DEPARTAMENTO DE MATEMÁTICA
DISCIPLINA: ESTATÍSTICA – PROF.a PAULA
 = graus de liberdade

25%
10%
TABELA - Distribuição t de Student (Unicaudal e Bicaudal)
5%
2,5%
1%

0,5%

25%
10%
5%
2,5%
1%
0,5%

1
2
3
4
5
1,0000
0,8165
0,7649
0,7407
0,7267
3,0777
1,8856
1,6377
1,5332
1,4759
6,3138
2,9200
2,3534
2,1318
2,0150
12,7062
4,3027
3,1824
2,7764
2,5706
31,8207
6,9646
4,5407
3,7469
3,3649
63,6574
9,9248
5,8409
4,6041
4,0322
46
47
48
49
50
0,6799
0,6797
0,6796
0,6795
0,6794
1,3002
1,2998
1,2994
1,2991
1,2987
1,6787
1,6779
1,6772
1,6766
1,6759
2,0129
2,0117
2,0106
2,0096
2,0086
2,4102
2,4083
2,4066
2,4049
2,4033
2,6870
2,6846
2,6822
2,6800
2,6778
6
7
8
9
10
0,7176
0,7111
0,7064
0,7027
0,6998
1,4398
1,4149
1,3968
1,3830
1,3722
1,9432
1,8946
1,8595
1,8331
1,8125
2,4469
2,3646
2,3060
2,2622
2,2281
3,1427
2,9980
2,8965
2,8214
2,7638
3,7074
3,4995
3,3554
3,2498
3,1693
51
52
53
54
55
0,6793
0,6792
0,6791
0,6791
0,6790
1,2984
1,2980
1,2977
1,2974
1,2971
1,6753
1,6747
1,6741
1,6736
1,6730
2,0076
2,0066
2,0057
2,0049
2,0040
2,4017
2,4002
2,3988
2,3974
2,3961
2,6757
2,6737
2,6718
2,6700
2,6682
11
12
13
14
15
0,6974
0,6955
0,6938
0,6924
0,6912
1,3634
1,3562
1,3502
1,3450
1,3406
1,7959
1,7823
1,7709
1,7613
1,7531
2,2010
2,1788
2,1604
2,1448
2,1315
2,7181
2,6810
2,6503
2,6245
2,6025
3,1058
3,0545
3,0123
2,9768
2,9467
56
57
58
59
60
0,6789
0,6788
0,6787
0,6787
0,6786
1,2969
1,2966
1,2963
1,2961
1,2958
1,6725
1,6720
1,6716
1,6711
1,6706
2,0032
2,0025
2,0017
2,0010
2,0003
2,3948
2,3936
2,3924
2,3912
2,3901
2,6665
2,6649
2,6633
2,6618
2,6603
16
17
18
19
20
0,6901
0,6892
0,6884
0,6876
0,6870
1,3368
1,3334
1,3304
1,3277
1,3253
1,7459
1,7396
1,7341
1,7291
1,7247
2,1199
2,1098
2,1009
2,0930
2,0860
2,5835
2,5669
2,5524
2,5395
2,5280
2,9208
2,8982
2,8784
2,8609
2,8453
61
62
63
64
65
0,6785
0,6785
0,6784
0,6783
0,6783
1,2956
1,2954
1,2951
1,2949
1,2947
1,6702
1,6698
1,6694
1,6690
1,6686
1,9996
1,9990
1,9983
1,9977
1,9971
2,3890
2,3880
2,3870
2,3860
2,3851
2,6589
2,6575
2,6561
2,6549
2,6536
21
22
23
24
25
0,6864
0,6858
0,6853
0,6848
0,6844
1,3232
1,3212
1,3195
1,3178
1,3163
1,7207
1,7171
1,7139
1,7109
1,7081
2,0796
2,0739
2,0687
2,0639
2,0595
2,5177
2,5083
2,4999
2,4922
2,4851
2,8314
2,8188
2,8073
2,7969
2,7874
66
67
68
69
70
0,6782
0,6782
0,6781
0,6781
0,6780
1,2945
1,2943
1,2941
1,2939
1,2938
1,6683
1,6679
1,6676
1,6672
1,6669
1,9966
1,9960
1,9955
1,9949
1,9944
2,3842
2,3833
2,3824
2,3816
2,3808
2,6524
2,6512
2,6501
2,6490
2,6479
26
27
28
29
30
0,6840
0,6837
0,6834
0,6830
0,6828
1,3150
1,3137
1,3125
1,3114
1,3104
1,7056
1,7033
1,7011
1,6991
1,6973
2,0555
2,0518
2,0484
2,0452
2,0423
2,4786
2,4727
2,4671
2,4620
2,4573
2,7787
2,7707
2,7633
2,7564
2,7500
71
72
73
74
75
0,6780
0,6779
0,6779
0,6778
0,6778
1,2936
1,2934
1,2933
1,2931
1,2929
1,6666
1,6663
1,6660
1,6657
1,6654
1,9939
1,9935
1,9930
1,9925
1,9921
2,3800
2,3793
2,3785
2,3778
2,3771
2,6469
2,6459
2,6449
2,6439
2,6430
31
32
33
34
35
0,6825
0,6822
0,6820
0,6818
0,6816
1,3095
1,3086
1,3077
1,3070
1,3062
1,6955
1,6939
1,6924
1,6909
1,6896
2,0395
2,0369
2,0345
2,0322
2,0301
2,4528
2,4487
2,4448
2,4411
2,4377
2,7440
2,7385
2,7333
2,7284
2,7238
76
77
78
79
80
0,6777
0,6777
0,6776
0,6776
0,6776
1,2928
1,2926
1,2925
1,2924
1,2922
1,6652
1,6649
1,6646
1,6644
1,6641
1,9917
1,9913
1,9908
1,9905
1,9901
2,3764
2,3758
2,3751
2,3745
2,3739
2,6421
2,6412
2,6403
2,6395
2,6387
36
37
38
39
40
0,6814
0,6812
0,6810
0,6808
0,6807
1,3055
1,3049
1,3042
1,3036
1,3031
1,6883
1,6871
1,6860
1,6849
1,6839
2,0281
2,0262
2,0244
2,0227
2,0211
2,4345
2,4314
2,4286
2,4258
2,4233
2,7195
2,7154
2,7116
2,7079
2,7045
81
82
83
84
85
0,6775
0,6775
0,6775
0,6774
0,6774
1,2921
1,2920
1,2918
1,2917
1,2916
1,6639
1,6636
1,6634
1,6632
1,6630
1,9897
1,9893
1,9890
1,9886
1,9883
2,3733
2,3727
2,3721
2,3716
2,3710
2,6379
2,6371
2,6364
2,6356
2,6349
41
42
43
44
45
0,6805
0,6804
0,6802
0,6801
0,6800
1,3025
1,3020
1,3016
1,3011
1,3006
1,6829
1,6820
1,6811
1,6802
1,6794
2,0195
2,0181
2,0167
2,0154
2,0141
2,4208
2,4185
2,4163
2,4141
2,4121
2,7012
2,6981
2,6951
2,6923
2,6896
86
87
88
89
90
0,6774
0,6773
0,6773
0,6773
0,6772
1,2915
1,2914
1,2912
1,2911
1,2910
1,6628
1,6626
1,6624
1,6622
1,6620
1,9879
1,9876
1,9873
1,9870
1,9867
2,3705
2,3700
2,3695
2,3690
2,3685
2,6342
2,6335
2,6329
2,6322
2,6316
100
0,677
1,290
1,660
1,984
2,364
2,626
120
0,677
1,289
1,658
1,980
2,358
2,617

0,674
1,282
1,645
1,960
2,326
2,576



106
Prof a Paula Francis Benevides
Estatística
Exemplos:
1) Admita parâmetro 9, ou seja  = 9 e  = 5%
Entrando na 1o coluna com  = 9 e na primeira linha com  = 0,05 (5%), encontramos, na
interseção dessa linha e coluna, o número 1,8331. Graficamente:
Obs.: Como a distribuição t é simétrica em relação a origem t = 0, a abscissa – 1,8331
deixará 0,05 = 5% de área (probabilidade) à esquerda.
2) Sendo  = 25 e  = 10%, temos:
3) Considere uma distribuição t com parâmetro 18. Encontre a média, a variância, o desvio padrão,
a mediana, o 1o quartil e o 95o percentil.
   
Média : E t    t   0
Variância : s 2 (t18 ) 
18
 1,13
18  2
Desvio Padrão : s(t18) = 1,13 =1,06
107
Prof a Paula Francis Benevides
Estatística
Mediana:
Logo, Md (t18) = 0
1o Quartil:
Como a distribuição é simétrica, temos Q3 = 0,6884
95o Percentil:
108
Prof a Paula Francis Benevides
Estatística
17.4 DISTRIBUIÇÃO F:
Desenvolvida por R.A. Fischer, a distribuição F possui importante aplicação na Análise da
Variância. Sejam: X 2 e X 2 duas variáveis aleatórias independentes com distribuições Qui2
1
Quadrado. Define-se como distribuição F com parâmetros  1 e  2 (  1 = grau de liberdade do
numerador e  2 = grau de liberdade do denominador), como:
F (1 ,  2 ) 
X 21
2
X2

2
1
11  2 2
Observe que: F(  1,  2) > 0
Média da distribuição:  
2
2  2
,  2 >2
2 22 (1   2  2)
Variância da distribuição: s 
, 2 > 4
1 ( 2  4)( 2  2) 2
2
   2   2 

 ,  1  2
A distribuição tem uma única moda, no valor: Mo   1
  1   2  2 
Para cada par (  1,  2), temos diferentes gráficos:
109
Prof a Paula Francis Benevides
Estatística
17.4.1
USO DA TABELA DA DISTRIBUIÇÃO F:
Na tabela encontram-se abscissas da distribuição F dados os parâmetros  1 e  2 e,
admitindo-se áreas (  ) de 5% na cauda à direita. Assim:
Para consultar a tabela:
1
2
1
........
.
.

Valor da abscissa que deixa a probabilidade
direita
 na cauda à
.
Para encontrarmos o valor da abscissa F95% (  1,  2), utilizamos a seguinte fórmula:
F95% (1 , 2 ) 
1
F5% ( 2 ,1 )
Graficamente, temos:
A fórmula também é válida para F97,5%(  1,  2) e F2,5%(  1,  2)
110
Prof a Paula Francis Benevides
Estatística
DEPARTAMENTO DE MATEMÁTICA
DISCIPLINA: ESTATÍSTICA – PROF.a PAULA
 = 5%
TABELA - Distribuição F de Fisher
Graus de liberdade para o numerador
1
Graus de liberdade para o denominador
2
1
2
3
4
5
6
7
8
9
10
12
14
15
16
18
20
24
30
40
60
120

1
2
3
4
5
161,4 199,5 215,7 224,6 230,2 234,0 236,8 238,9 240,5 241,9 243,9 245,4 245,9 246,5 247,3 248,0 249,1 250,1 251,1 252,2 253,3 254,3
18,51 19,00 19,16 19,25 19,30 19,33 19,35 19,37 19,38 19,40 19,41 19,42 19,43 19,43 19,44 19,45 19,45 19,46 19,47 19,48 19,49 19,50
10,13 9,55 9,28 9,12 9,01 8,94 8,89 8,85 8,81 8,79 8,74 8,72 8,70 8,69 8,67 8,66 8,64 8,62 8,59 8,57 8,55 8,53
7,71 6,94 6,59 6,39 6,26 6,16 6,09 6,04 6,00 5,96 5,91 5,87 5,86 5,84 5,82 5,80 5,77 5,75 5,72 5,69 5,66 5,63
6,61 5,79 5,41 5,19 5,05 4,95 4,88 4,82 4,77 4,74 4,68 4,64 4,62 4,60 4,58 4,56 4,53 4,50 4,46 4,43 4,40 4,36
6
7
8
9
10
5,99
5,59
5,32
5,12
4,96
5,14
4,74
4,46
4,26
4,10
4,76
4,35
4,07
3,86
3,71
4,53
4,12
3,84
3,63
3,48
4,39
3,97
3,69
3,48
3,33
4,28
3,87
3,58
3,37
3,22
4,21
3,79
3,50
3,29
3,14
4,15
3,73
3,44
3,23
3,07
4,10
3,68
3,39
3,18
3,02
4,06
3,64
3,35
3,14
2,98
4,00
3,57
3,28
3,07
2,91
3,96
3,53
3,24
3,03
2,87
3,94
3,51
3,22
3,01
2,85
3,92
3,49
3,20
2,99
2,83
3,90
3,47
3,17
2,96
2,80
3,87
3,44
3,15
2,94
2,77
3,84
3,41
3,12
2,90
2,74
3,81
3,38
3,08
2,86
2,70
3,77
3,34
3,04
2,83
2,66
3,74
3,30
3,01
2,79
2,62
3,70
3,27
2,97
2,75
2,58
3,67
3,23
2,93
2,71
2,54
11
12
13
14
15
4,84
4,75
4,67
4,60
4,54
3,98
3,89
3,81
3,74
3,68
3,59
3,49
3,41
3,34
3,29
3,36
3,26
3,18
3,11
3,06
3,20
3,11
3,03
2,96
2,90
3,09
3,00
2,92
2,85
2,79
3,01
2,91
2,83
2,76
2,71
2,95
2,85
2,77
2,70
2,64
2,90
2,80
2,71
2,65
2,59
2,85
2,75
2,67
2,60
2,54
2,79
2,69
2,60
2,53
2,48
2,74
2,64
2,55
2,48
2,42
2,72
2,62
2,53
2,46
2,40
2,70
2,60
2,52
2,44
2,39
2,67
2,57
2,48
2,41
2,35
2,65
2,54
2,46
2,39
2,33
2,61
2,51
2,42
2,35
2,29
2,57
2,47
2,38
2,31
2,25
2,53
2,43
2,34
2,27
2,20
2,49
2,38
2,30
2,22
2,16
2,45
2,34
2,25
2,18
2,11
2,40
2,30
2,21
2,13
2,07
16
17
18
19
20
4,49
4,45
4,41
4,38
4,35
3,63
3,59
3,55
3,52
3,49
3,24
3,20
3,16
3,13
3,10
3,01
2,96
2,93
2,90
2,87
2,85
2,81
2,77
2,74
2,71
2,74
2,70
2,66
2,63
2,60
2,66
2,61
2,58
2,54
2,51
2,59
2,55
2,51
2,48
2,45
2,54
2,49
2,46
2,42
2,39
2,49
2,45
2,41
2,38
2,35
2,42
2,38
2,34
2,31
2,28
2,37
2,34
2,29
2,26
2,22
2,35
2,31
2,27
2,23
2,20
2,33
2,29
2,25
2,22
2,18
2,30
2,26
2,22
2,18
2,15
2,28
2,23
2,19
2,16
2,12
2,24
2,19
2,15
2,11
2,08
2,19
2,15
2,11
2,07
2,04
2,15
2,10
2,06
2,03
1,99
2,11
2,06
2,02
1,98
1,95
2,06
2,01
1,97
1,93
1,90
2,01
1,96
1,92
1,88
1,84
21
22
23
24
25
4,32
4,30
4,28
4,26
4,24
3,47
3,44
3,42
3,40
3,39
3,07
3,05
3,03
3,01
2,99
2,84
2,82
2,80
2,78
2,76
2,68
2,66
2,64
2,62
2,60
2,57
2,55
2,53
2,51
2,49
2,49
2,46
2,44
2,42
2,40
2,42
2,40
2,37
2,36
2,34
2,37
2,34
2,32
2,30
2,28
2,32
2,30
2,27
2,25
2,24
2,25
2,23
2,20
2,18
2,16
2,20
2,17
2,15
2,13
2,11
2,18
2,15
2,13
2,11
2,09
2,16
2,13
2,11
2,09
2,07
2,12
2,10
2,08
2,05
2,04
2,10
2,07
2,05
2,03
2,01
2,05
2,03
2,01
1,98
1,96
2,01
1,98
1,96
1,94
1,92
1,96
1,94
1,91
1,89
1,87
1,92
1,89
1,86
1,84
1,82
1,87
1,84
1,81
1,79
1,77
1,81
1,78
1,76
1,73
1,71
26
27
28
29
30
4,23
4,21
4,20
4,18
4,17
3,37
3,35
3,34
3,33
3,32
2,98
2,96
2,95
2,93
2,92
2,74
2,73
2,71
2,70
2,69
2,59
2,57
2,56
2,55
2,53
2,47
2,46
2,45
2,43
2,42
2,39
2,37
2,36
2,35
2,33
2,32
2,31
2,29
2,28
2,27
2,27
2,25
2,24
2,22
2,21
2,22
2,20
2,19
2,18
2,16
2,15
2,13
2,12
2,10
2,09
2,09
2,08
2,06
2,05
2,04
2,07
2,06
2,04
2,03
2,01
2,05
2,04
2,02
2,01
1,99
2,02
2,00
1,99
1,97
1,96
1,99
1,97
1,96
1,94
1,93
1,95
1,93
1,91
1,90
1,89
1,90
1,88
1,87
1,85
1,84
1,85
1,84
1,82
1,81
1,79
1,80
1,79
1,77
1,75
1,74
1,75
1,73
1,71
1,70
1,68
1,69
1,67
1,65
1,64
1,62
40
60
120
4,08
4,00
3,92
3,23
3,15
3,07
2,84
2,76
2,68
2,61
2,53
2,45
2,45
2,37
2,29
2,34
2,25
2,17
2,25
2,17
2,09
2,18
2,10
2,02
2,12
2,04
1,96
2,08
1,99
1,91
2,00
1,92
1,83
1,95
1,86
1,77
1,92
1,84
1,75
1,90
1,81
1,72
1,87
1,78
1,69
1,84
1,75
1,66
1,79
1,70
1,61
1,74
1,65
1,55
1,69
1,59
1,50
1,64
1,53
1,43
1,58
1,47
1,35
1,51
1,39
1,25

3,84
3,00
2,60
2,37
2,21
2,10
2,01
1,94
1,88
1,83
1,75
1,69
1,67
1,63
1,60
1,57
1,52
1,46
1,39
1,32
1,22
1,00
111
Prof a Paula Francis Benevides
Estatística
EXEMPLO: Sendo  1 = 20 e  2 = 18, determinar o 95% e o 5% percentis.
Graficamente:
Para determinar o P95 (95o percentil), entramos na 1o linha da tabela com 20 (  1 = 20) e na
1o coluna com 18 (  2 = 18), encontrando 2,19. Logo: P95 = 2,19
112
Estatística
Prof a Paula Francis Benevides
REFERÊNCIAS
AKANIME, C.T.; YAMAMOTO, R.K. Estatística Descritiva. Editora Érica, 2000
CRESPO, A.A. Estatística Fácil. 17 ed. Saraiva, 2002.
GIOVANNI, J.R.; BONJORNO, J.R.; JR GIOVANNI, J.R. Matemática Fundamental. Uma nova
abordagem. Volume Único. Editora FTD, 2002.
JAMES, B. R. Probabilidade: um curso em nível intermediário. 3 ed. IMPA, 2006.
MUCELIN, C.A. Estatística. Editora do Livro Técnico. 2004
113
Download