capitulos_1_2__3_ 2013_0 - Páginas Pessoais

Propaganda
MINISTÉRIO DA EDUCAÇÃO
UNIVERSIDADE TECNOLÓGICA FEDERAL DO PARANÁ
CAMPUS PATO BRANCO
Curso de Tecnologia em Manutenção Industrial
1 APRESENTANDO DADOS EM TABELAS E GRÁFICOS
2 MEDIDAS NUMERICAS DESCRITIVAS
3 DISTRIBUIÇÕES DE PROBABILIDADE BÁSICA E DE PROBABILIDADE
DISCRETA
Prof. Jorge Roberto Grobe 11/09/14 15:35:40 ES34M-TEC
1
MINISTÉRIO DA EDUCAÇÃO
UNIVERSIDADE TECNOLÓGICA FEDERAL DO PARANÁ
CAMPUS PATO BRANCO
Curso de Tecnologia em Manutenção Industrial
Sumário
3 DISTRIBUIÇÕES DE PROBABILIDADE BÁSICA E DE PROBABILIDADE
DISCRETA.................................................................................................................................1
CAPITULO 1 ..........................................................................................................................4
1 APRESENTANDO DADOS EM TABELAS E GRÁFICOS..................................................4
1.1 ORGANIZANDO DADOS NUMÉRICOS.....................................................................9
1.1.1Exercicios .................................................................................................................9
Diagrama de ramos e folhas.................................................................................................10
1.3 TABELAS E GRÁFICOS PARA DADOS NUMÉRICOS...................................13
1.3.1Exercicios...........................................................................................................13
1.3.2 A Distribuição de Frequencia Relativa e a Distribuição de Percentagem..............14
Veículos mais vendidos - outubro de 2012.................................................................15
1.3.4 A Distribuição Acumulada......................................................................................15
...................................................................................................................................15
1.3.5 Exercicios..............................................................................................................16
1.3.6 Histograma............................................................................................................16
1.3.7 Exercicios..............................................................................................................16
1.4 ELABORANDO GRÁFICOS DE DADOS NUMÉRICOS BIVARIADOS.................17
1.4.1 Exercicios...............................................................................................................18
1.5 ELABORANDO TABELAS E GRÁFICOS DE DADOS CATEGÓRICOS........18
1.6 ELABORANDO TABELAS E GRÁFICOS DE DADOS CATEGÓRICOS
BIVARIADOS......................................................................................................................20
1.6.1 Exercicios...............................................................................................................20
1.7 EXCELÊNCIA GRÁFICA.............................................................................................22
CAPITULO 2 .........................................................................................................................23
2 MEDIDAS NUMERICAS DESCRITIVAS..........................................................................23
O QUE É DESVIO PADRÃO?............................................................................................27
2.1.1 Exercicios...............................................................................................................32
2.2 ANÁLISE EXPLORATÓRIA DE DADOS...................................................................36
2.3 O COEFICIENTE DE CORRELAÇÃO........................................................................37
CAPITULO 3............................................................................................................................40
3 DISTRIBUIÇÕES DE PROBABILIDADE BÁSICA E DE PROBABILIDADE
DISCRETA...............................................................................................................................40
3.1 Conceitue os Básicos de Probabilidade.........................................................................40
3.1.1Exercicios................................................................................................................42
3.2 TABELA DE CONTINGENCIA..................................................................................45
3.3 Regra de Adição para Eventos Mutuamente Excludentes ou Exclusivos.....................48
3.4 Probabilidade Condicional.............................................................................................50
3.5 Teorema de Bayes...........................................................................................................57
3.5.1 Exercicios...............................................................................................................59
3.6 DISTRIBUIÇÃO DE PROBABILIDADE PARA CADA UMA VARIÁVEL
ALEATÓRIA DISCRETA....................................................................................................63
3.6.1 VARIÁVEL ALEATÓRIA DISCRETA......................................................................63
3.6.2 Exercicios...............................................................................................................64
Prof. Jorge Roberto Grobe 11/09/14 15:35:40 ES34M-TEC
2
MINISTÉRIO DA EDUCAÇÃO
UNIVERSIDADE TECNOLÓGICA FEDERAL DO PARANÁ
CAMPUS PATO BRANCO
Curso de Tecnologia em Manutenção Industrial
solução: ...........................................................................................................................65
3.6.3 Distribuições de probabilidades discretas...............................................................65
3.6.3 EXERCICIOS.........................................................................................................73
3.6.4 Distribuição de Poisson (lê-se : poassom)..............................................................74
3.6.5 Exercicios...............................................................................................................75
3.6.6 Distribuição hipergeométrica..................................................................................76
3. 6.7 Exercicios..............................................................................................................78
3.6.8 Exercicios...............................................................................................................79
Prof. Jorge Roberto Grobe 11/09/14 15:35:40 ES34M-TEC
3
CAPITULO 1
1 APRESENTANDO DADOS EM TABELAS E GRÁFICOS
Estatística: é a ciência que coleta, organiza, analisa e interpreta dados para tomada de decisões.
Dados consistem em informações que vem de observações, contagens, medições ou respostas.
Dois tipos de dados: população e amostra.
•
População : é uma coleção de todos os resultados, respostas, medições ou contagens que
são de interesse.
•
Amostra: é um subgrupo de uma população.
Identificando conjunto de dados
1) O departamento de energia dos EUA conduz uma pesquisas semanais em aproximadamente 800
postos de gasolina para determinar o preço por galão de gasolina comum. Em 12 fevereiro de 2007,
o preço médio era de $2,24 por galão. Identifique a população e a amostra.
•
Identificando a população: consiste dos preços por galão de gasolina comum em todos os
postos de gasolina dos EUA.
•
Identifique a amostra: consiste dos preços por galão de gasolina comum em 800 postos
pesquisados.
•
Do que consiste o conjunto de dados: o conjunto de dados consiste em 800 preços.
Parâmetro: descrição numerica populacional
Estatistica: descrição numérica amostral
2)Decida se o valor numérico descreve um parâmetro populacional ou estatistica amostral.
•
Uma pesquisa recente de uma amostra de MBAS reportou que o salário médio para uma
MBA é mais do que $82000.
•
Resposta: em razão da média de $82000 ser baseada em um subgrupo de uma população é
uma estatistica amostral.
•
Os salarios iniciais para 667 MBAS graduados na Escola de Negocios da Universidade de
Chicago aumentaram 8,5 % em comparação ao ano anterior.
•
Resposta: devido ao fato de o aumento porcentual de 8,5% ser baseado em salarios iniciais
de todos os 667 graduandos, é um parametro populacional.
Estatistica descritiva: é o ramo da estatistica que envolve a organização, o resumo e a
representação dos dados.
Prof. Jorge Roberto Grobe 11/09/14 15:35:40
ES34MTEC
4
Estatistica inferencial: é o ramo da estatistica que envolve o uso de uma amostra para chegar a
conclusões sobre uma população. Uma ferramenta básica no estudo da estatistica inferencial é a
probabilidade.
Exemplo:FARBER(2009, p.6) Uma grande amostra de homens, com 48 anos de idade, foi estudada
durante 18 anos. Conforme o gráfico estão vivos aos 65 anos de idade.
90,00%
70,00%
solteiros
casados
FARBER(2009, p.3­9) Classificação dos dados Dados qualitativos: consistem em atributos, rótulos ou entradas não numericas.
Dados quantitativos: consistem de medidas numéricas ou contagens.
Dados qualitativos
Dados quantitativos
modelo
Preço base
fusion
$17795
F150
$18710
FARBER (2009, p.9) Níveis de mensuração
nominal
Nomes, rótulos ou qualidades. Nao são realizados calculos matematicos.
ordinal
Qualitativos ou quantitativos- podem ser organizados em ordem ou posição,
mas a diferença entre as entradas de dados não são significantes.
intervalar
Podem ser ordenados e poderá calcular diferenças significativas entre as
entradas de dados. Um registro nulo simplesmente representa uma posiçao
em uma escala; a entrada não é um zero inerente. Ex: temperatura: zero
graus.
racional
Similares ao intervalar com uma propriedade adicionada; neste nível, um
registro nulo é um zero inerente( não significa nada).Uma razão de dois
valores dados pode ser formada de modo que um valor de dado possa ser
significativamente expresso com multiplo do outro.ex: zero dólares na
poupança
Prof. Jorge Roberto Grobe 11/09/14 15:35:40
ES34MTEC
5
ordinal
os cincos primeiros de Tv
mais assistidos
nominal
afiliadas das redes em
Pittsburg
wtae
wpxi
kdka
wpgh
1. american idol terça feira
2.american idol-quarta feira
3.grey's anatomy
4.house
5.csi
intervalar
vitorias do New York Yankees
1923
1927
1938
1939
1950
1951
1961
1962
1999
2000
totais de home runs da liga
Americana
Baltimore
164
Boston
192
Chicago
236
Cleveland
196
nivel
de categorizar os ordenar
mensuração dados
dados
nominal
sim
não
ordinal
sim
sim
intervalar
sim
sim
racional
sim
sim
•
subtrair
os valores
dados
não
não
sim
sim
determinar se
os um valor dado
dos é multiplo do
outro
não
não
não
sim
FARBER(2009, p.15)
planejamento de estudo estatístico
1 identifique a variável de interesse e a população do estudo
2 desenvolva um plano detalhado para a coleta de dados.
se usar uma amostra tenha certeza de que a amostra representa
a população
3 colete dos dados
4 descreva os dados usando técnicas de estatistica descritiva
5 interprete os dados e tome decisões sobre a população usando
estatistica inferencial
6 identifique quaisquer possíveis erros
Prof. Jorge Roberto Grobe 11/09/14 15:35:40
ES34MTEC
6
COLETA DE DADOS
faça um estudo observacional
o pesquisador observa e mede as caracteristicas de interesse de parte
de uma população, mas não altera as condições existentes.
realize um experimento
um tratamento é aplicado em uma parte da população e as respostas são observadas
use uma simulação
uso de um modelo matemático ou fisico para reproduzir as condições de uma situação
ou processo.
use um levantamento ou pesquisa de mercado
é uma investigação de uma ou mais características de uma população.
PLANEJAMENTO EXPERIMENTAL
Planejamento experimental
produzir resultados significativos e não tendenciosos,
os experimentos devem ser cuidadosamente planejados
Um experimento bem planejado são controle, aleatorização e replicação.
CONTROLE:
variável confouding ( “ confusão”)
ocorre quando um pesquisador não pode dizer
a diferença entre os efeitos de diferentes fatores em uma
variável.
técnica cega
o sujeito não sabe se está recebendo tratamento ou placebo
Experimento duplamente cego ( double-blind)
nem o sujeito nem a pesquisador sabem se o sujeito
está recebendo tratamento ou placebo
Prof. Jorge Roberto Grobe 11/09/14 15:35:40
ES34MTEC
7
ALEATORIZAÇÃO:processo de se designar sujeitos aleatoriamente para diferentes grupos de
tratamento.
30 a 39 anos
todos os
sujeitos
controle
tratamento
40 a 49 anos
controle
tratamento
mais de 50 anos
controle
tratamento
REPLICAÇÃO:é a repetição de um experimento usando um grande grupo de sujeitos.
Exemplo: A empresa identifica 10 adultos que são fumantes . 5 deles recebem uma nova goma de
mascar e os outros 5 placebo. Depois de 2 meses eles são avaliados e descobre­se que os 5 sujeitos
que estão usando a nova goma de mascar pararam de fumar.
Solução: o tamanho da amostra usado não é grande suficiente para validar os resultados. O
experimento deve ser replicado para melhorar a validade.
TÉCNICAS DE AMOSTRAGEM
1 censo
2 amostragem
3 erro de amostragem
4 amostra aleatória
5 amostra aleatória simples
população inteira
parte da população
diferença entre os erros da amostra e população
membros de uma população tem chances iguais de
serem selecionados
toda amostra possível de mesmo tamanho
tem a mesma chance de ser selecionada
Exemplo de amostra aleatória simples:
731 estudantes se inscreveram no curso de estatistica em uma universidade. Formar uma amostra de
8 estudantes para responder questões de uma pesquisa.Selecionar os estudantes que pertencerão a
amostra aleatória simples.
Prof. Jorge Roberto Grobe 11/09/14 15:35:40
ES34MTEC
8
amostra estratificada
Grupo 1
renda baixa
Grupo 2
renda média
Grupo 3
renda alta
amostra por agrupamento
Zona 1
Zona 2
Zona 3
Zona 4
amostra sistemática
- atribuído um numero a cada membro da população
FARBER(2009, p.29­30)Usando a tecnologia na estatistica
•
os números aleatóros pode ser uma lista gerada que serve para selecionar membros da
amostra ou realizar simulações.
•
Na planilha Calc : •
Sintaxe
•
ALEATÓRIOENTRE (Inferior; Superior)
1.1 ORGANIZANDO DADOS NUMÉRICOS
•
Para LEVINE (2005), uma disposição ordenada consiste em uma seqüência de dados
brutos, com ordem de classificação partindo da menor observação para maior observação.
•
A disposição ordenada torna mais fácil a separação de extremos, de valores típicos e da área
na qual a maioria dos valores encontra­se concentrada.
1.1.1Exercicios
1) Um departamento de controle de qualidade esta testando 25 celulares de um carregamento de 300
telefones com cameras. Faça uma lista aleatória de 25 numeros de 1 a 300 e ordene a lista.
* na classificação dos dados não vincular a formula ALEATÓRIOENTRE (Inferior;
Superior)
Prof. Jorge Roberto Grobe 11/09/14 15:35:40
ES34MTEC
9
2) Considere a população de 41 numeros inteiros de 0 a 40. Qual é a média desses numeros?
Selecione tres amostras aleatórias de 7 numeros dessa lista. Encontre a média de cada amostra.
Compare seus resultados com a média da população inteira.
1.2 DISPOSIÇÃO RAMO-e-FOLHA
•
Em LEVINE (2005), a disposição ramo e folha organiza um conjunto de dados e
compreende melhor a maneira como os valores se distribuem e se agrupam ao longo
da amplitude das observações no conjunto de dados.
•
Segundo MONTGOMERY (2003), é uma boa maneira de obter uma apresentação
visual informativa de um conjunto de dados em que cada x I consiste no mínimo dois
dígitos. •
Para construir o diagrama de ramos e folhas dividimos cada número xi duas
partes:ramo consiste em um ou mais dígitos e uma folha consiste nos dígitos
restantes. •
Geralmente é escolhido entre 5 e 20 ramos, uma vez escolhidos , eles são listados ao
longo da margem esquerda do diagrama. .
ramo
folha
freqüência

Valor mínimo

Valor máximo

Maior concentração dos dados

Menor concentração dos dados

Distribuição da simetria em torno do valor central.
3) Exemplo:
Diagrama de ramos e folhas
•
Este tipo de gráfico é um modo simples de organizar os dados e que pode facilitar a
construção de tabelas de freqüências. Prof. Jorge Roberto Grobe 11/09/14 15:35:40
ES34MTEC
10
•
Podem ser usados para dados quantitativos (numéricos), mas não qualitativos (por exemplo,
dados nominais ou por categorias). •
Seja o seguinte exemplo: considere que se tenha anotado 20 valores relativos ao tempo de
uma atividade, e que se deseja organizá­los em um diagrama de ramos e folhas. •
Os valores são os seguintes: 23 ­ 31 ­ 42 ­ 45 ­ 51 ­ 52 ­ 57 ­ 61 ­ 61 ­ 64 ­ 68 ­ 69 ­ 73 ­ 75 ­
75 ­ 82 ­ 89 ­ 94 ­ 118 – 120,
•
(1) determina­se o menor e o maior valores; neste exemplo, 23 minutos o menor valor e 120
minutos o maior. •
(2) constróem­se categorias nas quais se deseja agrupar os dados a partir menor dezena até a
maior, ver Figura 1. •
Nas colunas, o 2 representa a dezena dos "20" minutos and o 12 representa a dezena dos
"120 minutos".
Dezenas de minutos 2|
3|
4|
5|
6|
7|
8|
9|
10|
11|
12|
Figura 1. Passo inicial da construção de um gráfico de ramos e folhas
•
(3) retorna­se aos dados originais e simplesmente coloca­se as unidades referentes às
dezenas em cada uma das linhas, ordenadamente. Prof. Jorge Roberto Grobe 11/09/14 15:35:40
ES34MTEC
11
•
Por exemplo, o número 23 é representado por um 3 colocado na linha 2, e 118 pode ser
representado na linha 11 por um 8. •
Uma vez feito para todos os valores, o diagrama fica com o aspecto da Figura 2. Dezenas de
minutos
Minutos
2| 3
3| 1
4| 2 5
5| 1 2 7
6| 1 1 4 8 9
7| 3 5 5
8| 2 9
9| 4
10|
11| 8
12| 0
Figura 2. Diagrama de ramos e folhas
fonte: http://www.estatistica.eng.br/ramosefolhas.htm
1.2.1 Exercicios
4)FARBER(2009, p.30)O Securities and Excange Comission esta investigando uma empresa de
serviços financeiros que tem 86 corretores.O SEC decide revisar os registros de uma amostra
aleatória de 10 corretores. Gerar uma lista de 10 numeros aleatórios de 1 a 86 e construa o grafico
de ramo e folha.
5) FARBER (2009, p.53)Notas de exames .Use um diagrama ramo­e­folha para representar os
dados . O dados representam as notas de uma turma de biologia em um teste.
Prof. Jorge Roberto Grobe 11/09/14 15:35:40
ES34MTEC
12
75
83
88
95
85
92
95
87
90
94
91
76
80
68
73
91
87
75
80
85
67
91
82
79
1.3 TABELAS E GRÁFICOS PARA DADOS NUMÉRICOS
•
FARBER (2009, p.32)Distribuição de freqüência: é uma tabela que mostra classes ou
intervalos das entradas de dados com uma contagem do numero de entradas em cada classe.
•
A frequencia f de uma classe é o numero de dados em uma classe.
•
O numero de classes deve estar entre 5 e 20.
Construção da distribuição de freqüência

Número de grupos de classe para a tabela

Intervalo ou amplitude de cada classe

Limite de cada grupo.
OBTENDO OS INTERVALOS DE CLASSES
Amplitude do intervalo=
valor máximo ­ valor mínimo
número de grupos de classes desejado
1.3.1Exercicios
6) FARBER (2009, p.40) Use as entradas de dados minimas e máximas e o numero de classes para
encontrar a largura da classe, os limites inferiores e superiores da classe.
a) minimo: 7 maximo:58 6 classes
b)minimo: 11 maximo:94 8 classes
7) FARBER (2009, p.41) Use a distribuição de frequencia para construir uma distribuição de
frequencia expandida:
Cleveland, OH- temperaturas altas ( F)
classe
frequencia
20-30
19
31-41
43
Prof. Jorge Roberto Grobe 11/09/14 15:35:40
Ponto médio
ES34MTEC
Frequencia (%)
relativa
Frequencia
acumulada
13
42-52
68
53-63
69
64-74
74
75-85
68
86-96
24
Sintaxe
FREQÜÊNCIA(Dados; Classes)
Dados representa a referência para os valores que serão computados.
Classes representa a matriz dos valores limites ou pode acrescentar também a matriz de dados
para fazer uma contagem de quantos de cada dado amostra se repetem.
Chamamos de freqüência os números de elementos da população ou amostra pesquisada que
correspondem a cada faixa do fenômeno estudado. TROTTA(1988)
1.3.2 A Distribuição de Frequencia Relativa e a Distribuição de Percentagem
Freqüência relativa : n = numero total de pesquisados , ni =freqüência correspondente , onde a freqüência relativa é dada em porcentagem (%).
FARBER (2009, p.34) A frequência relativa de uma classe é a porção ou porcentagem de dados
que está em determinada classe.
frequencia relativa=
frequencia da classe
tamanho da amostra
Prof. Jorge Roberto Grobe 11/09/14 15:35:40
ES34MTEC
14
1.3.3 Exercicios
8) RANKING
Veículos mais vendidos - outubro de 2012
1º
2º
3º
4º
5º
6º
7º
8º
9º
VOLKSWAGEN GOL
FIAT UNO
FIAT PALIO
VOLKSWAGEN FOX
FIAT SIENA
CHEVROLET CELTA
FIAT STRADA
VOLKSWAGEN VOYAGE
RENAULT SANDERO
CHEVROLET CORSA SEDAN
10º
27737
21370
18824
13191
12512
12074
11643
9710
9429
8505
Fonte:http://carros.ig.com.br/
8.1 Em 1982 no estado do Acre , havia 62279 alunos matriculados no 1 0 grau , 4221 no 2o grau e
1713 no ensino superior. Construa a tabela de distribuição de freqüências e o correspondente
gráfico.
Tipos
de freqüência
Freqüência relativa
porcentagem
Acumulada %
ensino
1o grau
20 grau
Superior
total
1.3.4 A Distribuição Acumulada
É uma tabela de percentagens acumuladas, conhecida como distribuição de percentagem
acumulada. A distribuição acumulada e seu respectivo polígono acumulado fornecem informações
sobre conjuntos de dados que não podem ser obtidas a partir da própria distribuição de freqüência.
Prof. Jorge Roberto Grobe 11/09/14 15:35:40
ES34MTEC
15
1.3.5 Exercicios
9) FARBER (2009, p.42­43) Construa a distribuição de frequencia , o grafico em barras ou
histograma , poligono de frequencia, para o conjunto de dados usando o numero de classes.
Vendas: 6 classes
4278
3981
4105
5835
4608
1030
1643
3183
1512
2478
2000
1858
1931
1697
1077
1500
1355
2478
1.3.6 Histograma
É um gráfico no qual as barras retangulares são construídas nos limites de cada classe.
•
PODE­SE CONSTRUIR AUTOMÁTICO SEM O LIMITE SUPERIOR
1.3.7 Exercicios
10) LEVINE(2005, p.56) Os dados daqui exibidos representam o custo de energia eletrica durante o
mês de julho, para uma amostra aleatoria de dois quartos, em uma cidade grande.
102
153
197
127
82
157
185
90
116
172
Tarifas de Serviços ( em dólares)
111
141
128
148
149
144
213
206
168
130
175
109
165
123
167
95
163
150
154
130
143
187
166
139
149
108
119
183
151
114
135
191
137
129
158
a) forme uma distribuição de frequencia que possua :
(1) cinco intervalos de classes.
(2)seis intervalos de classes
(3) sete intervalos de classes.
Dica:para ajudar na decisão sobre a melhor forma de construir os limites de classe deve­se
posicionar os dados brutos em uma disposição de ramo­e­folha ( deixando que as folhas sejam
os dígitos secundarios) ou em uma disposição ordenada.
b) forme uma distribuição de frequencia que possua sete intervalos de classe com limites de classes
superiores iguais a $99, $119 e assim por diante.
Prof. Jorge Roberto Grobe 11/09/14 15:35:40
ES34MTEC
16
c) forme a distribuição de percentagem, com base na distribuição de frequência desenvolvida no
item (b).
d) desenhe o histograma ou grafico em barras da frequencia.
* para fazer o grafico do histograma deixar o limite inferior e superior como texto e intervalo de
dados em linhas.
e)desenhe o poligono de percentagem.
f) forme a distribuição de frequência acumulada.
g) forme a distribuição de percentagem acumulada.
h) desenhar a ogiva ( poligono de percentagem acumulada).
i) em torno de que valor o custo mensal de energia eletrica está concentrado?
j) qual dos graficos que é melhor para representar a distribuição do custo de energia eletrica?
11) Forme uma distribuição de freqüência que possua 7 intervalos de classes com limites de classes
superiores iguais a $ 99, $119 e assim por diante. Gerar uma lista de 20 numeros aleatorios entre o
limite inferior da primeira classe e limite superior da ultima classe.
limite inferior
si
1
2
3
4
5
6
7
limite superior frequencia media das classes
99
119
1.4 ELABORANDO GRÁFICOS DE DADOS NUMÉRICOS BIVARIADOS
•
A partir de uma variável numérica, o histograma, o polígono e a ogiva ou polígono
acumulado são ferramentas gráficas apropriadas para fins de utilização. •
Para examinar duas variáveis pode­se utilizar outra ferramenta gráfica denominada
diagrama de dispersão.
•
O desenho de duas variáveis numéricas foi popularizado no século 19 por Sir Francis
Galton. •
Quanto a relação das variáveis elas podem ser crescentes
(positiva ) ou decrescentes
(negativas) em que uma variável cresce e a outra decresce.
Prof. Jorge Roberto Grobe 11/09/14 15:35:41
ES34MTEC
17
1.4.1 Exercicios
12) A tabela a seguir representa um conjunto de dados, a partir de uma amostra de n =11 itens:
x 7 5 8 3 6 10 12 4 9 15
y 21 15 24 9 18 30 36 12 27 45
18
54
a) desenhe o diagrama de dispersão
b) existe uma relação entre X e Y? Explique
13) Os dados a seguir representam o preço aproximado de varejo( em dólares), bem como o custo
da energia elétrica por ano ( em dólares) de 10 refrigeradores do tipo dúplex de tamanho médio :
preço
custo da energia elétrica por ano ($)
850
760
900
870
1100
800
650
750
750
570
48
54
58
66
77
66
70
81
72
78
a) com custo de energia elétrica no eixo X e o preço no eixo Y, construa um gráfico de dispersão.
b)parece haver uma relação entre o preço e o custo da energia?Em caso afirmativo, a relação é
positiva ou negativa?
c)você poderia supor que os refrigeradores com preços mais elevados tivessem maior eficácia no
consumo de energia elétrica? Isto é identificado através de dados?
1.5 ELABORANDO TABELAS E GRÁFICOS DE DADOS CATEGÓRICOS
Ao lidar com variáveis categóricas as observações são alocadas em tabelas resumidas e podem ser
exibidas em gráficos de barras, pizzas ou diagrama de Pareto.

Gráficos em barras : cada categoria é ilustrada por uma barra, cujo comprimento
representa a freqüência ou porcentagem das observações que se enquadram na categoria

Gráficos de pizza: expressam dados em dados categóricos a partir de uma tabela resumida.
Ele se baseia no circulo de 360oe mostra a porcentagem de cada categoria .e que perfazem
ao todo 100%

O diagrama de Pareto : fornece mais informações que os dois gráficos citados acima. 
O diagrama de Pareto é um tipo especial de gráfico de barras verticais, no qual as respostas
categóricas são desenhadas em ordem de classificação decrescente em relação as suas
freqüências, e combinadas com um polígono acumulado no mesmo gráfico. Prof. Jorge Roberto Grobe 11/09/14 15:35:41
ES34MTEC
18

Ele atinge sua máxima utilidade quando a variável categórica de interesse contem muitas
categorias. 
No eixo vertical á esquerda pode conter as freqüências ou percentagens. 
Uma característica importante que norteia este dispositivo é a capacidade de separar os
“poucos dados vitais” e dos “muitos dados triviais”, possibilitando que seja dada a
atenção as categorias importantes.
•
selecionar as duas colunas/dados/classificar/2a coluna/decrescente
1.5.1 Exercicios
14) Uma variável categórica possuía 4 categorias com as seguintes percentagens de ocorrência:
categoria Percentagem Categoria Percentagem
A
12
C
35
B
29
D
24
a) construa um gráfico de barras
b)construa um gráfico de pizza
15) Um analista de rede registrou as causas que deram origem a quedas de sistemas de rede durante
os últimos 6 meses:
Motivo para a falha
Conexão física
Software do servidor
Falha de energia
Hardware do servidor
Servidor sem memória
Largura de banda inadequada
Freqüência
1
29
3
2
32
1
* selecionar as duas colunas/dados/classificar/2a coluna/decrescente
Prof. Jorge Roberto Grobe 11/09/14 15:35:41
ES34MTEC
19
a) elabore um diagrama de Pareto
35
30
Servidor sem memória
Software do servidor
Falha de energia
Hardware do servidor
Conexão física
Largura de banda inadequada
25
20
15
10
5
0
b)discuta sobre os “poucos dados vitais“ em relação aos “muitos dados triviais” correspondentes às
causas que dão origem a queda no sistema de rede.
1.6 ELABORANDO TABELAS E GRÁFICOS DE DADOS CATEGÓRICOS BIVARIADOS
•
Uma maneira de visualizar dados categóricos bivariados ao procurar padrões ou relações é
pela construção de gráficos de barras paralelas ou agrupadas.
1.6.1 Exercicios
16)Os resultados de um estudo realizado como parte de um esforço para otimizar a produção em
uma fábrica de semi condutores forneceram dados sobre defeitos para uma amostra de 450 placas.
A tabela a seguir apresenta um resumo das respostas as duas perguntas: foi encontrada alguma
partícula na matriz que produziu a placa? E a placa é adequada ou inadequada?
Qualidade nenhuma da placa
partícula
adequada
inadequada
totais
Prof. Jorge Roberto Grobe 11/09/14 15:35:41
partícula
320
80
400
ES34MTEC
totais
14
36
50
334
116
450
20
* selecionar a tabela inteira ­ gráficos de barras a) construa um gráfico de barras paralelas ou agrupadas da qualidade da placa baseada na condição
da matriz?
b)construa uma tabela de percentagens totais
c)construa uma tabela de percentagens de linhas
d)construa uma tabela de percentagens de colunas
17) Um banco de investimentos realizou uma pesquisa de satisfação uma pesquisa de satisfação de
clientes numa base mensal, para medir a satisfação em relação a várias áreas de serviços oferecidos
pelas suas agências. Os resultados a partir de uma amostra de 200 clientes se deram da seguinte
forma:
área de serviço
tempo de espera no caixa
caixa eletrônico
aconselhamento sobre investimentos
serviço de cheques de viagem
segurança de depósitos
serviços de manutenção de conta
numero de pessoas satisfeitas
123
73
43
25
24
46
numero de pessoas insatisfeitas
65
7
6
11
5
4
Repare que, uma vez nem todos os clientes utilizaram todos os serviços, o número de respostas para
cada área de serviço é diferente.
a) construa a tabela de percentagens por linha.
b) construa a tabela de percentagens por coluna
c) construa a tabela de percentagens totais.
d)que tipo de porcentagem­ de linha, de coluna ou total­ você acha que serve de maior auxilio na
compreensão desses dados? Por que?
R: os percentuais de linha são úteis para demonstrar diferentes taxas de satisfação em relação a
vários serviços bancários.
e)construa o gráfico de barras paralelas de satisfação do cliente por área de serviço.
f)os clientes parecem igualmente satisfeitos com relação a todas as áreas de serviço? Quais áreas
parecem precisar de melhorias mais do que as outras ? comente.
Prof. Jorge Roberto Grobe 11/09/14 15:35:41
ES34MTEC
21
R: os clientes não estão igualmente satisfeitos com todas as áreas de serviço do banco. Mais de
91% estão satisfeitos com os caixas eletrônicos, mas somente 65,4% estão satisfeitos com o tempo
de espera no caixa. O banco poderia melhorar o nível de satisfação geral dos clientes diminuindo
o tempo de espera no caixa.
1.7 EXCELÊNCIA GRÁFICA

Descreve e comunica informações estatísticas
o Funções de dados gráficos
o Mostrar os dados
o Fazer com que o observador se concentre na essência do gráfico, e não forma como o
gráfico foi desenvolvido.
o Evitar distorções
o Incentivar comparação de dados
o Servir a um propósito claro.
o Estar integrado com as descrições estatísticas e verbais do gráfico.

Princípios da excelência gráfica

Apresentações bem elaboradas de dados, que fornece substância, estatística e forma.

Comunica idéias complexas com clareza, precisão e eficiência

Fornece ao observador o maior número de idéias, no menor espaço de tempo, com menor
volume de impressão.

Envolve várias dimensões.

Exige que seja transmitida a verdade sobre os dados.
Prof. Jorge Roberto Grobe 11/09/14 15:35:41
ES34MTEC
22
CAPITULO 2
2 MEDIDAS NUMERICAS DESCRITIVAS
•
Para CRESPO (1993),a coleta , a organização e a descrição dos dados estão a cargo da
estatística descritiva.
•
Conforme WITTE(2005),a estatística descritiva, oferece uma serie de ferramentas, tais
como tabelas, gráficos e médias, no sentido de organizar e resumir informações em relação a
um conjunto de observações existentes .
2.1 MEDIDAS DE TENDENCIA CENTRAL, VARIAÇÃO E FORMATO
•
FARBER (2009, p.55) é um valor que representa uma entrada típica ou central do conjunto
de dados.
•
As tres medidas da tendencia central mais comum são :
•
média , mediana e a moda
A MEDIA ARITMÉTICA
É a medida mais utilizada
X=
n X
∑ i=1
i
n
Xi = i-ésima observação da variável X
n = numero de observações da variável X
Quando utilizar a média aritmética
•
O calculo é baseado em todas as observações, a média aritmética é altamente afetada por um
ou mais valores extremos.
•
Então a média aritmética apresenta distorções daquilo que os dados estão representados,
assim sendo, a média aritmética não seria a melhor medida de tendência central a ser
utilizada para descrever ou resumir um conjunto de dados que possua valores extremos.
A MEDIANA

é o valor do meio em uma seqüência ordenada de dados.
Prof. Jorge Roberto Grobe 11/09/14 15:35:41
ES34MTEC
23

Mediana é o valor para o qual 50% das observações são menores e 50% das observações são
maiores.

observações classificadas

impar:

par = media dos valores numéricos centrais
 n1
2
MED
•
Retorna a mediana de um conjunto de números. Em um conjunto contendo um número
ímpar de valores, a mediana será o número do meio do conjunto e, em um conjunto
contendo um número par de valores, ela será a média dos dois valores do meio do conjunto.
Sintaxe
•
MED(Número 1; Número 2; ...Número 30)
Número 1; Número 2;...Número 30 são valores ou intervalos e representam um exemplo. Os
números também podem ser substituídos por uma referência.
A MODA
•
È o valor que aparece mais freqüentemente em um conjunto de dados.
•
A moda não é afetada pela ocorrência de quaisquer valores extremos.
•
Pode não existir a moda.
MODO
•
Retorna o valor mais comum em um conjunto de dados.
•
Se houver vários valores com a mesma freqüência, o menor valor será retornado. Um erro
ocorre quando um valor não aparece duas vezes.
Sintaxe
MODO(Número 1; Número 2; ...Número 30)
Número 1; Número 2;...Número 30 são intervalos ou valores numéricos.
Exemplo
=MODO(A1:A50)
Média ponderada e média de dados agrupados
Definição: é a media de um conjunto de dados cujas entradas tem pesos variados.
Onde w é o peso de cada entrada x.
Prof. Jorge Roberto Grobe 11/09/14 15:35:41
ES34MTEC
24
X=
∑  x∗w
∑w
Percentis e outros fractis
•
quartis: divide um conjunto de dados em 4 partes iguais
•
decis:divide um conjunto de dados em 10 partes iguais
•
percentis:divide um conjunto de dados em 100 partes iguais
•
exemplo: se o peso de uma criança de 6 meses de idade esta no 78 percentil, a criança
pesa mais que 78% de todas as crianças da mesma idade.
•
Exemplo: o 72 percentil corresponde a uma nota no teste de 1700, significa que 72%
dos estudantes teve uma nota de 1700 ou menos. FARBER (2004, p.89,90)
QUARTIS
•
São mais amplamente empregadas medidas de localização não central, e são utilizados para
descrever as propriedades de grandes conjuntos de dados numéricos.
•
Os quartis são medidas que dividem os dados ordenados em 4 partes (quartos).
O primeiro quartil Q1
observação ordenada

Q1 é valor que faz com que 25% das observações sejam menores e 75% das observações
sejam maiores.
O Terceiro quartil Q3

Q3 é valor que faz com que 75% das observações sejam menores e 25% das observações
sejam maiores.
observação ordenada.
As regras que são utilizadas para obter os valores de quartil:

Se o ponto de posicionamento resultante for um numero inteiro, a observação numérica em
questão, correspondente aquele ponto de posicionamento, é escolhida para ser o quartil.

Se o ponto de posicionamento resultante estiver entre dois números inteiros, a media de seu
respectivos valores é selecionada para ser o quartil.

Se o ponto de posicionamento resultante não se tratar de um numero inteiro, nem
corresponder ao valor equivalente a metade do caminho entre dois números inteiros, uma
regra simples consiste em fazer arredondamento ate o numero inteiro mais próximo e, em
seguida, selecionar o valor numérico relativo a observação correspondente.
Prof. Jorge Roberto Grobe 11/09/14 15:35:41
ES34MTEC
25
QUARTIL
Retorna o quartil de um conjunto de dados.
Sintaxe
QUARTIL(Dados; Tipo)
Dados representa o vetor de dados na amostra.
Tipo representa o tipo de percentil. (0 = MÍN, 1 = 25%, 2 = 50% (MÉDIO), 3 = 75% e 4 = MÁX.)
Exemplo
QUARTIL(A1:A50; 2) retorna o valor do qual 25% da escala corresponde aos valores mais baixos e
mais altos no intervalo A1:A50.
AMPLITUDE INTERQUARTIL ( ou dispersão média)
Esta medida considera a dispersão nos dados que estão entre os 50% de observações centrais
•
ou seja chamados de termos do meio.
VARIÂNCIA DA AMOSTRA
•
S 2=
mede a variabilidade através dos desvios
n  X −X 2
∑ i=1
i
n−1
VAR
Estima a variância com base em uma amostra.
Sintaxe
VAR(Número 1; número 2; ...número 30)
Número 1,número 2,...número 30 são valores ou intervalos numéricos que representam um
exemplo com base em uma população inteira.
Calcule a variância da amostra e o desvio padrão.
DESVIO PADRÃO DA AMOSTRA
S=

n  X −X 2
∑ i=1
i
n−1
Prof. Jorge Roberto Grobe 11/09/14 15:35:41
ES34MTEC
26
O QUE É DESVIO PADRÃO?
•
Parâmetro que indica o grau de variação de um conjunto de elementos.
•
Exemplos:
a) Dada a temperatura maxima durantes 3 dias em uma cidade A e obteve-se os seguintes valores,
28°, 29° e 30°, a média calcula é : X = 29°.
b) Em outra cidade B foi coletado as temperaturas maxima 22°, 29° e 35°. E média calculada é de:
X = 29°.
•
As médias têm o mesmo valor, mas os moradores da cidade A viveram três dias de calor,
enquanto os cidade B tiveram dois dias de calor e um de frio.
•
Para diferenciar uma média da outra, foi criada a noção de desvio padrão, que serve para
dizer o quanto os valores dos quais se extraiu a média são próximos ou distantes da própria
média.
•
O desvio padrão da cidade B é muito maior que o da cidade A.
Fonte:http://www.carlosescossia.com/2009/09/o-que-e-desvio-padrao.html
*''menor o desvio padrão, mais homogênea é a minha amostra''.
Fonte:http://fisioterapiahumberto.blogspot.com.br/2009/12/desvio-padrao-afinal-de-contas-para-
que.html
TAKAHASHI(2010, p.51) comparando duas amostras A e B, o desvio-padrão que for menor ,
indica que os valores estãos parecidos.
O desvio padrão é uma medida que só pode assumir valores não negativos e quanto maior for,
maior será a dispersão dos dados.
Algumas propriedades do desvio padrão, que resultam imediatamente da definição, são:

o desvio padrão é sempre não negativo e será tanto maior, quanto mais variabilidade houver
entre os dados.

se s = 0, então não existe variabilidade, isto é, os dados são todos iguais.
Interpretando a variância e o desvio padrão.
Prof. Jorge Roberto Grobe 11/09/14 15:35:41
ES34MTEC
27
•
A variância e o desvio padrão medem a dispersão média em torno da média aritmética, isto
é, como as observações maiores flutuam acima da média aritmética e como as observações
menores se distribuem abaixo dela.
DESVPAD
Estima o desvio padrão com base em um exemplo.
Sintaxe
DESVPAD(Número 1;número 2;...número 30)
Número 1, número 2, ... número 30 são valores ou intervalos numéricos que representam uma
amostra com base em uma população inteira.
Exemplo
=DESVPAD(A1:A50) retorna o desvio padrão estimado com base nos dados indicados.
O que desvio padrão indica
Neste exemplo
9,77 11,4 12,5 13,8 15,5 17,5 18,4 18,5 18,6 20,7 21,5 22,5 31,5 38,2
O desvio padrão é de 7,71, isto indica que eles estão se agrupando em torno deste valor e da sua
média 19,29 ou seja e [19,29 – S (7,71); 19,29 + S (7,71)]=[11,58 ; 27]
Entendendo a variação dos dados

Quanto mais espalhados ou dispersos estiverem os dados, maior serão a amplitude,
amplitude interquartil, a variância e o desvio padrão.

Quanto menos espalhados ou dispersos estiverem os dados, menores serão a amplitude,
amplitude interquartil, a variância e o desvio padrão.

Se as observações forem todas as iguais (não exista variação dos dados) a amplitude,
amplitude interquartil, a variância e o desvio padrão serão todos iguais a zero.

Todas essas medidas são maiores que zero.
COEFICIENTE VARIAÇÃO
S
CV = ∗100 %
x
S= desvio padrão
X = media da amostra
•
Caracteriza a dispersão ou variabilidade dos dados em termos relativos a seu valor médio.
•
Mede a dispersão dos dados em relação a média aritmética
FORMATO
Prof. Jorge Roberto Grobe 11/09/14 15:35:41
ES34MTEC
28
regra empirica
Significado de Empírico
adj. Que se apóia exclusivamente na experiência e na observação, e não em uma teoria: medicina
empírica.
Fonte: http://www.dicio.com.br/
FARBER( 2004, p.73) , quando os dados estiverem uma distribuição simétrica com formato de
curva, o desvio padrão tem as seguintes caracteristicas:
•
68% dos dados esta dentro de 1 desvio padrão em relação a média;
•
95% dos dados esta dentro 2 desvio padrão em relação a média;
•
99,7% dos dados esta dentro 3 desvio padrão em relação a média:
Estes percentuais estão descritos na figura 1 a seguir:
FIGURA 1: DISTRIBUIÇÃO EM FORMA DE SINO
Fonte:http://lauromartins.com/o-ibovespa-e-a-curva-normal/
FARBER (2004,p.74) Teorema de Chebychev
•
distribuição desconhecida
•
pode se aplicar as todas as distribuições que não estão em forma de sino (simétrica)
•
A porção de qualquer conjunto de dados que estejam dentro de k desvio padrao (k>1)
1
da média, pelo menos : 1− 2
k
Prof. Jorge Roberto Grobe 11/09/14 15:35:41
ES34MTEC
29
•
k=2 em qualquer conjunto de dados, 75% dos dados estão dentro de 2 desvios padrão
em relação a média.
•
K=3
88,5% dos dados estao dentro de 3 desvios padrões em relação a média.
LEVINE (2005, p.113) Uma outra maneira de verificar o conjunto de dados é seu formato( como
os dados estão distribuidos). A distribuição pode ser simetrica ou assimétrica ( distorcida)
i) Média aritmética > mediana ;positiva ou assimétrica à direita ( alongamento a direita)

Quando a média aritmética é aumentada em função de alguns valores elevados incomuns.

Longa cauda a direita, é causada por valores extremamente elevados. Empurram a média
para cima.
ii)Média aritmética = mediana ;simétrica

Os valores baixos e altos estão equilibrados
iii)Média aritmética < mediana ;negativa ou simétrica à esquerda (alongamento a esquerda)

Quando a média aritmética é reduzida em função de alguns valores elevados incomuns

Quando a média aritmética é reduzida em função de alguns valores extremamente baixos.

Os valores baixos puxam a média aritmética para baixo.
Fonte:http://aprendamatematica.com/site/wp-content/uploads/2012/02/assimetria.jpg
Prof. Jorge Roberto Grobe 11/09/14 15:35:41
ES34MTEC
30
Curtose: o grau de achatamento de uma distribuição em relação a uma distribuição padrão,
denominada curva normal (curva de sino), utilizada na distribuição de frequencia
coeficiente percentílico de curtose
C=
Q3−Q1 
2 P 90−P10 
C = 0,263 calculo baseado na curva normal.
Condições das curvas
C = 0,263 curva mesocúrtica é a própria normal
C < 0,263 curva leptocúrtica (apresenta uma curva de freqüência mais fechada que a normal ou
mais aguda em sua parte superior)
C > 0,263 curva platitúrtica (mais aberta que a normal ou mais achatada na sua parte superior).
COEFICIENTE DE CURTOSE DO BR.OFFICE CALC
MAGRINI (2008), o Coeficiente de Curtose do CALC (CC) é calculado pela fórmula abaixo,
quando registramos a função CURT( ) (KURT() na versão em inglês). Esta função do Calc se aplica
a Tabelas Primitivas ou Rol e não a Distribuição de freqüências.

n n  1
CC  
  n  1. n  2 . n  3 

 Xi  X 

 

Sx


4
3 n  1
 
 n  2. n  3 


2
A interpretação dos valores assumidos pelo CC é mostrada a seguir, destacando-se que este
coeficiente estabelece uma comparação da distribuição em estudo com a Distribuição Normal.
CC = 0
CC < 0
CC > 0
Prof. Jorge Roberto Grobe 11/09/14 15:35:41
Distribuição Mesocúrtica
Distribuição Platicúrtica
Distribuição Leptocúrtica
ES34MTEC
31
CURT
Retorna o valor de kurtosis de um conjunto de dados (são necessários ao menos 4 valores).
Sintaxe
CURT(Número 1; Número 2; ...Número 30)
Número 1, Número 2,... Número 30 são argumentos numéricos ou intervalos que representam uma
amostra de distribuição aleatória.
Exemplo
=curt(A1;A2;A3;A4;A5;A6)
exemplo:
9,77 11,4 12,5 13,8 15,5 17,5 18,4 18,5 18,6 20,7 21,5 22,5 31,5 38,2
Calcule a curtose.
CC > 0
•
Coeficiente
de
assimetria
Distribuição Leptocúrtica
de
Pearson:
ou
COMANDO
DISTORÇÃO
(ASSIMETRIA) : O valor enviesado caracteriza o grau de assimetria de uma distribuição
em torno de sua média.
•
Um valor enviesado positivo indica uma distribuição com uma ponta assimétrica que se
estende em direção a valores mais positivos.
•
Um valor enviesado negativo indica uma distribuição com uma ponta assimétrica que se
estende em direção a valores mais negativos.
exemplo:
9,77 11,4 12,5 13,8 15,5 17,5 18,4 18,5 18,6 20,7 21,5 22,5 31,5 38,2
Calcule a distorcao ou assimetria
2.1.1 Exercicios
1) FARBER (2009, p. 63-66) Encontre a média, a mediana e a moda dos dados, se possível.
30
35
19
22
Prof. Jorge Roberto Grobe 11/09/14 15:35:42
20
ES34MTEC
20
23
21
35
25
32
2) Encontre a média ponderada dos dados das notas e porcentagens na nota final para um aluno de
estatistica. Qual é a nota média do aluno?
nota
Porcentagem na nota final
Dever de casa
85
5,00%
testes
80
35,00%
projetos
100
20,00%
apresentações
90
15,00%
Teste final
Resposta: 89
93
25,00%
3) Os salarios médios iniciais por graduação atingida para 25 funcionários em uma empresa são
dados a seguir. Qual é a média dos salários iniciais para esses funcionários?
8 com MBA: $ 45500
Resposta :
e 17 com bacharelado em administração :$32000.
8∗45500+ 17∗32000
=$ 36320
8+ 17
4) Estudantes em uma aula de psicologia experimental realizaram uma pesquisa sobre depressão
como sinal de estresse. Um teste foi administrado com uma amostra de 30 estudantes. As notas são
fornecidas:
44
51
11
90
76
36
64
37
43
72
53
62
36
74
51
72
37
28
38
61
47
63
36
41
22
37
51
46
85
13
a) encontre a média e a mediana.
Resposta:
media
mediana
49,2333
46,5000
b) desenhe um grafico de ramo e folha para os dados usando uma fileira por ramo. Localize a média
e a mediana no grafico.
Resposta:
ramo folha
1 1
2 2
3 6
4 1
5 1
6 1
7 2
8 5
9 0
3
8
6
3
1
2
2
Prof. Jorge Roberto Grobe 11/09/14 15:35:42
6
4
1
2
4
7
6
3
3
6
ES34MTEC
33
c) descreva a forma da distribuição.
Resposta:
Média aritmética=49,23 é maior que mediana=46,5 ;positiva ou assimétrica à direita
( alongamento a direita)
 Quando a média aritmética é aumentada em função de alguns valores elevados incomuns.

Longa cauda a direita, é causada por valores extremamente elevados.

Empurram a média para cima.
5) FARBER (2009, p.78) Listamos uma amostra dos salários anuais em milhares de dólares para os
funcionários municipais de Los Angeles e Long Beach:
Los
20,2
26,1
20,9
32,1
35,9
23
28,2
31,6
18,3
20,9
18,2
20,8
21,1
26,5
26,9
24,2
25,1
22,2
Angeles
Long
Beach
a) encontre a amplitude, a variância , desvio padrão , coeficiente de variação e formato dos dados.
amplitude
variancia
desvio padrão
media
coeficiente de variação
mediana
17,6000
37,3478
6,1113
26,2556
23,28%
26,100
8,7000
8,7144
2,9520
22,8778
12,90%
22,200
b) interprete os resultados no contexto de um cenário real.
6) FARBER (2004,p.79) O valor médio de terras e construções por acre de uma amostra de
fazendas é $1500, com desvio padrão de $200. O conjunto de dados tem distribuição em forma de
sino. Estime a porcentagem de fazendas cujos valores das construções e terras por acre estejam
entre $1300 e $1700. * use a regra empírica
resposta: 68% dos dados esta dentro de um desvio padrão em relação a média ou seja [1500-200;
1500+200] = [1300;1700].
Prof. Jorge Roberto Grobe 11/09/14 15:35:42
ES34MTEC
34
7) FARBER (2004,p.80) Teorema de Chebychev.O tempo médio de mulheres em uma corrida de
400 metros rasos é de 57,07 segundos, com desvio padrão de 1,05. Aplique o teorema de
Chebychev para dos dados usando k=2. Interprete os resultados.
•
k=2 em qualquer conjunto de dados, 75% dos dados estão dentro de 2 desvios padrão
1
1− 2
em relação a média.
k
8) FARBER (2004,p.81) A tabela a seguir mostra as alturas em polegadas e pesos em libras dos
membros de um time de basquete. Encontre o coeficiente de variação para cada conjunto de dados.
Qual a conclusao?
altura
peso
72
180
74
168
68
225
76
201
74
189
69
192
72
197
70
162
69
174
77
185
73
210
9) FARBER (2004,p.81) Teorema de Chebychev Pelo menos 99% dos dados em qualquer conjunto
de dados fica dentro de quantos desvios padrão da média? Explique como você obteve essa
resposta.
Solução: 0,99=1−
1
k=10 desvio padrões.
k2
Prof. Jorge Roberto Grobe 11/09/14 15:35:42
ES34MTEC
35
2.2 ANÁLISE EXPLORATÓRIA DE DADOS
•
LEVINE (2005) O resumo dos 5 números:
X menor Q1 Mediana Q 3 X maior
•
•
para serem perfeitamente simétricos as distâncias entres eles tem que ser o mesmo, caso
contrário terá uma assimetria a esquerda ou a direita.
•
O BOX PLOT ( pode ser chamado de Box and Whisker Plot diagrama caixa e bigode;
•
Box é caixa representando a caixa do gráfico e whisker (bigode) representando as linhas
laterais.
•
È uma representação gráfica que descreve simultaneamente várias características
importantes de um conjunto de dados, tais como centro, dispersão, desvio de simetria e
identificação das observações que estão longe dos dados.(outliers)
•
Maior variabilidade é indicado através da caixa de maior tamanho e pelas linhas mais
longas.
•
Ela é valiosa quando se compara dois ou mais categorias.
10) FARBER (2004,p.90-91-92) Os gols marcados por um jogo de um time de futebol representam
o primeiro quartil para todos os times da liga. O que podemos concluir sobre gols marcados pelo
time por jogo?
11) O numero de dias de férias usadas por uma amostra de 20 funcionários em um ano recente.
3
9
2
1
7
5
3
2
2
6
4
0
10
0
3
5
7
8
6
5
a) encontrar o primeiro, o segundo e o terceiro quartis do conjunto de dados.
TIPOS
minimo
Q1
Q2=MEDIANA
Q3
maximo
0,000
2,000
4,500
6,250
10,000
Prof. Jorge Roberto Grobe 11/09/14 15:35:42
0
1
2
3
4
ES34MTEC
36
b) desenhar grafico de caixa e bigode que representam o conjunto de dados.
12) ASSISTINDO TV . O numero de horas que uma amostra de 28 pessoas assiste TV diariamente.
2
4
1
5
7
2
5
4
4
2
3
6
4
3
5
2
0
3
5
9
4
5
2
1
3
6
7
2
a) até quantas horas 75% das pessoas assistem TV diariamente?
Resposta: até 5 horas tem 75% das pessoas que assistem televisão.
b) qual a porcentagem de pessoas que assistem mais do que 4 horas de TV por dia?
Resposta: ate 4 horas é 50% das pessoas que assistem televisao.
c) se selecionarmos uma pessoa aleatoriamente a partir da amostra, qual é a probabilidade desta
pessoa assistir menos do que 2 horas de TV por dia? Escreva a resposta em porcentagem.
Resposta: 25%
2.3 O COEFICIENTE DE CORRELAÇÃO
•
Coeficiente de correlação (ρ) cujos valores se estendem para -1 para uma correlação
perfeitamente negativa, se for +1 correlação perfeitamente positiva.
•
Perfeito significa se todos os pontos forem desenhados em um diagrama de dispersão, eles
podem estar ligados a uma reta.
•
Então o coeficiente de correlação mede o grau de associação entre duas variáveis.
Prof. Jorge Roberto Grobe 11/09/14 15:35:42
ES34MTEC
37

as duas matrizes tem que ser do mesmo tamanho

coeficiente aproximando de +1 ou -1 torna-se mais forte

aproximando de zero , existe pouca ou nenhuma relação linear.

Comandos : correl ou pearson
Fórmula do coeficiente de correlação de Pearson
Sejam xi e yi os valores das variáveis X e Y.
e
são respectivamente as médias dos valores xi e yi.
A fórmula do coeficiente de correlação de Pearson é então,
fonte: http://stat2.med.up.pt/cursop/regressao/imagens/formula_correlacao.html
13)Os dados a seguir, representam os valores relativos a tarifas cobradas em função de cheques
devolvidos ($) em uma amostra de 23 bancos, correspondendo a clientes de conta corrente que
mantém um saldo de $ 100, e as tarifas mensais ($) cobradas, caso o saldo médio do cliente
permaneça abaixo do saldo mínimo exigido, correspondendo a uma amostra de 26 bancos, para
clientes de conta corrente que mantém um saldo médio de $1500.
tarifas de cheques
devolvidos
Prof. Jorge Roberto Grobe 11/09/14 15:35:48
26
28
20
20
21
22
25
25
18
25
15
20
18
20
25
25
22
ES34MTEC30
30
15
20
29
0
0
tarifas de serviços
mensais
12
8
5
5
6
6
10
10
9
7
7
5
0
10
6
9
12
0
5
10
8
5
5
9
38
a) calcule a correlação entre as duas amostras.
R: -0,0611 correlação fraca, não existe um grau de associação entre tarifas de cheques devolvidos
e tarifas de serviços mensais.
14) O gerente de operações de uma industria que manufatura pneus deseja comparar o real diâmetro
interno de dois tipos de pneus, cada um dos quais devendo ser igual a 575 mm. Uma amostra de 5
pneus de cada tipo foi selecionada , e os resultados, representando os diâmetros internos desses
pneus, ordenados do menor para o maior ,são os seguintes:
tipo x 568 570 575 578 584
tipo y 573 574 575 577 578
a) calcule o coeficiente de correlação .
b)o quão forte é a relação entre x e y? Explique
Prof. Jorge Roberto Grobe 11/09/14 15:35:48
ES34MTEC
39
CAPITULO 3
3 DISTRIBUIÇÕES DE PROBABILIDADE BÁSICA E DE PROBABILIDADE DISCRETA
3.1 CONCEITUE OS Básicos de Probabilidade
◦
FARBER(2009, p.105) exemplo simples do uso de termo experimento de probabilidade,
espaço amostral, evento e resultado:
◦
Experimento de probabilidade: lançamento de um dado de 6 lados
◦
Espaço amostral: {1,2,3,4,5,6}
◦
Evento : sair um numero par {2,4,6}
◦
Resultado : rolar um numero 2 : {2}
◦
Em WITTE(2005), probabilidade refere-se a proporção, ou fração, de vezes que um
determinado resultado é passível de ocorrer.
•
Segundo LEVINE (2005), probabilidade é a chance ou possibilidade de que um
determinado evento venha ocorrer.
•
Valores entre 0 e 1
•
Evento impossível – não tem chance de ocorrer é igual a zero
•
Evento certo igual a 1
•
FARBER (2009,p.109), Probabilidade clássica ou teórica é usada quando cada resultado
em um espaço amostral é igualmente possível de ocorrer.
•
•
A probabilidade clássica para um evento E é dada por:
P  E =
numero resultados no evento E
numero total de resultados no espaço amostral
Prof. Jorge Roberto Grobe 11/09/14 15:35:48
ES34MTEC
40
•
Jogando um dado de 6 lados :
•
Evento A: lançar um 3 R:1/6
•
Evento B: lançar um 7 R:0
•
Evento C: lançar um numero menor que 5. R:4/6=2/3
PROBABILIDADE EMPÍRICA ( ou estatistica) FARBER (2009, p.110), basea-se em observações
obtidas de experimentos de probabilidades.
A probabilidade empírica de um evento E é a frequência relativa do evento E.
P  E =
frequencia do evento E
frequencia total
15) Uma empresa esta conduzindo uma pesquisa on-line com indivíduos selecionados
aleatoriamente para determinar se o congestionamento no transito é um problema em sua
comunidade. A distribuição de frequência mostra os resultados . Qual é a probabilidade de que a
próxima pessoa que responda a essa pesquisa diga que o congestionamento é um problema sério em
sua comunidade?
resposta
Numero de vezes f
É um problema sério
123
É um problema moderado
115
Não é um problema
82
320
Resposta:
123
=0,3844=38,44 %
320
EVENTOS E ESPAÇOS AMOSTRAIS
•
Para MONTGOMERY(2003), um experimento é a medição de uma corrente em um fio de
cobre.
•
Com repetições diárias de medidas, os resultados podem diferir levemente, devido a
pequenas variações nas temperaturas ambientes, nos medidores, química do fio, etc.
Evento Simples FARBER(2009, p.106): consiste um único resultado
16) Determine o numero de resultados em cada evento. Escreva se cada evento é simples ou não.
•
Para um controle de qualidade, selecionar aleatoriamente uma peça de maquina de um lote
que foi fabricado naquele dia.O evento A é selecionar uma peça de maquina com um defeito
específico. R: evento simples
Prof. Jorge Roberto Grobe 11/09/14 15:35:48
ES34MTEC
41
•
Lançar um dado de 6 lados. O evento B é rolar pelo menos um numero 4. R:nao é simples.
17)DOMENICO (pag. 127),
•
lançamento de uma moeda
•
a aposta em um jogo qualquer da loteria esportiva.
Espaço amostral- é o conjunto de todos os resultados possíveis de um experimento aleatório.
18)DOMENICO ( pag.127) , no lançamento de um dado, o espaço amostral dos números voltados
para cima é o conjunto: S={1,2,3,4,5,6}, o numero de elementos de S é n(S)=6.
Evento- é um subconjunto do espaço amostral de um experimento aleatório.
19) DOMENICO ( pag.127), seja o experimento aleatório jogar um dado e verificar se a face
voltada para cima é impar.
O espaço amostral é: S={1,2,3,4,5,6} O evento A é : {1,3,5}
EVENTOS
Evento certo: é um evento igual ao espaço amostral. S={1,2,3,4,5,6}
Evento impossível: {}
Evento elemento : {5}
3. 2EVENTOS UNIÃO , INTERSECÇÃO E COMPLEMENTAR
União- são os resultados que estão contidos nos dois eventos. E1∪E2
Intersecção- são os resultados que estão contidos em ambos os eventos. E1∩ E2 Complemento
– são os resultados que não estão no evento E. E’=S-E MONTGOMERY(2003).
3.1.1Exercicios
DECIDA SE O EVENTO É SIMPLES OU NÃO NOS EXERCICIOS 1 E 2.
21)FARBER(2009,p.115) Um computador é usado para selecionar aleatoriamente um numero entre
1 e 2000. O evento A é selecionar 359.
RESPOSTA: EVENTO SIMPLES
22)FARBER(2009,p.115) um computador é usado para selecionar aleatoriamente um numero entre
1 e 2000. O evento B é selecionar um numero menor que 200.
R: não é um evento simples , pois tem mais de um resultado.
Prof. Jorge Roberto Grobe 11/09/14 15:35:48
ES34MTEC
42
23) Jogar
uma moeda e selecionar aleatoriamente um numero de 0 a 9. Qual a probabilidade de
obter coroa e selecionar um 3? R:1/2* 1/10= 0,05
24) (DOMENICO, pag.128) Seja o lançamento de um dado; forneça os eventos ao encontrar na face
voltada para cima:
a) números pares
b) números ímpares
c) números menores que 3 d) números primos
25) DOMENICO ( pag. 128), seja o lançamento de um dado e a verificação da face voltada para
cima, o espaço amostral:S={1,2,3,4,5,6}, sejam os eventos :
a) face par : A= {2,4,6}
b) divisores de 6: B= {1,2,3,6}
c) múltiplo de 5:C={5}
i) A∪B = {1,2,3,4,6}
A∩B =
ii)
{2,6}
A∩C = { } * A e C são mutuamente exclusivos, pois não ocorrem ao mesmo tempo.
iii)
•
se todos os elementos de S tem a mesma possibilidade de ocorrência, o espaço amostral
S um espaço equiprovável ou uniforme.
•
Espaço não -equiprovável : onde todos os pontos amostrais de um evento tem
diferentes possibilidades de ocorrência.
•
p1+p2+...+pn=1
26) DOMENICO ( pag. 130), na disputa de um campeonato mundial de futebol , a chance do Brasil
ser campeão é o dobro de chance da Argentina ser campeã. Qual é a probabilidade do Brasil ser o
campeão?
Solução : P(Argentina)= p
P(Brasil)=2p
P(A)+P(B)=1
P(B) =2/3
27) DOMENICO ( p.129-130) Suponha que numa caixa existem 7 bolas, sendo 2 pretas, 3 brancas
e 2 vermelhas. Sendo o espaço amostral equiprovável, determine, na retirada de uma bola da caixa,
a probabilidade:
a) vermelha
b) não preta
c) preta ou branca d) preta ou vermelha
28) Internacional, Cruzeiro , Corinthians e Flamengo vao disputar o titulo do campeonato brasileiro
de futebol. As chances do Corinthians e do Cruzeiro serem vencedores são iguais, mas a chance do
Prof. Jorge Roberto Grobe 11/09/14 15:35:48
ES34MTEC
43
Internacional é o dobro da chance do Cruzeiro e a chance do Flamengo é o triplo da chance do
Internacional.
a) qual é a probabilidade do Corinthians ser campeão? R:1/10
b) qual é a probabilidade do Flamengo ser campeão: R:3/5
•
P(A)+P(B)+P(C)+P(D)=1
29) Medidas do tempo necessário para completar uma reação química podem ser modeladas com o
espaço amostral S = 0 ;∞ . Dados os eventos : E1=[1;10) E2=(3;118).
a) E1∪ E2
b) E1’=S-E1
c) E1∩ E2
d)E1’∩ E2
respostas:a) [1;118[; b) ]0;1[UNIAO [10;inf [ ;c) ]3;10[;d) [10;118[
30) FARBER (2009, p.116) Dias de sol e chuva .Uma viagem de 4 dias para Seatle, Washington ,
em outubro.
a) faça um diagrama de arvore dos dias de sol e chuva para sua viagem.
b) liste o espaço amostral
c) liste os resultados para o evento que ira chover exatamente em um dia.
Dia 1
sol
chuva
31) FARBER (2009, p.117) use a distribuição de frequencia, que mostra o numero de eleitores
americanos ( em milhoes), de acordo com a idade:
Idade dos eleitores
Frequencia ( em milhoes)
18 a 20 anos
5,8
21 a 24 anos
8,5
25 a 34 anos
21,7
35 a 44 anos
27,7
45 a 64 anos
51,7
Acima de 65 anos
26,7
Encontre a probabilidade de que um eleitor , escolhido aleatoriamente, esteja:
a) entre 21 e 24 anos
Prof. Jorge Roberto Grobe 11/09/14 15:35:48
ES34MTEC
44
resposta:
8,5
=5,98 porcento
142,1
b) entre 35 e 44 anos
c) não esteja entre 18 e 20 anos
d) não esteja entre 25 e 34 anos.
3.2 TABELA DE CONTINGENCIA
Em LEVINE (2005), o comportamento de compra com relação a aparelho de televisão com tela
grande.
efetivamente comprou
planejou em
adquirir
sim (A)
não (A')
total
sim
Não
(B)
(B')
total
200
50
250
100
650
750
300
700
1000
•
Espaço amostral: coleção de todos os eventos possíveis.
•
O espaço amostral é de 1000 famílias
•
O complemento de A inclui todos os eventos que não fazem parte de A pode ser escrito por
A’.
PROBABILIDADE SIMPLES (marginal)
Em LEVINE (2005), a probabilidade simples é chamada de probabilidade marginal, uma vez que
ela pode ser obtida através da margem apropriada
 n o de familias que adquiriu  250
P planejou em adquirir=
=
=25 %
total de familias
1000
È a chance de 25% de uma família tenha planejado em adquirir uma tv com tela grande.
32) PROBABILIDADE SIMPLES ( MARGINAL)
Prof. Jorge Roberto Grobe 11/09/14 15:35:48
ES34MTEC
45
P(B)=250/1000
pode-se escrever P(B e A1)+P(B e A2)=200/1000+50/1000=250/1000
33)Calculando a probabilidade de um aparelho de tv com tela grande adquirido seja HDTV nos
últimos 12 meses, dado pela tabela de contingência:
comprou DVD (B)
comprou
HDTV (A)
HDTV (sim)
HDTV (não)
total
sim
Nao
38
70
108
total
42
150
192
80
220
300
a) Encontre a probabilidade de que uma família que tenha adquirido um aparelho de tv HDTV.
Resposta: 80/300, existe uma chance de 26,7% de que uma compra aleatoriamente selecionada de
um aparelho de televisão com tela grande seja de um HDTV (televisão de alta definição)
Probabilidade Combinada

Envolvem mais de dois eventos

Eles ocorrem simultaneamente
34)EXEMPLO: Uma vez que esse grupo em 200 familias , a probabilidade de escolher uma família
que tenha planejado adquirir e comprou uma tv com tela grande é :
efetivamente comprou
planejou em
adquirir
sim
não
total
sim
não
total
200
50
250
100
650
750
300
700
1000
P  A e B = P  A ∩ B 
resposta:
200
1000 =20%
35) Encontre a probabilidade de que uma família tenha comprado HDTV e um DVD.
comprou DVD (B)
Prof. Jorge Roberto Grobe 11/09/14 15:35:48
ES34MTEC
46
comprou
HDTV (A)
HDTV
Não HDTV
total
sim
Nao
38
70
108
total
42
150
192
80
220
300
resposta: existe uma chance de 12,7 % de que uma família, aleatoriamente selecionada que tenha
adquirido um aparelho de tv com tela grande tenha adquirido um HDTV e um aparelho de DVD.
38
300 =12,7%
Calculando a probabilidade marginal
P(A)= P(A e B1 )+...+P(A e Bk)
são eventos mutuamente excludentes se ambos não ocorrem ao mesmo tempo.
36) Calcular a probabilidade marginal de planejar em adquirir um aparelho de Tv com tela grande.
efetivamente comprou
planejou em
adquirir
sim
não
total
resposta:
sim
não
total
200
50
250
100
650
750
300
700
1000
200
50

= 25 %
1000 1000
Regra geral de Adição
P  A ∪ B = P  A  P  B − P  A∩ B 
P( AouB)  P(A )  P( B)  P(AeB)
37) DOMENICO (p.131) , seja o lançamento de um dado { 1,2,3,4.6} com eventos equiprováveis.
Qual é probabilidade de ocorrer um número par ou um número múltiplo de 3?
resposta:
P (A∪ B)=P (A)+ P (B)−P ( A∩B) =
3 2 1 4
+ − =
6 6 6 6
38) Planejou em adquirir ou efetivamente comprou, calcule esta probabilidade referente a compra
de uma tv com tela grande. Use a regra geral da adição. R: 35%
Prof. Jorge Roberto Grobe 11/09/14 15:35:48
ES34MTEC
47
efetivamente comprou
planejou em
adquirir
sim
não
total
A=efetivamente comprou
sim
não
total
200
50
250
100
650
750
300
700
1000
B=planejou em adquirir
P  A ∪ B = P  A  P  B − P  A∩ B 
300 250 200

−
=35 %
1000 1000 1000
39) Encontre a probabilidade de que uma família tenha comprado HDTV ou DVD.R:50%
comprou DVD (B)
comprou
HDTV (A)
HDTV
Não HDTV
total
sim
não
38
70
108
total
42
150
192
80
220
300
3.3 Regra de Adição para Eventos Mutuamente Excludentes ou Exclusivos
Os eventos são mutuamente excludentes se ambos os eventos não puderem ocorrer ao mesmo
tempo.
P(A ou B)= P(A) +P(B) ou P  A ∪ B = P  A  P  B 
Em WITTE (2005), resultados mutuamente excludentes não podem ocorrer conjuntamente.
Regra da Adição- some conjuntamente as probabilidades em separado de vários resultados
mutuamente excludentes para encontrar a probabilidade de que qualquer um desses resultados
venha ocorrer.
40) DOMENICO (p.131), seja o lançamento de um dado com eventos equiprováveis. Qual é a
probabilidade de ocorrer um número par ou um número multiplo de 5? resposta: 4/6
Prof. Jorge Roberto Grobe 11/09/14 15:35:48
ES34MTEC
48
•
se todos os elementos de S tem a mesma possibilidade de ocorrência, o espaço amostral
S um espaço equiprovável ou uniforme.
41) Assumindo que todas as pessoas seja igualmente possiveis de nascer durante qualquer um dos
12 meses do ano, qual é a probabilidade de que Jack tenha nascido:
a) em junho? resposta:
1
12
b) em qualquer mês que não seja junho?
c)em maio ou junho?
42) Qual é a probabilidade de que uma família, tenha adquirido uma tv com tela grande tenha feito
através da net ou do correio?
tipo de numero de
compra entrevistados
loja
183
net
87
correio
30
87
30
MAIS
= 39%
300
300
43) Ao longo dos últimos anos, empresas de cartão de credito realizaram um esforço intensivo a fim
de obter novas contas de alunos de faculdades. Suponha que um amostra de 200 alunos em sua
faculdade tenha indicado as seguintes informações em relação ao fato de os alunos possuírem um
cartão de credito bancário e/ou cartão para turismo e lazer:
cartão de credito para turismo e lazer
cartão de crédito
bancario
sim
não
sim
60
60
não
15
65
a) forneça um evento simples
resposta : possuir cartão de crédito bancário =0,60
b)evento combinado
resposta: possuir os dois cartões
c)qual o complemento de possuir um cartão de credito bancário?
resposta: não possuir um cartão de credito bancário
Prof. Jorge Roberto Grobe 11/09/14 15:35:48
ES34MTEC
49
d) por que possuir um cartão de credito bancário e possuir um cartão de credito para turismo e lazer
é um evento combinado?
Se um aluno for selecionado qual é a probabilidade de que:
e) o aluno possua cartão de credito bancário?
f)o aluno possua cartão de credito para turismo e lazer?
g)o aluno possua um cartão de credito bancário e um cartão de credito para turismo e lazer?
resposta:
h)o aluno não possua nenhum cartão?
resposta:
i) a aluno possua cartão de credito bancário ou para turismo e lazer?
resposta:
j)o aluno não possua um cartão de credito bancário ou possua um cartão de credito para turismo e
lazer? Respostas:e)0,6 f)0,375 g)0,3 h)0,325 i)0,675 j)0,7
3.4 Probabilidade Condicional
Em LEVINE (2005), ao calcular a probabilidade de um determinado evento, A, sendo conhecida
informações sobre a ocorrência de um outro evento B,
P(A / B)= probabilidade de A dado que ocorreu B.
P A/ B=
P  A e B
P  B
ou
P A∩B
P  B
P(B/A)= probabilidade de B dado que ocorreu A
P B / A=
P  B e A
P  A
ou
P B∩A
P  A
P(A e B)= probabilidade combinada de A e B
P(A) e P(B) = probabilidades marginais de A e B
•
Para DOMENICO (p.133), sendo S o espaço amostral de um conjunto de torcedores de
futebol, A o evento constituído por torcedores do Palmeiras e B o evento constituídos por
torcedores do Flamengo.
Prof. Jorge Roberto Grobe 11/09/14 15:35:48
ES34MTEC
50
•
Sendo P(A) é a probabilidade de um torcedor que, escolhido aleatoriamente em S, seja
palmeirense, enquanto que P(A/B) é a probabilidade de um torcedor
flamenguista,
escolhido ao acaso, ser também palmeirense.
44) DOMENICO ( p.133), sejam 100 torcedores n(S)=100, 20 torcedores do Palmeiras,
30
torcedores do Flamengo e 10 torcedores do Palmeiras e Flamengo. Qual é a probabilidade de que
um flamenguista escolhido seja palmeirense P(A/B):
solução: * fazer o diagrama de Venn
P A/ B=
n A∩B 10 1
= =
nB
30 3
S=100
P=20
F=30
F e P=10
10
10
100
20
45) Suponha que fosse informado de que uma família planejava adquirir um aparelho de televisão
com tela grande.
efetivamente comprou (B)
planejou em
adquirir (A)
sim A
não A'
total
Não
sim B B'
total
200
50
250
100
650
750
300
700
1000
a)Qual é a probabilidade de que uma família tenha efetivamente comprado o aparelho de Tv com
tela grande, sabendo –se que essa família tenha planejado em adquiri-lo?
P( B/ A)=
P( A∩B) 200
=
=0,8
P( A)
250
B= efetivamente comprou
A = planejou em adquirir
resposta :0,8
46) Qual a probabilidade de que uma família adquiriu um DVD (A) dado que comprou um HDTV
(B):
Prof. Jorge Roberto Grobe 11/09/14 15:35:49
ES34MTEC
51
Comprou DVD
Comprou HDTV Sim
não
HDTV
Não HDTV
38
70
total
42
150
80
220
P(A)= adquiriu um aparelho de DVD P(B)= adquiriu um HDTV
SOLUÇÃO:
38
P A∩B 300
P A /B=
=
= 0,475= 47,5%
PB
80
300
ARVORES DE DECISÃO
47) Arvore de decisão da empresa de produtos eletrônicos.
efetivamente comprou (B)
planejou em
adquirir (A)
sim
não
total
sim
200
50
250
não
Total
100
300
650
700
750
1000
conjunto inteiro das famílias
A'=750/1000
A =250/1000
B'
B
P(A'e B')=650/100
P(A' e B)=100/1000
B
P(A e B)=200/1000
B'
P( A e B')=50/1000
Calculo da probabilidade de P(B).
Prof. Jorge Roberto Grobe 11/09/14 15:35:49
ES34MTEC
52
P(B/A)= probabilidade de B dado que ocorreu A
200
P B∩ A 1000
P B/ A=
=
=80%
P  A
250
1000
entao a P(B)=80%=200/250
A P(A e B)= P(A)*P(B)=200/1000 resulta o valor da tabela
48) MOTGOMERY( 2003, p.40), uma historia de 266 amostras de ar foi classificada com base na
presença de duas moléculas raras. Faça A denotar o evento que consiste em todas as amostras de ar
em que a molécula rara 1 esteja presente. Faça B denotar o evento que consiste em todas as
amostras de ar em que a molécula rara 2 esteja presente. Conforme tabela :
Tabela 1: Moléculas em Amostra de Ar
MOLECULA 1 PRESENTE (A)
MOLECULA 2 PRESENTE
(B)
nao
sim
nao
212
24
236
sim
18
12
30
230
36
266
12
P( B∩ A) 266 12
=
=
Solução: P( B/ A)=
P( A)
36
36
266
Molecula 1 presente
230/266 ( nao)
36/266 ( sim)
Molecula 2 esta presente
212/230 nao
18/230 sim
Prof. Jorge Roberto Grobe 11/09/14 15:35:49
24/36 nao 12/36 sim
ES34MTEC
53
INDEPENDÊNCIA ESTATÍSTICA
Em WITTE (2005), a ocorrência de um resultado não possui nenhum efeito sobre a
•
probabilidade de que o outro resultado venha ocorrer.
Regra da multiplicação para resultados independentes
P(A e B)= P(A) *P(B)
Multiplicar as probabilidades em separado de vários resultados independentes para encontrar
•
a probabilidade de que esses resultados venham ocorrer conjuntamente.
Para LEVINE (20005), a independência estatística pode ser determinada utilizando-se a
•
equação:
P(A / B)=P(A) ou P(B/A)=P(B)
•
MILONE (2004, p.120), independentes são aqueles em que a ocorrencia de um não altera a
chance de os outros acontecerem;
•
•
cada um comporta-se a sua própria maneira , sem afetar nem ser influenciado pelos demais.
No lançamento de uma moeda , o fato de ter saido cara em uma jogada não modifica a
probabilidade de sair cara na seguinte;
•
a chance de um jogador receber um ás permanece igual se a carta retirada é reposta no
baralho antes da próxima extração;
•
o fato de ter caido cara no lançamento de uma moeda não afeta a possibilidade de sair par no
lançamento de um dado;
•
lançados dois dados, sair face tres em um deles não modifica a chance de sair face 4 no
outro.
•
Exemplo: MILONE ( 2004,p.138) qual a probabilidade de se obter, no lançamento de duas
moedas: a) só coroas
•
b) uma coroa e uma cara Como os eventos são independentes.
Soluçaõ : P(Ke K)= p(k) * p(k)=0,25
P(Ke C)= p(k)*p(c) =0,25
•
Prof. Jorge Roberto Grobe 11/09/14 15:35:49
ES34MTEC
54
49) DOMENICO ( p.134), a probabilidade de quem um casal o marido esteja vivo aos 70 anos é
1/8 e que a mulher esteja viva aos 70 anos é 1/10. Qual é a probabilidade do casal estar vivo aos 70
anos?
Solução :
1 1
1
P A∩B= ∗ =
8 10 80
50) DOMENICO (p. 134), seja uma moeda, sendo A={cara, coroa} e um dado , com
B={1,2,3,4,5,6}. Qual é a probabilidade de ser obtido o evento coroa na moeda e número impar no
dado? Resposta:
1 3 1
∗ =
2 6 4
51) FARBER( 2009, p.126) Computadores e acesso a internet. Um estudo descobriu que 62% das
residencias nos EUA tem computador. Desses 62%, 88% tem acesso a internet. Encontre a
probabilidade de que uma residencia americana selecionada aleatoriamente tenha computador e
acesso a internet. Resposta:0,62*0,88=0,546 * diagrama da arvore.
52) FARBER( 2009, p.125) A tabela mostra os resultados de uma pesquisa na qual 146 famílias
foram questionadas se tem computado e se vao tirar férias de verão este ano.
Férias de verão este ano
Tem computador
sim
nao
sim
46
11
nao
55
34
total
total
a) encontre a probabilidade de selecionar aleatoriamente uma família que não vá tirar férias de
verao este ano. R:0,3082
b) encontre a probabilidade de que uma família selecionada aleatoriamente tenha computador.
R:0,3904
c) encontre a probabilidade de que uma família selecionada aleatoriamente tire férias de verao este
ano, dado que tem computador. R:0,807
P ( B / A)=
P ( Ae B) 46/146 46
=
=
P( A)
57/146 57
Prof. Jorge Roberto Grobe 11/09/14 15:35:49
ES34MTEC
55
d) encontre a probabilidade de que uma família selecionada aleatoriamente tire férias de verão este
ano e tenha computador. R:0,315
e) os eventos de ter um computador e tirar férias de verão são eventos dependentes ou
independentes?
solução :
P (B / A)= P( B) para ser independentes.
P ( B / A)=
46
e
57
P (B)=
101
146
como as duas probabilidades P(B/A) é diferente de P(B) os eventos são dependentes.
53) FARBER (2009, p.135) A tabela mostra o numero de homens e mulheres matriculados em
enfermagem no centro de saude da Universidade de Oklahoma em um semestre recente. Um
estudante é selecionado aleatoriamente. Encontre a probabilidade de cada evento.
Estudantes de enfermagem Estudantes de outros total
cursos
homens
95
1015
mulheres
700
1727
total
a) o estudante é homem ou estuda enfermagem. R:0,512
b) o estudante é mulher ou não estuda enfermagem. R: 0,762
c) o estudante não é mulher ou estudante de enfermagem. R:0,589
d) os eventos ser homem e ser estudante de enfermagem são mutuamente exclusivos? Explique.
R: não são mutuamente exclusivos, por que um homem pode estudar enfermagem.
MILONE (2004, p.139) Probabilidade de ocorrencia disjunta dos eventos A e B.
Mutuamente excludentes
Mutuamente não excludentes
P(A ou B)=P(A) + P(B)
P(A ou B)=P(A) + P(B)- P(Ae B)
54) Qual a probabilidade de se retirar , de um baralho, em uma única tentativa:
a) um ás ou valete
solução : a)
b) um ás ou uma carta de espadas
13 4
4∗13
4
4
4
2
+ =
+ −
=
b)
52 52 13
52 52 52∗52 13
Prof. Jorge Roberto Grobe 11/09/14 15:35:49
ES34MTEC
56
3.5 Teorema de Bayes
•
Segundo LEVINE (2005), a probabilidade condicional leva em consideração informações
sobre a ocorrência de um evento para encontrar a probabilidade de um outro evento.
•
Determina a probabilidade de que um determinado efeito tenha ocorrido em função de uma
causa específica.
P Bi / A=
P  A/ Bi  P  Bi 
P  A/ B1  P  B1P  A /B 2 P B 2...P A/ BK  P  B K 
55)LEVINE( 2005, p.162 )
A empresa está avaliando a comercialização de um novo modelo de aparelho de televisão. No
passado, 40% dos televisores introduzidos pela empresa obtiveram sucesso e 60% não.
Antes de introduzir o aparelho de televisão no mercado, o departamento de pesquisas de mercado
realiza um amplo estudo e divulga um relatório favorável ou desfavorável.
Anteriormente, 80% dos aparelhos de televisão haviam recebido um relatório favorável da pesquisa
de mercado, e 30% dos aparelhos de televisão que não obtiveram sucesso haviam recebido um
relatório favorável.
Qual é a probabilidade de que o televisor obterá sucesso?
Solução:
Sejam os eventos
S= tv bem sucedida
S’=tv mal sucedido
F = relatório favorável
F’=relatório nao favorável
Dados as probabilidades:
Prof. Jorge Roberto Grobe 11/09/14 15:35:49
ES34MTEC
57
P(S)=0,4 P(S’)=0,6 P(F/S)=0,8 P(F/S’)=0,3
P ( S / F )=
P (S / F ) P (S )
P ( F / S) P ( S)+ P (F / S ' ) P (S ' )
Qual é a probabilidade de que o televisor obterá sucesso? P(S/F)?
P( S /F )=
0,40∗0,80
0,40∗0,80+ 0,60∗0,30
Resposta: a probabilidade de um modelo de TV ser bem sucedido , sendo conhecido que foi
recebido um relatório favorável , é igual a P(S /F) =0,64
ARVORE DA DECISÃO
S
S'
0,4
F
0,6
F'
0,8
0,8*0,4
F
F'
0,2
0,3
0,7
0,4*0,2 0,6*0,3 0,6*0,7
Cálculos do Teorema de Bayes
Probabilidades
Event
Condicion Combina
o
A Priori
al
da
Revisada
S
0,4
0,8
0,32
0,64
S'
0,6
0,3
0,18
0,36
Total:
0,5
 digitar os dados conforme está pedindo no problema.

No CAL PARA RESOLVER
1 Cálculos do Teorema de Bayes
2
3
Probabilidades
A
Eve Prio Condici Combin Revisad
4 nto
ri
onal
ada
a
=D5/$D7
5 S
X
Z
=B5*C5
$
=D6/$D7
6 S'
Y
T
=B6*C6
$
Prof. Jorge Roberto Grobe 11/09/14 15:35:49
ES34MTEC
58
7
Total:
=D5+D
6
*X e Y a soma é 100% (Verdadeiro e Falso)
*Z e T é a condicional é dado no problema.
3.5.1 Exercicios
56) A probabilidade de que uma pessoa seja portadora de uma certa enfermidade é 0,03. Testes
diagnósticos médicos encontram-se disponíveis para determinar se a pessoa efetivamente é
portadora de uma enfermidade. Se a enfermidade estiver realmente presente, a probabilidade de que
o teste diagnóstico médico apresente um resultado positivo(indicando) que a enfermidade está
presente) é 0,9. Se a enfermidade não estiver efetivamente presente , a probabilidade de um
resultado positivo para o teste (indicando que a enfermidade está presente) é 0,02.Suponha que o
teste
para diagnóstico médico tenha apresentado um resultado positivo( indicando que a
enfermidade está presente). Qual é a probabilidade de que a enfermidade esteja efetivamente
presente? Qual é a probabilidade de um resultado positivo para o teste?
Solução :evento D=é portador
D’=não é portador
T=o teste é positivo
T’= o teste não é positivo

fazer a arvore de decisão
P(D e T )=P( T / D)*P(D)=probabilidade de T dado que saiu D vezes a probabilidade de D.

Resolver na planilha eletrônica do libreOffice
Prof. Jorge Roberto Grobe 11/09/14 15:35:49
ES34MTEC
59
EVENTOS
EVENTOS
F1
F2 F3
Ai
0,0270
REVISADA
P(A/Ai)
0,5819
0,0000
0,0000
0,0194
0,4181
P(B')
0,0000
0,0000
P(C)
0,0000
0,0000
P(C')
0,0000
0,0000
CONDICIONAL
COMBINADA
P(A/Ai)
P(A e Ai)*P(A)
P(A)
P(F1)
0,9000
0,0300
P(A')
P(F2)
0,9700
P(B)
P(F3)
0,0200
1
probabilidade
total
0,0464
Resposta: P(T/D) = 0,5819 ( é a probabilidade de que o teste seja positivo e a pessoa seja
portadora da enfermidade)
57) Conforme exercício anterior, suponha que a probabilidade de um teste para diagnóstico médico
ofereça um resultado positivo, sem que haja presença da enfermidade, seja reduzida de 0,02 para
0,01. Sendo conhecida esta informação:
a) se o teste para diagnóstico médico tiver apresentado um resultado positivo (indicando que
enfermidade está presente), qual é a probabilidade de que a enfermidade esteja efetivamente
presente?
R:0,736
Cálculos do Teorema de Bayes
Evento
S
S'
A Priori
0,03
0,97
Probabilidades
Condicional Combinada
0,9
0,03
0,01
0,01
Total:
0,04
Prof. Jorge Roberto Grobe 11/09/14 15:35:49
ES34MTEC
Revisada
0,7357
0,26
60
b)se o teste para diagnóstico médico tiver apresentando um resultado negativo (indicando que a
enfermidade não está presente), qual é a probabilidade de que a enfermidade não está efetivamente
presente? R: 0,997
EVENTOS
EVENTOS
F1
F2 F3
Ai
0,0000
REVISADA
P(A/Ai)
0,0000
0,0030
0,0031
0,0000
0,0000
0,9506
0,9969
P(C)
0,0000
#DIV/0!
P(C')
0,0000
0,0000
CONDICIONAL
COMBINADA
P(A/Ai)
P(A e Ai)*P(A)
P(A)
P(F1)
0,0300
P(A')
P(F2)
0,9700
0,1000
P(B)
P(B')
P(F3)
0,9800
1
probabilidade
total
0,9536
58)MILONE( 2006, p.146) o medicamento M cura 65% das ocorrências da doença D. Se
ministrado as dois pacientes, qual a probabilidade de:
a) curar os dois? R: 0,65*0,65=0,4225
b) não curar nenhum? R:0,35*0,35=0,1225
c) curar só um deles? R: 0,65*0,35 + 0,35*0,65 =0,455
* use o diagrama da arvore
59) MILONE( 2006, p.145) A pé na Tábua LTDA verificou que 2 em 15 de seus veículos pifam por
defeito mecânico e 3 em 15 por falha elétrica . Seu departamento de manutenção também levantou
que , por viagem 18% dos veículos apresentam defeito mecânico e 29% falha elétrica. Qual a
chance de um defeito mecânico impedir um dos veículos de chegar ao destino? R:29,27%
•
teorema de Bayes
•
calculo da probabilidade:
•
evento D:defeito mecanico
2/15∗0,18
=0,2927
2/ 15∗0,18+ 3/15∗0,29
Prof. Jorge Roberto Grobe 11/09/14 15:35:49
ES34MTEC
61
•
evento D': defeito elétrico
Cálculos do Teorema de Bayes
Evento
D
D'
C
A Priori
0,1333
0,2000
Probabilidades
Condicional Combinada
0,18
0,0240
0,29
0,0580
0
0,0000
Total:
0,0820
Revisada
0,2927
0,7073
0,0000
1
60) MILONE( 2006, p.145)
Se
89%
dos
indivíduos
atendidos por um ambulatório são RH- , qual a chance de 5 pacientes aleatoriamente escolhidos
serem RH+?
solução: 0,11*0,11*0,11*0,11*0,11=0,0000161051
61) MILONE( 2006, p.145) Se as probabilidades de Romeu e Julieta estarem vivos daqui a 25 anos
são, respectivamente , 63% e 66%, e se o casamento deles tem 10% de probabilidade de acabar em
divórcio antes, qual a chance de :
a) eles estiverem bodas de prata? R:0,3742 =0,63*0,66*0,9
b) ela estar viuva naquela ocasião? R: 0,2442=0,37*0,66
c) pelo menos um deles estar vivo? R: 0,8742=0,63*0,34+0,37*0,66+0,63*0,66
d) ele estar vivo naquela ocasião? R:0,2142=0,63*0,34
•
fazer o diagrama da arvore
Prof. Jorge Roberto Grobe 11/09/14 15:35:49
ES34MTEC
62
3.6 DISTRIBUIÇÃO DE PROBABILIDADE PARA CADA UMA VARIÁVEL ALEATÓRIA
DISCRETA
3.6.1 VARIÁVEL ALEATÓRIA DISCRETA
•
Definição de Variável aleatória: MONTGOMERY(2003, p.48) “uma variável aleatória é
uma função que confere um número real a cada resultado no espaço amostral de um
experimento aleatório”.
•
MILONE(2004, p.148) a variável aleatória pode ser denominada variável aleatória,
estocástica ou indicadora.
Definição de Variável aleatória : FARBER(2009, p.155) :''uma variável aleatoria x
•
representa um valor numérico associado a cada resultado de um experimento de
probabilidade ''.
•
MILONE(2004, p.148)As variáveis aleatórias são indicadas por X e é indicável por
X={x1,x2,x3,..,xk} e os xk são os elementos.
•
MONTGOMERY(2003, p.48), após o experimento ser conduzido, o valor medido da
variável aleatória é denotado por uma letra minúscula, tal como x=70 miliampéres.
•
Uma variável aleatória discreta é uma variável aleatória com uma faixa finita ( ou infinita
contável).
•
1)
MILONE(2004, p.149-150)Associe
uma variável aleatória conveniente ao evento
X={ número de caras} do experimento E={ lançamento de 3 moedas}
p1
c
k
c=cara
p2
c
k
k=coroa
p3
c
k
numeros de
caras
evento caracteristico variável aleatória
nenhuma k,k,k
0
uma
(k,c,K)(k,K,c)(c,k,k)
1
duas
(k,c,c)(c,k,c)(c,c,k)
2
tres
c,c,c
3
62) FARBER(2009, p.155) Um estudo do numero de ligações que um vendedor faz em um único
dia. Os possíveis valores da variável aleatória x, são 0,1,2,3,4 assim por diante, pode ser listado, x é
uma variável aleatória discreta.
FARBER(2009, p. 155) , o resultados de um experimento de probabilidade é uma contagem ou
medida, este resultado é chamado de variavel aleatoria.
Variavel aleatoria x representa um valor numerico associado a cada resultado de um experimento de
probabilidade.
Aleatoria significa que x é determinado por acaso.
Discreta: numero finito ou contavel de possíveis resultados.
Prof. Jorge Roberto Grobe 11/09/14 15:35:49
ES34MTEC
63
Contínua : numero incontável de possíveis resultados, representados por um intervalo na reta
numerica.
Discreta:Numero de ligações que um vendedor faz em um único dia. {0,1,2,3,4,...}, pode ser listada
os valores possíveis
contínua: tempo gasto em horas que um vendedor faz ligações em um dia :[0;24]
incluindo frações e decimais, não pode ser listadas os valores possíveis.
3.6.2 Exercicios
63) MONTGOMERY( 2003, p.53) O espaço amostral de um experimento aleatório é { a,b,c,d,e,f} e
cada resultado é igualmente provável. Uma variável aleatória é definida como segue:
resultado
x
a b c
d
e f
0 0 1,5 1,5 2 3
Determine a função de probabilidade de X.
respostas: P(X=0)= 1/6+1/6=1/3;P(X=1,5)=1/3;P(X=2)=1/6/; P(X=3)=1/6
64) O setor de comercialização estima que um novo instrumento para análise de amostras de solo
terá grande sucesso, moderado sucesso ou não terá sucesso, com probabilidades de 0,3 ; 0,6 e 0,1,
respectivamente. A receita anual associada com um produto de grande sucesso , moderado sucesso
ou nenhum sucesso é de $ 10 milhoes, $ 5 milhoes e $ 1 milhao , respectivamente. Faça a variável
aleatória X denotar a renda anual do produto. Determine a função de probabilidade de X.
solução : P(X=10 milhoes)=0,3 e assim por diante
65) Em um processo de fabricação de simcondutores, 3 pastilhas de um lote são testadas. Cada
pastilha é classificada como passa ou falha. Suponha que a probabilidade de uma pastilha passar no
teste seja de 0,8 e que as pastilhas sejam independentes.
* diagrama da arvore
a) qual é a probabilidade de que todas as 3 pastilhas passem no teste? R:0,512
b) determine a função de probabilidade do número de pastilhas de um lote que passe no teste.
Solução :
P(X=0)=0,2*0,2*0,2=0,008 ( nenhuma passa no teste)
P(X=1)=0,096 ( um passa no teste em qualquer posição)
P(X=2)=0,384
P(X=3)=0,512
Prof. Jorge Roberto Grobe 11/09/14 15:35:49
ES34MTEC
64
66) Um sistema de inspeção óptica deve distinguir diferentes tipos de peças. A probabilidade de
uma classificação correta de qualquer peça é de 0,98. Suponha que 3 peças seja inspecionadas e que
as classificações sejam independentes. Seja X a variável aleatória que designa o numero de peças
classificadas corretamente. Determine a função de probabilidade de X.
solução:
P(X=0)
P(X=1)
P(X=2)
P(X=3)
0,000008
0,001176
0,057624
0,941192
1
3.6.3 Distribuições de probabilidades discretas
•
FARBER (2009, p.156) , a distribuição de probabilidade discreta lista cada valor possível
que a variavel aleatoria pode assumir, junto com sua probabilidade.
•
Uma distribuição de probabilidade tem as seguintes condições:
•
0≤P  x ≤1
•
∑ P  x=1
VALOR ESPERADO DE UMA VARIÁVEL ALEATÓRIA DISCRETA
•
LEVINE (2005) , é a média ponderada de todos os possíveis resultados X - sendo os pesos
as probabilidades P(X) associadas a cada um dos resultados.
u =E  x = n X i P  X i 
i=1
•
FARBER( 2009, p.161), a média de uma variavel aleatoria representa o que ira acontecer em
milhares de testes.
Variância e Desvio padrão de uma variável aleatória discreta
VARIÂNCIA
DESVIO PADRÃO
 2 = N [ X i−E  X ]2 P X i 
i=1

=  N [ X i −E  X ]2 P  X i
i=1
Prof. Jorge Roberto Grobe 11/09/14 15:35:49
ES34MTEC
65
67) EXEMPLO:Calcule a média ( o valor esperado) , desvio padrão e a variância.
Hipotecas de
imóveis
aprovadas
por semana probabilidade
0
0,1
1
0,1
2
0,2
3
0,3
4
0,15
5
0,1
6
0,05
R:
68) FARBER( 2009, p.163) Um sociológo pesquisou as famílias em uma cidade pequena. A
variavel aleatoria x representa o numero de criancas na família.
x
0
1
2
3
4
P(x)
0,07
0,2
0,38
?
0,13
R :0,22
69) FARBER (2009, p.163) o numero de computadores por casa, em uma cidade pequena.
computadores 0
1
2
3
casas
300
280
95
20
a) use distribuição de frequência para construir a distribuição de probabilidade.
b) calcule a média R:0,8
c)variancia R:0,6
d) desvio padrão R:0,8
e) interprete os resultados no contexto da vida real.
Prof. Jorge Roberto Grobe 11/09/14 15:35:49
ES34MTEC
66
70) FARBER (2009, p163) Os alunos de um sala de aula fazem um teste com 8 perguntas. O
numero x de perguntas respondidas corretamente pode ser aproximado pela seguinte distribuição de
probabilidade.
x
0
1
2
3
4
5
6
7
8
P(x)
0,02
0,02
0,06
0,06
0,08
0,22
0,3
0,16
0,08
a) faça um histograma ou grafico em barras.
b) calcule a média
c) variancia
d) desvio padrao
e) valor esperado da distribuição de probabilidade.
f) interprete os resultados.
71)Utilizando os registros da empresa para os últimos 500 dias úteis, o gerente da Koing Motors,
uma agencia de automóveis do subúrbio, fez uma relação do numero de carros vendidos por dia, na
tabela a seguir apresentada:
Numero de carros Freqüência
vendidos
De
Ocorrência
Por
dia
0
1
2
3
4
5
6
7
8
9
10
11
Total: 500
40
100
142
66
36
30
26
20
16
14
8
2
a) forme a distribuição de probabilidade para o numero de carros vendidos por dia.
b) calcule a média aritmética ou o numero esperado de carros vendidos por dia
Prof. Jorge Roberto Grobe 11/09/14 15:35:49
ES34MTEC
67
R:
c)calcule o desvio padrão
R:
Qual é a probabilidade de que um determinado dia
d) menos de 4 carros sejam vendidos ?
RESPOSTA: 69,60%
e)no máximo 4 carros sejam vendidos?
RESPOSTA:76,80%
f) pelo menos 4 carros sejam vendidos?
RESPOSTA:30,40%
g) exatamente 4 carros sejam vendidos?
RESPOSTA:7,20%
h) mais de 4 carros sejam vendidos?
RESPOSTA: 23,20%
3.6.4 Distribuição Uniforme
MONTGOMERY (2003, p.57)Uma variável aleatória discreta unifome,se cada um dos valores em
sua faixa, isto é x1,x2,..,xn tiver igual probabilidade .
Então : f(xi)=1/n
Suponha que X seja uma variável discreta uniforme nos inteiros consecutivos a,a+1,a+2,...,b para
a≤b . A média de X é :
μ=E ( x )=
b+ a
2
o desvio padrão de X é : σ=
√
(b−a+1)2−1
ou
12
σ=
√
n2−1
12
2) Considere a variavel aleatória X tendo uma distribuição uniforme nos inteiro
0≤x≤100 .
Determine a média e a variancia de X.
73) Medidas de espessura em um processo de recobrimento são feitas para centésimo mais próximo
a de um milimetro. As medidas de espessura estão unifomemente distribuidas, com valores 0,15 ;
Prof. Jorge Roberto Grobe 11/09/14 15:35:49
ES34MTEC
68
0,16 ; 0,17; 0,18; 0,19. Determine a média e a variancia da espessura de recobrimento para este
processo.
3.6.5 Distribuição binomial
•
FARBER(2009, p.165), um experimento binomial tem os seguintes critérios:
1. o experimento é repetido por um numero fixo de tentativas, onde cada tentativa é
independente das outras.
2. Tem apenas dois resultados possíveis sucesso (S) ou fracasso(F).
3. A probabilidade de um sucesso P(S) é a mesma para cada tentativa.
4. A variavel aleatoria x contabiliza o numero de tentativas com sucesso.
74) FARBER (2009, p.166) Decida se o experimento é binomial ou não.
i)Um dado procedimento cirurgico tem 85% de chances de sucesso. Um médico realiza o
procedimento em 8 pacientes. A variável aleatória representa o numero de cirurgias com
sucesso.
•
Está de acordo com as 4 condições.
•
Cada cirurgia representa uma tentativa e há 8 cirurgias e cada uma é independente da
outra.
•
Tem dois resultados possíveis sucesso ou fracasso.
•
p=sucesso e q=fracasso
•
(p+q)8= p 8+ 8∗ p7∗q+...
•
probabilidade de 8 pacientes obtiverem sucesso na cirurgia é 0,858=27,24%
•
probabilidade de 7 pacientes obtiverem sucesso e 1 fracasso é: 8* 0,857*0,15=38,47%
DIAGRAMA DE ARVORE
DOIS PACIENTES n=2
SUCESSO
p
FRACASSO q
p
0,85
q
0,15
p
0,85
q
0,15
0,85
0,15
aplicando o binomio de Newton : ( p +q)2 = p 2 +2∗p∗q+ q2=0,852 +2∗0,85∗0,15+ 0,152
Prof. Jorge Roberto Grobe 11/09/14 15:35:49
ES34MTEC
69
•
ii) Um jarra contem 5 bolinhas de gude vermelhas , 9 azuis e 6 verdes. Escolha 3 bolinhas
aleatoriamente , sem trocas. A variavel aleatoria representa o numero de bolinhas vermelhas.
•
O experimento não é binomial porque ele não esta de acordo com as 4 condições de um
experimento binomial.
•
Cada seleção de bolinha de gude representa uma tentativa e selecionar uma bolinha
vermelha é um sucesso.
•
Quando a primeira bolinha é selecionada, a probabilidade de sucesso é 5/20.
•
Como a bolinha de gude não é colocada de volta a jarra, probabilidade de sucesso por
tentativas subsequentes não é mais 5/20.
•
As tentativas não são independentes e a probabilidade de sucesso não é mais a mesma para
uma cada das tentativas.
•
Primeira tentativa é: 5/20 =0,25 ( bolinhas vermelhas)
•
segunda tentativa: 4/19=0,21
•
terceira tentativa :3/18=0,16
DISTRIBUIÇÃO BINOMIAL ( LEVINE, 2005)
P ( X )= n p X (1− p)n− X
X
( )
P(X)= probabilidade de X sucessos
n= tamanho da amostra
p= probabilidade de sucesso
1-p=probabilidade de insucesso ou fracasso
X= numero de sucessos na amostra (X=0,1,2,...n)
Formato
-pode ser simétrica ou assimétrica

se p=0,5 é simétrica

Para n =13 e p=0,50=50%
Prof. Jorge Roberto Grobe 11/09/14 15:35:49
ES34MTEC
70
Título principal
0,2500
0,2000
0,1500
Coluna C
0,1000
0,0500
0,0000
0
1
2
3
4
5
6
7
8
9
10
11
12
13
MÉDIA ARITMÉTICA
μ= E(x)=np
DESVIO PADRÃO
σ = √ np(1− p )
Sintaxe
DISTRBINOM(X;tentativas;PS;A)
X é o número de sucessos em uma série de tentativas.
Tentativas é o número de tentativas independentes ( valor de n)
PS é a probabilidade de sucesso em cada tentativa( probabilidade)
Quando o parâmetro A for igual a 0, será calculada a probabilidade individual e quando o parâmetro
A for igual a 1, será calculada a probabilidade cumulativa.
Prof. Jorge Roberto Grobe 11/09/14 15:35:49
ES34MTEC
71
75) FARBER(2009, p.173)ENCONTRANDO E INTERPRETANDO A MÉDIA, A VARIANCIA
E O DESVIO PADRÃO.
Em Pittsburg , Pensilvania , cerca de 56% dos dias são nublados. Encontre a média , a variancia e o
desvio padrão para o numero de dias nublados durante o mês de junho. Interprete os resultados e
determine quaisquer valores incomuns.
MÉDIA ARITMÉTICA μ= E(x)=np
DESVIO PADRÃO σ =  np 1− p
Solução : n=30 p=0,56 q =0,44
média: 16,8
desvio padrão: 2,7
variancia:7,4
INTERPRETAÇÃO
•
Em média há 16,8 dias (17 dias) que são nublados no mês de junho.
•
O desvio padrão é aproximadamente 2,7 dias.
•
Valores que são mais do que 2 desvios padrões da média são considerados incomuns.
•
[16,8-2*2,7=11,4 ; 16,8 +2*2,7=22,2], o mês de junho com 11 dias nublados seria incomum,
sendo que no mês de junho com 23 dias nublado também seria considerado incomum.
70)FARBER(2009, p.174) Em São Francisco , California , 44% dos dias em 1 ano apresentam
tempo limpo. Encontre a média, a variancia e o desvio padrão para o numero de dias limpos durante
o mês de maio ( 31 dias). Interprete os resultados e determine quaisquer valores incomuns.
a) identifique um sucesso e os valores n , p, q.
n=31 p=0,44
q=0,56
b) encontre o produto de n e p para calcular a média
media :13,6
c) encontre o produto de n , p, q para a variancia
variancia: 7,6
d) encontre a raiz quadrada das variancias para o desvio padrão.
Desvio padrão: 2,8
e) interprete os resultados.
Em média, há 14 dias claros durante o mês de maio. Um mês de maio com menos de 8 dias de sol
ou mais do que 19 dias de sol pode ser incomum. ( duplicando os desvio padrão)
Probabilidades Binomiais
Dados
Tamanho da Amostra (n)
Probabilidade
de sucesso (p)
Prof. Jorge Roberto Grobe 11/09/14
15:35:49
ES34MTEC
31
0,4400
Estatísticas
Média
Variância
Desvio Padrão
13,6400
7,6384
2,7638
72
3.6.3 EXERCICIOS
71)LEVINE (2005, p.182) Determine o seguinte:
a) Se n=4 e p=0,12 , então qual é a P(X=0)? R:0,5997
b) Se n=10 e p=0,9 , então qual é a P(X)=9? R: 0,38742
72) Se a probabilidade de um formulário de encomendas assinalado for 0,1, qual é a probabilidade
de 3 ou mais ( ou seja pelo menos 3) formulários de encomendas assinaladas sejam encontrados, na
amostra de 4 formulários de encomendas?
Solução :
P ( X  3 )  P ( X  0 )  P ( X  1 )  P ( X  2 )  0 ,9 9 6 3
para obter
P ( X  3 )  1  0 ,9 9 6 3  0 ,0 0 3 7  0 ,3 7 %
ou
Probabilidades
Binomiais
Dados
Tamanho da Amostra
Probabilidade de sucesso
Estatísticas
Média
Variância
Desvio Padrão
4
0,1
0,4
0,36
0,6
Prof. Jorge Roberto Grobe 11/09/14 15:35:49
ES34MTEC
73
73) Registros de certificados de garantia mostram que a probabilidade de que um carro novo
necessite de um reparo inerente a garantia, nos primeiros 90 dias , é de 0,05. Se uma amostra de 3
carros novos for selecionada:
solução n=3 p=0.05
a) qual é probabilidade de nenhum deles necessite de reparo inerente a garantia?
Resposta:0,8574
b) qual é probabilidade de que pelo menos um deles necessite de reparo inerente a garantia?
Resposta: P(X=1)+P(X=2)+P(X=3)=0,14
c) qual é probabilidade de que mais de um deles necessite de reparo inerente a garantia?
Resposta:P(X=2)+P(X+3)=0,01
d) que premissas são necessárias em (a) até (c)?
e) qual é a media aritmética e o desvio padrão?
Resposta: média: 0,15
desvio padrão: 0,3775
f)quais seriam as respostas para a até c , se a probabilidade de vir necessitar de um reparo inerente á
garantia fosse 0,1?
resposta:
Estatísticas
Média
Variância
Desvio Padrão
0,3000
0,2700
0,5196
3.6.4 Distribuição de Poisson (lê-se : poassom)
•
Observação de eventos discretos em um área de oportunidades-intervalo continuo
( de tempo, extensão, área de superficie) de maneira tal que, se a área de oportunidade ou intervalo
for suficientemente reduzida.

Probabilidade de observar exatamente um sucesso no intervalo é estável.

A probabilidade de observar mais de um sucesso no intervalo é zero.

A ocorrência de um sucesso em qualquer intervalo é estatisticamente independente da
ocorrência em qualquer outro intervalo
P ( X )=
e−λ λ X
X!
P(X)=probabilidade de X sucessos, dado o conhecimento de λ
λ= numero esperado de sucessos
Prof. Jorge Roberto Grobe 11/09/14 15:35:49
ES34MTEC
74
e= constante matemática aproximada por 2,71828
X= numero de sucessos por unidade.
MONTGOMERY (2003, p.68)
E ( X )=λ=np Média esperada
p= λ probabilidade de que um subintervalo contenha uma falha
n
2
σ =λ=np variancia
Sintaxe
POISSON(Número; MV; K)
Número representa o valor que serve de base para o cálculo da distribuição de Poisson.
MV representa o valor do meio da distribuição de Poisson.
K = 0 calcula a função de densidade; K = 1 calcula a distribuição.
73) LEVINE (2005, p.183-184) Suponha que seja examinado o numero de clientes que chegam na
hora do almoço, entre 12 h e 13h em uma agencia bancária localizada no centro de uma grande
cidade. Qualquer chegada de cliente é um evento discreto, em um determinado ponto do tempo ao
longo do intervalo continuo de 1 hora. Durante este intervalo de tempo pode haver uma média de
180 chegadas. Seja o intervalo de 1 hora desmembrando em 3600 intervalos consecutivos de 1
segundo.
•
O numero esperado ( média) do numero de clientes que chegam em qualquer intervalo de 1
segundo seria de 0,05.
•
a probabilidade de ter mais de um cliente chegando, em qualquer intervalo de 1 segundo,
aproxima-se de zero.
•
A chegada de um cliente em qualquer intervalo de 1 segundo , não possui nenhum efeito
( ou seja estatisticamente independente) em relação a chegada de qualquer outro cliente, em
qualquer outro intervalo de 1 segundo.
3.6.5 Exercicios
74)LEVINE (2005, p.186) Suponha uma distribuição de Poisson:
a) Se λ=2,5 , então qual é P(X=2)?
Prof. Jorge Roberto Grobe 11/09/14 15:35:49
ES34MTEC
75
b) Se λ=8 , então qual é P(X=8)?
75) LEVINE (2005, p.187)Admita que o numero de erros de sistemas de rede ocorridos em um dia
em um sistema de rede local (LAN- local de área network) seja distribuído na forma de uma
variável aleatória de Poisson. O numero médio de erros de sistemas de rede ocorridos em um dia é
2,4. Qual é a probabilidade de que em um determinado dia:
a)zero erro de sistemas de rede irá ocorrer?
b) exatamente 1 erro de rede de servidor irá ocorrer?
c) dois ou mais erros de sistemas de rede irão ocorrer?
Solução :1- [P(X=1)+P(X=0)]=0,691559
d) mais de três erros de sistemas de rede irão ocorrer?
Solução :1- [P(X=2 )+P(X=1)+P(X=0)]
X
0
1
2
3
P(X)
0,090718
0,217723
0,261268
0,209014
76) FARBER (2009, p.181) A média do numero de acidentes por mês em certa intersecção é 3. Qual
é probabilidade de que, em qualquer mês dado, 4 acidentes ocorram nessa intersecção? R:0,168.
77) FARBER (2009, p.182) 2000 mil trutas são colocadas em um pequeno lago. O lago tem um
volume de 20000 metros cúbicos. Calcule a probabilidade de 3 das trutas sejam encontradas em um
mesmo metro cubico do lago. SOLUÇÃO: média: 2000/20000=1/10 R: 0,0002
3.6.6 Distribuição hipergeométrica
•
A distribuição binomial e a hipergeométrica estão relacionadas.
•
O numero de sucessos em uma amostra contendo n observações.
•
Modelo binomial-dados são extraídos com reposição a partir de uma população finita.
•
Sem reposição de uma população infinita.
•
Modelo hipergeométrico- os dados são extraídos sem reposição a partir de uma população
finita.
•
Experimento binomial-a probabilidade de sucesso é p (constante) para todas as observações.
•
O resultado não depende de outras observações.
Prof. Jorge Roberto Grobe 11/09/14 15:35:49
ES34MTEC
76
Experimento hipergeométrico- o resultado de uma observação é afetado pelos resultados das
•
observações anteriores
•
binomial – extraída de uma população infinita
•
hipergeométrica- extraída de uma população finita
  
 
P X  =
A
X
N −A
n−X
N
n
P(X)= probabilidade de sucessos
n= tamanho da amostra
N= tamanho da população
N-A=numero de insucessos na população
X= numero de sucessos na amostra
A= numero de sucessos na população
MEDIA ARITMÉTICA
u=E  X =
nA
N
DESVIO PADRÃO
=


nA N − A N −n
 N−1
 N2
fator de correção de população finita que resulta da amostragem sem reposição.

 N −n 
 N−1
DIST.HIPERGEOM
Retorna a distribuição hipergeométrica.
Sintaxe
DIST.HIPERGEOM(X; n; A; N)
DIST.HIPERGEOM(X; NAmostra=n; Sucessos=A; NPopulação=N)
X é o número de resultados alcançados na amostra aleatória.
Prof. Jorge Roberto Grobe 11/09/14 15:35:49
ES34MTEC
77
NAmostra é o tamanho da amostra aleatória.
Sucessos é o número de resultados possíveis na população total.
NPopulação é o tamanho da população total.
3. 6.7 Exercicios
78)LEVINE (2005, p.190) Determine o seguinte:
a) Se n=4, N=10 e A=5 , então encontre P(X=3)
b) Se n=5, N=12 e A=3 , então encontre P(X=0)
c) calcular a media aritmética e o desvio padrão dos itens a e b
79) Em uma remessa de 15 discos rígidos, 5 são defeituosos. Se 4 dos discos forem inspecionados:
a) qual é a probabilidade de que exatamente 1 seja defeituoso?
  
 
P X  =
A
X
N −A
n−X
N
n
Solução 1: N=15( população) A=5 (sucesso) n=4 (tamanho da amostra)
R:0,43956
solução 2 : D ( defeituoso) B ( não é defeituoso)
DBBB
então :
5∗10∗9∗8
C 5∗C 10
1∗3∗2∗1
600
1
3
=
=
=0,43956
15∗14∗13∗12
1365
C 15
4
4∗3∗2∗1
b) de que pelo menos 1 seja defeituoso?
R:0,8462
c)qual é a probabilidade de que não mais do que 2 sejam defeituosos?
R:0,9231
d)qual é o numero médio de discos rígidos defeituosos que você esperaria encontrar na amostra de 4
drives de disco rígido?
R:1,33
Prof. Jorge Roberto Grobe 11/09/14 15:35:49
ES34MTEC
78
3.6.8 Exercicios
80) O reitor de uma escola de negócios deseja formar um comitê executivo de 5 entre 40
professores titulares da faculdade. A seleção deve ser realizada ao acaso, e na escola existem 8
professores titulares em contabilidade.
Qual é a probabilidade de o comitê:
a) não conter nenhum desses professores?
Resposta:P(X=0)= 0,3060
b)conter pelo menos 1 desses professores?
Resposta: 1-P(X=0)=1-0,3060=0,6940
c)não mais do que 1 desses professores?
Resposta:P(X=0) + P(X=1)=0,7432
d)qual seria a sua resposta para (a) , se o comitê fosse composto de 7 membros?
  
 
P X  =
A
X
N −A
n−X
N
n
N=40 A=8 professores de contabilidade
X
0
1
2
3
4
5
6
7
n=7 membros
P(X)
0,1805
0,3888
0,3024
0,1080
0,0186
0,0015
0,0000
0,0000
REFERENCIAS
•
MONTGOMERY, D.C. e RUNGER,G.C. Estatística Aplicada e Probabilidade Para
Engenheiros. 2a edição RJ. Editora LTC.2003. •
LEVINE, David M. et. al. Estatística –Teoria e Aplicações Usando o Microsoft Excel em
Português. 3a ed.RJ Editora LTC. 2005.
•
CRESPO, A. Estatística Fácil. 14a ed .SP. Editora Saraiva.1994 Prof. Jorge Roberto Grobe 11/09/14 15:35:49
ES34MTEC
79
•
LibreOffice 3.6.22
•
disponível em http://technet.microsoft.com/pt-br/library/cc737478(WS.10).aspx acessado
em 17/08/2009
•
disponível em http://www.estatistica.eng.br/ramosefolhas.htm acessado em 17/08/2009.
•
disponível em < http://www.novagripe.pr.gov.br/modules/conteudo/conteudo.php?
conteudo=19 >acessado em 18/08/2009 •
FARBER, Betsy. LARSON, Ron. Estatística Aplicada. São Paulo. 4 edição.2009. Pearson.
•
Disponivel em www.magrini.eng.br/Disc_Estat/ Apoio/Apostilas/ CAP1.6_ Medidas
_de_Forma.doc -acessado em 26/02/2008.
•
Disponível em http://info.abril.com.br/professional/ acessado em 03/09/2009
•
Disponivel em http://stat2.med.up.pt/cursop/regressao/imagens/formula_correlacao.html acessado em 03/10/2010.
•
disponivel em http://lauromartins.com/o-ibovespa-e-a-curva-normal/, acessado em 29/03/2012.
•
disponivel em http://aprendamatematica.com/site/wpcontent/uploads/2012/02/assimetria.jpg, aessado em 29/03/2012.
•
disponivel em http://carros.ig.com.br/ acessado em 26/11/2012.
•
disponivel em http://www.carlosescossia.com/2009/09/o-que-e-desvio-padrao.html, acessado em 06/12/2012.
•
Takahashi, Shin. Guia Mangá de Estatistica. SP. Novatec Editora.2010.
Prof. Jorge Roberto Grobe 11/09/14 15:35:49
ES34MTEC
80
Download