distribuição de probabilidades

Propaganda
55
CURSO DE PÓS-GRADUAÇÃO LATO SENSU EM GESTÃO ESTRATÉGICA
ECONÔMICA, FINANCEIRA E CONTÁBIL
DISCIPLINA: MÉTODOS QUANTITATIVOS
DOCENTE: Emília Satoshi Miyamaru Seo
TERCEIRA AULA: MODELOS DE PROBABILIDADES BINOMIAIS E NORMAIS
INTRODUÇÃO
Consciente ou inconscientemente, a probabilidade é usada por qualquer indivíduo que
toma decisões em situações de incerteza. Conhecendo ou não regras de cálculo, muitas pessoas
interessam-se por eventos ligados às probabilidades.
São várias situações em que é desejável se ter uma medida (avaliação numérica) de quão
provável é a ocorrência de determinado evento futuro. Por exemplo: lançamento de um produto,
bons lucros em uma operação mercantil, meu time vai ganhar o próximo jogo, etc.
Por definição probabilidade pode ser calculada como:
P( A) 
númerodecasosfavoráveisaoeventoA
númerodecasospossíveis
Como nas distribuições de freqüências, vamos tratar sobre as distribuições de probabilidades de
populações. Pode-se dizer que uma distribuição de freqüência de uma amostra é uma estimativa
das distribuições de probabilidades da população.
As análises das distribuições de probabilidades possibilitam a construção de modelos que
nos auxiliam no entendimento de fenômenos do mundo real.
VARIÁVEIS ALEATÓRIAS (v.a.)
Uma variável aleatória, X = v.a., fornece um meio para descrever por valores numéricos os
resultados experimentais.
Definição: Uma variável aleatória é uma descrição numérica do resultado de um experimento
Classificação: variável aleatória discreta e variável aleatória contínua.
Definições:
56
Uma v.a. é considerada discreta se toma valores que podem ser contados, ou seja, pode assumir um
número de valores de X for finito como uma seqüência infinita numerável (0, 1, 2, 3,
).
Uma v.a. é considerada contínua se pode assumir qualquer valor numérico em um intervalo ou uma
coleção de intervalos.
Tabela 1 - Exemplos de variáveis aleatórias discretas
Experimento
Variável aleatória (X)
Contatar cinco clientes
Número
de
clientes
Possíveis valores para X
que 0, 1, 2, 3, 4, 5
colocam um pedido de compra
Inspecionar um embarque de 50 Número de rádios defeituosos
0, 1, 2,........48, 49, 50.
rádios
Operar um restaurante por um Número de clientes
0, 1, 2, 3, .........
dia
Vender um automóvel
Gênero do cliente
0 se masculino
1 se feminino
Tabela 2 - Exemplos de variáveis aleatórias Contínuas
Experimento
Variável aleatória (X)
Possíveis valores para X
Operar um banco
Tempo entre as chegadas dos X  0
clientes em min.
Encher
um
recipiente
de Número de ml
0  X  343 mL
refrigerante (max.=343 mL)
Trabalhar em um projeto para a % de término do projeto após 6 0  X  100
construção
de
uma
nova meses
biblioteca
Testar
um
novo
químico
processo Temperatura quando a desejada 65  X  100
reação tem lugar (min 65 oC,
max. 100 oC)
OBS.: A VARIÁVEL ALEATÓRIA (X) SERÁ UTILIZADA PARA ESTABELECER
MODELOS TEÓRICOS DE PROBABILIDADE COM A FINALIDADE DE DESCREVER
POPULAÇÕES.
57
DISTRIBUIÇÃO DE PROBABILIDADES
Uma distribuição de probabilidades é uma distribuição de frequências relativas para os
resultados de um espaço amostral; mostra a proporção de vezes em que a v.a. tende a assumir cada
um dos diversos valores. Em outras palavras, a distribuição de probabilidades para uma v.a.
descreve como as probabilidades estão distribuídas sobre os valores da variável aleatória.
Por exemplo: Demanda diária de aluguel de caminhotes durante um período de 50 dias.
Demanda possível
Número de dias
Probabilidade
P(X )
X
3
3
0,06
4
7
0,14
5
12
0,24
6
14
0,28
7
10
0,20
8
4
0,08
50
1,00
No exemplo acima:
Seja X v.a. que pode assumir os valores xi (3, 4, 5, 6, 7, 8). A cada valor de xi correspondem
pontos do espaço amostral. Associamos, então, a cada valor xi, a probabilidade Pi de ocorrência de
tais pontos no espaço amostral.
Assim temos:
 Pi = 1
Os valores de xi e seus correspondentes Pi definem uma distribuição de probabilidade.
As frequências relativas observadas foram convertidas, na última coluna da tabela, em
probabilidades para este período de 50 dias. Então, podemos observar que a probabilidade de serem
solicitadas exatamente sete caminhonetes em um dia aleatoriamente escolhido no período é de 0,20
e a probabilidade de serem solicitadas seis ou mais é de 0,56.
58
FUNÇÃO PROBABILIDADE
Ao definir a distribuição de probabilidade, estabelecemos uma correspondência unívoca
entre os valores da variável aleatória X e os valores da variável P.
Esta correspondência define uma função; os valores xi (3, 4, 5, 6, 7, 8) formam o domínio da
função e os valores Pi (0,06; 0,14; 0,24; 0,28; 0,20; 0,08), a sua imagem. Esta função é denominada
função probabilidade e representada por:
f(x) = P(X = xi)
A função P(X = xi) determina a distribuição de probabilidade da variável aleatória X.
DISTRIBUIÇÕES DISCRETAS DE PROBABILIDADE – DISTRIBUÇÃO BINOMIAL
Para uma variável aleatória discreta, X, a distribuição de probabilidades é definida por uma função
de probabilidade, denotada por f(x). A função probabilidade fornece a probabilidade para cada um
dos valores da variável aleatória.
f(x) = P(X = xi)
0,30
Probabilidades f(x)
0,25
0,20
0,15
0,10
0,05
0,00
3
4
5
6
7
Demanda de aluguel
8
X
Representação gráfica da distribuição de probabilidades.
A utilização da distribuição binomial exige certas hipóteses. Essas hipóteses são:
1. Há n observações ou provas idênticas;
59
2. Cada prova tem dois resultados possíveis, um chamado “sucesso” e o outro “insucesso”;
3. As probabilidades p de “sucesso” e 1 – p de “insucesso”; permanecem constantes em todas as
provas;
4. Os resultados das provas são independentes uns dos outros.
Há dois métodos para obter as probabilidades para uma v.a. distribuída binomialmente:
I)
Utilização da fórmula binomial (não será dado no curso)
II)
Utilização das tabelas de probabilidades binomiais.
UTILIZAÇÃO DAS TABELAS DE PROBABILIDADES BINOMIAIS
Há dois tipos de tabelas binomiais. Um dá as probabilidades de resultados individuais de
uma v.a. e o outro dá as probabilidades de um conjunto de resultados. O primeiro é utilizado quando
há interesse na determinação da probabilidade de um único valor numa distribuição binomial, tal
como a probabilidade de exatamente 4 sucessos em 6 observações. O segundo tipo de tabela quando
há interesse nos resultados do tipo “mais do que” ou “menos do que” determinado número.
Exemplo 01: Calcular a probabilidade de 5 sucessos (x = 5) em 8 observações ( n = 8), quando a
probabilidade de sucesso é 0,30. Utilizar a tabelas binomiais.
Solução:
1. Procurar no topo da tabela o valor de p indicado;
2. Localizar o n na coluna esquerda da tabela, e procurar o número x de sucessos desejado;
3. A probabilidade de x sucessos se encontra na intersecção da linha achada conforme a parte 2
com a coluna achada conforme a parte 1.
Assim, a probabilidade de exatamente 5 sucessos em 8 observações, quando a probabilidade de
sucesso em cada observação é 0,30, é 0,0467.
Exemplo 02: A probabilidade de 2 ou menos sucessos (isto é, 0, ou 1 ou 2) em 3 observações, com
probabilidade de sucesso 0,40.
Solução: Utiliza-se a tabela de probabilidades binomiais acumuladas = a tabela dá a
probabilidade de x ou menos sucessos, podemos ler diretamente a probabilidade de 2 ou menos
60
[dados n e P(sucesso). Para determinar de mais de 2 sucessos, determinamos a probabilidade de 2
ou menos e a subtraímos de 1,00.
O raciocínio é igual à tabelas binomiais individuais
Neste caso o valor é 0,9360 para 2 ou menos sucessos = P ( X  2)
E probabilidade de mais de 3 sucessos: 1 – 0,9360 = 0,0640 = P(X > 2)
OBS.: As tabelas binomiais encontram-se na pág. 554 do livro Anderson, Sweeney and
Williams. Estatística Aplicada à Administração e Economia.
DISTRIBUIÇÕES CONTÍNUAS DE PROBABILIDADE – DISTRIBUIÇÃO NORMAL
Entre as distribuições teóricas de variável aleatória contínua, uma das mais empregadas é a
distribuição normal.
O aspecto gráfico de uma distribuição normal é o da Figura abaixo:
Área sob a curva = probabilidade normalmente distribuída
25
20
15
10
5
0
1
2
3
4

6
7
8
9
10
X
1.
2.
3.
4.
5.
6.
7.
Em resumo as características das curvas normais são:
A variável aleatória X pode assumir todo e qualquer valor real;
A curva normal tem a forma de sino;
O ponto mais alto na curva normal está a média, que também é a mediana e a moda também;
É simétrica em relação à média (), que recebe o nome de curva normal ou de Gauss;
A área total limitada pela curva e pelo eixo das abscissas é igual a 1 = 100%;
A curva normal é assintota em relação ao eixo das abscissas, prolonga-se de - a +;
A área sob a curva entre dois pontos é a probabilidade de uma variável normalmente
distribuída tomar um valor entre esses pontos;
61
8. Há uma família inteira de distribuições normais de probabilidade. Elas são diferenciadas por
suas médias  e desvios padrões .
9. As probabilidades para a variável aleatória normal são dadas por áreas sob a curva. Por
exemplo:
 68,26% dos valores de uma variável aleatória normal estão dentro de um desvio padrão
positivo ou negativo de sua média;
 99,72% dos valores de uma variável aleatória normal estão dentro de um desvio padrão
positivo ou negativo de sua média;
99,72%
68,26%
25
20
15
10
5
0

1
 - 32
3

 - 14

6
 + 1 7
8
 + 3 9
10
X
Distribuição normal-padrão de probabilidades
Diz-se que uma variável aleatória que tem uma distribuição normal com uma média de zero e
um desvio padrão de 1 tem uma distribuição normal-padrão de probabilidade. A letra z é
comumente usada para designar essa particular variável aleatória normal
25
20
=1
15
10
5
0
1
2
3
4

0
6
7
8
9
10
X z
Distribuição normal-padrão de probabilidade
Quando temos em mãos uma variável aleatória com distribuição normal, nosso principal
interesse é obter a probabilidade de essa variável aleatória assumir um valor em um determinado
intervalo.
62
Exemplo 03:
Seja X a variável aleatória que representa ao diâmetros dos parafusos produzidos por certa
máquina. Vamos supor que essa variável tenha distribuição normal com média = 2 cm e desvio
padrão  = 0,04 cm.
Pode haver interesse em conhecer a probabilidade de um parafuso ter diâmetro com valor
entre 2 e 2,05 cm.
É fácil notar que essa probabilidade, indicada por:
P(2 < X < 2,05);
Corresponde à área hachurada na Figura abaixo:
25
20
15
10
5
0
1,75
1,80
1,85
1,90
1,95
2,00

2,05
2,10
2,15
2,20
2,25
X
Se X é uma variável aleatória com distribuição normal de  e desvio padrão , então a
variável:
X 
z=

Onde: z = número de desvios padrões a contar da média;
X = valor arbitrário;
 = a média da distribuição normal;
 = o desvio padrão.
Podemos escrever: P ( < X < x) = P(0 < Z < z)
Note-se que z tem sinal negativo para valores de x inferiores à média e sinal positivo para
valores superiores à média.
Queremos calcular P(2 < X < 2,05). Para obter essa probabilidade, precisamos, em primeiro
lugar, calcular o valor de z:
z=
X 

=
2,05  2
0,05
=
= 1,25
0,04
0,04
Donde: P(2 < X < 2,05) = P (0 < Z < 1,25)
Procuremos na Tabela de distribuições normal z = 1,25: Na primeira coluna encontramos o valor
1,2. Em seguida, encontramos, na primeira linha, o valor 5, que corresponde ao último algarismo do
número 1,25. Na intersecção da linha e coluna correspondentes encontramos o valor 0,3944, o que
permite escrever:
63
P(0 < Z < 1,25) = 0,3944
Assim, a probabilidade de um parafuso fabricado por essa máquina apresenta um diâmetro
entre a média  = 2 e o valor x = 2,05 é 0,3944
OBS.: A tabela Normal encontra-se na pág. 225 do livro Anderson, Sweeney and Williams.
Estatística Aplicada à Administração e Economia.
EXERCÍCOS DE FIXAÇÃO
1. Usando as tabelas binomiais, determinar:
a)
b)
c)
d)
e)
P(X =5  n = 9, p = 0,50);
P(X =7  n = 15, p = 0,60);
P(X  3  n = 20, p = 0,05);
P(X 18  n = 20, p = 0,90);
P(X > 8  n = 10, p = 0,70).
2. Devido às altas taxas de juros, uma firma informa que 30% de suas contas a receber de outras
firmas comerciais se encontram vencidas. Se um contador escolhe aleatoriamente uma amostra
de cinco contas, determinar a probabilidade de cada um dos seguintes eventos usando a tabela
de probabilidades binomiais: (a) nenhuma das contas está vencida, (b) exatamente duas contas
estão vencidas, (c) a maioria das contas estão vencidas, (d) exatamente 20% das contas estão
vencidas.
3. Uma firma de pedidos pelo correio envia uma carta circular que terá uma taxa de respostas de
10%. Suponha que 20 cartas circulares são endereçadas a uma nova área geográfica como um
teste de mercado. Supondo que na nova área é aplicável a taxa de respostas de 10%, determinar
as probabilidades dos seguintes eventos: (a) ninguém responde, (b) exatamente duas pessoas
respondem.
4. Se X:N(10,4) calcular:
a)P(8<X<10),
b)P(9X12),
c)P(X>10),
5. Se Z:N(0,1) calcular:
a)P(0<Z<1,28),
b)P(-1,28  Z  0),
d)P(-1,28<Z<1,28),
e) P(1,89<Z<3,50),
g) o valor a tal que P(0<Z<a)= 0,18793,
h) o valor b tal que P(Z>b)= 0,0025,
i) o valor c tal que P(Z>c)=0,20.
d)P(X<8 ou X>11).
c)P(Z>1,28),d)P(Z<-2),
f)P(Z>-1,22), k)P(Z<2,33),
6. Os salários semanais dos operários industriais são distribuídos normalmente em torno da média
de R$ 500,00 com desvio padrão de R$ 40,00. Calcule a probabilidade de um operário ter um
salário semanal situado entre R$ 490,00 e R$ 520,00.
7. As vendas de um determinado produto têm distribuição aproximadamente normal, com média
500 e desvio padrão 50.Se a empresa decide fabricar 600 unidades no mês em estudo, qual é a
64
probabilidade de que não possa atender a todos os pedidos desse mês, por estar com a produção
esgotada e sem estoque no início do mês.
8. A renda média de uma comunidade têm distribuição aproxim. normal, com média R$1500,00 e
desvio padrão R$300,00.
a)Que % da população terá renda superior a R$1850,00?
b)Que % da população terá renda entre 1600,00 e 1850 reais?
9. As vendas diárias de um restaurante têm distribuição normal com média R$5300,00 e desvio
padrão R$1200,00.
a)Qual é a probabilidade das vendas excederem R$7000,00 em determinado dia?
b)Esse restaurante deve vender, no mínimo, R$3000,00 por dia para não ter prejuízo. Qual é a
probabilidade de que, em um certo dia, haja prejuízo.
Download