distribuição de probabilidades

Propaganda
DISTRIBUIÇÃO DE PROBABILIDADES
Apresentaremos neste capítulo três modelos teóricos de distribuição
de probabilidade, aos quais um experimento aleatório estudado possa
ser adaptado, o que permitirá a solução de grande número de
problemas práticos.
Variável Aleatória
Suponhamos um espaço amostral S e que a cada ponto amostral seja
atribuído um número. Fica, então, definida uma função chamada
variável aleatória.
Muitas vezes não estamos interessados propriamente no resultado de
um experimento aleatório, mas em alguma característica numérica a
ele associada. Essa característica será chamada variável aleatória.
Assim, se o espaço amostral relativo ao "lançamento simultâneo de
duas moedas" é S = {(ca,ca), (ca,co), (co,ca), (co,co)} e se X
representa o "número de caras" que aparecem, a cada ponto
amostral podemos associar um número para X, de acordo com a
tabela abaixo ( X é a variável aleatória associada ao número de caras
observado):
Ponto Amostral
X
(ca,ca)
2
(ca,co)
1
(co,ca)
1
(co,co)
0
Logo podemos escrever:
Número de caras (X) Probabilidade (X)
2
1/4
1
2/4
0
1/4
Total
4/4 = 1
Exemplo prático de uma distribuição de probabilidade:
Consideremos a distribuição de freqüências relativa ao número de
acidentes diários na Rodovia do SOL durante o mês de nov/97:
Número de Acidentes Freqüência
0
22
1
5
2
2
3
1
Podemos então escrever a tabela de distribuição de probabilidade:
Número de Acidentes (X) Probabilidade (X)
0
0,73
1
0,17
2
0,07
3
0,03
Total
1,00
Construímos acima uma tabela onde aparecem os valores de uma
variável aleatória X e as probabilidades de X ocorrer que é a tabela
de distribuição de probabilidades.
Funções de probabilidades: f(X) = p(X= xi)
Ao definir a distribuição de probabilidade, estabelecemos uma
correspondência unívoca entre os valores da variável aleatória X e os
valores da variável P (probabilidade). Esta correspondência define
uma função onde os valores xi formam o domínio da função e os
valores pi o seu conjunto imagem. Assim, ao lançarmos um dado, a
variável aleatória X, definida por "pontos de um dado", pode tomar os
valores 1,2,3,4,5 e 6. Então resulta a seguinte distribuição de
probabilidade:
X
P (X)
1
1/6
2
1/6
3
1/6
4
1/6
5
1/6
6
1/6
T o t a l 6/6 = 1
Distribuição Binomial
Vamos imaginar fenômenos cujos resultados só podem ser de dois
tipos, um dos quais é considerado como sucesso e o outro insucesso.
Este fenômeno pode ser repetido tantas vezes quanto se queira (n
vezes), nas mesmas condições. As provas repetidas devem ser
independentes, isto é, o resultado de uma não deve afetar os
resultados das sucessivas. No decorrer do experimento, a
probabilidade p do sucesso e a probabilidade de q (q = 1 - p) do
insucesso manter-se-ão constantes. Nessas condições X é uma
variável aleatória discreta que segue uma distribuição binomial.
P(x) =
P(x) = é a probabilidade de que o evento se realize x vezes em n
provas.
p = é a probabilidade de que o evento se realize em uma só prova =
sucesso.
q = é a probabilidade de que o evento não se realize no decurso
dessa prova = insucesso.
OBS: O nome binomial é devido à fórmula, pois representa o termo
geral do desenvolvimento do binômio de Newton.
Parâmetros da Distribuição Binomial
Média = n . p
Desvio padrão = é a raiz quadrada do produto de n . p . q
Variância = n . p . q
Exemplos:
1- Uma moeda é lançada 5 vezes seguidas e independentes. Calcule
a probabilidade de serem obtidas 3 caras nessas 5 provas.
n=5
x=3
p = 1/2
q = 1 - (1/2) = 1/2
P(x=3) = 5/16
Distribuição de Poisson
Distribuição de probabilidades aplicada para acontecimentos raros,
entretanto o seu maior uso prático é como aproximação para a
distribuição binomial.
A P(x) é calculada pela fórmula abaixo:
Onde:
é a média da distribuição ( n . p)
e representa a constante de valor igual a 2,7182
x ! é o fatorial de x
elevado a zero é igual a 1
OBS: 0 ! = 1 e qualquer número
OBS: quando um acontecimento segue a distribuição binomial com
um “p” (sucesso) muito pequeno de tal modo que temos que ter um
“n” muito grande para que o sucesso ocorra. Podemos simplificar os
cálculos usando a distribuição de Poisson como aproximação para a
distribuição binomial.
Para que os resultados aproximados pela distribuição de Poisson
sejam satisfatórios nós só devemos fazer a substituição da
distribuição binomial pela de Poisson quando “n” for maior ou igual a
50 e “p” menor ou igual a 0,1 ou “p” maior ou igual a 0,9 ( “p”
próximo de 0 ou próximo de 1).
DISTRIBUIÇÃO NORMAL
Entre as distribuições teóricas de variável aleatória contínua, uma das
mais empregadas é a distribuição Normal.
Muitas das variáveis analisadas na pesquisa sócio-econômica
correspondem à distribuição normal ou dela se aproximam.
Propriedades da distribuição normal :
1ª - A variável aleatória X pode assumir todo e qualquer valor real.
2ª - A representação gráfica da distribuição normal é uma curva em
forma de sino, simétrica em torno da média, que recebe o nome de
curva normal ou de Gauss.
3ª - A área total limitada pela curva e pelo eixo das abscissas é igual
a 1, já que essa área corresponde à probabilidade de a variável
aleatória X assumir qualquer valor real.
4ª - A curva normal é assintótica em relação ao eixo das abscissas,
isto é, aproxima-se indefinidamente do eixo das abscissas sem,
contudo, alcançá-lo.
5ª - Como a curva é simétrica em torno da média, a probabilidade de
ocorrer valor maior que a média é igual à probabilidade de ocorrer
valor menor do que a média, isto é, ambas as probabilidades são
iguais a 0,5 ou 50%. Cada metade da curva representa 50% de
probabilidade.
Quando temos em mãos uma variável aleatória com distribuição
normal, nosso principal interesse é obter a probabilidade de essa
variável aleatória assumir um valor em um determinado intervalo.
Vejamos com proceder, por meio de um exemplo concreto.
Exemplo: Seja X a variável aleatória que representa os diâmetros dos
parafusos produzidos por certa máquina. Vamos supor que essa
variável tenha distribuição normal com média = 2 cm e desvio padrão
= 0,04 cm. Qual a probabilidade de um parafuso ter o diâmetro com
valor entre 2 e 2,05 cm ?
P ( 2 < X < 2,05) = ?
Com o auxílio de uma distribuição normal reduzida, isto é, uma
distribuição normal de média = 0 e desvio padrão = 1. Resolveremos
o problema através da variável z , onde z = (X -
)/S
Utilizaremos também uma tabela normal reduzida, que nos dá a
probabilidade de z tomar qualquer valor entre a média 0 e um dado
valor z, isto é: P ( 0 < Z < z)
Temos, então, que se X é uma variável aleatória com distribuição
normal de média
e desvio padrão S, podemos escrever: P(
< x ) = P (0 < Z < z)
< X
No nosso problema queremos calcular P(2 < X < 2,05). para obter
ees probabilidade, precisamos, em primeiro lugar, calcular o valor de
z que correponde a x = 2,05
z = (2,05 - 2) / 0,04 = 1,25
Utilização da Tabela Z
Procuremos, agora, na tabela Z o valor de z = 1,25
Na primeira coluna encontramos o valor até uma casa decimal = 1,2.
Em seguida, encontramos, na primeira liha, o valor 5, que
corresponde ao último alagarismo do número 1,25. Na intersecção da
linha e coluna correspondentes encontramos o valor 0,3944, o que
nos permite escrever:
P (0 < Z < 1,25 ) = 0,3944 ou 39,44 %, assim a probabilidade de um
certo parafuso apresentar um diâmetro entre a média = 2cm e x =
2,05 cm é de 39,44 %.
Exercícios:
1- Determine as probabilidades:
a) P(-1,25 < Z < 0) =
b) P(-0,5 < Z < 1,48) =
c) P(0,8 < Z < 1,23) =
d) P(-1,25 < Z < -1,20) =
e) P( Z < 0,92) =
f) P(Z > 0,6) =
2- Os salários dos bancários são distribuídos normalmente, em torno
da média R$ 10.000,00, com desvio padrão de R$ 800,00. Calcule a
probabilidade de um bancário ter o salário situado entre R$ 9.800,00
e R$ 10.400,00.
Devemos inicialmente calcular os valores z1 e z2,
z1 = (9800 - 10000) / 800 = -0,25
/ 800 = 0,5
e
z2 = (10400 - 10000)
P( 9800 < X < 10400) = P(-0,25 < Z < 0,5) =
P(-0,25 < Z < 0) + P(0 < Z < 0,5) = 0,0987 +0,1915 = 0,2902 ou
29,02 %
3- Um teste padronizado de escolaridade tem distribuição normal
com média = 100 e desvio padrão = 10. Determine a probabilidade
de um aluno submetido ao teste ter nota :
a) maior que 120
b)maior que 80
c)entre 85 e 115
d)maior que 100
A distribuição normal é a mais importante distribuição estatística,
considerando a questão prática e teórica. Já vimos que esse tipo de
distribuição apresenta-se em formato de sino, uni modal, simétrica
em relação a sua média.
Considerando a probabilidade de ocorrência, a área sob sua curva
soma 100%. Isso quer dizer que a probabilidade de uma observação
assumir um valor entre dois pontos quaisquer é igual à área
compreendida entre esses dois pontos.
68,26%
95,44%
99,73%
=>
=>
=>
1
2
3
desvio
desvios
desvios
Na figura acima, tem as barras na cor marrom representando os
desvios padrões. Quanto mais afastado do centro da curva normal,
mais área compreendida abaixo da curva haverá. A um desvio
padrão, temos 68,26% das observações contidas. A dois desvios
padrões, possuímos 95,44% dos dados compreendidos e finalmente a
três desvios, temos 99,73%. Podemos concluir que quanto maior a
variabilidade dos dados em relação à média, maior a probabilidade de
encontrarmos
o
valor
que
buscamos
embaixo
da
normal.
De acordo com o exposto acima tem-se uma possibilidade de medir a
chance de um dado valor ocorrer em uma distribuição, essa forma de
se avaliar
nos leva a considerar conveniente
calcular a distância
entre os valores individuais e a média da distribuição a que
pertencem, essa distância é definida como z-score e é definido como:
xx
z
s
Propriedade 1:
"f(x)
é
simétrica
em
relação
à
origem,
x
=
média
=
0;
Propriedade 2:
"f(x) possui um máximo para z = 0, e nesse caso sua ordenada vale
0,39;
Propriedade3:
"f(x) tende a zero quando x tende para + infinito ou - infinito;
Propriedade4:
"f(x) tem dois pontos de inflexão cujas abscissas valem média + DP e
média - DP, ou quando z tem dois pontos de inflexão cujas abscissas
valem
+1
e
-1.
Para se obter a probabilidade sob a curva normal, utilizamos a tabela
de faixa central
COMO USAR A TABELA PARA OBTER AS ÁREAS OU PROBABILIDADE
A tabela que apresentamos dá a probabilidade de ocorrência de um
evento entre 0 e z. Na margem esquerda temos o valor de z com
uma decimal e, se necessitamos considerar a segunda decimal, a
procuramos
na
margem
superior.
No
interior
obtemos
as
probabilidades.
Para calcular a probabilidade de z entre 0 e 1, procuramos na
margem esquerda a linha que tem z = 1,0 e a coluna 0,00 e
encontramos o valor 0,3413. Isto significa que a probabilidade de
encontrar um valor de x entre a média zero e z=1,0 é 0,3413 ou
34,13%.
Por outro lado, para se obter a probabilidade de z maior que 1,
calculamos a probabilidade de z entre 0 e 1 que é 0,3413 e a seguir
fazemos 0,5-0,3413 = 0,1587 ou 15,87%.
Para se obter a probabilidade de z entre 0 e 1,87, procuramos a
célula cuja linha é 1,8 e coluna 0,07 o que resulta o valor 0,4693 ou
46,93%.
Referência:
http://www.ai.com.br/pessoal/indices/2A0.HTM
Curva Normal (p = área entre 0 e z)
z
0.00
0.01
0.02
0.03
0.04
0.05
0.06
0.07
0.08
0.09
0.0
0.0000
0.0040
0.0080
0.0120
0.0160
0.0199
0.0239
0.0279
0.0319
0.0359
0.1
0.0398
0.0438
0.0478
0.0517
0.0557
0.0596
0.0636
0.0675
0.0714
0.0753
0.2
0.0793
0.0832
0.0871
0.0910
0.0948
0.0987
0.1026
0.1064
0.1103
0.1141
0.3
0.1179
0.1217
0.1255
0.1293
0.1331
0.1368
0.1406
0.1443
0.1480
0.1517
0.4
0.1554
0.1591
0.1628
0.1664
0.1700
0.1736
0.1772
0.1808
0.1844
0.1879
0.5
0.1915
0.1950
0.1985
0.2019
0.2054
0.2088
0.2123
0.2157
0.2190
0.2224
0.6
0.2257
0.2291
0.2324
0.2357
0.2389
0.2422
0.2454
0.2486
0.2517
0.2549
0.7
0.2580
0.2611
0.2642
0.2673
0.2704
0.2734
0.2764
0.2794
0.2823
0.2852
0.8
0.2881
0.2910
0.2939
0.2967
0.2995
0.3023
0.3051
0.3078
0.3106
0.3133
0.9
0.3159
0.3186
0.3212
0.3238
0.3264
0.3289
0.3315
0.3340
0.3365
0.3389
1.0
0.3413
0.3438
0.3461
0.3485
0.3508
0.3531
0.3554
0.3577
0.3599
0.3621
1.1
0.3643
0.3665
0.3686
0.3708
0.3729
0.3749
0.3770
0.3790
0.3810
0.3830
1.2
0.3849
0.3869
0.3888
0.3907
0.3925
0.3944
0.3962
0.3980
0.3997
0.4015
1.3
0.4032
0.4049
0.4066
0.4082
0.4099
0.4115
0.4131
0.4147
0.4162
0.4177
1.4
0.4192
0.4207
0.4222
0.4236
0.4251
0.4265
0.4279
0.4292
0.4306
0.4319
1.5
0.4332
0.4345
0.4357
0.4370
0.4382
0.4394
0.4406
0.4418
0.4429
0.4441
1.6
0.4452
0.4463
0.4474
0.4484
0.4495
0.4505
0.4515
0.4525
0.4535
0.4545
1.7
0.4554
0.4564
0.4573
0.4582
0.4591
0.4599
0.4608
0.4616
0.4625
0.4633
1.8
0.4641
0.4649
0.4656
0.4664
0.4671
0.4678
0.4686
0.4693
0.4699
0.4706
1.9
0.4713
0.4719
0.4726
0.4732
0.4738
0.4744
0.4750
0.4756
0.4761
0.4767
2.0
0.4772
0.4778
0.4783
0.4788
0.4793
0.4798
0.4803
0.4808
0.4812
0.4817
2.1
0.4821
0.4826
0.4830
0.4834
0.4838
0.4842
0.4846
0.4850
0.4854
0.4857
2.2
0.4861
0.4864
0.4868
0.4871
0.4875
0.4878
0.4881
0.4884
0.4887
0.4890
2.3
0.4893
0.4896
0.4898
0.4901
0.4904
0.4906
0.4909
0.4911
0.4913
0.4916
2.4
0.4918
0.4920
0.4922
0.4925
0.4927
0.4929
0.4931
0.4932
0.4934
0.4936
2.5
0.4938
0.4940
0.4941
0.4943
0.4945
0.4946
0.4948
0.4949
0.4951
0.4952
2.6
0.4953
0.4955
0.4956
0.4957
0.4959
0.4960
0.4961
0.4962
0.4963
0.4964
2.7
0.4965
0.4966
0.4967
0.4968
0.4969
0.4970
0.4971
0.4972
0.4973
0.4974
2.8
0.4974
0.4975
0.4976
0.4977
0.4977
0.4978
0.4979
0.4979
0.4980
0.4981
2.9
0.4981
0.4982
0.4982
0.4983
0.4984
0.4984
0.4985
0.4985
0.4986
0.4986
3.0
0.4987
0.4987
0.4987
0.4988
0.4988
0.4989
0.4989
0.4989
0.4990
0.4990
Exercícios sobre Distribuição de Probabilidades
1) Em 10 lançamentos, qual a probabilidade de obter:
a) exatamente 3 caras ?
b) pelo menos 3 coroas?
Qual o número mais provável de caras? Com que desvio padrão?
2) Se em novembro chove 4 dias, em média, calcule a
probabilidades de
a) chover pelo menos 5 dias de novembro;
b) não chover em novembro.
Qual a probabilidade de chover num dia qualquer de novembro?
Qual o desvio padrão desta distribuição?
3) Se a média numa distribuição de Poisson é 16,7, calcule a
probabilidade de:
a) aparecer o valor 8;
b) aparecer valores menores que 5;
c) aparecer valores maiores que 30 (estimativa com centésimos de
%).
d) Qual o desvio padrão desta distribuição?
4) A altura média de certa população masculina adulta é de 1,70m,
com desvio padrão de 10cm. Calcule a porcentagem de homens
com altura :
a) entre 1,60m e 1,75m;
b) maior que 1,70m;
c) menor que 1,50m.
5) Mostre que, numa distribuição normal, 50% dos valores estão a
uma distância da média menor que 0,6745 .
6) A média entre várias medidas de uma grandeza foi 3,15, com
desvio padrão de 0, 4.
Qual a probabilidade da medida estar:
a) entre 3, 147 e 3, 148?
b) entre 3, 151 e 3, 152?
c) entre 3, 155 e 3, 156?
d) entre 3, 1511 e 3, 1512?
7) Em média, chegam 30 clientes por hora numa fila com distribuição
de Poisson. Qual a probabilidade de, na próxima hora,
a) chegar 20 clientes?
b) chegar menos de 10 clientes?
Respostas:
1) a) 0,1172
b) 0,9453
5  1,6
2) a) 0,3708
b) 0,01366
0,1333
1,9
3) a) 0,008385
b) 0,0002333
c) 0,11%
4
4) a) 53,28%
b) 50%
c) 2,275%
5) A integral da gaussiana entre –0,6745
6) a) ~ b) ~ c) ~ 0,0009973
7) a) 0,01341
b) 0,999992878
e 0,6745 dá 0,5
d) ~
0,00009974
Download