A Lei dos Grandes Números

Propaganda
A Lei dos Grandes Números
Por Thiago de Oliveira Alves (ToWo) –
Rio das Flores – 18/01/2013
Introdução: a desigualdade de
Tchebycheff
• Quando conhecemos a distribuição de probabilidades
de uma variável aleatória X ( quer no caso contínuo ou
discreto), podemos calcular E(X) e Var(X), se existirem.
• Já a recíproca não é verdadeira. Ou seja, do
conhecimento de E(X) e Var(X) não é possível
reconstruir a distribuição de probabilidades de X.
• Porém, mesmo não podendo calcular estas
probabilidades ( a partir do conhecimento de E(X) e
Var(X)), pode-se provar que existe um limite superior
(ou inferior) para elas.
• Isto será expresso na chamada “desigualdade de
Tchebycheff”.
Apresentação simples da desigualdade
de Tchebycheff
• Seja f(x) a função densidade de probabilidade
(fdp) de da variável aleatória X.
• Pela definição de probabilidade sabemos que

P(  X  )   f ( x)dx  1

• Qualquer outra probabilidade, como

P( X  c   )   f ( x)dx  1

• De X c   , temos que

X
X  c   
2
2
 c
2

2
1
• Daí, se efetuarmos o produto
X
 c
2

2



f ( x) dx  1
• podemos modificar a primeira desigualdade
para
2
  X  c 
P( X  c   )  
f ( x)dx
2


• O segundo membro desta desigualdade
expressa uma “esperança”. A saber
2
  X  c 
1 
1
2
2
  2 f ( x)dx   2   X  c  f ( x)dx   2 E  X  c 
• Esta é a desigualdade de Tchebycheff
1
2
P( X  c   )  2 E  X  c 

• E sua forma complementar é
1
2
P( X  c   )  1  2 E  X  c 

• Cabe ressaltar que c é um número real qualquer,
ԑ é qualquer número positivo e E(X-c)2 é finita.
• Para o caso discreto, com p(xi) sendo a função de
probabilidade de X=xi , o processo é análogo.
Basta substituir a integral pelo somatório.





i 1
• Agora, para ficar mais interessante e prático,
vamos ilustrar este resultado fazendo algumas
considerações.
• Considere E(X)=μ (média da população),
ε=k.σ (um múltiplo do desvio padrão da
população) e Var(X)=σ2 (quadrado do desvio
padrão).
• Podemos utilizar a desigualdade de
Tchebycheff para mostrar que existem limites
para uma probabilidade, sem ser necessário
conhecer a fdp da variável aleatória.
• Façamos o seguinte
P  X    k  
1
EX   
2
k 
2
2
E  X     Var ( X )   
1
 P  X    k   2
k
• Isto significa que a probabilidade da variável
aleatória X assumir um valor que distancie da
média μ, k vezes o desvio padrão, tanto pra
mais quanto pra menos, é no máximo 1/k2!
2
2
Exemplo
• Houve um concurso público e nele participaram
2000 candidatos.
• A prova era de múltipla escolha e tinha 50
questões.
• Sabe-se por experiências anteriores que a média
das notas é próxima de 25 e que o desvio padrão
é sempre próximo de 6,0.
• Podemos estimar usando a desigualdade de
Tchebycheff que a probabilidade de alguém tirar
uma nota acima de 37=(25+2x6,0) ou abaixo de
13=(25-2x6,0) é no máximo 0,25=(1/22).
• Surge então uma pergunta.
• Quando digo que a probabilidade de alguém tirar
certa nota numa prova é 0,25, quer dizer que
25% dos candidatos obterão este resultado?
• A resposta depende de um fator: o número de
candidatos. Quanto maior o número de
candidatos, mais provável que a frequência
relativa de pessoas que tiraram uma nota seja
igual a probabilidade deste evento.
• Matematicamente falando, podemos dizer que a
frequência relativa será igual a probabilidade se o
número de candidatos for infinito.
• Este resultado é expresso na Lei dos Grandes
Números.
Lei dos Grandes Números
• Esta lei possui várias formulações, mas
enunciaremos aqui a formulação de Bernouilli.
• Seja E um experimento e A um evento associado
a E.
• Considere n repetições independentes de E,
• seja nA o número de vezes em que A ocorra nas n
repetições,
• e façamos fA = nA/ n.
• Seja P(A)=p para todas as repetições de E.
• Dado as condições anteriores, para todo ԑ>0
p1  p 
P f A  p    
2
n
• Ou, equivalente,
p1  p 
P f A  p     1 
2
n
• Podemos demonstrar esta lei usando a
desigualdade de Tchebycheff que nos foi
apresentada anteriormente.
• nA é uma variável aleatória binomialmente
distribuída. O evento A é uma dicotomia. Pode
ocorrer ou não.
• fA também é uma variável aleatória e
aplicaremos a desigualdade de Tchebycheff a
ela.
E n A   np
Var n A   np1  p 
nA
fA 

n
1
 E  f A   E n A   p
n
1
p1  p 
 Var  f A   2 Var n A  
n
n

P f A  p  k

p1  p  
1
  1 2

n
k

p1  p 
1 1 p1  p 
 k
 

n
k 
n
1
p1  p 
 2 

2
k
 n
p1  p 
 P f A  p     1 
2
 n
• Fazendo n tender ao infinito, chegaremos ao
limite que pretendíamos demonstrar.
 p 1  p  
lim 1 
1
2

n 
 n 

 lim P f A  p     1,   0
n 
• Ou seja, quando o número n de repetições de
um experimento for muito grande a
frequência relativa de sucessos fA convergirá
em probabilidade para o valor teórico da
probabilidade de sucesso p.
Exemplo
• Quantos candidatos serão necessários para
que tenhamos no mínimo 95% de certeza de
que a proporção de pessoas que tiraram a
nota 37 difira 0,01 da probabilidade teórica
máxima 0,25?
• A resposta é 37500 candidatos.
p1  p 
P f A  p     1 
2
 n
  0,01
p  0,25
p1  p 
1
 0,95 
2
 n
0,251  0,25
0,25  0,75
 1
 0,95 
 0,05 
2
0,0001n
0,01 n
1875
n
 37500
0,05
Agora um exemplo para fazer em casa.
• Ao jogar uma moeda para o alto você tem 0,5
de probabilidade teórica de tirar coroa.
• Quantas vezes você jogaria uma moeda para
ter ao menos 99% de certeza de que a
proporção de coroas entre as jogadas seja no
máximo 50,1%?
• Confira a resposta no próximo slide.
p  0,5
f A  0,501
f A  p  0,01
p1  p 
p1  p 
1
 0,99 
 0,01 
2
2
 n
 n
0,51  0,5
0,25

 0,01 
 0,01 
2
0,0001n
0,01 n
2500
n
 250000
0,01
• Cabe lembrar que fA é uma variável aleatória e
se jogarmos a moeda 250000 vezes ela estará
ou não a menos de 0,01 de 1/2.
• O que o exemplo anterior garante é que eu
tenho no mínimo 99% de chance de ter este
resultado ao jogar a moeda 250000 vezes.
• Isto, é. A cada ocasião que eu jogar a moeda
250000 vezes, cerca de 99% destas ocasiões
terá a frequência relativa de sucessos
diferenciando 0,01 da probabilidade teórica.
Conclusão
• Sabemos agora de maneira segura que podemos inferir a
probabilidade de um evento ocorrer pela frequência com
que ele ocorre e vice-versa.
• Esta lei também é uma ótima ferramenta no processo de
decisão e análise de risco. Ao decidirmos pelo mais
provável estaremos garantidos de que em longo prazo
erraremos menos.
• O mesmo seria que se escolhêssemos a opção que ocorreu
com mais frequência após um longo prazo, estaríamos
escolhendo a opção mais provável.
• Vale a pena tentar. O problema é que, como foi visto, o
prazo pode ser muito longo para se ter uma boa garantia
como 95% ou 99% de certeza, por exemplo.
Bibliografia
• MEYER, Paul L. Probabilidade: aplicações à estatística; tradução do
Prof. Ruy de C. B. Lourenço Filho. 2 ed. Rio de Janeiro: LTC – Livros
Técnicos e Científicos S.A., 1983.
• HELENE, Otaviano Augusto Marcondes, VANIN, Vito R. Tratamento
estatístico de dados em física experimental. 2 ed. São Paulo: Edgar
Blucher, 1991.
• MAE 228 - Notas de aula. Desigualdades de Markov e Chebyshev e
Lei Fraca dos Grandes Números. Notas transcritas por: Rafael Keiti
Oiski Grunho de Souza ([email protected]) e Paulo Laurent
Waelkens ([email protected]). IME – USP, 31 de
Março de 2006
• MURTEIRA, Bento José Ferreira (1990): Probabilidades e Estatística Volume I, 2ª Edição Revista, Editora McGraw-Hill de Portugal, Lda..
• MAGALHÃES, Marcos N. Probabilidade e
variáveis aleatórias. 2 ed. São Paulo: Edusp,
2006.
• JAMES, Barry. Probabilidade: um curso em
nível intermediário. 3 ed. Rio de Janeiro:
IMPA, 2006.
Para críticas, sugestões e correções envie um email para:
• [email protected] (Thiago de Oliveira
Alves).
Download