A Lei dos Grandes Números Por Thiago de Oliveira Alves (ToWo) – Rio das Flores – 18/01/2013 Introdução: a desigualdade de Tchebycheff • Quando conhecemos a distribuição de probabilidades de uma variável aleatória X ( quer no caso contínuo ou discreto), podemos calcular E(X) e Var(X), se existirem. • Já a recíproca não é verdadeira. Ou seja, do conhecimento de E(X) e Var(X) não é possível reconstruir a distribuição de probabilidades de X. • Porém, mesmo não podendo calcular estas probabilidades ( a partir do conhecimento de E(X) e Var(X)), pode-se provar que existe um limite superior (ou inferior) para elas. • Isto será expresso na chamada “desigualdade de Tchebycheff”. Apresentação simples da desigualdade de Tchebycheff • Seja f(x) a função densidade de probabilidade (fdp) de da variável aleatória X. • Pela definição de probabilidade sabemos que P( X ) f ( x)dx 1 • Qualquer outra probabilidade, como P( X c ) f ( x)dx 1 • De X c , temos que X X c 2 2 c 2 2 1 • Daí, se efetuarmos o produto X c 2 2 f ( x) dx 1 • podemos modificar a primeira desigualdade para 2 X c P( X c ) f ( x)dx 2 • O segundo membro desta desigualdade expressa uma “esperança”. A saber 2 X c 1 1 2 2 2 f ( x)dx 2 X c f ( x)dx 2 E X c • Esta é a desigualdade de Tchebycheff 1 2 P( X c ) 2 E X c • E sua forma complementar é 1 2 P( X c ) 1 2 E X c • Cabe ressaltar que c é um número real qualquer, ԑ é qualquer número positivo e E(X-c)2 é finita. • Para o caso discreto, com p(xi) sendo a função de probabilidade de X=xi , o processo é análogo. Basta substituir a integral pelo somatório. i 1 • Agora, para ficar mais interessante e prático, vamos ilustrar este resultado fazendo algumas considerações. • Considere E(X)=μ (média da população), ε=k.σ (um múltiplo do desvio padrão da população) e Var(X)=σ2 (quadrado do desvio padrão). • Podemos utilizar a desigualdade de Tchebycheff para mostrar que existem limites para uma probabilidade, sem ser necessário conhecer a fdp da variável aleatória. • Façamos o seguinte P X k 1 EX 2 k 2 2 E X Var ( X ) 1 P X k 2 k • Isto significa que a probabilidade da variável aleatória X assumir um valor que distancie da média μ, k vezes o desvio padrão, tanto pra mais quanto pra menos, é no máximo 1/k2! 2 2 Exemplo • Houve um concurso público e nele participaram 2000 candidatos. • A prova era de múltipla escolha e tinha 50 questões. • Sabe-se por experiências anteriores que a média das notas é próxima de 25 e que o desvio padrão é sempre próximo de 6,0. • Podemos estimar usando a desigualdade de Tchebycheff que a probabilidade de alguém tirar uma nota acima de 37=(25+2x6,0) ou abaixo de 13=(25-2x6,0) é no máximo 0,25=(1/22). • Surge então uma pergunta. • Quando digo que a probabilidade de alguém tirar certa nota numa prova é 0,25, quer dizer que 25% dos candidatos obterão este resultado? • A resposta depende de um fator: o número de candidatos. Quanto maior o número de candidatos, mais provável que a frequência relativa de pessoas que tiraram uma nota seja igual a probabilidade deste evento. • Matematicamente falando, podemos dizer que a frequência relativa será igual a probabilidade se o número de candidatos for infinito. • Este resultado é expresso na Lei dos Grandes Números. Lei dos Grandes Números • Esta lei possui várias formulações, mas enunciaremos aqui a formulação de Bernouilli. • Seja E um experimento e A um evento associado a E. • Considere n repetições independentes de E, • seja nA o número de vezes em que A ocorra nas n repetições, • e façamos fA = nA/ n. • Seja P(A)=p para todas as repetições de E. • Dado as condições anteriores, para todo ԑ>0 p1 p P f A p 2 n • Ou, equivalente, p1 p P f A p 1 2 n • Podemos demonstrar esta lei usando a desigualdade de Tchebycheff que nos foi apresentada anteriormente. • nA é uma variável aleatória binomialmente distribuída. O evento A é uma dicotomia. Pode ocorrer ou não. • fA também é uma variável aleatória e aplicaremos a desigualdade de Tchebycheff a ela. E n A np Var n A np1 p nA fA n 1 E f A E n A p n 1 p1 p Var f A 2 Var n A n n P f A p k p1 p 1 1 2 n k p1 p 1 1 p1 p k n k n 1 p1 p 2 2 k n p1 p P f A p 1 2 n • Fazendo n tender ao infinito, chegaremos ao limite que pretendíamos demonstrar. p 1 p lim 1 1 2 n n lim P f A p 1, 0 n • Ou seja, quando o número n de repetições de um experimento for muito grande a frequência relativa de sucessos fA convergirá em probabilidade para o valor teórico da probabilidade de sucesso p. Exemplo • Quantos candidatos serão necessários para que tenhamos no mínimo 95% de certeza de que a proporção de pessoas que tiraram a nota 37 difira 0,01 da probabilidade teórica máxima 0,25? • A resposta é 37500 candidatos. p1 p P f A p 1 2 n 0,01 p 0,25 p1 p 1 0,95 2 n 0,251 0,25 0,25 0,75 1 0,95 0,05 2 0,0001n 0,01 n 1875 n 37500 0,05 Agora um exemplo para fazer em casa. • Ao jogar uma moeda para o alto você tem 0,5 de probabilidade teórica de tirar coroa. • Quantas vezes você jogaria uma moeda para ter ao menos 99% de certeza de que a proporção de coroas entre as jogadas seja no máximo 50,1%? • Confira a resposta no próximo slide. p 0,5 f A 0,501 f A p 0,01 p1 p p1 p 1 0,99 0,01 2 2 n n 0,51 0,5 0,25 0,01 0,01 2 0,0001n 0,01 n 2500 n 250000 0,01 • Cabe lembrar que fA é uma variável aleatória e se jogarmos a moeda 250000 vezes ela estará ou não a menos de 0,01 de 1/2. • O que o exemplo anterior garante é que eu tenho no mínimo 99% de chance de ter este resultado ao jogar a moeda 250000 vezes. • Isto, é. A cada ocasião que eu jogar a moeda 250000 vezes, cerca de 99% destas ocasiões terá a frequência relativa de sucessos diferenciando 0,01 da probabilidade teórica. Conclusão • Sabemos agora de maneira segura que podemos inferir a probabilidade de um evento ocorrer pela frequência com que ele ocorre e vice-versa. • Esta lei também é uma ótima ferramenta no processo de decisão e análise de risco. Ao decidirmos pelo mais provável estaremos garantidos de que em longo prazo erraremos menos. • O mesmo seria que se escolhêssemos a opção que ocorreu com mais frequência após um longo prazo, estaríamos escolhendo a opção mais provável. • Vale a pena tentar. O problema é que, como foi visto, o prazo pode ser muito longo para se ter uma boa garantia como 95% ou 99% de certeza, por exemplo. Bibliografia • MEYER, Paul L. Probabilidade: aplicações à estatística; tradução do Prof. Ruy de C. B. Lourenço Filho. 2 ed. Rio de Janeiro: LTC – Livros Técnicos e Científicos S.A., 1983. • HELENE, Otaviano Augusto Marcondes, VANIN, Vito R. Tratamento estatístico de dados em física experimental. 2 ed. São Paulo: Edgar Blucher, 1991. • MAE 228 - Notas de aula. Desigualdades de Markov e Chebyshev e Lei Fraca dos Grandes Números. Notas transcritas por: Rafael Keiti Oiski Grunho de Souza ([email protected]) e Paulo Laurent Waelkens ([email protected]). IME – USP, 31 de Março de 2006 • MURTEIRA, Bento José Ferreira (1990): Probabilidades e Estatística Volume I, 2ª Edição Revista, Editora McGraw-Hill de Portugal, Lda.. • MAGALHÃES, Marcos N. Probabilidade e variáveis aleatórias. 2 ed. São Paulo: Edusp, 2006. • JAMES, Barry. Probabilidade: um curso em nível intermediário. 3 ed. Rio de Janeiro: IMPA, 2006. Para críticas, sugestões e correções envie um email para: • [email protected] (Thiago de Oliveira Alves).