Probabilidade e Estatística I – Antonio Roque – Aula 24 Aproximação da Distribuição Binomial pela Distribuição Normal Uma das utilidades da distribuição normal é que ela pode ser usada para fornecer aproximações para algumas distribuições de probabilidade discretas. Vamos considerar aqui a aproximação de uma distribuição binomial por uma distribuição normal. Observe abaixo dois gráficos da distribuição binomial para duas situações diferentes (são os mesmos gráficos dados na aula 12). Lembre-se também que a média e o desvio padrão de uma distribuição binomial são dados por: µ = np e σ = npq = np(1 − p ) . Note que os dois gráficos têm aproximadamente uma forma de sino. No caso da esquerda, com p = ½ (q = ½), a distribuição é perfeitamente simétrica e, no caso da direita, com p ≠ q, a distribuição é aproximadamente simétrica. À medida que o número de repetições n do experimento binomial aumenta, a distibuição binomial resultante pode ser muito bem aproximada por uma distribuição normal com média µ = np e variância σ 2 = np(1 − p). 1 Probabilidade e Estatística I – Antonio Roque – Aula 24 Esta é uma observação empírica (observe os gráficos acima ou gere novos gráficos para distribuições binomiais com n grande). Também podemos ver empiricamente que, quanto mais próximo o valor de p for de 0 ou 1, maior terá que ser o valor de n para que a aproximação fique boa. A justificativa matemática para a observação empírica de que quanto maior é o n de uma distribuição binomial, melhor ela pode ser aproximada por uma distribuição normal com média µ = np e desvio padrão σ = np(1 − p) é dada por um teorema muito importante em estatística, chamado de teorema central do limite, e que será visto mais tarde. Uma das conseqüências do teorema central do limite é a seguinte: Se uma distribuição binomial satisfizer as condições, np ≥ 5 e n(1 – p) ≥ 5, então ela pode ser aproximada por uma distribuição normal com média e desvio padrão dados por: µ = np e σ = np(1 − p) . Exemplo: Seja um experimento binomial com p = ¼ e q = ¾. Se o experimento for repetido n = 30 vezes, qual a probabilidade de que haja 9 sucessos? Pela fórmula da distribuição binomial, a probabilidade pedida é, P(9 | 30, p = 0,25) = 30! (0,25)9 (0,75)21 = 0,1298. 9!21! 2 Probabilidade e Estatística I – Antonio Roque – Aula 24 Vejamos agora o que uma distribuição normal com média µ = np = 7,5 e desvio padrão σ = npq = 2,37 nos dá. Sabemos que ela deve fornecer uma boa aproximação para o valor calculado acima, pois np = 30.0,25 = 7,5 > 5 e nq = 30.0,75 = 22,5 > 5. No entanto, temos um problema: a distribuição normal é uma distribuição contínua, de maneira que não se define o valor de p(x = 9). A convenção neste caso é calcular o valor de p(x = 9) como p(8,5 ≤ x ≤ 9,5). Isto é chamado de correção de continuidade (veja abaixo). A distribuição binomial é discreta. Então, a probabilidade de x = 9 pode ser vista como a área de um retângulo centrado em 9 e com largura de 1 unidade. Esta área pode ser aproximada pela área abaixo da função contínua da distribuição normal entre 8,5 e 9,5. Para calcular a área entre 8,5 e 9,5, devemos transformar a distribuição normal acima para a distribuição normal padrão e obter a área entre os escores-z associados a 8,5 e 9,5, respectivamente. Esses escores-z valem: z1 = 8,5 − 7,5 9,5 − 7,5 = 0,42 e z 2 = = 0,84. 2,37 2,37 3 Probabilidade e Estatística I – Antonio Roque – Aula 24 Portanto, a área desejada vale 0,2995 – 0,1628 = 0,1367. Este valor é uma aproximação razoável para 0,1298. Se o valor de n fosse maior do que 30 (tente em casa para n = 40 e 50), teríamos uma aproximação ainda melhor. Em geral, se y for uma variável que satisfaça a uma distribuição binomial com parâmetros n e p, e x for uma variável que satisfaça a uma distribuição normal com parâmetros µ = np e σ = np(1 − p) tais que np ≥ 5 e n(1 – p) ≥ 5, então, para inteiros a e b com a < b, pode-se usar a aproximação: 1 1 ⎞ ⎛ P(a ≤ y ≤ b ) ≈ P⎜ a − ≤ x ≤ b + ⎟ . 2 2 ⎠ ⎝ Os fatores ½ que aparecem na fórmula acima são devidos à correção de continuidade. O exemplo dado deve ter deixado claro que a fórmula acima não é exata, mas constitui uma aproximação. Ela deve ser usada para o cálculo de uma probabilidade binomial apenas quando não se tiver à disposição um computador ou uma tabela conveniente para a distribuição binomial (por exemplo, quando n for muito grande). Nas aulas anteriores, vimos que uma distribuição binomial com parâmetros n e p pode ser aproximada por uma distribuição de Poisson com parâmetro µ = np quando n for grande e p for pequeno. Isto sugere que uma distribuição de Poisson também pode ser aproximada por uma distribuição normal. Observe, por exemplo, os gráficos da distribuição de Poisson a seguir, retirados da aula 12: 4 Probabilidade e Estatística I – Antonio Roque – Aula 24 À medida que µ cresce, a forma da distribuição de Poisson se aproxima da forma típica de sino da distribuição normal. Isto também é uma conseqüência do teorema central do limite. Para as aplicações práticas, a aproximação de uma distribuição de Poisson por uma distribuição normal é razoável para µ ≥ 20. 5