Princípios de Modelagem Matemática Aula 10 Prof. José Geraldo DFM — CEFET/MG 19 de maio de 2014 Alguns resultados importantes em estatística 1 Alguns resultados importantes em estatística Distribuição normal Teorema do limite central Lei dos grandes números Prof. José Geraldo Princípios de Modelagem Matemática Aula 10 Alguns resultados importantes em estatística Distribuição normal Teorema do limite central Lei dos grandes números Distribuição normal A distribuição normal tem importante papel em estatística pois é utilizada para descrever um grande número de fenômenos naturais, biológicos e sociais; fundamenta a inferência estatística. Prof. José Geraldo Princípios de Modelagem Matemática Aula 10 Alguns resultados importantes em estatística Distribuição normal Teorema do limite central Lei dos grandes números Distribuição normal A distribuição normal é uma distribuição de probabilidade associada a variáveis aleatórias contínuas. É completamente descrita, no caso de uma única variável, por dois parâmetros: a média µ e o desvio padrão σ → N (µ, σ) designa distribuição normal com média µ e o desvio padrão σ . Sua expressão é dada por " # (x − µ)2 1 ρ (x) = √ exp − 2σ 2 2πσ (1) com −∞ < x + ∞ e σ > 0. Prof. José Geraldo Princípios de Modelagem Matemática Aula 10 Alguns resultados importantes em estatística Distribuição normal Teorema do limite central Lei dos grandes números Distribuição normal ρ(x) σ = 0, 2 σ = 0, 5 σ=1 x h 1 Figura: Distribuição normal ρ (x) = √2πσ exp − (x−µ) 2σ 2 µ = 0 para três diferentes valores de desvio padrão. Prof. José Geraldo 2 i com média Princípios de Modelagem Matemática Aula 10 Alguns resultados importantes em estatística Distribuição normal Teorema do limite central Lei dos grandes números Distribuição normal ρ(x) a b x Figura: Gráfico de uma distribuição normal. A área abaixo da curva no intervalo [a, b] é igual à probabilidade de se obter, como resultado de uma medida da variável aleatória, um valor x compreendido neste ´b intervalo. Em outras palavras, Pr (a ≤ x ≤ b) = a ρ (x) dx. Prof. José Geraldo Princípios de Modelagem Matemática Aula 10 Alguns resultados importantes em estatística Distribuição normal Teorema do limite central Lei dos grandes números Exercício 1 Verifique que a distribuição de probabilidades dada em Eq. (1) está corretamente normalizada, i.e., " # ˆ +∞ ˆ +∞ (x − µ)2 1 ρ (x) dx = √ exp − dx = 1. 2σ 2 2πσ −∞ −∞ 2 Verifique que a média da variável aleatória X , dado que esta obedece à distribuição normal dada por Eq. (1), é µ, como esperado. Prof. José Geraldo Princípios de Modelagem Matemática Aula 10 Alguns resultados importantes em estatística Distribuição normal Teorema do limite central Lei dos grandes números Independência de variáveis aletórias Em um experimento (observação experimental/simulação computacional), a amostragem é uma etapa fundamental. Amostragem bem feita deve refletir a estatística da população → mas, como inferir, a partir de uma amostra, a estatística de toda a população? Dois importantes resultados da teoria de probabilidades — o teorema do limite central e a lei dos grandes números — permitem inferir a média e o desvio padrão da população a partir da média e do desvio padrão amostrais. Prof. José Geraldo Princípios de Modelagem Matemática Aula 10 Alguns resultados importantes em estatística Distribuição normal Teorema do limite central Lei dos grandes números Independência de variáveis aletórias Grosso modo, a lei dos grandes números estabelece que a média de uma amostra caracterizada por variáveis aleatórias independentes e igualmente distribuídas converge para a média da população à medida que o número de indivíduos amostrados aumenta; o teorema do limite central (muitas vezes também citado como teorema central do limite) estabelece que a distribuição de probabilidades da soma de variáveis aleatórias independentes e igualmente distribuídas converge para uma distribuição normal caracterizada pela média e desvio padrão da própria soma. Prof. José Geraldo Princípios de Modelagem Matemática Aula 10 Alguns resultados importantes em estatística Distribuição normal Teorema do limite central Lei dos grandes números Independência de variáveis aletórias Em ambos teoremas, assume-se, por hipótese, que as variáveis aleatórias são independentes e igualmente distribuídas (iid). Duas variáveis aleatórias X e Y são independentes se a distribuição conjunta de probabilidades1 ρ (x, y ) do par (X , Y ) puder ser escrita como ρX ,Y (x, y ) = ρX (x) ρY (y ) , onde ρX (x) e ρY (y ) são distribuições de probabilidade associadas a cada uma das variáveis aleatórias, X e Y , resp. Se X e Y representam grandezas, sua independência significa que a probabilidade de se obter um determinado valor na medida de uma delas independe do valor obtido na medição da outra. 1 Sem perda de generalidade, consideramos as variáveis aleatórias X e Y contínuas. Prof. José Geraldo Princípios de Modelagem Matemática Aula 10 Alguns resultados importantes em estatística Distribuição normal Teorema do limite central Lei dos grandes números Variáveis aleatórias identicamente distribuídas Duas variáveis aleatórias X e Y são igualmente distribuídas se são descritas pela mesma distribuição de probabilidades. Por exemplo, se X e Y são variáveis aleatórias com distribuição normal e possuem médias e variâncias idênticas, então X e Y são igualmente distribuídas. Prof. José Geraldo Princípios de Modelagem Matemática Aula 10 Alguns resultados importantes em estatística Distribuição normal Teorema do limite central Lei dos grandes números Teorema do limite central Theorem (do limite central) Sejam X1 , X2 , . . . , Xn variáveis aleatórias i.i.d. com média µ e desvio padrão σ. A soma Sn = n X Xi (2) i=1 também é uma variável aleatória cuja distribuição de probabilidades, nestas condições, se aproxima de uma distribuição √ normal N nµ, σ n à medida que n → ∞. Prof. José Geraldo Princípios de Modelagem Matemática Aula 10 Alguns resultados importantes em estatística Distribuição normal Teorema do limite central Lei dos grandes números Teorema do limite central Uma outra maneira de estabelecer o teorema do limite central é dada a seguir: Theorem [do limite central]Sejam X1 , X2 , . . . , Xn variáveis aleatórias i.i.d. com média µ e desvio padrão σ. A soma n X Sn = Xi (3) i =1 √ é uma variável aleatória com média nµ e variância σ n. Então, a distribuição de probabilidades da variável aleatória Zn = Sn − nµ √ σ n (4) se aproxima de uma distribuição normal N (0, 1) à medida que que n → ∞. Prof. José Geraldo Princípios de Modelagem Matemática Aula 10 Alguns resultados importantes em estatística Distribuição normal Teorema do limite central Lei dos grandes números Teorema do limite central O teorema do limite permite obter um resultado importante para a distribuição da média amostral. Sejam X1 , X2 , . . . , Xn variáveis aleatórias i.i.d. com média µ e desvio padrão σ. Então, a média amostral deste conjunto n X̄ = 1X Xi n (5) i=1 √ é variável aleatória com média µ e desvio padrão σ/ n, cuja distribuição de probabilidades se aproxima de uma distribuição √ normal N µ, σ/ n à medida que n → ∞ (verifique!). Prof. José Geraldo Princípios de Modelagem Matemática Aula 10 Alguns resultados importantes em estatística Distribuição normal Teorema do limite central Lei dos grandes números Teorema do limite central Um exemplo: Suponha que determinada empresa fabrique parafusos cujo diâmetro segue uma distribuição uniforme de média µ = 5, 00 mm e desvio padrão σ = 0, 01 mm. Qual é a probabilidade de se obter uma amostra de 100 parafusos com diâmetro médio maior que 5, 001 mm? O diâmetro Di de cada parafuso na amostra pode ser considerado uma variável aleatória i.i.d. O diâmetro médio dos parafusos da amostra D̄ é variável aleatória √ que segue uma distribuição aproximadamente normal N µ, σ/ n = N (5, 00; 0, 001) com n = 100. Prof. José Geraldo Princípios de Modelagem Matemática Aula 10 Alguns resultados importantes em estatística Distribuição normal Teorema do limite central Lei dos grandes números Teorema do limite central Um exemplo. Para este cálculo, é necessário conhecer a distribuição acumulada da variável aleatória D̄, definida como ˆ d ρD̄ (x) dx, FD̄ D̄ ≤ d = −∞ que dá a probabilidade de se obter um valor para D̄ menor ou igual a d . Deste modo, a probabilidade de se obter D̄ > 5, 001 mm para a amostra é ˆ 5,001 Pr D̄ > 5, 10 ' 1 − FD̄ D̄ ≤ 5, 001 = 1 − ρD̄ (x) dx. −∞ Prof. José Geraldo Princípios de Modelagem Matemática Aula 10 Alguns resultados importantes em estatística Distribuição normal Teorema do limite central Lei dos grandes números Teorema do limite central Como ρD̄ (x) representa uma função de distribuição de probabilidades normal com média µD̄ = 5, 00 mm e desvio padrão σD̄ = 0, 001 mm temos Pr D̄ > 5, 10 ' 1 − 0, 8413 = 0, 1587. Prof. José Geraldo Princípios de Modelagem Matemática Aula 10 Alguns resultados importantes em estatística Distribuição normal Teorema do limite central Lei dos grandes números Exercícios 1 Verifique a equivalência dos dois enunciados do teorema do limite central. 2 Verifique, usando o teorema do limite central, o resultado para a distribuição da média amostral. 3 Peças são embaladas em engradados com capacidade para 100 peças. Os pesos das peças são variáveis aleatórias i.i.d. com distribuição uniforme no intervalo 0, 49 kg ≤ Mi ≤ 0, 51 kg. Vinte engradados são carregados em um veículo que suporta o peso de, no máximo, uma 980 kg. Desprezando o peso dos engradados, qual a probabilidade de que a capacidade de carga do veículo seja ultrapassada? Prof. José Geraldo Princípios de Modelagem Matemática Aula 10 Alguns resultados importantes em estatística Distribuição normal Teorema do limite central Lei dos grandes números Lei dos grandes números O resultado que enunciamos para a distribuição da média amostral X̄ de um conjunto de variáveis aleatórias i.i.d. pode ser complementado com a lei dos grandes números. Há duas formas de se enunciar esta lei — a forma fraca e a forma forte. Prof. José Geraldo Princípios de Modelagem Matemática Aula 10 Alguns resultados importantes em estatística Distribuição normal Teorema do limite central Lei dos grandes números Lei dos grandes números Theorem ((Lei fraca dos grandes números)) Sejam X1 , X2 , . . . , Xn variáveis aleatórias i.i.d. com média µ finita. Definimos a média amostral como a variável aleatória n X̄ = 1X Xi . n i=1 Então, para qualquer ε > 0, lim Pr X̄ − µ < ε = 1. n→∞ Prof. José Geraldo Princípios de Modelagem Matemática Aula 10 Alguns resultados importantes em estatística Distribuição normal Teorema do limite central Lei dos grandes números Lei dos grandes números Theorem ((Lei forte dos grandes números)) Sejam X1 , X2 , . . . , Xn variáveis aleatórias i.i.d. com média µ finita. Então, para qualquer ε > 0, Pr lim X̄ − µ < ε = 1. n→∞ Prof. José Geraldo Princípios de Modelagem Matemática Aula 10 Alguns resultados importantes em estatística Distribuição normal Teorema do limite central Lei dos grandes números Lei dos grandes números A diferença entre as duas formulações da lei dos grandes números é sutil. A forma fraca da lei dos grandes números estabelece que, se o número de indivíduos n da amostra for suficientemente grande, a probabilidade de a média amostral X̄ estar suficientemente próxima da média da distribuição µ, dentro de um intervalo de tamanho 2ε centrado em µ, é muito próxima de 1. No entanto, amostras com n suficientemente grande ainda podem apresentar média amostral que se desvie da média da distribuição, embora isto aconteça com pouca frequência. A forma forte estabelece que, para todo n suficientemente grande, a média amostral X̄ se mantém suficientemente próxima da média da distribuição µ e a probabilidade de se obter amostras que se desviem desse resultado é nula. Prof. José Geraldo Princípios de Modelagem Matemática Aula 10