Distribuições de Probabilidade Distribuição Normal 1 Distribuição Normal ou Gaussiana A distribuição Normal ou Gaussiana é muito utilizada em análises estatísticas. É uma distribuição simétrica em torno da sua média e em forma de sino. Depende de dois parâmetros que são a média e a variância da distribuição. X ~ N(µ, σ) significa que X tem distribuição Normal com média µ e desvio padrão σ. Nota: alguns autores utilizam a notação N(µ, σ2) sendo o segundo parâmetro a variância em vez do desvio padrão. 2 Curva de densidade da Normal 3 Densidades Normais N(0,0.7) N(0,1) N(0,1.2) 4 Normal standard ou padrão Quando µ = 0 e σ = 1 temos a distribuição Normal standard (também se diz Normal padrão ou Normal centrada e reduzida). Os valores da função de distribuição, F(x), e os valores de certos quantis mais utilizados encontram-se tabelados. 5 Normal Standard Habitualmente utiliza-se: a letra Z para representar uma Normal Standard. A designação Φ(z) para representar F(z). A designação zp para representar o quantil de ordem p. Atenção que os quantis têm diferentes representações de autor para autor. Muitos utilizam zp para representar o quantil de ordem 1-p, ou ainda (1-p)/2. 6 Normal Standard – quantil de ordem 0.95 z0.95 7 Normal Standard – quantis de ordem 0.025 e 0.975 z0.025 e z0.975 8 Cálculo de probabilidades da Normal Para calcular probabilidades associadas a uma distribuição Normal qualquer, podemos recorrer às tabelas ou a software ou a máquinas de calcular. No SPSS as funções associadas à distribuição Normal são: Cdf.Normal(x,µ,σ) para a função de distribuição no ponto x, F(x); Idf.Normal(p,µ,σ) para o quantil de ordem p, xp. 9 Cálculo de probabilidades da Normal: Normalização Para recorrer às tabelas é necessário normalizar a variável antes de calcular uma probabilidade (ou um quantil). Se X ~ N(µ,σ) então Z = (X- µ) / σ ~ N(0,1). 10 Cálculo de probabilidades da Normal: Normalização Por exemplo, se X tem distribuição N(5,2) e queremos calcular P(X≤7): X −5 7 −5 P ( X ≤ 7) = P ≤ = P (Z ≤ 1) = Φ(1) = 0,8413 2 2 11 Propriedades da Normal Se adicionarmos uma constante b a uma variável Normal X ~ N(µ,σ), obtemos uma nova variável Normal, Y=X+b ~ N(µ+b, σ). Se multiplicarmos uma variável Normal por uma constante a obtemos uma nova variável Normal, Y=aX ~ N(aµ,aσ). 12 Propriedades da Normal A soma de variáveis aleatórias Normais é ainda Normal com média igual à soma das médias. Se as variáveis forem independentes a variância é igual à soma das variâncias. Em particular a média X de n variáveis Normais independentes e com a mesma distribuição é ainda Normal X ~ N (µ , σ / n ) 13 Resultados Importantes Lei dos Grandes Números Teorema do Limite Central 14 Lei dos grandes números A média de um conjunto de n variáveis aleatórias independentes e identicamente distribuídas, com média µ e desvio padrão σ, converge para µ à medida que n aumenta. A partir deste resultado podemos dizer que a frequência relativa de um certo acontecimento de interesse num conjunto de n experiências independentes, converge para a probabilidade do acontecimento à medida que n aumenta. 15 Estabilização das frequências relativas no lançamento sucessivo de uma moeda ao ar 16 Teorema do Limite Central Vimos anteriormente que a média de uma conjunto de variáveis aleatórias Normais, é ainda Normal: X ~ N ( µ,σ ) ⇒ X ~ N (µ , σ / n ) O Teorema do Limite Central permite dizer que a média de um conjunto de variáveis aleatórias com uma qualquer distribuição é aproximadamente Normal (cada vez mais Normal à medida que o nº de variáveis aumenta) X ~ F ( x ) ⇒ X ~ N (µ , σ / apr . n ) 17 Teorema do Limite Central Se tivermos n variáveis aleatórias X1,X2…,Xn independentes e com a mesma distribuição de média µ e variância σ2,então quando n cresce para infinito, X −µ dist → N (0,1) σ/ n ou equivalentemente ∑X i − nµ nσ dist → N (0,1) 18 Ilustrações do TLC e da LGN Alguns sites para explorar o TLC e a LGN http://www.stat.sc.edu/~west/javahtml/CLT.html (dados) http://www.rand.org/statistics/applets/clt.html (bolinhas a cair) http://www.statisticalengineering.com/central_limit_t heorem_(inverse).htm (texto com pequena simulação) http://www.maths.soton.ac.uk/teaching/units/ma1c6/l inks/samplingapplet/samplingapplet.html 19 Aproximações baseadas no TLC Podemos efectuar cálculos de probabilidades aproximadas com base no TLC. Ilustramos esta situação com dois exemplos: Probabilidades associadas a distribuições Binomiais; Probabilidades associadas a distribuições de Poisson. 20 Aproximações baseadas no TLC: Binomial - Normal Probabilidades associadas a uma distribuição Binomial, B(n,p), podem ser aproximadas utilizando uma distribuição Normal, N(µ,σ), com µ=np e σ = np(1-p). Para que a aproximação não seja muito má, devemos ter np ≥ 5 e n (1-p) ≥ 5. 21 Aproximações baseadas no TLC: Binomial - Normal Quando usamos a distribuição Normal (que é uma distribuição contínua) para aproximar a distribuição Binomial (que é uma distribuição discreta), fazemos uma correção de continuidade ao valor discreto x na distribuição binomial representando o valor x pelo intervalo de x – 0.5 a x + 0.5. 22 Aproximações baseadas no TLC: Binomial - Normal 23 Aproximações baseadas no TLC: Binomial - Normal 24 Aproximações baseadas no TLC: Poisson - Normal Probabilidades associadas a uma distribuição de Poisson, P(λ), podem ser aproximadas utilizando uma distribuição Normal, N(µ,σ), com µ= λ e σ = λ. A aproximação será tanto melhor quanto maior for λ. 25