ESTATÍSTICA EXPLORATÓRIA Prof Paulo Renato A. Firmino [email protected] Aulas 13-14 VACs – Função Densidade de Probabilidade (FDP) • • ΩX é um conjunto contido nos reais Tem-se agora uma função contínua cujo argumento é um elemento de ΩX: f(x) • f(x) pode ser visualizada através de histogramas A partir de f(x), calcula-se as probabilidades de interesse Devido aos axiomas nos quais f(x) se baseia: 1. f(x) ≥ 0, x real § f(x) não tem um limite superior 2. Para quaisquer a < b : P(a ≤ X ≤ b)= ∫ f (x ) ⋅ dx b a § A função probabilidade é uma integral definida +∞ 3. ∫. f (x ) ⋅ dx = 1 −∞ Estatí Estatística Explorató Exploratória - Paulo Renato A. Firmino 2 VACs – Exercício 1 1. 1, x ∈ [0, 1] A função f ( x ) = ⎧⎨ ⎩0, caso contrário • a) b) c) d) e) 2. é uma função densidade de probabilidades? Se sim, Qual é a probabilidade de X assumir valores entre 1 e 2? Qual é a probabilidade de X=½? Qual é a probabilidade de X pertencer ao intervalo [0, ½)? Qual é a probabilidade de X pertencer ao intervalo (0, 1)? Qual é a moda e mediana de X? ⎧c ⋅ x 2 , x ∈ [0, 2] Se f ( x ) = ⎨ é uma função de densidade de probabilidade, ⎩0, caso contrário a) b) c) d) e) Qual é o valor de c? Calcule P(X<x), para qualquer valor real x Calcule P(X>x) Calcule P(X=x) Qual é a moda e mediana de X? Estatí Estatística Explorató Exploratória - Paulo Renato A. Firmino 3 VACs - Função Densidade de Probabilidade • Quando a variável em questão caracteriza-se como contínua É em geral provinda de um processo de mensuração Pode-se trabalhar com a média • Média de X = E(X) = E(X1) Pode-se trabalhar com a variância • Variância de X = V(X) = E(X2) – [E(X)]2 = ∫ +∞ x r ⋅ f (x ) ⋅ dx • E(Xr) • Exercício 2: Retorne ao Exercício 1 e calcule o coeficiente de variação das variáveis estudadas. Qual apresenta maior dispersão? −∞ Estatí Estatística Explorató Exploratória - Paulo Renato A. Firmino 4 VACs - Função Densidade de Probabilidade • Distribuição Uniforme Emerge quando os resultados de um experimento aleatório (ε) são totalmente aleatórios, não apresentando qualquer tendência A distribuição Uniforme pode expressar o total desconhecimento sobre o fenômeno ou a sua total aleatoriedade • Ela expressa equiprobabilidade entre quaisquer eventos compostos por intervalos de mesma amplitude em ΩX ΩX = {x, a, b reais | a ≤ x ≤ b} ⎧ 1 , x ∈ [a , b ] ⎪ f. ( x ) = ⎨ b − a ⎪⎩0, Caso contrário dunif() # density punif() # probability qunif() # quantile runif() # random E(X) = (a+b)/2 V(X) = (b-a)2/12 Estatí Estatística Explorató Exploratória - Paulo Renato A. Firmino 5 VACs – Exercício 2 1. Após inúmeras tentativas para modelar o melhor momento do dia para comprar ações (das 11:00h às 18:00h), um analista financeiro conclui não haver qualquer padrão; isto é, o melhor momento para investir se distribui de maneira totalmente aleatória ao longo do dia. a) b) c) d) e) f) Qual é a probabilidade de o melhor momento ser às 11h? Qual é a probabilidade de o melhor momento ocorrer entre meio-dia e 14h? Em geral, qual é o melhor momento? Em média, qual é o melhor momento? Qual é a probabilidade de o melhor momento não ser 11h? Qual é a probabilidade de o melhor momento não ocorrer entre meio-dia e 14h? Estatí Estatística Explorató Exploratória - Paulo Renato A. Firmino 6 VACs - Função Densidade de Probabilidade • Distribuição Normal Emerge quando os resultados de um experimento aleatório (ε) são efeito da soma de um nº razoável de fatores A distribuição Normal é a mais usada das distribuições de probabilidade • A média de uma amostra aleatória tende a aderir à distribuição Normal à medida que o tamanho da amostra cresce: Teorema do Limite Central – A frequência relativa é uma média, o que permite a associação entre a Lei dos Grandes Números e o Teorema do Limite Central ΩX = {x| x é real} 1 e σ 2π f.( x ) = E(X) = μ V(X) = σ 2 1 ⎛ x −μ ⎞ − ⎜ ⎟ 2⎝ σ ⎠ 2 onde μ é real e σ2 > 0 Estatí Estatística Explorató Exploratória - Paulo Renato A. Firmino dnorm() # density pnorm() # probability qnorm() # quantile rnorm() # random 7 VACs - Função Densidade de Probabilidade • Distribuição Normal Se X ~ N(μ, σ 2), isto é, se X segue uma distribuição Normal com média μ e variância σ 2: Z = (X – μ)/ σ segue uma Normal-padrão: Z ~ N(0, 1) • Como não é trivial avaliar qualquer probabilidade P(X < x) devido a integral de f(x), elaborou-se tabelas para Z: P(X < x)=P[Z < (x – μ)/ σ ] 8 VACs – Exercício 3 1. Estudos indicam que o saldo mensal de uma loja segue uma distribuição Normal com média de R$20000.00 e desvio-padrão de R$4000.00. Em geral, qual é o saldo mensal da loja? Qual é a probabilidade de o saldo mensal: a) Ser de R$20000.00? b) Ser de, no máximo, R$20000.00? c) Ser algo entre R$15000.00 e R$22000.00? d) Ser não inferior a R$20000.00? e) Ser não superior a R$15000.00? f) Ser de, ao menos, R$15000.00? g) Ultrapassar os R$22000.00? h) Ser negativo? i) Qual é o valor, v, para o qual a probabilidade de o saldo mensal ser menor que v é de 10%? 2. Seguindo da questão anterior, a) b) c) d) Qual é o risco (≡ probabilidade) de que o saldo mensal da loja não ultrapasse os R$15000.00 durante todo o ano? Qual é a probabilidade de que nos próximos 4 meses ocorra de, em três meses seguidos o saldo ser inferior a R$15000.00 e de que no mês seguinte o saldo ultrapasse os R$15000.00? Qual é o risco de que ao longo do ano, o saldo mensal da loja seja inferior a R$15000.00 em apenas 2 meses? Se o gestor não deseja saldos mensais inferiores a R$10000.00 ao longo do ano, qual é a sua probabilidade de sucesso? 9 VACs - Função Densidade de Probabilidade • Distribuição Exponencial Emerge quando um experimento aleatório (ε) envolvendo um evento de interesse (Ev) de S ocorre sob determinada unidade de medida de maneira homogênea (a taxa de ocorrências de Ev, λ, não varia com o tempo) Uma VA Exponencial representa a quantidade de unidades de medida entre as ocorrências de Ev durante a realização de ε ΩX = {x real| x > 0} . E(X) = 1/ λ V(X) = 1/ λ2 dexp() # density pexp() # probability qexp() # quantile rexp() # random onde λ > 0 Estatí Estatística Explorató Exploratória - Paulo Renato A. Firmino 18 VACs - Função Densidade de Probabilidade • Distribuição Exponencial Está diretamente ligada à distribuição de Poisson • Enquanto a Poisson conta o número de ocorrências por unidade de medida a Exponencial mede o “tempo” entre tais ocorrências t1 t2 t3 ... tn tempo A Exponencial é a única distribuição contínua com a característica de “falta de memória” • • • P(X > x+Δ | X > Δ) = P(X > x) λ não varia com o tempo (decorrer do experimento) Ela é a versão contínua da distribuição Geométrica Estatí Estatística Explorató Exploratória - Paulo Renato A. Firmino 19 VACs – Exercício 4 1. Uma página de internet recebe em média 30 acessos por semana. Qual é a probabilidade de que não haja acessos durante um período de uma semana? Qual é a probabilidade de o primeiro acesso ocorrer antes de um dia e meio? 2. Acredita-se que o tempo médio entre ocorrências de Tsunamis em dado local seja de 3.2 anos. Qual é a probabilidade de que o próximo Tsunami ocorra após 5 anos? Qual é a probabilidade de que ocorram 3 Tsunamis em um período de 5 anos? 3. Acredita-se que o tempo para que uma família assistida pelo governo supere a linha da pobreza seja normalmente distribuído, com média de 4.6 anos e desviopadrão de 0.9 ano. Qual é a probabilidade de que 10 dentre 12 famílias assistidas superem a linha da pobreza durante 4 anos? 4. O fabricante de dado equipamento pensa em fixar sua garantia em 3 anos. Se o tempo até a falha do equipamento segue uma normal, com média de 5 anos e desvio-padrão de 1 ano, qual é a probabilidade de o comprador precisar da sua manutenção durante a garantia? 20