DISTRIBUIÇÃO AMOSTRAL E ESTIMAÇÃO Distribuição Normal Histograma - Distribuição Normal Distribuição Normal • GRÁFICO SIMÉTRICO em torno da média. • MÉDIA, MODA e MEDIANA: são idênticas . • A área sob a curva define 100 % da probabilidade. média moda mediana • Cada metade tem 50% de probabilidade. • Forma: SINO Distribuição Normal • O gráfico é simétrico em torno da média, e tem o formato de sino. • Todas as medidas de tendência central: média, moda e mediana; são idênticas (simetria). • A área sob a curva define 100% da probabilidade. • Cada metade da curva tem 50% de probabilidade. Função Densidade da Distribuição Normal A função densidade da normal deve ser entendida como uma extensão natural de um histograma A probabilidade é a área sob a curva de densidade. Para qualquer variável x, a Probabilidade de x: P (X) ≥ 0 Função Densidade da Distribuição Normal • A distribuição normal é definida por 2 parâmetros: μ σ representa a média populacional, e representa o desvio padrão da população • A função densidade de probabilidade de uma variável aleatória com distribuição normal é: Distribuição Normal: Propriedades Distribuição Normal: Propriedades Distribuição Normal: Propriedades mesmo σ diferentes μ Distribuição Normal Padronizada • A média e o desvio padrão da distribuição normal padronizada são: • σ - desvio padrão σ=1 • μ - média aritmética μ=0 • A distribuição normal padronizada facilita o cálculo de probabilidade, evita o uso da fórmula e permite qualquer análise mediante utilização dos ESCORES (Z) Distribuição Normal Padronizada Distribuição Normal Padronizada A fórmula de transformação abaixo permite converter qualquer variável aleatória normal X em uma variável normal padronizada Z : X –μ Z= -----------σ O valor padronizado Z representa o número de desvios-padrão que uma variável X se dispersa em torno da média (para mais ou para menos) Distribuição Normal Padronizada Distribuição Normal Padronizada Propriedades • A área sob a curva corresponde a probabilidade da variável aleatória assumir qualquer valor real entre: 0 e 1. • Valores acima ou abaixo da média têm a mesma probabilidade de ocorrer, pois a curva é simétrica. • A distribuição normal padronizada permite calcular a área debaixo da curva de qualquer outra distribuição normal, pois as áreas associadas com a normal padronizada estão calculadas em tabelas. Distribuição Normal Padronizada Propriedade 1 Probabilidade Probabilidade 50 % 50 % • A área sob a curva corresponde a probabilidade da variável aleatória assumir qualquer valor real entre 0 e 1. • Áreas sob a curva = probabilidade Distribuição Normal Padronizada • Propriedade 2 50% 50% • Valores acima ou abaixo da média têm a mesma probabilidade de ocorrer, pois a curva e simétrica. Distribuição Normal Padronizada Propriedade 3 • A distribuição normal padronizada permite calcular probabilidades de qualquer distribuição normal, pois funciona como uma escala de comparação. • A as áreas associadas com a normal padronizada estão calculadas em tabelas. Distribuição Normal Padronizada • Análise Gráfica • 68% dos valores de Z estão entre • 95,5% dos valores de Z estão entre • 99,7% dos valores de Z estão entre (μ-3σ) (μ-2σ) (μ-1σ) (μ+1σ) (μ-1σ) e (μ+1σ) (μ-2σ) e (μ+2σ) (μ-3σ) e (μ+3σ) (μ+2σ) (μ+3σ) Distribuição Normal Padronizada Distribuição Normal Padronizada Distribuição Normal Padronizada • Tabela da Distribuição Normal Padrão P(Z<z) Distribuição Normal Evento/Variável Frequência 0 10 20 30 40 50 60 70 80 90 100 0 2 3 4 7 10 6 5 2 1 0 Exemplo: Notas dos alunos da FAU num teste aplicado em toda USP. Total alunos: 40 Distribuição Normal 12 10 8 6 4 2 0 0 10 20 30 40 50 60 70 80 90 100 Distribuição Normal Variável Frequência Xi . fi xi - α (xi - α)2 0 0 0 -48,5 2352,25 10 2 20 -38,5 1482,25 20 3 60 -28,5 812,25 30 4 120 -18,5 342,25 40 7 280 -8,5 72,25 50 10 500 1,5 2,25 60 6 360 11,5 132,25 70 5 350 21,5 462,25 80 2 160 31,5 992,25 90 1 90 41,5 1722,25 100 0 0 51,5 2652,25 40 1940 ∑ ∑ xi . f / n média √ ∑ (xi - α)2 / n desvio padrão 11.025 α = 48,5 282,6858974 s = 16,81 Distribuição Distribuição Normal Normal Ex: Qual a probabilidade de selecionar um aluno na FAU que tenha obtido uma nota igual ou abaixo de 40,0 ou igual ou acima de 80,0. x-µ Z = σ / √n z <= X - µ /(σ / √n) z <= 48,5 – 40,0 / (16,81) Z <= 0,505 x-µ Z = σ / √n Z >= x - µ / (σ / √n) Z >= 48,5 - 80/ (16,81) Z >= 1,87 Estimação • O objetivo desta seção é estimar o valor da média de uma população a partir das informações contidas numa única amostra. • Este processo de uma inferir sobre a média da população é chamado estimação Estimação • A média α de uma amostra de tamanho n retirada de uma população com média µ x e desvio padrão σx está contida numa distribuição de médias amostrais que tem um valor médio esperado igual ao da média da população: αmédio = µ x • e um desvio padrão igual a: s = σx / √n Estimação Distribuição de Médias Amostrais s = σx / √n s α1 α2 µx α3 α4 Intervalo de Confiança • É um intervalo de valores — delimitado por um valor mínimo e um valor máximo. • É utilizado para estimar um parâmetro desconhecido da população. • Permite afirmar se o valor do parâmetro procurado (no caso a média da população) está contido dentro deste intervalo. Intervalo de Confiança Propriedades 1 95,44% das médias das amostras estão entre +2 e -2 desvios padrões em torno da média da população. α 2 A média da população está situada dentro do intervalo de +2 e -2 desvios padrões em torno da média amostral em 95,44% das vezes. α µ α+2σ µ αmédio α+2σ Intervalo de Confiança Propriedades 3 4 • Se retirarmos infinitas amostras podemos dizer que em 95,44% das vezes o valor da média da população estará dentro do intervalo: • Assim pode-se dizer que: - 2σ ≤ µ ≤ + 2σ 2 σ ≤ α ≤ +2 σ • Na forma de probabilidade: P (- 2σ ≤ µ ≤+ 2σ ) = 0,9544 µ -2σ α +2 σ Estimação: Intervalo de Confiança • Pela fórmula da distribuição Z (abaixo) estima-se o valor da média da população com base na média de uma amostra: Z = α-µ σ / √n µ = α ± Z (σ / √n) α - Z (σ / √n) ≤ µ ≤ α +Z (σ / √n) Intervalo de Confiança Eventos Frequência 0 10 20 30 40 50 60 70 80 90 100 0 2 3 4 7 10 6 5 2 1 0 • Exemplo: • Notas dos alunos da FAU num teste aplicado na USP. • Total alunos: 40 Distribuição Normal Variável Frequência Xi . fi xi - α (xi - α)2 0 0 0 -48,5 2352,25 10 2 20 -38,5 1482,25 20 3 60 -28,5 812,25 30 4 120 -18,5 342,25 40 7 280 -8,5 72,25 50 10 500 1,5 2,25 60 6 360 11,5 132,25 70 5 350 21,5 462,25 80 2 160 31,5 992,25 90 1 90 41,5 1722,25 100 0 0 51,5 2652,25 40 1940 ∑ ∑(xi .f)/n média √ ∑((xi - α)2 / n desvio padrão 11.025 α = 48,5 282,6858974 s = 16,81 Intervalo de Confiança 12 10 α = 48,5 8 σ = 16,81 6 4 2 0 0 10 20 30 α -2σ α-σ 14,8 31,6 40 50 α 48,5 60 70 80 90 α+σ α + 2σ 65,3 82,13 100 Estimação • Notas dos alunos da FAU num teste aplicado em toda USP – a nota média obtida na amostra foi: – O desvio padrão encontrado foi – A amostra tem 40 respostas α = 48,5 σ = 16,81 n = 40 • Estimar a nota média do teste em toda USP tendo por base as notas da FAU adotando-se as seguintes margens de erro? - erro 0,5% - erro 2,5% - erro 5% intervalo 99% intervalo 95% intervalo 90% Estimação Resolução: • Busca-se na tabela de distribuição normal, os valores de Z para, 90%, 95%, 99% de intervalo de confiança são: P (X) 90% 95% 99% Z ±1,64 ±1,96 ±2,58 • Tabela da Distribuição Normal Padrão P(Z<z) Estimação Z = α-µ σ / √n µ = α ± Z (σ / √n) µ = 48,5 ± 1,64. (16,8/ √40) Intervalo de Confiança 90% 44,1 ≤ µ ≤ 52,8 Margem de Erro: 5% Z = α-µ σ / √n µ = α ± Z (σ / √n) µ = 48,5 ± 1,96 . (16,8/ √40) Intervalo de Confiança 95% 43,29 ≤ µ ≤ 53,71 Margem de Erro: 2,5% Estimação Z = α-µ σ / √n µ = α ± Z σ / √n µ = 48,5 ± 2,58. (16,8/ √40) Intervalo de Confiança 99% Margem Confiança Margem de Erro Intervalo Confiança 90% 5% 44,1 ≤ µ ≤ 52,8 95% 2,5% 43,3 ≤ µ ≤ 53,7 99% 0,5% 41,6 ≤ µ ≤ 55,3 41,64 ≤ µ ≤ 55,35 Margem de Erro: 0,5% Estimação Estimação • Exemplo: • Numa amostra de 64 estudantes levanta-se o gasto médio diário com transporte p/ vir ao campus. Obtém como média amostral R$5. • Sabe-se que o desvio padrão do gasto dos estudantes é de R$1,6. • Pede-se estimar o valor médio gasto com transporte para toda população do campus para um intervalo de confiança de 95%. Estimação • Resolução: Na tabela de distribuição normal Z, os valores de Z para uma probabilidade de 95% em torno da média são: µ = α ± Z . σ/√n Obtém-se então: • Z= -1,96 e Z= + 1,96 • µ = α ±Zσ • µ = 5 ± 1,96.(1,6/ √64) Usando a fórmula: Intervalo de Confiança • Z = α - µ σ / √n • 4,6 ≤ µ ≤ 5,4 Estimação • Uma amostra de 100 domicílios selecionada ao acaso em vários bairros da cidade de São Paulo revela que em média existem 5 pessoas morando por domicílio. • O desvio padrão da amostra foi de 4. • Pede-se estimar a média de pessoas por domicílio para a cidade como um todo, para um intervalo de confiança de 80%, 90%, 95%, 99%.. Estimação Resolução: • Na tabela de distribuição normal, o valor da probabilidade para 80%, 90%, 95%,99% de intervalo de confiança os valores de Z são: P (X) 80% 90% 95% 99% Z ±1,28 ±1,64 ±1,96 ±2,58 Estimação α-µ • Z = σ / √n • Z = α - µ σ / √n µ = α ± Z σ / √n µ = 5 ± 1,28. (4/ √100) µ = α ± Z σ / √n µ = 5 ± 1,64. (4/ √100) Intervalo de Confiança 80% Intervalo de Confiança 90% 4,48 ≤ µ ≤ 5,51 4,34 ≤ µ ≤ 5,65 Estimação α-µ • Z = _________ • σ / √n µ = α ± Z σ / √n µ = 5 ± 1,96. (4/ √100) Intervalo de Confiança 95% 4,21 ≤ µ ≤ 5,78 α-µ • Z = _________ • σ / √n µ = α ± Z σ / √n µ = 5 ± 2,58. (4/ √100) Intervalo de Confiança 99% 3,96 ≤ µ ≤ 6,0 Estimação P (X) Z - + 80% ±1,28 4,48 5,51 90% ±1,64 4,34 5,65 95% ±1,96 4,21 5,78 99% ±2,58 3,96 6,03 • Tabela da Distribuição Normal Padrão P(Z<z)