pptx - FAU

Propaganda
DISTRIBUIÇÃO AMOSTRAL
E
ESTIMAÇÃO
Distribuição Normal
Histograma - Distribuição Normal
Distribuição Normal
• GRÁFICO SIMÉTRICO
em torno da média.
• MÉDIA, MODA e
MEDIANA: são
idênticas .
• A área sob a curva
define 100 % da
probabilidade.
média
moda
mediana
• Cada metade tem 50%
de probabilidade.
• Forma: SINO
Distribuição Normal
• O gráfico é simétrico em torno da média, e tem o
formato de sino.
• Todas as medidas de tendência central: média,
moda e mediana; são idênticas (simetria).
• A área sob a curva define 100% da probabilidade.
• Cada metade da curva tem 50% de probabilidade.
Função Densidade da Distribuição Normal
A função densidade da normal deve ser entendida
como uma extensão natural de um histograma
A probabilidade é a área sob a curva de densidade.
Para qualquer variável x, a Probabilidade de x:
P (X) ≥ 0
Função Densidade da Distribuição Normal
• A distribuição normal é definida por 2 parâmetros:
μ
σ
representa a média populacional, e
representa o desvio padrão da população
• A função densidade de probabilidade de uma
variável aleatória com distribuição normal é:
Distribuição Normal: Propriedades
Distribuição Normal: Propriedades
Distribuição Normal: Propriedades
mesmo σ diferentes
μ
Distribuição Normal Padronizada
• A média e o desvio padrão da distribuição
normal padronizada são:
• σ - desvio padrão
σ=1
• μ - média aritmética
μ=0
• A distribuição normal padronizada facilita o cálculo
de probabilidade, evita o uso da fórmula e permite
qualquer análise mediante utilização dos ESCORES (Z)
Distribuição Normal Padronizada
Distribuição Normal Padronizada
A fórmula de transformação abaixo permite converter
qualquer variável aleatória normal X em uma variável
normal padronizada Z :
X –μ
Z=
-----------σ
O valor padronizado Z representa o número de
desvios-padrão que uma variável X se dispersa em
torno da média (para mais ou para menos)
Distribuição Normal Padronizada
Distribuição Normal Padronizada
Propriedades
• A área sob a curva corresponde a probabilidade da
variável aleatória assumir qualquer valor real entre:
0 e 1.
• Valores acima ou abaixo da média têm a mesma
probabilidade de ocorrer, pois a curva é simétrica.
• A distribuição normal padronizada permite calcular a
área debaixo da curva de qualquer outra distribuição
normal, pois as áreas associadas com a normal
padronizada estão calculadas em tabelas.
Distribuição Normal Padronizada
Propriedade 1
Probabilidade
Probabilidade
50 %
50 %
• A área sob a curva
corresponde a
probabilidade da variável
aleatória assumir
qualquer valor real entre
0 e 1.
• Áreas sob a curva =
probabilidade
Distribuição Normal Padronizada
• Propriedade 2
50%
50%
• Valores acima ou
abaixo da média
têm a mesma
probabilidade de
ocorrer, pois a
curva e
simétrica.
Distribuição Normal Padronizada
Propriedade 3
• A distribuição normal
padronizada permite
calcular probabilidades
de qualquer
distribuição normal,
pois funciona como
uma escala de
comparação.
• A as áreas associadas
com a normal
padronizada estão
calculadas em tabelas.
Distribuição Normal Padronizada
• Análise Gráfica
• 68% dos valores de Z estão entre
• 95,5% dos valores de Z estão entre
• 99,7% dos valores de Z estão entre
(μ-3σ) (μ-2σ) (μ-1σ)
(μ+1σ)
(μ-1σ) e (μ+1σ)
(μ-2σ) e (μ+2σ)
(μ-3σ) e (μ+3σ)
(μ+2σ)
(μ+3σ)
Distribuição Normal Padronizada
Distribuição Normal Padronizada
Distribuição Normal Padronizada
• Tabela da Distribuição Normal Padrão P(Z<z)
Distribuição Normal
Evento/Variável
Frequência
0
10
20
30
40
50
60
70
80
90
100
0
2
3
4
7
10
6
5
2
1
0
Exemplo:
Notas dos
alunos da FAU
num teste
aplicado em
toda USP.
Total alunos: 40
Distribuição Normal
12
10
8
6
4
2
0
0
10
20
30
40
50
60
70
80
90
100
Distribuição Normal
Variável
Frequência
Xi . fi
xi - α
(xi - α)2
0
0
0
-48,5
2352,25
10
2
20
-38,5
1482,25
20
3
60
-28,5
812,25
30
4
120
-18,5
342,25
40
7
280
-8,5
72,25
50
10
500
1,5
2,25
60
6
360
11,5
132,25
70
5
350
21,5
462,25
80
2
160
31,5
992,25
90
1
90
41,5
1722,25
100
0
0
51,5
2652,25
40
1940
∑
∑ xi . f / n
média
√ ∑ (xi - α)2 / n
desvio padrão
11.025
α = 48,5
282,6858974
s = 16,81
Distribuição
Distribuição Normal
Normal
Ex: Qual a probabilidade de selecionar um aluno na FAU que
tenha obtido uma nota igual ou abaixo de 40,0 ou igual ou acima
de 80,0.
x-µ
Z =
σ / √n
z <= X - µ /(σ / √n)
z <= 48,5 – 40,0 / (16,81)
Z <= 0,505
x-µ
Z =
σ / √n
Z >= x - µ / (σ / √n)
Z >= 48,5 - 80/ (16,81)
Z >= 1,87
Estimação
• O objetivo desta seção é estimar o valor da
média de uma população a partir das
informações contidas numa única amostra.
• Este processo de uma inferir sobre a média da
população é chamado estimação
Estimação
• A média α de uma amostra de tamanho n retirada
de uma população com média µ x e desvio padrão
σx está contida numa distribuição de médias
amostrais que tem um valor médio esperado igual
ao da média da população:
αmédio = µ x
• e um desvio padrão igual a:
s = σx / √n
Estimação
Distribuição de Médias Amostrais
s = σx / √n
s
α1
α2
µx
α3
α4
Intervalo de Confiança
• É um intervalo de valores — delimitado por
um valor mínimo e um valor máximo.
• É utilizado para estimar um parâmetro
desconhecido da população.
• Permite afirmar se o valor do parâmetro
procurado (no caso a média da população)
está contido dentro deste intervalo.
Intervalo de Confiança
Propriedades
1
95,44% das médias das
amostras estão entre +2
e -2 desvios padrões em
torno da média da
população.
α
2
A média da população está
situada dentro do intervalo
de +2 e -2 desvios padrões
em torno da média amostral
em 95,44% das vezes.
α
µ
α+2σ
µ
αmédio
α+2σ
Intervalo de Confiança
Propriedades
3
4
• Se retirarmos infinitas
amostras podemos dizer que
em 95,44% das vezes o valor
da média da população estará
dentro do intervalo:
• Assim pode-se dizer que:
- 2σ
≤
µ
≤ + 2σ
2 σ ≤ α ≤ +2 σ
• Na forma de probabilidade:
P (- 2σ ≤ µ ≤+ 2σ ) = 0,9544
µ
-2σ
α
+2 σ
Estimação: Intervalo de Confiança
• Pela fórmula da distribuição Z (abaixo) estima-se o
valor da média da população com base na média de
uma amostra:
Z =
α-µ
σ / √n
µ = α ± Z (σ / √n)
α - Z (σ / √n) ≤ µ ≤ α +Z (σ / √n)
Intervalo de Confiança
Eventos
Frequência
0
10
20
30
40
50
60
70
80
90
100
0
2
3
4
7
10
6
5
2
1
0
• Exemplo:
• Notas dos alunos
da FAU num teste
aplicado na USP.
• Total alunos: 40
Distribuição Normal
Variável
Frequência
Xi . fi
xi - α
(xi - α)2
0
0
0
-48,5
2352,25
10
2
20
-38,5
1482,25
20
3
60
-28,5
812,25
30
4
120
-18,5
342,25
40
7
280
-8,5
72,25
50
10
500
1,5
2,25
60
6
360
11,5
132,25
70
5
350
21,5
462,25
80
2
160
31,5
992,25
90
1
90
41,5
1722,25
100
0
0
51,5
2652,25
40
1940
∑
∑(xi .f)/n
média
√ ∑((xi - α)2 / n
desvio padrão
11.025
α = 48,5
282,6858974
s = 16,81
Intervalo de Confiança
12
10
α = 48,5
8
σ = 16,81
6
4
2
0
0
10
20
30
α -2σ
α-σ
14,8
31,6
40
50
α
48,5
60
70
80
90
α+σ
α + 2σ
65,3
82,13
100
Estimação
• Notas dos alunos da FAU num teste aplicado em toda
USP
– a nota média obtida na amostra foi:
– O desvio padrão encontrado foi
– A amostra tem 40 respostas
α = 48,5
σ = 16,81
n = 40
• Estimar a nota média do teste em toda USP tendo
por base as notas da FAU adotando-se as seguintes
margens de erro?
- erro 0,5%
- erro 2,5%
- erro 5%
intervalo 99%
intervalo 95%
intervalo 90%
Estimação
Resolução:
• Busca-se na tabela de distribuição normal, os valores
de Z para, 90%, 95%, 99% de intervalo de confiança
são:
P (X)
90%
95%
99%
Z
±1,64
±1,96
±2,58
• Tabela da Distribuição Normal Padrão P(Z<z)
Estimação
Z =
α-µ
σ / √n
µ = α ± Z (σ / √n)
µ = 48,5 ± 1,64. (16,8/ √40)
Intervalo de Confiança 90%
44,1 ≤ µ ≤ 52,8
Margem de Erro: 5%
Z =
α-µ
σ / √n
µ = α ± Z (σ / √n)
µ = 48,5 ± 1,96 . (16,8/ √40)
Intervalo de Confiança 95%
43,29 ≤ µ ≤ 53,71
Margem de Erro: 2,5%
Estimação
Z =
α-µ
σ / √n
µ = α ± Z σ / √n
µ = 48,5 ± 2,58. (16,8/ √40)
Intervalo de Confiança 99%
Margem
Confiança
Margem
de Erro
Intervalo
Confiança
90%
5%
44,1 ≤ µ ≤ 52,8
95%
2,5%
43,3 ≤ µ ≤ 53,7
99%
0,5%
41,6 ≤ µ ≤ 55,3
41,64 ≤ µ ≤ 55,35
Margem de Erro: 0,5%
Estimação
Estimação
• Exemplo:
• Numa amostra de 64 estudantes levanta-se o gasto
médio diário com transporte p/ vir ao campus.
Obtém como média amostral R$5.
• Sabe-se que o desvio padrão do gasto dos
estudantes é de R$1,6.
• Pede-se estimar o valor médio gasto com transporte
para toda população do campus para um intervalo
de confiança de 95%.
Estimação
• Resolução:
Na tabela de distribuição
normal Z, os valores de Z para
uma probabilidade de 95% em
torno da média são:
µ = α ± Z . σ/√n
Obtém-se então:
• Z= -1,96 e Z= + 1,96
• µ = α ±Zσ
• µ = 5 ± 1,96.(1,6/ √64)
Usando a fórmula:
Intervalo de Confiança
• Z =
α - µ
σ / √n
• 4,6 ≤ µ ≤ 5,4
Estimação
• Uma amostra de 100 domicílios selecionada ao
acaso em vários bairros da cidade de São Paulo
revela que em média existem 5 pessoas morando
por domicílio.
• O desvio padrão da amostra foi de 4.
• Pede-se estimar a média de pessoas por domicílio
para a cidade como um todo, para um intervalo de
confiança de 80%, 90%, 95%, 99%..
Estimação
Resolução:
• Na tabela de distribuição normal, o valor da
probabilidade para 80%, 90%, 95%,99% de intervalo de
confiança os valores de Z são:
P (X)
80%
90%
95%
99%
Z
±1,28
±1,64
±1,96
±2,58
Estimação
α-µ
• Z =
σ / √n
• Z =
α - µ
σ / √n
µ = α ± Z σ / √n
µ = 5 ± 1,28. (4/ √100)
µ = α ± Z σ / √n
µ = 5 ± 1,64. (4/ √100)
Intervalo de Confiança 80%
Intervalo de Confiança 90%
4,48 ≤ µ ≤ 5,51
4,34 ≤ µ ≤ 5,65
Estimação
α-µ
• Z = _________
•
σ / √n
µ = α ± Z σ / √n
µ = 5 ± 1,96. (4/ √100)
Intervalo de Confiança 95%
4,21 ≤ µ ≤ 5,78
α-µ
• Z = _________
•
σ / √n
µ = α ± Z σ / √n
µ = 5 ± 2,58. (4/ √100)
Intervalo de Confiança 99%
3,96 ≤ µ ≤ 6,0
Estimação
P (X)
Z
-
+
80%
±1,28
4,48
5,51
90%
±1,64
4,34
5,65
95%
±1,96
4,21
5,78
99%
±2,58
3,96
6,03
• Tabela da Distribuição Normal Padrão P(Z<z)
Download