ESTATÍSTICA AULA 12
Inferência Estatística e
Distribuição Amostral – Unidade 8
Professor Marcelo Menezes Reis
1
Aulas prévias
Planejamento da pesquisa, técnicas de
amostragem: generalização.
Análise exploratória de dados: organização
dos dados.
Probabilidade e variável aleatória.
Modelos probabilísticos mais comuns.
2
Conteúdo desta aula
Conceito de inferência estatística.
Tipos de inferência estatística.
Parâmetros e estatísticas.
Distribuições amostrais de média
proporção.
e
3
Relembrando...
População: conjunto das medidas da(s)
característica(s) de interesse em todos os
elementos que a(s) apresenta(m).
Pode ser representada por um modelo:
parâmetros (Unidade 7).
Se amostragem: inferência estatística.
4
Inferência Estatística
Consiste
em
fazer
afirmações
probabilísticas sobre as características do
modelo, que se supõe representar uma
população, a partir dos dados de uma
amostra aleatória (probabilística) desta
mesma população.
Estimação de parâmetros e testes de
hipóteses.
5
Estimação de parâmetros
Fazer afirmação sobre os possíveis
valores dos parâmetros do modelo a partir
dos dados de uma amostra aleatória da
população.
Estimar média e variância de um
modelo normal.
Estimar a probabilidade de sucesso de
um modelo binomial.
6
Testes de hipóteses
Testes de hipóteses: testar hipóteses
sobre as características do modelo a partir
dos dados de uma amostra aleatória da
população.
o valor da média de uma variável é
maior do que um certo valor?
o modelo probabilístico da população é
o normal?
7
Medidas de
síntese
Parâmetros
(População)
n
N
Média
x
i 1
i
N
x
2
2
(
x
)
i
i 1
N
fa
N
X
i 1
i
n
n
N
Variância
Proporção
Estatísticas
(Amostra)
s2
2
(
x
x
)
i
i 1
n
fa
p
n
8
Estatísticas
Amostragem probabilística:
Estatísticas são variáveis aleatórias.
Seus
resultados
dependem
da
amostragem.
Necessário
construir
modelos
probabilísticos para as Estatísticas.
9
Distribuição amostral
O modelo probabilístico de uma estatística
é chamado de Distribuição Amostral.
Seja um parâmetro e T uma estatística.
Amostras aleatórias são retiradas da
população e são calculados os valores t
da Estatística T.
Valores de t formam a distribuição
amostral de T.
10
População
Amostras
{64, 67, 60} => Média = 63,67
{64, 70, 72} => Média = 68,67
{65, 70, 60} => Média = 65
Sortear 3
64 67
70 57
65 72
70 60
= 65,62 kg
Observe que há uma variação na
estatística média, e esta variação precisa
ser considerada quando são realizadas as
inferências sobre os parâmetros.
11
Distribuição amostral da média
Se forem retiradas várias amostras
aleatórias de n elementos da população.
Calculadas as médias de todas as
amostras.
2
E( x )
V( x )
n
Distribuição aproximada por uma normal.
12
Exemplo 1
Ver 2o exemplo, Unidade 8.
Suponha uma variável quantitativa cujos
valores constituem uma população com os
seguintes valores: (2, 3, 4, 5).
Retire todas as amostras aleatórias de 2
elementos
(com
reposição)
desta
população e observe a distribuição das
médias amostrais.
13
Exemplo 1
População: {2, 3, 4, 5}
Parâmetros: = 3,5
Há 16 amostras de
reposição) possíveis:
(2, 2)
(2, 3)
(3, 2)
(3, 3)
(4,2)
(4, 3)
(5, 2)
(5, 3)
2 = 1,25
2 elementos (com
(2, 4)
(3, 4)
(4, 4)
(5, 4)
(2, 5)
(3, 5)
(4, 5)
(5, 5)
14
Exemplo 1
(2,0)
_ ( 2,5)
X
(3,0)
(3,5)
56
x
3,5
16
(2,5)
(3,0)
(3,5)
(4,0)
s
(3,0)
(3,5)
(4,0)
(4,5)
2
x
(3,5)
(4,0)
(4,5)
(5,0)
1,25
0,625
2
15
Distribuição das médias normal
16
Distribuição amostral da média
A distribuição amostral da média será
normal se a distribuição da variável na
população for normal.
A distribuição amostral da média será
normal, mesmo que a distribuição da
variável na população não seja, desde
que o tamanho de amostra seja
suficientemente grande.
17
Exemplo 2
Ver o 3º exemplo da Unidade 8.
Na figura a seguir temos a distribuição
populacional de uma variável quantitativa
qualquer de interesse. Ela apresenta
média populacional () igual a 416,99, e
variância populacional (2) igual a
89554,51264.
18
70
60
Frequency
50
40
30
20
10
0
0
200 400 600 800 1000 1200 1400 1600 1800
Dados 2
Distribuição NÃO normal!
19
Exemplo 2
Vamos retirar 40 amostras aleatórias, com
reposição, da população com os seguintes
tamanhos: 2, 4, 16 e 30 elementos.
Para cada amostra calcularemos a média.
As médias serão postas em um
histograma, e serão calculadas a média e
a variância das médias amostrais.
20
Frequency
20
416,99
2
44777,25632
n
10
0
0
250
500
750
1000
Médias amostras n =2
x 423,8875
s
2
x
67528,98666
21
Frequency
20
416,99
2
22388,62816
n
10
0
200
350
500
650
800
Médias amostras n= 4
x 444,5375
s
2
x
26464,3269
22
416,99
Frequency
10
2
5597,1577
n
5
0
260
320
380
440
500
Médias amostras n =16
x 394,4922
s
2
x
5568,3945
23
70
416,99
60
Frequency
50
2
2985,1508
n
40
30
20
10
0
300
360
420
480
540
Médias amostras n=30
x 421,9217
s
2
x
2945,1326
24
Distribuição amostral da proporção
Se forem retiradas várias amostras
aleatórias de n elementos da população.
Calculadas as proporções de um atributo
em todas as amostras.
E ( p)
(1 )
V ( p)
n
Distribuição aproximada por uma normal.
25
Exemplo 3
Veja o 4º exemplo da Unidade 8.
Pense em uma variável qualitativa que
pode assumir apenas dois valores, e que
constitui a seguinte população: (□□□□■). A
proporção populacional = 1/5 = 0,2.
Retiram-se todas as amostras aleatórias
de 2 elementos (com reposição) possíveis
desta população.
26
Exemplo 3
Calcular proporção de ■ em cada amostra!
27
( 0)
( 0)
(0)
( 0)
( 0)
( 0)
(0)
( 0)
p ( 0)
( 0)
(0)
( 0)
( 0)
( 0)
(0)
( 0)
(1 / 2) (1 / 2) (1 / 2) (1 / 2)
_
1
X E ( p)
5
(1 / 2)
(1 / 2)
(1 / 2)
(1 / 2)
(1)
1 1
1
5 5 (1 )
2
s 0,08
2
n
28
Tô afim de saber
Sobre distribuição amostral:
BARBETTA, P.A., REIS, M.M., BORNIA,
A.C. Estatística para Cursos de
Engenharia e Informática. 2ª ed.: São
Paulo: Atlas, 2008, capítulo 7.
STEVENSON,
Willian J. Estatística
Aplicada à Administração. São Paulo:
Ed. Harbra, 2001, capítulo 7.
29
Para saber mais
Sobre a utilização do Microsoft Excel
para estudar distribuições amostrais veja
LEVINE,
D.
M.,
STEPHAN,
D.,
KREHBIEL, T. C., BERENSON, M. L.
Estatística: Teoria e Aplicações - Usando
Microsoft Excel em Português. 5ª ed. –
Rio de Janeiro: LTC, 200, capítulo 5.
30
Próxima aula
Estimação de parâmetros
Estimação por ponto, propriedades dos
estimadores, estimador de média e
proporção.
Estimação por intervalo de média e de
proporção.
Tamanho mínimo de amostra para
estimação.
31