Inferência estatística e distribuição amostral

Propaganda
ESTATÍSTICA AULA 12
Inferência Estatística e
Distribuição Amostral – Unidade 8
Professor Marcelo Menezes Reis
1
Aulas prévias




Planejamento da pesquisa, técnicas de
amostragem: generalização.
Análise exploratória de dados: organização
dos dados.
Probabilidade e variável aleatória.
Modelos probabilísticos mais comuns.
2
Conteúdo desta aula




Conceito de inferência estatística.
Tipos de inferência estatística.
Parâmetros e estatísticas.
Distribuições amostrais de média
proporção.
e
3
Relembrando...



População: conjunto das medidas da(s)
característica(s) de interesse em todos os
elementos que a(s) apresenta(m).
Pode ser representada por um modelo:
parâmetros (Unidade 7).
Se amostragem: inferência estatística.
4
Inferência Estatística


Consiste
em
fazer
afirmações
probabilísticas sobre as características do
modelo, que se supõe representar uma
população, a partir dos dados de uma
amostra aleatória (probabilística) desta
mesma população.
Estimação de parâmetros e testes de
hipóteses.
5
Estimação de parâmetros

Fazer afirmação sobre os possíveis
valores dos parâmetros do modelo a partir
dos dados de uma amostra aleatória da
população.
 Estimar média e variância de um
modelo normal.
 Estimar a probabilidade de sucesso de
um modelo binomial.
6
Testes de hipóteses

Testes de hipóteses: testar hipóteses
sobre as características do modelo a partir
dos dados de uma amostra aleatória da
população.
 o valor da média de uma variável é
maior do que um certo valor?
 o modelo probabilístico da população é
o normal?
7
Medidas de
síntese
Parâmetros
(População)
n
N
Média

x
i 1
i
N
x
 
2
2
(
x


)
 i
i 1
N
fa

N
X
i 1
i
n
n
N
Variância
Proporção
Estatísticas
(Amostra)
s2 
2
(
x

x
)
 i
i 1
n
fa
p
n
8
Estatísticas

Amostragem probabilística:
 Estatísticas são variáveis aleatórias.
 Seus
resultados
dependem
da
amostragem.
 Necessário
construir
modelos
probabilísticos para as Estatísticas.
9
Distribuição amostral




O modelo probabilístico de uma estatística
é chamado de Distribuição Amostral.
Seja  um parâmetro e T uma estatística.
Amostras aleatórias são retiradas da
população e são calculados os valores t
da Estatística T.
Valores de t formam a distribuição
amostral de T.
10
População
Amostras
{64, 67, 60} => Média = 63,67
{64, 70, 72} => Média = 68,67
{65, 70, 60} => Média = 65
Sortear 3
64 67
70 57
65 72
70 60
 = 65,62 kg
Observe que há uma variação na
estatística média, e esta variação precisa
ser considerada quando são realizadas as
inferências sobre os parâmetros.
11
Distribuição amostral da média

Se forem retiradas várias amostras
aleatórias de n elementos da população.
 Calculadas as médias de todas as
amostras.
2
E( x )  


V( x ) 
n
Distribuição aproximada por uma normal.
12
Exemplo 1



Ver 2o exemplo, Unidade 8.
Suponha uma variável quantitativa cujos
valores constituem uma população com os
seguintes valores: (2, 3, 4, 5).
Retire todas as amostras aleatórias de 2
elementos
(com
reposição)
desta
população e observe a distribuição das
médias amostrais.
13
Exemplo 1



População: {2, 3, 4, 5}
Parâmetros:  = 3,5
Há 16 amostras de
reposição) possíveis:
(2, 2)
(2, 3)
(3, 2)
(3, 3)
(4,2)
(4, 3)
(5, 2)
(5, 3)
2 = 1,25
2 elementos (com
(2, 4)
(3, 4)
(4, 4)
(5, 4)
(2, 5)
(3, 5)
(4, 5)
(5, 5)
14
Exemplo 1
(2,0)
_ ( 2,5)

X
(3,0)

 (3,5)
56
x
 3,5
16
(2,5)
(3,0)
(3,5)
(4,0)
s
(3,0)
(3,5)
(4,0)
(4,5)
2
x
(3,5) 

(4,0)

(4,5) 
(5,0) 

1,25
 0,625 
2
15
Distribuição das médias  normal
16
Distribuição amostral da média


A distribuição amostral da média será
normal se a distribuição da variável na
população for normal.
A distribuição amostral da média será
normal, mesmo que a distribuição da
variável na população não seja, desde
que o tamanho de amostra seja
suficientemente grande.
17
Exemplo 2


Ver o 3º exemplo da Unidade 8.
Na figura a seguir temos a distribuição
populacional de uma variável quantitativa
qualquer de interesse. Ela apresenta
média populacional () igual a 416,99, e
variância populacional (2) igual a
89554,51264.
18
70
60
Frequency
50
40
30
20
10
0
0
200 400 600 800 1000 1200 1400 1600 1800
Dados 2
Distribuição NÃO normal!
19
Exemplo 2



Vamos retirar 40 amostras aleatórias, com
reposição, da população com os seguintes
tamanhos: 2, 4, 16 e 30 elementos.
Para cada amostra calcularemos a média.
As médias serão postas em um
histograma, e serão calculadas a média e
a variância das médias amostrais.
20
Frequency
20
  416,99
2
 44777,25632
n
10
0
0
250
500
750
1000
Médias amostras n =2
x  423,8875
s
2
x
 67528,98666
21
Frequency
20
  416,99
2
 22388,62816
n
10
0
200
350
500
650
800
Médias amostras n= 4
x  444,5375
s
2
x
 26464,3269
22
  416,99
Frequency
10
2
 5597,1577
n
5
0
260
320
380
440
500
Médias amostras n =16
x  394,4922
s
2
x
 5568,3945
23
70
  416,99
60
Frequency
50
2
 2985,1508
n
40
30
20
10
0
300
360
420
480
540
Médias amostras n=30
x  421,9217
s
2
x
 2945,1326
24
Distribuição amostral da proporção

Se forem retiradas várias amostras
aleatórias de n elementos da população.
 Calculadas as proporções de um atributo
em todas as amostras.
E ( p)  

  (1  )
V ( p) 
n
Distribuição aproximada por uma normal.
25
Exemplo 3



Veja o 4º exemplo da Unidade 8.
Pense em uma variável qualitativa que
pode assumir apenas dois valores, e que
constitui a seguinte população: (□□□□■). A
proporção populacional  = 1/5 = 0,2.
Retiram-se todas as amostras aleatórias
de 2 elementos (com reposição) possíveis
desta população.
26
Exemplo 3
Calcular proporção de ■ em cada amostra!
27
( 0)
( 0)
(0)
( 0)
( 0)
( 0)
(0)
( 0)
p  ( 0)
( 0)
(0)
( 0)
( 0)
( 0)
(0)
( 0)
(1 / 2) (1 / 2) (1 / 2) (1 / 2)
_
1
X  E ( p)   
5
(1 / 2)
(1 / 2)
(1 / 2)
(1 / 2)
(1)
1  1
   1  
5   5    (1  )

2
s  0,08 

2
n
28
Tô afim de saber

Sobre distribuição amostral:
 BARBETTA, P.A., REIS, M.M., BORNIA,
A.C. Estatística para Cursos de
Engenharia e Informática. 2ª ed.: São
Paulo: Atlas, 2008, capítulo 7.
 STEVENSON,
Willian J. Estatística
Aplicada à Administração. São Paulo:
Ed. Harbra, 2001, capítulo 7.
29
Para saber mais

Sobre a utilização do Microsoft Excel 
para estudar distribuições amostrais veja
LEVINE,
D.
M.,
STEPHAN,
D.,
KREHBIEL, T. C., BERENSON, M. L.
Estatística: Teoria e Aplicações - Usando
Microsoft Excel em Português. 5ª ed. –
Rio de Janeiro: LTC, 200, capítulo 5.
30
Próxima aula

Estimação de parâmetros
 Estimação por ponto, propriedades dos
estimadores, estimador de média e
proporção.
 Estimação por intervalo de média e de
proporção.
 Tamanho mínimo de amostra para
estimação.
31
Download