Slide 1 - UFSCar

Propaganda
AULA12:
Inferência Estatística
Josemar Rodrigues
Estatística
2
3
Inferência Estatística é dividida em duas partes:
• Estimação dos parâmetros;
• Teste de hipóteses.
Definição: População é o conjunto de todos os elementos ou
resultados sob investigação
Definição: Uma amostra é um subconjunto
selecionadas a partir de uma população.
de
observações
Definição: As variáveis aleatórias X1 , X n são uma amostra
aleatória de tamanho n , se (a) os Xi’s forem variáveis
aleatórios independentes e (b) cada Xi tiver a mesma
distribuição de probabilidade.
4
Exemplo 1: Considera-se uma população com 5 elementos, que
correspondem aos seguintes valores da variável aleatória X:
{1,3,5,5,7}. Escolhemos todas as amostras possíveis de tamanho 2,
com reposição desta população.
Distribuição de probabilidade da variável aleatória X.
X
1
3
5
f(x)=P(X=x)
1/5
1/5
2/5
7
1/5
E(X)=1(1/5)+2(1/5)+5(2/5)+7(1/5)=21/5=4,2
Var(X)=2,08.
5
X 2 \ X1
1
3
5
7
1
(1,1)
(1,3)
(1,5)
(7,1)
3
(3,1)
(3,3)
(3,5)
(3,7)
5
(5,1)
(3,3)
(5,5)
(5,7)
X 2 \ X1
1
1/25
1
1/25
3
2/25
5
1/25
7
f X ( x1 ) 1/5
7
(7,1)
(7,3)
(7,1)
(7,7)
1
3
1/25
1/25
2/25
1/25
1/5
5
2/25
2/25
4/25
1/25
2/5
7
1/25
1/25
2/25
1/25
1/5
f X ( x2 )
2
1/5
1/5
2/5
1/5
1
Observação:
(i ) f X ( xi )  f X ( x), i  1,2;
i
(ii) f ( x1 , x2 )  f X ( x1 ) f X ( x1 ), ( x1 , x2 ).
1
1
6
Definição: Uma estatística é uma característica da amostra,
ou seja, uma estatística T é uma função de X1 , X n
As estatísticas mais comuns são:
n
X  1 / n X i , média da amostra,
i 1
n
S2 
X (1)
(Xi  X )
i 1
2
, Variância da amostra,
n 1
 min( X 1 , X n ), o menor valor da amostra,
X (n)  max( X 1 , X n ), o maior valor da amostra.
Definição: Uma parâmetro é uma medida usada para descrever uma
característica da população.
7
Denominação
Média
Mediana
Variância
Nª de elementos
Proporção
Função densidade
População
  E (X )
Md
V ar ( X )   2
N
p
f(x)
Amostra
X
Md
S2
n
p̂
Histograma
8
Distribuições amostrais
A distribuição de probabilidades de uma estatística é chamada de
distribuição amostral da estatística.
Exemplo 1: Considera-se uma população com 5 elementos, que
correspondem aos seguintes valores da variável aleatória X:
{1,3,5,5,7}. Escolhemos todas as amostras possíveis de tamanho 2,
com reposição desta população.
Distribuição de probabilidade da variável aleatória X.
X
1
3
5
f(x)=P(X=x)
1/5
1/5
2/5
7
1/5
E(X)=4,2
Var(X)=2,08.
Determine a distribuição da média amostral.
9
Amostra
(1,1)
(1,3) (3,1)
(1,5) (5,1) (3,3)
(3,5) (1,7) (5,3) (7,1)
(5,5) (3,7) (7,3)
(5,7) (7,5)
(7,7)
X 
X1  X 2
2
Probabilidade
1
2
3
4
5
6
7
1/25
2/25
5/25
6/25
6/25
4/25
1/25
Distribuição de probabilidade da variável aleatória X.
1
2
3
4
5
6
x
f (x )
1/25 2/25 5/25
6/25
6/25
4/25
7
1/25
E ( X )  4,2; Var ( X )  2,08  4,16 / 2
10
Resultado 4 (Teorema Central do Limite)
Sejam X1 , X n uma amostra aleatória de tamanho n retirada de
uma população com média  e variância  2 finita. Então a
média amostral X , tem distribuição normal com média  e
variância  2 / n , para n suficientemente grande. Isto é,
X 
Z
/ n
~
aproximadamente
N (0,1), para n grande.
Observação:
(i ) X
~
aproximadamente
 2
N  ,
;
n 

n
(ii)  X i
i 1
~
aproximadamente
N n , n 2 
11
12
Exemplo (Aproximação da distribuição Binomial pela Normal)
Sejam X1 , X n uma amostra aleatória de tamanho n retirada de
uma população Bernoulli com parâmetro p (0<p<1). Então,
n y
Y   X i ~ Binomial (n, p),  f ( y )    p (1  p) n  y , y  0,1,, n.
i
 y
n
13
Distribuição Binomial com parâmetros n=10 e p
4
6
8
0
6
p=0,8
4
6
x
8
8
0.00
0.20
p=0,5
0.15
2
4
x
0.00
0
2
x
P(X=x)
2
0.00
P(X=x)
0.2
0.0
P(X=x)
P(X=x)
0
0.20
p=0,3
0.4
p=0,1
0
2
4
6
8
x
14
Distribuição Binomial com parâmetros n=20 e p
5
0.15
0
5
10 15 20
x
p=0,5
p=0,8
10 15 20
x
0.15
x
0.00 0.10
0
0.00
10 15 20
0.00
5
P(X=x)
0
P(X=x)
p=0,3
P(X=x)
0.20
0.00
P(X=x)
p=0,1
0
5
10 15 20
x
15
Distribuição Binomial com parâmetros n=30 e p
20
0.10
30
0
10
20
x
p=0,5
p=0,8
20
x
30
0.00
P(X=x)
10
30
0.15
x
0.00
0
0.00
P(X=x)
0.15
10
0.10
0
P(X=x)
p=0,3
0.00
P(X=x)
p=0,1
0
10
20
30
x
16
Exemplo: Sabe-se que 25% das crianças expostas a um particular
agente infeccioso adquirem uma certa doença. Considere um grupo de
100 crianças com igual exposição ao agente infeccioso. Determinar a
probabilidade de no mínimo 15 e no máximo 30 crianças adoeçam.
Solução:Seja a v.a. Y: número de crianças que adoecem dentre as 100 crianças
expostas. Então, Y~B(100;0,25).
100 
x
100  x
 0,25 0,75 , y  0,1,,100
f ( y)   y 

0,
c.c
P(15  Y  30)  f (15)  f (16)   f (30)  0,848
17
Pelo Teorema Central do Limite temos:
n
Y   Xi
i 1
~
aproximadamente
N np, np(1  p)   N (25;18,75)
 15  25 Y - 25 30  25 
P(15  Y  30)  P



18,75
18,75 
 18,75
 P- 2,31  Z  1,15   (1,15)   (2,31)
 0,874928 - 0,01044408  0,864484
18
Download