AULA 1 - ICEB-UFOP

Propaganda
Inferência Estatística:
Amostragem
Estatística
Cálculo de
Descritiva
Probabilidade
Inferência
Estatística
Estimação
Pontual
Por Intervalo
Teste de Hipótese
Conceitos básicos
 Estimação
É um processo que consiste em avaliar os parâmetros de
uma distribuição de estimadores obtidos em uma
amostral.
 Parâmetro
As quantidade da população, em geral, desconhecidas e
sobre as quais temos interesse, e usualmente
representadas por letras gregas tais como , ,  e ,
entre outras.
 Estimativa
Valor numérico de um estimador.
Prof.
Propriedades de um Estimador
1. Não - Viciado
O valor esperado coincide com o valor que ele estima.
2. Consistência
Um estimador
E (ˆ )  
̂
de um parâmetro  é consistente se:
E (ˆ )  
3. Eficiência
e
lim Var ( ˆ )  0
n 
Um estimador é dito ser eficiente, quando gera a menor
dispersão possível.
4. Suficiente
Se contém o máximo possível de informação com
referência ao parâmetro por ele estimado.
Prof.
são usados para
descrever a
Parâmetros
,,p
População
X1, X2, X3, ..., XN
São usadas
para estimar
O pesquisador
seleciona uma
Estimativas:
7,0; 1,2; 80%
Amostra:
X10, X21, ...,
Xn
As estatísticas
geram
A amostra
gera
Dados
7,0; 5,8; 6,4; ...
Os dados são
processados por
Estatísticas ou
estimadores:
X, s, p
Distribuições Amostrais
Definição: Uma distribuição amostral é uma distribuição
de freqüência ou distribuição de probabilidade de uma
estatística da amostra que é formada quando amostras de
tamanho n são repetidamente colhidas de uma população.
- Se a estatística da amostra for a média amostral, resultará
em uma distribuição amostral das médias amostrais;
- Se for a variância, resultará em uma distribuição amostral
das variâncias amostrais.
- Se for a proporção de itens com cada característica, será a
distribuição amostral das proporções amostrais.
Prof.
Exemplo 1: 8 amostras aleatórias de 10 elementos
Amostra
Valores
x
~
x x(1)
1 -1
0
-2
2
-0,10
0
-3
2
0
2
0
1
1
0,80
1
-1
-2
-1
1
2
1
-1 -1
0,00
-1
-2
2
-1
-3
0
1
-5
1 -3
-0,90 -0,5
-5
1
0
1
0
-2
1
-2
1 -2
-0,40
0
-2
-1 -1
0
1
3
-2 -1
-4
2 -1
-0,40
-1
-4
1
1
1
0
0
-3
2
2
1 -1
0
3
-1
4 -2
4
-1
0
5
-2
6
7
1
1 -1
1
0
0 -5
1
0
1
-0,10
0,5
-5
8
0
1
0
3
1
0
3 -2
0,80
0,5
-2
0
2
~
x é a média amostral, x
Em que
x(1) é o mínimo amostral.
é a mediana amostral e
Prof.
Exemplo 2: Um jogo consiste em lançar uma moeda 3 vezes.
Para cada lançamento:
Se cair cara você ganha 1 ponto
Caso saia coroa, você perde um ponto
- Determine as distribuições de probabilidade dos
estimadores x e S2.
Solução: Em uma população podemos assumir os valores
–1 e 1, com probabilidades iguais.
c= cara e k=coroa, 23=8 lançamentos.
(
), (
), (
),
(
), (
), (
).
(
), (
),
(X1,X2,
X3)
Probabilidade
X
S2
(-1,-1,-1)
1/8
-1
0
(-1,-1,1)
1/8
-1/3
4/3
(-1,1,-1)
1/8
-1/3
4/3
(-1,1,1)
1/8
1/3
4/3
(1,-1,-1)
1/8
-1/3
4/3
(1,-1,1)
1/8
1/3
4/3
(1,1,-1)
1/8
1/3
4/3
(1,1,1)
1/8
1
0
Baseando-se na tabela acima, podemos construir as
distribuições dos estimadores, dada por:
X
-1
-1/3
1/3
1
pi
1/8
3/8
3/8
1/8
E ( X )  1*
S2
0
4/3
pi
2/8
6/8
1  1 1 1 1
1
    *  *  1*  0
8  3 8 3 8
8
E (S 2 )  0 *
2 4 6
 * 1
8 3 8
Estimação Pontual
Definição: As estimativas são ditas pontuais quando
apontam para um único valor.
Tabela: Estimadores para Média, Variância e Proporção
Parâmetro Estimador Estimativa por ponto

X
X  27 anos
2
S2
S 2  10 anos

S
s  3,16 anos
P
p
pˆ  0,3
Prof.
Teorema Central do Limite
1. Quando a população é normal N(;), a média amostral X
de amostras de tamanho n tem distribuição N  ; n


2. Para uma pop. Não-normal com média  e d.p. , a
distribuição da média amostral X para amostras de
tamanho n suficientemente grande é aproximadamente
normal com média  e desvio padrão  n , isto é:
X 

~ N (0,1)
n
Prof.
Teorema Central do Limite
Prof.
Exemplo 3: Coleta-se uma amostra de 10
observações independentes de uma N(2;2).
Determine a probabilidade de a média amostral:
a) Ser inferior a 1.
Solução:
  2;  2  2 e n  10


 X 
1 2 
P( X  1)  P

  P( Z  2,23)  0,0125

1
,
42


n
10 

Portanto, a probabilidade de a média amostral ser
inferior a 1 é de 0,0125.
b) Ser Superior a 2,5.


 X 
2,5  2 
P( X  2,5)  P

  1  P( Z  1,11)  0,1314
1,42


n
10 

Prof.
Exemplo 4: O gráfico enumera os
períodos de tempos que os adultos
gastam lendo jornais. Selecione ao
acaso 50 adultos com idade entre 18
e 24 anos. Qual é a probabilidade de
que o tempo médio gasto por eles
lendo jornal esteja entre 8,7 e 9,5
minutos? Suponha  = 1,5 minutos.
Solução:
Como n >30, então pelo TCL a distribuição de médias das
amostras é aproximadamente normal N  ; n
X    9

1,5
X 

 0,2121
n
50



 8,7  9
X 
9,5  9 
P (8,7  X  9,5)  P



1
,
5

1
,
5


n
50
50


 P(1,41  Z  2,36)

Continuação,
P(8,7  X  9,5)  P( Z  2,36)  P( Z  1,41)
 0,9909  0,0793
 0,9116.
Então, a probabilidade de que o tempo médio
gasto pelos 50 adultos lendo jornal esteja
entre 8,7 e 9,5 minutos é 0,9116.
Assim, 91,16% das amostras de 50 adultos com idade entre 18 e 24
anos apresentarão uma média situada entre 8,7 e 9,5 minutos. Isso
significa que, assumindo que o valor =9 esteja correto, somente
8,84% de médias das amostras estarão fora do intervalo dado.
Dica de estudo
1. Para obter as probabilidades de membros individuais
de uma população com uma variável aleatória x,
distribuída normalmente, use a fórmula:
z
X 

2. Para obter probabilidade para a média X de uma
amostra de tamanho n, use a fórmula:
z
X  x
x
onde,  X 

n
Prof.
Estimação Intervalar
Definição: Uma estimativa intervalar é um intervalo de
valores usados para estimar um parâmetro populacional.
Definição: O Nível de Confiança  é a probabilidade de
que o intervalo estimado contenha o parâmetro
populacional.
Intervalo de Confiança para a média
populacional ()
 IC 100(1   )% para a média populacional, onde a é
População Normal e desvio-padrão é conhecido (), temos:


 
; X  z *
Fórmula:  X  z *
  1
n
n
2
2

 IC 100(1   )% para a média populacional, onde a é População
Normal e desvio-padrão é desconhecido (), temos:
s
s 

Fórmula:
 X  t 2;n1 * n ; X  t 2;n1 * n   1  


Dica: IC para pequenas mostras. Usa a
distribuição t, quando n<30
Intervalo de Confiança para a média
populacional ()
 População Não-Normal. Grande Amostras,
Fórmula:
pg 146, Chico
s
s 

 X  z 2 * n ; X  z 2 * n   1  


Exercício 1, Cap 9: Uma amostra de 80 motoristas de
determinado estado indica que um automóvel roda, em
média, 22.000 km por ano, com d.p de 3.800 km. Construa
um intervalo de confiança de 98% de confiança para a
rodagem anual média dos carros.
Solução: n  80, (amostra grande)
x  2000km ,   3800 km (d . p populac. conhecido )
1    0,98    0,02
0,02
z 
 0,01  Procura 0,01 dentro da tabela e encontra o valor de
2
2,32 em módulo.
2


 
; X  z *
 X  z *
  1
n
n
2
2

3800
3800 

22000

2
,
32
*
;
22000

2
,
32
*
 21014,34 ; 22985,66


80
80 

Download