Decisões Estatísticas - epoli

Propaganda
Escola Politécnica de Pernambuco
Departamento de Ensino Básico
Capítulo 08
TESTES DE HIPÓTESES E
SIGNIFICÂNCIA
Prof. Sérgio Mário Lins Galdino
http://epoli.pbworks.com/
Agenda
Decisões Estatísticas;
Hipóteses Estatísticas;
Testes de Hipóteses e Significância;
Erros do Tipo I e do Tipo II;
Nível de Significância;
Testes que Envolvem a Distribuição Normal;
Agenda
Testes Unilaterais e Bilaterais;
Diferenças de Médias;
Desvio Padrão;
Erro Padrão;
Testes para Diferença de Médias;
Relação entre a Teoria da Estimação e o Teste de
Hipóteses.
Decisões Estatísticas
São
decisões
tomadas
sobre
populações com base em amostras das
mesmas.
Hipóteses Estatísticas
Para tomar decisões é útil formular
hipóteses ou suposições sobre as populações em
estudo. Tais hipóteses chamam-se hipóteses
estatísticas e, em geral, consistem de afirmações
sobre as distribuições de probabilidade das
populações. Formulamos uma hipótese com o
propósito de aceitá-la ou rejeitá-la.
Testes de Hipóteses e Significância
Quando admitimos que uma determinada hipótese é
verdadeira e obtermos um resultado que difere
substancialmente do resultado esperado, dizemos que as
diferenças observadas são significativas.
Os processos que nos permitem decidir entre aceitar
ou rejeitar uma hipótese ou determinar se as amostras
observadas diferem significativamente dos resultados
esperados, são chamados de testes de hipóteses, testes de
significância ou regras de decisão.
Erros do Tipo I e do Tipo II
Se rejeitamos uma hipótese quando ela
deveria ser aceita, dizemos que foi cometido um
erro do tipo I. Se, por outro lado, aceitamos uma
hipótese quando ela deveria ser rejeitada,
cometemos um erro do tipo II. Em qualquer dos
casos ocorre um erro de julgamento.
Nível de Significância
O nível de significância representa a
probabilidade de erro na rejeição de uma
hipótese, ou seja, a probabilidade de um
erro do tipo I.
Região crítica: aceitação ou
rejeição da hipótese
O conjunto de valores dos extremos da
estatística S exteriores ao intervalo obtido constitui o
que se chama região crítica, região de rejeição da
hipótese ou ainda região de significância. E o conjunto
de valores extremos da estatística S interiores ao
intervalo obtido pode então ser chamado de região de
aceitação da hipótese ou região de não-significância.
Testes que Envolvem a Distribuição
Normal
Suponha que sob a hipótese dada, a
distribuição de amostragem de uma estatística S é uma
distribuição normal com médias µS e desvio padrão σS.
A distribuição desse padrão variável Z = (S - µS) / σS é
a distribuição normal padrão (média 0, variância 1), e
os valores extremos de Z determinam à rejeição da
hipótese.
Testes que Envolvem a Distribuição
Normal
Como indicado na figura, podemos estar 95% confiantes
de que, se a hipótese for verdadeira, o escore z de uma
amostra estatística S real estará entre - 1,96 a 1,96 (pois
a área sob a curva normal entre esses dois valores é
0,95).
Testes Unilaterais e Bilaterais
Os testes são chamados bilaterais quando há
interesse nos dois valores extremos da estatística S,
ou seja, em seus escores z em ambos os lados da
média.
Já os testes unilaterais ocorrem quando há
interesse em apenas um dos valores extremos de um
ou de outro lado da média.
A tabela abaixo mostra os valores críticos de z
tanto para os testes unilaterais como para testes
bilaterais, a vários níveis de significância.
Valores críticos de z
Valores críticos de z para os testes unilaterais e para testes
bilaterais, a vários níveis de significância.
Nível de Significância 
0.10
0.05
0.01
0.005
Valores Críticos de z para testes
unilaterais
-1.28
ou 1.28
-1.645
ou 1.645
-2.33
ou 2.33
-2.58
ou 2.58
Valores Críticos de z para testes
bilaterais
-1.645
ou 1.645
-1.96
ou 1.96
-2.58
ou 2.58
-2.81
ou 2.81
Diferenças de Médias
Comparação das médias de populações através da
estimação das diferenças de médias e intervalo de
confiança para esta diferença.
Sejam:
x1 , S1 , n1 e x2 , S2 , n2
a média, o desvio padrão e o tamanho amostral da
1ª e 2ª população respectivamente.
A estimativa da diferença entre médias ( 1  2 ) é
dada por ( x1  x2 ), sendo necessário determinar um
erro padrão para esta estimativa.
Desvio Padrão e Erro Padrão
Define-se o desvio padrão combinado como sendo:
DP 
n1S12  n2 S 22
n1  n2  2
E, a partir desse valor, define-se o erro padrão das
diferenças nas médias como:
EP  DP
1
1

n1
n2
Teste para Diferença de Médias
Um teste de hipótese para a diferença entre
médias é
H 0 : 1  2  0
assim como  1   2  0
Usa-se a variável:
( x1  x2 )
t
EP
distribuição t-Student com   n1  n2  2
liberdade (pequenas amostras).
graus de
Exemplo
Sejam as amostras das alturas de um grupo de estudantes
com valores de média, desvio padrão e tamanho da amostra.
Os valores com índice 1 referem-se aos homens e os com
índice 2, às mulheres. As alturas estão medidas em
centímetros.
x1  178.85, S1  7.734, n1  20
x2  164.09, S 2  9.750, n2  17
Exemplo (continuação)
Temos que:
DP 
n1 S12  n2 S 22
n1  n2  2
20.(7,734) 2  17.(9,75) 2
DP 
20  17  2
DP  8,964
EP  DP
1
1

n1
n2
EP  8,964.
EP  2,956
1
1

20 17
Exemplo (continuação)
x1  x2
t
SE
178,85  164,09
t
2,956
t  4,993
Graus de Liberdade: 20+17-2 = 35
Probabilidade de exceder o valor crítico (unilateral)
 0.10
1. 3.078
0.05
0.025 0.01
0.005
0.001
6.314 12.706 31.821 63.657 318.313
35. 1.306 1.690
2.030 2.438
2.724
3.340
Conclui-se que: temos que rejeitar a hipótese = Afirma-se que as
médias são diferente no nível 0.05 (t > 2.724)
Tabela t-Student
Graus de
Liberdade
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
80%
90%
95%
99%
3.078
6.314
12.706
63.657
1.886
2.920
4.303
9.925
1.638
2.353
3.182
5.841
1.533
2.132
2.776
4.604
1.476
2.015
2.571
4.032
1.440
1.943
2.447
3.707
1.415
1.895
2.365
3.500
1.397
1.860
2.306
3.355
1.383
1.833
2.262
3.250
1.372
1.812
2.228
3.169
1.363
1.796
2.201
3.106
1.356
1.782
2.179
3.055
1.350
1.771
2.160
3.012
1.345
1.761
2.145
2.977
1.341
1.753
2.131
2.947
df
infinity
Graus de
80%
Liiberdade
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
90%
95%
99%
1.337
1.746
2.120
2.921
1.333
1.740
2.110
2.898
1.330
1.734
2.101
2.878
1.328
1.729
2.093
2.861
1.325
1.725
2.086
2.845
1.323
1.721
2.080
2.831
1.321
1.717
2.074
2.819
1.319
1.714
2.069
2.807
1.318
1.711
2.064
2.797
1.316
1.708
2.060
2.787
1.315
1.706
2.056
2.779
1.314
1.703
2.052
2.771
1.313
1.701
2.048
2.763
1.311
1.699
2.045
2.756
1.310
1.697
2.042
2.750
80%
90%
95%
99%
1.282
1.645
1.96
2.576
Tabela t-Student
Relação entre a Teoria da Estimação
e o Teste de Hipóteses
Relação entre a Teoria da Estimação e o Teste de Hipóteses
1,96
1,96
x
x
n
n
Pode-se notar que existe uma relação entre a teoria da
estimação envolvendo intervalos de confiança e a teoria dos
testes de hipóteses. Por exemplo, para aceitação de ao
nível de 0,05 é equivalente ao resultado que conduz ao
intervalo de confiança de 95 %
Download