Testes de Hipóteses

Propaganda
Bioestatística -Testes de Hipóteses
Prof. Antonio Sales
Em Estatística temos alguns testes conhecidos como testes de
hipóteses. São testes utilizados para verificar se a hipótese nula é
verdadeira ou falsa, deve ser aceita ou rejeitada. Na realidade todo
pesquisador trabalha com duas hipóteses (a hipótese de
nulidade e a
hipótese alternativa), mas poderia trabalhar apenas com uma hipótese, a
hipótese de nulidade (Ho).
O que significa tudo isso?
Vamos dar um exemplo para facilitar a compreensão. Informamos que
os dados são fictícios e o problema proposto é apenas um exemplo.
Suponhamos que um pesquisador esteja analisando o consumo de
tereré em relação com o câncer do estômago. Sua hipótese de nulidade
(Ho) seria: não há relação entre o consumo de tereré e o câncer do
estômago.
Em seguida esse pesquisador irá trabalhar no sentido de confirmar ou
negar essa hipótese.
Se desejar pode estabelecer a hipótese alternativa (Ha): o uso do
tereré é um fator de câncer no estômago.
Um dos testes utilizados chama-se X2 que se lê “qui-quadrado”.
O TESTE DO “QUI-QUADRADO” (X2)
Este teste é recomendado para situações em que a variável não é
quantitativa, como no exemplo acima em que a variável pode ser
respondida com “sim” ou “não”, como se vê no quadro abaixo, e é uma
variável dicotômica.
O teste do “qui-quadrado” é dado pela seguinte fórmula:
X2 
(O  E ) 2
E
2
Sendo que “O” representa os valores observados no estudo e “E” os
valores esperados, se Ho for verdadeira
Vamos supor que esse pesquisador analisou o caso de 250 pessoas e
obteve os seguintes resultados:
Quadro de Valores Observados (O)
Consumo do Tereré Câncer no estômago
Presente Ausente
Sim
35
70
Não
40
105
Total
75
175
Total
105
145
250
Este quadro contém os valores observados (O),
mas precisamos
também de um quadro com os valores esperados e, para isso devemos
proceder alguns cálculos envolvendo produto (multiplicação) e divisão:
E1 
105.75 7875

 31,5
250
250
E2 
105.175 18375

 73,5
250
250
E3 
145.75 10875

 43,5
250
250
E4 
145.175 25375

 101,5
250
250
Quadro de Valores Esperados (E)
Consumo do Tereré Câncer no estômago
Presente Ausente
Sim
31,5
73,5
Não
43,5
101,5
Total
75
175
Total
105
145
250
3
Quadro de cálculos
O
E
O-E (O(O-E)2/E
E)2
35
31,5 3,5
12,25 12,25
 0,389
31,5
70
73,5
-3,5
12,25 12,25
40
43,5
-3,5
12,25 12,25
105
101,5 3,5
73,5
43,5
 0,167
 0,282
12,25 12,25
0
101,5
 0,121
X2 calculado=0,959
Finalmente para decidir se a hipótese nula deve ser aceita ou rejeitada
necessitamos determinar os graus de liberdade e o nível de confiança.
O parâmetro grau de liberdade é determinado pelo produto do número
de linhas, subtraído de uma unidade, pelo número de coluna, também
subtraído de um a unidade, (GL=(L-1)(C-1)). Como neste caso temos duas
linhas e duas colunas então GL=(2-1)(2-1)=1.1=1
O índice de confiança pode ser definido como 1% ou 5%. Vamos
trabalhar com =0,05, isto é, com nível de confiança de 5% o que significa
dizer que se a hipótese nula for rejeitada há apenas 5% de chance de que se
cometeu o erro em rejeitá-la, ou melhor, que temos apenas 5% de chances
de que não haja uma relação entre o consumo de tereré e o câncer do
estômago. No entanto, se a hipótese nula for aceita há apenas 5% de
chances de que o consumo de tereré
tenha relação com o câncer do
estômago.
Por último, precisamos conhecer o valor ou ponto crítico que se
encontra tabelado. Se o “qui-quadrado” for maior do que o valor desse
ponto crítico então a hipótese nula deverá ser rejeitada.
Vamos, portanto,
ao valor tabelado. Encontramos X2=3,84 ( ver
tabela no final). Como 0,959<3,84,a hipótese nula não pode ser rejeitada,
isto é, quando o valor encontrado for menor do que o valor crítico ou
tabelado, a hipótese nula é confirmada, caso contrário aceita-se a hipótese
4
alternativa. Neste caso diz-se que o uso de tereré não está relacionado com
o câncer do estômago, isto é, não é uma das causas do câncer.
Obs. Lembre-se que este é apenas uma exemplificação e que os dados
são fictícios.
Quando se aceita a hipótese nula está dizendo que as diferenças
observadas nas proporções são aleatórias.
Observe que este problema é considerado de dois critérios porque
levou em conta o paciente ter ou não ter câncer
Em resumo: o quadro do “qui-quadrado” pode ser expresso da
seguinte forma:
Valores observados
Consumo do Tereré Câncer no estômago
Presente Ausente
Sim
a
b
Não
c
d
Total
a+c
b+d
Total
a+b
c+d
a+b+c+d
Valores esperados
Consumo do Tereré Câncer no estômago
Presente
Ausente
(a  b)(a  c)
(a  b)(b  d )
Sim
E=
E=
1
2
Não
(a  b  c  d )
(c  d )(a  c)
E3=
(a  b  c  d )
(a  b  c  d )
(c  d )(b  d )
E4=
(a  b  c  d )
Total
E1+E3
E2+E4
Total
E1+E2
E3+E4
E1+E2+E3+E4
Os valores da última linha e da última coluna são chamados valores
marginais.
A linha marginal é composta pelas células: a+c, b+d e a+b+ c+d ,
na tabela de valores observados,
ou E1+E3, E2+E4
E1+E2 + E3+E4, na
tabela dos valores esperados.
A coluna marginal é composta pelas células: a+b, c+d e a+b+c+d, na
tabela de valores observados, ou E1+E2, E3+E4 e E1+E2+E3+E4 , na tabela
dos valores esperados.
5
Conforme já foi visto usou-se o “qui-quadrado” a dois critérios. Se o
pesquisador tivesse considerado apenas pessoas portadoras de câncer no
estômago, o qui-quadro seria de um critério. Vejamos um caso, também
fictício:
O pesquisador analisou 26 pacientes com câncer no estômago, dentre
os quais 16 tomavam tereré. Tem-se então o quadro:
Valores observados
Consumo do Tereré Câncer no estômago
sim
16
não
10
26
Valores esperados (
26
)
2
Consumo do Tereré Câncer no estômago
sim
13
não
13
26
Tabela de cálculos
O E O-E (O-E)2 (O-E)2/E
16 13 3
9
0,7
9 13 -3
9
0,7
X2 calculado=1,4
GL=(L-1)=(2-1)=1
Consultando tabela do X2 temos que para GL=1 e =0,05, X2=3,84
Sendo X2 calculado < X2 crítico ou tabelado, a hipótese nula não pode
ser rejeitada.
O teste do “qui-quadrado” não está limitado a tabelas 2x2. Ele pode
ser aplicado tabelas de ordem 2x3, 3x3, 5x6, etc.
6
Outros exemplos (os dois primeiros com dados fictícios e o terceiro
com dados alterados):
1. Suponha que das 500 crianças habitantes de uma região 150 tenham
sido vacinadas e, destas, 10 adoeceram. Das 350 não vacinadas 50
adoeceram. Determine o “qui-quadrado” para =0,01 e verifique se
hipótese de que a vacina não protege contra a doença deve ser rejeitada.
2. Considere agora este caso em que s e analisa uma anomalia e sua
relação com o sexo.
Sexo
Masculino
Feminino
Total
Anomalia X
Presente Ausente
97
3
10
70
107
73
Total
100
80
180
Verifique se a anomalia está associada ao sexo.
3. Foram entrevistadas 35 mulheres. 22 planejaram a gravidez e,
destas, 18 desmamaram o filho precocemente. Das treze restantes apenas
10 fizeram o desmame precoce. Verifique se há uma relação entre a
gravidez planejada e o desmame precoce.
No entanto para que seja apropriado utilizar o “qui-quadrado” é
necessário que os dados apresentem as seguintes características:
1.
Terem sido tomados aleatoriamente
2.
As frequências não serem muito pequenas. Recomenda-se que
nenhuma frequência deve ser menor do que 5. Se os problemas tiverem
muitos critérios e um deles for menor do que 5, normalmente, junta se duas
colunas para que esta exigência seja satisfeita.
Bibliografia
LEVIN, Jack; FOX, James Alan. Estatística para ciências humanas.
9.ed. São Paulo: Prentice-Hall, 2004.
VIEIRA, Sonia. Estatística Experimental. 2.ed. São Paulo: Atlas, 1999.
7
Valores de X2, segundo os graus de liberdade.
e o valor de a ( se o problema tiver mas de 30 critérios considera-se
com tendo distribuição normal e se aplica outros testes)

Graus de Liberdade
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
10%
2,71
4,60
6,25
7,78
9,24
10,64
12,02
13,36
14,68
15,99
17,28
18,55
19,81
21,06
22,31
23,54
24,77
25,99
27,20
28,41
29,62
30,81
32,01
33,20
34,38
35,56
36,74
37,92
39,09
40,26
5%
3,84
5,99
7,82
9,49
11,07
12,59
14,07
15,51
16,92
18,31
19,68
21,03
22,36
23,68
25,00
26,30
27,59
28,87
30,14
31,41
32,67
33,92
35,17
36,42
37,65
38,88
40,11
41,34
42,56
43,77
1%
6,64
9,21
11,34
. 13,28
15,09
16,81
18,48
20,09
21,67
23,21
24,72
26,22
27,69
29,14
30,58
32,00
33,41
34,80
36,19
37,57
38,93
40,29
41,64
42,98
44,31
45,64
46,96
48,28
49,59
50,89
8
Download