Bioestatística -Testes de Hipóteses Prof. Antonio Sales Em Estatística temos alguns testes conhecidos como testes de hipóteses. São testes utilizados para verificar se a hipótese nula é verdadeira ou falsa, deve ser aceita ou rejeitada. Na realidade todo pesquisador trabalha com duas hipóteses (a hipótese de nulidade e a hipótese alternativa), mas poderia trabalhar apenas com uma hipótese, a hipótese de nulidade (Ho). O que significa tudo isso? Vamos dar um exemplo para facilitar a compreensão. Informamos que os dados são fictícios e o problema proposto é apenas um exemplo. Suponhamos que um pesquisador esteja analisando o consumo de tereré em relação com o câncer do estômago. Sua hipótese de nulidade (Ho) seria: não há relação entre o consumo de tereré e o câncer do estômago. Em seguida esse pesquisador irá trabalhar no sentido de confirmar ou negar essa hipótese. Se desejar pode estabelecer a hipótese alternativa (Ha): o uso do tereré é um fator de câncer no estômago. Um dos testes utilizados chama-se X2 que se lê “qui-quadrado”. O TESTE DO “QUI-QUADRADO” (X2) Este teste é recomendado para situações em que a variável não é quantitativa, como no exemplo acima em que a variável pode ser respondida com “sim” ou “não”, como se vê no quadro abaixo, e é uma variável dicotômica. O teste do “qui-quadrado” é dado pela seguinte fórmula: X2 (O E ) 2 E 2 Sendo que “O” representa os valores observados no estudo e “E” os valores esperados, se Ho for verdadeira Vamos supor que esse pesquisador analisou o caso de 250 pessoas e obteve os seguintes resultados: Quadro de Valores Observados (O) Consumo do Tereré Câncer no estômago Presente Ausente Sim 35 70 Não 40 105 Total 75 175 Total 105 145 250 Este quadro contém os valores observados (O), mas precisamos também de um quadro com os valores esperados e, para isso devemos proceder alguns cálculos envolvendo produto (multiplicação) e divisão: E1 105.75 7875 31,5 250 250 E2 105.175 18375 73,5 250 250 E3 145.75 10875 43,5 250 250 E4 145.175 25375 101,5 250 250 Quadro de Valores Esperados (E) Consumo do Tereré Câncer no estômago Presente Ausente Sim 31,5 73,5 Não 43,5 101,5 Total 75 175 Total 105 145 250 3 Quadro de cálculos O E O-E (O(O-E)2/E E)2 35 31,5 3,5 12,25 12,25 0,389 31,5 70 73,5 -3,5 12,25 12,25 40 43,5 -3,5 12,25 12,25 105 101,5 3,5 73,5 43,5 0,167 0,282 12,25 12,25 0 101,5 0,121 X2 calculado=0,959 Finalmente para decidir se a hipótese nula deve ser aceita ou rejeitada necessitamos determinar os graus de liberdade e o nível de confiança. O parâmetro grau de liberdade é determinado pelo produto do número de linhas, subtraído de uma unidade, pelo número de coluna, também subtraído de um a unidade, (GL=(L-1)(C-1)). Como neste caso temos duas linhas e duas colunas então GL=(2-1)(2-1)=1.1=1 O índice de confiança pode ser definido como 1% ou 5%. Vamos trabalhar com =0,05, isto é, com nível de confiança de 5% o que significa dizer que se a hipótese nula for rejeitada há apenas 5% de chance de que se cometeu o erro em rejeitá-la, ou melhor, que temos apenas 5% de chances de que não haja uma relação entre o consumo de tereré e o câncer do estômago. No entanto, se a hipótese nula for aceita há apenas 5% de chances de que o consumo de tereré tenha relação com o câncer do estômago. Por último, precisamos conhecer o valor ou ponto crítico que se encontra tabelado. Se o “qui-quadrado” for maior do que o valor desse ponto crítico então a hipótese nula deverá ser rejeitada. Vamos, portanto, ao valor tabelado. Encontramos X2=3,84 ( ver tabela no final). Como 0,959<3,84,a hipótese nula não pode ser rejeitada, isto é, quando o valor encontrado for menor do que o valor crítico ou tabelado, a hipótese nula é confirmada, caso contrário aceita-se a hipótese 4 alternativa. Neste caso diz-se que o uso de tereré não está relacionado com o câncer do estômago, isto é, não é uma das causas do câncer. Obs. Lembre-se que este é apenas uma exemplificação e que os dados são fictícios. Quando se aceita a hipótese nula está dizendo que as diferenças observadas nas proporções são aleatórias. Observe que este problema é considerado de dois critérios porque levou em conta o paciente ter ou não ter câncer Em resumo: o quadro do “qui-quadrado” pode ser expresso da seguinte forma: Valores observados Consumo do Tereré Câncer no estômago Presente Ausente Sim a b Não c d Total a+c b+d Total a+b c+d a+b+c+d Valores esperados Consumo do Tereré Câncer no estômago Presente Ausente (a b)(a c) (a b)(b d ) Sim E= E= 1 2 Não (a b c d ) (c d )(a c) E3= (a b c d ) (a b c d ) (c d )(b d ) E4= (a b c d ) Total E1+E3 E2+E4 Total E1+E2 E3+E4 E1+E2+E3+E4 Os valores da última linha e da última coluna são chamados valores marginais. A linha marginal é composta pelas células: a+c, b+d e a+b+ c+d , na tabela de valores observados, ou E1+E3, E2+E4 E1+E2 + E3+E4, na tabela dos valores esperados. A coluna marginal é composta pelas células: a+b, c+d e a+b+c+d, na tabela de valores observados, ou E1+E2, E3+E4 e E1+E2+E3+E4 , na tabela dos valores esperados. 5 Conforme já foi visto usou-se o “qui-quadrado” a dois critérios. Se o pesquisador tivesse considerado apenas pessoas portadoras de câncer no estômago, o qui-quadro seria de um critério. Vejamos um caso, também fictício: O pesquisador analisou 26 pacientes com câncer no estômago, dentre os quais 16 tomavam tereré. Tem-se então o quadro: Valores observados Consumo do Tereré Câncer no estômago sim 16 não 10 26 Valores esperados ( 26 ) 2 Consumo do Tereré Câncer no estômago sim 13 não 13 26 Tabela de cálculos O E O-E (O-E)2 (O-E)2/E 16 13 3 9 0,7 9 13 -3 9 0,7 X2 calculado=1,4 GL=(L-1)=(2-1)=1 Consultando tabela do X2 temos que para GL=1 e =0,05, X2=3,84 Sendo X2 calculado < X2 crítico ou tabelado, a hipótese nula não pode ser rejeitada. O teste do “qui-quadrado” não está limitado a tabelas 2x2. Ele pode ser aplicado tabelas de ordem 2x3, 3x3, 5x6, etc. 6 Outros exemplos (os dois primeiros com dados fictícios e o terceiro com dados alterados): 1. Suponha que das 500 crianças habitantes de uma região 150 tenham sido vacinadas e, destas, 10 adoeceram. Das 350 não vacinadas 50 adoeceram. Determine o “qui-quadrado” para =0,01 e verifique se hipótese de que a vacina não protege contra a doença deve ser rejeitada. 2. Considere agora este caso em que s e analisa uma anomalia e sua relação com o sexo. Sexo Masculino Feminino Total Anomalia X Presente Ausente 97 3 10 70 107 73 Total 100 80 180 Verifique se a anomalia está associada ao sexo. 3. Foram entrevistadas 35 mulheres. 22 planejaram a gravidez e, destas, 18 desmamaram o filho precocemente. Das treze restantes apenas 10 fizeram o desmame precoce. Verifique se há uma relação entre a gravidez planejada e o desmame precoce. No entanto para que seja apropriado utilizar o “qui-quadrado” é necessário que os dados apresentem as seguintes características: 1. Terem sido tomados aleatoriamente 2. As frequências não serem muito pequenas. Recomenda-se que nenhuma frequência deve ser menor do que 5. Se os problemas tiverem muitos critérios e um deles for menor do que 5, normalmente, junta se duas colunas para que esta exigência seja satisfeita. Bibliografia LEVIN, Jack; FOX, James Alan. Estatística para ciências humanas. 9.ed. São Paulo: Prentice-Hall, 2004. VIEIRA, Sonia. Estatística Experimental. 2.ed. São Paulo: Atlas, 1999. 7 Valores de X2, segundo os graus de liberdade. e o valor de a ( se o problema tiver mas de 30 critérios considera-se com tendo distribuição normal e se aplica outros testes) Graus de Liberdade 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 10% 2,71 4,60 6,25 7,78 9,24 10,64 12,02 13,36 14,68 15,99 17,28 18,55 19,81 21,06 22,31 23,54 24,77 25,99 27,20 28,41 29,62 30,81 32,01 33,20 34,38 35,56 36,74 37,92 39,09 40,26 5% 3,84 5,99 7,82 9,49 11,07 12,59 14,07 15,51 16,92 18,31 19,68 21,03 22,36 23,68 25,00 26,30 27,59 28,87 30,14 31,41 32,67 33,92 35,17 36,42 37,65 38,88 40,11 41,34 42,56 43,77 1% 6,64 9,21 11,34 . 13,28 15,09 16,81 18,48 20,09 21,67 23,21 24,72 26,22 27,69 29,14 30,58 32,00 33,41 34,80 36,19 37,57 38,93 40,29 41,64 42,98 44,31 45,64 46,96 48,28 49,59 50,89 8