Estatística Médica Júlia Tizue Fukushima Teste t para Amostras Pareadas Amostras pareadas são consideradas em planejamentos nos quais são realizadas duas medidas na mesma unidade amostral, ou seja, dados pareados, onde a unidade é o seu próprio controle. Este tipo de planejamento È utilizado quando se deseja determinar o nível de uma certa medida (pressão arterial, concentrações sangüíneas, etc) antes e depois de uma intervenção (dieta hiposódica, tratamento medicamentoso, etc.). Referimo-nos a observações pareadas também como amostras dependentes. O teste apropriado para a diferença entre médias de amostra pareadas consiste em determinar, primeiro, a diferença entre cada par de valores (tabela 1) e então testar se a médias das diferenças é igual a zero. Tabela 1. Estrutura dos dados de uma amostra pareada UNIDADE AMOSTRAL 1 2 . . n Média Desvio padrão 1ª MEDIDA (antes) x11 x21 . . xn1 x1 s1 2ª MEDIDA (depois) x12 x22 . . xn2 x2 s2 Diferença entre as medidas d1 d2 . . dn d sd Onde: n n xj x i 1 1j (x x 2 j x nj n i 1 e sj ij x j )2 n 1 , sendo j=1 para a 1ª medida e j=2 para a 2ª medida n d d i 1 n 1 d 2 d n n e sd (d i 1 i d )2 n 1 Considerando que as medidas tenham distribuição o normal, a diferença entre elas também terá distribuição normal, portanto as distribuições t são apropriadas para testar a hipótese nula de que a média das diferenças é igual a zero. Os graus de liberdade são o número de unidades amostrais menos 1 e a estatÌstica utilizada para testar a hipótese de que não existe diferença entre as condições antes e depois é: Se t n 11, / 2 ou t n 11, / 2 d sd / n rejeitamos a hipótese nula, ou seja, existe diferença significativa entre as condições antes e depois. Se t n 11, / 2 t n 11, / 2 não rejeitamos a hipótese nula, ou seja, a amostra não fornece evidência estatística de diferença entre as condições antes e depois. Os valores da distribuição t podem ser consultadas em tabela como a apresentada em Rosner (1995), os quais são apresentados segundo os graus de liberdade e diferentes percentuais (1-). Figura 1. Regiões de aceitação e rejeição da hipótese nula para o teste t para amostras pareadas. Distribuição t sob hipótese nula com n-1 graus de liberdade e nível de significância . região de aceitação t n 1,1 / 2 região de rejeição t n 11, / 2 t n 11, / 2 t n 11, / 2 região de rejeição Podemos observar na figura 1 as respectivas regiões de aceitação e rejeição da hipótese nula na distribuição t com n-1 graus de liberdade, onde a média desta distribuição é zero. Quanto maior a distância da estatística calculada em relação a média da distribuição (zero, sob hipótese nula), menor a probabilidade de significância (p), maior a evidência de diferença entre as condições antes e depois, a qual é determinada por: Se <0 então p= 2 x [área à esquerda de sob a distribuição t com n-1 graus de liberdade] >0 então p= 2 x [área à direita de sob a distribuição t com n-1 graus de liberdade] As observações pareadas são utilizadas em situações em que a unidade amostral é o seu próprio controle, diminuindo assim o efeito de variações individuais. É importante ressaltar que para uma mesma diferença hipotética de médias (antes e depois), desvio padrão, nível de significância () e poder do teste (1-); o tamanho amostral È menor nos desenhos de amostras pareadas, ou seja, é necessário um número menor de unidades para provar uma mesma diferença entre médias em relação a amostras independentes (dois grupos diferentes de pacientes). Tamanho da Amostra Amostras independentes n onde e 2 z 1- ( ) z1 z1 2 2 1 2 2 2 ( 2 1 ) 2 , para cada condição são, respectivamente, média e variância das populações que pretendemos coletar as amostras; é o valor da distribuição normal; é o nível de significância; é o poder do teste. Amostras pareadas n* onde d e d2 z1 z1 2 2 2 d ( d ) 2 são, respectivamente, média e variância da diferença entre as condições antes e depois da população que pretendemos coletar as amostras. Como d2 12 22 (Box, Hunter e Hunter, 1978), ent„o 2n > n*, ou seja, se considerarmos amostras independentes, será·necessário, no mínimo, o dobro do tamanho amostral, para uma mesma diferença entre condições. Referências 1. Rosner B. Fundamentals of Biostatistics, 4ª ed., New York, Duxbury Press, 1995 2. Box GEP, Hunter WG e Hunter JS. Statistics for Experimenters - An Introduction to design, data analysis, and model building, New York, John Wiley & Sons, 1978