Tipos de Estudos e Medidas de Risco em Epidemiologia Natalia Cristina Amancio de Souza and Airlane Pereira Alencar Estatística - IME-USP, Brasil [email protected] 1. Introdução O principal objetivo desse trabalho de iniciação científica é apresentar uma boa introdução aos principais conceitos de epidemiologia e medidas de associação entre a ocorrência de doenças e possíveis fatores de risco. A principal motivação desse trabalho é a relevância dessa introdução para pesquisadores que venham a trabalhar com áreas relacionadas à saúde pública, medicina, desenvolvimento de fármacos, etc. Em especial, os estatísticos têm uma importante responsabilidade nas análises realizadas nessas áreas e o domínio desses conceitos é fundamental. Nesse trabalho são apresentados e discutidos: o processo de desenvolvimento da doença, tipos de estudo, medidas de ocorrências de doenças como prevalência, incidência e taxas de risco (hazard rate) e quais medidas de associação entre um fator de risco de Estudos eda Medidas de Risco em Epidemiologia e Tipos a ocorrência doença podem ser utilizadas dependendo do tipo de estudo. Natalia Cristina Amâncio de Souza – Bacharelado em Estatística – IME-USP Orientadora: Airlane Pereira Alencar – Estatística – IME-USP 2. Processo de desenvolvimento da doença Um primeiro aspecto a ser levantado em Jewell Nesse trabalho são apresentados e discutidos: o processo de desenvolvimento da doença, tipos medidas de ocorrências doenças como prevalência,da (2003) [2] deé estudo, a compreensão do dedesenvolvimento incidência e taxas de risco (hazard rate) e quais medidas de associação entre um fator de doença, em seus como apresentado risco e a ocorrência da doençavários podem ser estágios, utilizadas dependendo do tipo de estudo. naProcesso Figura 1 e levantar a seguinte questão: Quais fade desenvolvimento da doença tores influenciam o desencadeamento das várias etaUm primeiro aspecto a ser levantado em Jewell (2003) é a compreensão do desenvolvimento da doença, em seus vários como apresentado na Figura 1 e pas do desenvolvimento daestágios, doença? levantar a seguinte questão: Quais fatores influenciam o desencadeamento das várias etapas do desenvolvimento da doença? Indução Doença começa Promoção Sintomas clínicos começam 3. Tipos de estudo A seguir, apresentamos uma classificação dos tipos de estudo devido à intervenção ou não do pesquisador. 1. Experimental O pesquisador pode manipular o fator de interesse mantendo outros fatores sob controle. Em ensaios clínicos, o principal fator de interesse, tipo de tratamento, está sob o controle do pesquisador, alocando pacientes aleatoriamente em cada tratamento. Outros fatores não são alterados, como sexo, idade, severidade da doença. 2. Quasi Experimental O principal objetivo desse trabalho de iniciação científica é apresentar uma boa introdução aos principais conceitos de epidemiologia e medidas de associação entre a ocorrência de doenças e possíveis fatores de risco. A principal motivação desse trabalho é a relevância dessa introdução para pesquisadores que venham a trabalhar com áreas relacionadas à saúde pública, medicina, desenvolvimento de fármacos, etc. Em especial, os estatísticos têm uma importante responsabilidade nas análises realizadas nessas áreas e o domínio desses conceitos é fundamental. Início do processo etiológico que são eventuais fatores de risco podem ser denominadas: variáveis explicativas, preditores, variáveis independentes, covariáveis ou variáveis de exposição. Para exemplificar as etapas do processo de desenvolvimento da doença, podemos entender o que pode acontecer até o diagnóstico de uma doença do coração. Fatores de risco para os 3 estágios podem ser: Dieta para Indução; Pressão Alta para Promoção e Idade e Sexo para Expressão. Expressão Diagnóstico da doença Nos estudos quasi experimentais, os grupos podem diferir com respeito ao nível do fator de risco de interesse, mas não são formados com alocação aleatória (ou do pesquisador). Um exemplo pode ser verificar que a taxa de óbito por câncer de próstata caíra 42% abaixo dos níveis esperados no estado de Tirol, da Áustria, único estado que oferece o teste PSA (prostate specific antigen) de graça. Os estudos ecológicos se encaixam nesse tipo de estudo por usarem dados secundários de bases de dados, como a de mortalidade (SIM-SVS). 3. Estudos observacionais Figura 1: Desenvolvimento da doença (Jewell, 2003) Em geral, para cada doença, o pesquisador busca verificar quais fatores podem estar Figura 1. Desenvolvimento da doença (Jewell, 2003) relacionados com o aparecimento dessa doença. As variáveis que são relacionadas a um maior risco de desenvolvimento de uma doença são usualmente denominadas fatores de risco para essa doença. Nas análises, as variáveis que são eventuais fatores de risco podem ser denominadas, variáveis explicativas, preditores, variáveis independentes, covariáveis ou variáveis de exposição. Em geral, para cada doença, o pesquisador busca verificar quais fatores podem estar relacionados com Para exemplificar as etapas do processo de desenvolvimento da doença, podemos o entender aparecimento dessa doença. As variáveis o que pode acontecer até o diagnóstico de uma doença do coração. que são Fatores de Risco para os 3 estágios: relacionadas a um maior risco de desenvolvimento • Dieta → Indução • Pressão Alta → Promoção de uma doença são usualmente denominadas fatores • Idade e sexo → Expressão de risco para essa doença. Nas análises, as variáveis Planejamento do estudo A seguir apresentamos uma classificação dos tipos de estudo devido à intervenção ou não do pesquisador. As variáveis não estão sob o controle do pesquisador ou com intervenção (como no quasi experimental). Um exemplo é o estudo sobre o tabagismo e fatores associados a ele no Rio Grande do Sul (Moreira et al. (1995) [5]) ou o estudo do efeito do consumo de café na incidência de câncer de pâncreas. Cada participante diz seu próprio nível de exposição, respondendo questionário. Uma outra classificação importante para os estudos é baseada no período em que os dados são coletados. Podemos dividir os estudos em: 1. Tranversais ou cross-section As informações nesses estudos são referentes a um só instante de tempo. Podem ser utilizadas informações passadas para cada unidade amostral, mas não há acompanhamento das informações durante um período de tempo. 2. Longitudinais Nesses estudos as unidades amostrais têm informações ao longo do tempo. As covariáveis podem ou não variar com o tempo. Por exemplo, sexo não varia com o tempo e estadio da doença pode ou não mudar ao longo do tempo. É importante mencionar que, quando citamos base, podemos ter, por exemplo, 100.000 habitantes como usualmente nas taxas de mortalidade e 1000 nascidos vivos para a mortalidade infantil. Nos dois primeiros exemplos temos proporções, visto que os indivíduos no numerador estão como parcela no denominador e o tempo não afeta os resultados. A terceira taxa define a população em risco em termos de pessoas ano e é uma estimativa da taxa média. A quarta taxa, anual, é também uma taxa aproximada. A rigor, nenhuma dessas quantidades deveria ser formalmente classificada como taxa. Em geral, o termo taxa é associado à variação, mudança ao longo do tempo. Como a velocidade é a variação do espaço em relação ao tempo (t). Assim, a taxa pode ser definida como: Os estudos longitudinais podem ser classificados como: 1. Retrospectivos Estudos que se baseiam em informações já ocorridas no passado, usando, tanto prontuários médicos, quanto coleta de dados sobre informações passadas, por exemplo, com questionários. 2. Prospectivos Estudos que a partir do início da pesquisa acompanham o paciente durante um período de tempo. Com tais acompanhamentos, é possível ter melhor controle de diversas variáveis. Mais adiante apresentaremos uma discussão sobre estudos de coorte que são prospectivos. Taxa = ∂y(t) ∂t y(t) . Poderíamos ter, por exemplo, 10 óbitos em um ano, mas só saberíamos se este valor é alto ou não, se olhássemos em relação à população. 5. Medidas de Ocorrência de Doenças Primeiramente devemos considerar que Prevalência e incidência são diferentes proporções da população com a doença em estudo em certos instantes de tempo. Por isso, podemos definir diferentes medidas do tempo, como por exemplo: 1. Idade; 2. Tempo de exposição a um específico fator de risco (por exemplo, quanto tempo fumando); 4. Medidas de Risco 3. Tempo do calendário (ex: ano 2007); Algumas taxas muito utilizadas (Selvin, 1996 [9]) são: Taxa de mort. fetal = Taxa = n. de óbitos fetais ób.fetais+ nascidos vivos eventos em um período pop. em risco no período base base Taxa de mortalidade (tábua de vida) = quantos morreram com idades em [xi , xi+1 ] base n. de anos vividos em [xi , xi+1 ] Taxa de mortalidade = n. de óbitos no ano base população no meio do ano 4. Tempo desde o diagnóstico. Considerando os 6 casos de doença ao longo do tempo em uma população de 100 pessoas apresentados na Figura 2 (Jewell, 2003, [2]), definimos, com exemplos, as medidas Prevalência e Incidência. Prevalência pontual de uma doença é a proporção de indivíduos de uma população definida, em risco para uma doença, que é afetada pela doença em certo tempo. No exemplo, a prevalência pontual é 4/100 se o caso 4 está em risco e 4/99, caso contrário. Prevalência no intervalo de tempo é a proporção da população em risco afetada pela doença em algum ponto do intervalo. No exemplo, a Prevalência em [t0 , t1 ] é 6/100. 1. Idade 2. Tempo de exposição a um específico fator de risco (por exemplo, quanto tempo fumando). 3. Tempo do calendário (ex: ano 2007) 4. Tempo desde o diagnóstico com relação à exposição a fatores de risco. Os controles devem ser semelhantes aos casos para variáveis que não sejam fatores de risco, como, por exemCaso 5 plo, para sexo e idade. Se os casos tiverem maior Caso 4 exposição a certos fatores, identificam-se os fatores Caso 3 de risco. Idealmente, os casos devem ser todos os Caso 2 que ocorreram durante um período de tempo numa população definida (Soares e Siqueira, 1999 [10]). Caso 1 O tempo gasto e os custos associados são relativamente pequenos, já que, em geral, são estudos retrost0 t t1 pectivos. Nos estudos de Coorte, identifica-se um grupo Figura 2: 6 casos de doença umadepopulação 100população pessoas (Jewell, Figura 2. 6em casos doença emdeuma de 100 2003). exposto ao fator e o grupo controle, constituído de pessoas (Jewell, 2003) pessoas que não foram expostas a ele. Os dois gruPrevalência pontual de uma doença= proporção de indivíduos de uma pos população são acompanhados por um período de tempo definida em risco para uma doença que é afetada pela doença em certo tempo. (prospectivo) e as taxas de incidência da doença Incidência é a proporção dos indivíduos em risco 4 são calculadas nos dois grupos. Se essas taxas se o caso 4 está em risco em t; Exemplo da Figura 2: Prevalência t= para a doença naem população no ,início de um intervalo 100 são significativamente diferentes nos dois grupos, o de tempo que se tornaram novos casos da doença pesquisador conclui que há associação entre doença e 4 antes do fim do intervalo. No, exemplo, incidência se o caso a4 não está em risco em t.As vantagens do estudo de coorte são o melo fator. no intervalo [t0 , t1 ] é 4/98. 99 hor controle de diversas variáveis explicativas e melUma outra medida importante em estudos da hor diagnóstico da doença, tendo informação sobre o área médica é a Probabilidade Sobrevivência, Prevalência no intervalo de tempo = proporção dade população em risco afetada pela tempo em que tal diagnóstico ocorreu. A comparaem estudos de pacientes com neopladoença em algum principalmente ponto do intervalo. bilidade dos dois grupos pode ser verificada no inicio sia e em estudos 6 atuariais. A função de sobrevivência Ex: Prevalência em [t . ,t ] = do estudo e identificadas as variáveis para as quais 0 1 simplesmente 100mede a probabilidade do paciente so- são necessários ajustes na análise dos dados (Soares e breviver até o tempo t, ou seja, vive um tempo maior Siqueira, 1999 [10]). A principal desvantagem desse do que t, denotada por S(t) = P (T > t), t ≥ 0. A ncidência tipo de estudo é o alto custo. função de sobrevivência apresenta as propriedades: Caso 6 Proporção dos indivíduos em risco para a doença na população no início de um (i) S(0) = 1; (ii) S(t) → 0, quando t → ∞; (iii) S(t) ntervalo de tempo que se tornaram novos casos da doença antes do fim doTabela intervalo. 1. Freqüências observadas em estudos casoé função não crescente. Estar em risco quer dizer que está sujeito a desenvolver a doença (ex: mulheres e câncer controle ou coorte. Uma medida do risco em cada tempo é a função de próstata) de risco (hazard), h(t), definida por Doença ∂S(t) 1 h(t) = − , ∂t S(t) mede a "variação", em módulo, da queda da probabilidade de sobrevida no tempo t. A incidência no intervalo [0, t], I(t), mede a probabilidade P (T ≤ t), t ≥ 0, e podemos escrever a função de sobrevivência como h(t) = ∂I(t) 1 . ∂t (1 − I(t)) Uma completa apresentação de análise de sobrevivência pode ser encontrada em Klein e Moeschberger (2003) [3]. 6. Estudos Caso-Controle e de Coorte Estudo caso-controle é uma forma de pesquisa que visa estudar casos, indivíduos que apresentam a doença, e controles, indivíduos que não a têm, Presente Ausente Total Exposição ao Fator Presente Ausente a b c d a+c b+d Total a+b c+d N Podemos definir os eventos: D= Doente e E= Exposto e os eventos complementares e usar os dados da Tabela 1 para ilustrar o cálculo do Risco Relativo e Razão de Chances. No estudo de coorte é bastante natural pensar na razão entre as probabilidades de estar doente para expostos e não expostos, como medida do efeito de exposição ao fator. Esta razão recebe o nome de Risco Relativo, denotada por RR, e definida por RR = P (D|E) , P (D|E c ) com E c denotando o complementar do evento E. O risco relativo é, naturalmente, estimado pela razão das duas proporções amostrais: ˆ = RR a a+c b b+d razão de chances são respectivamente ˆ = RR . O risco relativo não pode ser estimado em estudos de caso-controle porque, neste tipo de estudo, as incidências observadas são meras conseqüências do número escolhido de casos e controles e não das características dos grupos em estudo (Soares e Siqueira, 1999 [10]). Por isso, buscaram-se maneiras alternativas para se definir o efeito da exposição de forma adequada a todos os grupos epidemiológicos. A solução encontrada foi o uso de uma medida denominada razão de chances. Define-se chance de se desenvolver a doença entre os expostos como P (D|E)/P (Dc |E) e entre os não expostos como P (D|E c )/P (Dc |E c ). A Razão das Chances (odds ratio), denotada por OR, é definida por OR = P (D|E) P (D|E c ) / . P (Dc |E) P (Dc |E c ) Para análise de tabelas 2x2, como a Tabela 1, a razão de chances pode ser estimada por ˆ = OR a a+c c a+c b / b+d = d b+d ad . bc Uma forma de convertermos a razão de chances em risco relativo é dada por RR = OR (1 − P0 ) + (P0 OR) em que P0 é a incidência da doença no grupo dos não expostos. 7. Exemplo para tabelas de contingência 2 × 2 Para ilustrar as medidas de risco, com suas interpretações, consideremos os dados de um estudo com 1000 fumantes e 1000 não fumantes, acompanhados por 10 anos. As estimativas do risco relativo e da Tabela 2. Freqüências observadas em um estudo de coorte com 2000 pessoas. Doença Óbito Não óbito Total Exposição ao Fator Fumante Não Fumante a=70 b=7 c=930 d= 993 a+c=1000 b+d=1000 Total a+b=77 c+d=1923 N=2000 ˆ = OR a a+c b b+d a a+c c a+c = 10, 00. b = 10, 68. / b+d d b+d A razão de chances indica a probabilidade de óbito para os fumantes é 10 vezes a probabilidade para não fumantes. O risco relativo indica que a chance de morrer com relação a sobreviver para os fumantes é 10,68 vezes a mesma chance para os não fumantes. 8. Conclusões e Perspectivas As medidas de associação entre possíveis fatores de exposição e a ocorrência de alguma doença requer o conhecimento de várias medidas e quais são mais apropriadas dependendo do tipo de estudo a ser analisado. Muitas vezes,o pesquisador deseja apresentar o risco relativo, mas obtém somente a razão de chances, como por exemplo em estudos do tipo casocontrole. Na continuação desse trabalho vamos estudar a obtenção do risco relativo, usando os resultados de um estudo que avaliou fatores de risco relacionados à mortalidade neonatal no município de São Paulo em 2006 (Ministério da Saúde, 2006 [4]). Nesse estudo foi utilizada uma regressão logística (Paula, 2004 [6]) para avaliar a associação entre possíveis fatores de risco e o óbito neonatal e foi estimada a razão de chances. É importante apresentar estimativas para o risco relativo com seus intervalos de confiança (Zhang e Yu, 1998 [11]). Uma alternativa é o ajuste de modelos lineares generalizados utilizando a distribuição Poisson para contagens, como os óbitos, e estimar o risco relativo. Também serão revisados alguns modelos para dados categorizados (Agresti, 2002 [1] e Paulino e Singer, 2006 [7]). Referências [1] Alan Agresti, Categorical Data Analysis, 2nd ed., John Wiley and Sons, Inc, New York, 2002. [2] Nicholas P. Jewell, Statistics for Epidemiology, Chapman e Hall, Florida, 2003. [3] John P. Klein and Melvin L. Moeschberger, Survival Analysis: Techniques for Censored and Truncated Data, Springer, New York, 2003. [4] Ministério da Saúde, Saúde Brasil - Uma Análise da Desigualdade em Saúde, Ministério da Saúde, Brasilia, 2006. [5] Leila B. Moreira, Flávio D. Fuchs, Renan S. Moraes, Markus Bredemeir, and Sílvia Cardozo, Prevalence of smoking and associated factors in a metropolitan area of southern Brazil, Revista de Saúde Pública 29 (1995), no. 1, 45–51. [6] Gilberto A. Paula, Modelos de Regressão com apoio computacional, IME-USP, São Paulo, 2004. [7] Julio M. Singer and Carlos D. Paulino, Análise de Dados Categorizados, Edgard Blucher, São Paulo, 2006. [8] Maurício G. Pereira, Epidemiologia: Teoria e Prática, Ed. Guanabara Koogan, Rio de Janeiro, 1995. [9] Steve Selvin, Statistical Analysis of Epidemiologic Data, Oxford University, New York, 1996. [10] José F. Soares and Arminda L. Siqueira, Introdução à Estatística Médica, Departamento de Estatística - UFMG, Belo Horizonte, 1996. [11] Jun Zhang and Kai. F. Yu, What’s the relative risk? A method of correcting the odds ratio in cohort studies of common outcomes, Journal of American of Medical Association 280 (1998), 1690–1691.