AJUSTE DE MODELO DE ANÁLISE DE SOBREVIVÊNCIA PARA DADOS DE TUBERCULOSE DO MUNICÍPIO DE PATOS DE MINAS – MINAS GERAIS Bruno Henrique Gomes1 Guilherme Pereira de Oliveira2 Fabrícia Matos de Oliveira3 4 1 Introdução A tuberculose tem sido uma das doenças mais estudadas nos seus aspectos biológico, epidemiológico, diagnóstico, terapêutico e profilático. No entanto essa doença teima em persistir, em nível mundial, causando sofrimento humano e morte em pleno século XXI (Hijjar, Oliveira, Teixeira). Causada pelo Mycobacterium tuberculosis, pode acometer uma serie de órgãos e/ou sistemas, é transmitida por via aérea em praticamente todos os casos. A infecção ocorre a partir da inalação de núcleos secos de partículas contendo bacilos expelidos pela tosse, fala ou espirro do doente com tuberculose ativa de vias respiratórias (pulmonar ou laríngea). Os doentes bacilíferos, isto é, aqueles cuja baciloscopia de escarro é positiva, são a principal fonte de infecção. O Brasil é um dos 22 países priorizados pela OMS que concentram 80 % da carga mundial de tuberculose. Em 2009, foram notificados 72 mil novos casos, correspondendo a um coeficiente de incidência de 38/100.000 habitantes. Esses indicadores colocam o Brasil na 19ª posição em relação ao numero de casos e na 104ª posição em relação ao coeficiente de incidência (MS, 2011). A tuberculose continua sendo um grande problema de saúde global. Isso faz com que problemas de saúde entre os milhões de pessoas a cada ano e classifica como a segunda principal causa de morte de doenças infecciosas em todo o mundo, após o vírus da imunodeficiência humana (WHO, 2012). _________________________________ INGEB- Universidade Federal de Uberlândia – Campus Patos de Minas – Graduando em Biotecnologia. Email: [email protected] 1 INGEB- Universidade Federal de Uberlândia – Campus Patos de Minas – Graduando em Biotecnologia. Email: [email protected] 2 FAMAT - Universidade Federal de Uberlândia – Campus Patos de Minas - Professora. Email: [email protected]. 3 4 Agradecimento à FAPEMIG pelo apoio financeiro. Devido ao aumento de casos de Tuberculose no Brasil nos últimos anos, faz-se necessário o estudo de ferramentas estatísticas apropriadas, aqui às técnicas de análise de sobrevivência são consideradas, pois se ajustam cada vez mais aos dados que frequentemente são encontrados em vários tipos de estudos, especialmente, os estudos clínicos e observacionais. 2 Materiais e métodos Os dados para o desenvolvimento deste trabalho foram fornecidos pela Secretaria Regional de Saúde (SRS) - Regional Patos de Minas. Foram obtidos registros de 437 pessoas diagnosticadas com tuberculose em toda a região abrangida pela SRS no período de 2003 a 2012, sendo a variável resposta o tempo, em dias, desde o início do tratamento da doença até a cura da tuberculose. As covariáveis consideradas nesse estudo, também fornecidas pela SRS, encontram-se descritas na tabela a seguir. Tabela 1- Informações sobre pacientes Dados Situação Tempo de tratamento em dias Censura Sexo do paciente Idade do paciente Raça do paciente Região de origem 0(censurado), 1(falha) 0(Masculino),1(Feminino) 0 (≤ 40), 1(>40) 0 (Branca), 1( outras) 0 (Patos de Minas),1(outras) Os modelos de tempo de falha acelerado (AFT) são modelos que assumem que a relação entre S(.) de 2 indivíduos, i e j, é dada por: Si (t ) S j (ijt ) (1) em que Si (t ) é função do tempo t, é uma constante específica para o par (i,j), e, caso ij seja igual a 1, as curvas de sobrevivência se sobrepõem. Uma sub-classe de modelos AFT é da pela seguinte expressão: Ti 0 1 xi1 ... k x1k (2) em que, Ti é o tempo até a ocorrência do evento, i , i (1, 2,..., k ) são os parâmetros a serem estimados, xi são as covariáveis e é o erro aleatório (COLOSIMO e RUIZ, 2006). No modelo de regressão clássica assume-se o erro com distribuição normal, enquanto no modelo AFT o erro não necessariamente assume uma distribuição normal, sendo permitidas outras distribuições, como por exemplo, a distribuição Weibull, Log-normal, Exponencial, Log-logística e Gama. Neste trabalho foi utilizado o modelo paramétrico AFT para modelar o tempo até a cura em função das covariáveis consideradas, determinando a distribuição que melhor se ajusta aos dados, partindo da distribuição gama generalizada. No processo de seleção de covariáveis, utilizou-se o teste de razão de verossimilhanças, cuja estatística é dada por: TRV 2[log L( ) log L(0 )] (3) em que, L( ) e L(0 ) são as funções de verossimilhanças maximizadas do modelo gama generalizado sem restrição e sob a hipótese nula, respectivamente. A estatística do teste, TRV, segue aproximadamente uma distribuição qui-quadrado, com número de graus de liberdade igual à diferença entre número de parâmteros dos dois modelos. A escolha do modelo mais adequado também foi feita utilizando o TRV entre o modelo gama generalizado e os modelos Weibull, lognormal e exponencial. As análises foram feitas utilizando o software estatístico R, versão 2.13.3. 3 Resultados e discussão No processo de seleção das covariáveis utilizando o modelo gama generalizado, foram significativas a idade, a raça, região de origem e sexo, a um nível de significância de 0,05. Entre os três modelos testados, o modelo lognormal foi considerado o mais adequado, de acordo com o teste de razão de verossimilhanças. O gráfico das probabilidades de sobrevivência dos resíduos estimadas por KaplanMeier e pelo modelo log-normal, bem como de suas respectivas curvas de sobrevivência estimadas, estão na Figura abaixo. A partir desta Figura pode-se acreditar que o modelo de regressão log-normal se encontra bem ajustado aos dados sob análise. Figura 1: Sobrevivências dos resíduos ei* estimadas pelo método de Kaplan- Meier e pelo modelo log-normal (gráfico à esquerda) e respectivas curvas de sobrevivência estimadas ( gráfico à direita). Tabela 2 - Modelo de regressão log-normal Parâmetro (covariável) Estimativa Erro padrão z (Intercepto) 10.840 1.691 6.411 Pr>z 1.44e-10 1 (Idade) 2 (sexo) 3 (município) 4 (raça) 3.59e-01 3.90e-01 7.19e-01 3.24e-01 -0.755 0.739 -0.300 0.747 0.823 0.859 0.835 0.757 -0.918 0.860 -0.360 0.986 Tomando-se o exponencial dos coeficientes estimados, apresentados na tabela 2, obtém-se a razão dos tempos medianos de sobrevivência. Assim, tem-se que para a covariável Idade, por exemplo, o tempo mediano até a cura de pacientes com mais de 40 anos, é de ((1−exp{-0,755}) = 52,99) por cento a mais que pacientes com menos de 40 anos. Os demais coeficientes são interpretados usando o mesmo procedimento. 4 Conclusões A interpretação dos coeficientes estimados, que para uma covariável codificada (0 e 1), compara a probabilidade de sobrevivência do grupo 1 em relação ao grupo 0, permitiu obter as seguintes conclusões: Pacientes com mais de 40 anos tem 52,99% mais probabilidade de cura que pacientes com menos de 40 anos; pacientes do sexo feminino tem 109,38% a mais na probabilidade de cura que pacientes do sexo masculino; pacientes do município de Patos de Minas tem 259,18% a mais na probabilidade de cura que pacientes de outras regiões; pacientes da raça branca tem 111,06% a mais na probabilidade de cura que pacientes de outras raças. 5 Referências COLOSIMO, ENRICO ANTÔNIO; GIOLO, SUELY RUIZ. Análise de sobrevivência aplicada. São Paulo:EdgardBlucher, 2006. HIJJAR, Miguel Aiub; OLIVEIRA, Maria José Procopio Ribeiro de; TEIXEIRA, Gilmário , A TUBERCULOSE NO BRASIL E NO MUNDO. Boletim de Pneumologia Sanitaria, Rio de Janeiro, v. 9, n. 2, p.9-16, dez. 2001. MINISTERIO DA SAÚDE (MS), Manual de recomendações para o controle da tuberculose no Brasil. Brasília, 2011. R: A language and enviroment for statistical computing. R Foundation for Statistical Computing, Vienna, Austria. ISBN 3-900051-07 -0, URL http//www.R-project.org. WORLD HEALTH ORGANIZATION (WHO), Global Tuberculosis Report. Geneva, 2012.