Modelo de Fração de Cura: Uma Aplicação a Dados de Sobrevida de Mulheres Acometidas pelo Câncer de Mama Gleici da Silva Castro Perdoná – DMS, FMRP/USP Juliana Cobre – DEs, UFSCar Ana Maria de Almeida – EERP, USP Francisco Louzada-Neto – DEs, UFSCar 1. Introdução A natureza complexa dos problemas oncológicos faz com que a formulação de um modelo que contemple todas as características do fenômeno câncer seja uma tarefa difícil, se não impossível. O que se faz muitas vezes é modelar um processo biologicamente conhecido por modelos de sobrevivência (Yakolev, et al., 1996). Entretanto, usualmente os diferentes esquemas de tratamento não são incorporados adequadamente nas análises estatísticas. Geralmente estas informações são consideradas como variáveis independentes de confundimento (co-variáveis) relacionadas com a variável dependente (resposta) de forma usual. Neste trabalho, considerando como base o modelo proposto por Hanin, et al. (2001), o qual permite a incorporação várias informações relacionadas a doença de forma mecanística, abordamos a problemática do câncer de um ponto de vista macro. Consideraremos particularmente o problema do câncer de mama, por ser este um dos cânceres de maior incidência em mulheres no mundo. Este artigo é organizado da seguinte forma. Na Seção 2 apresentamos um caso particular do modelo proposto por Hanin (2001), motivado pelo problema oncológico. Na Seção 3 discutimos o procedimento de estimação dos parâmetros do modelo. Na Seção 4 apresentamos resultados de estudo de simulação para avaliar procedimentos assintóticos. Na Seção 5 ajustamos o modelo a um conjunto de dados real de câncer de mama. Na Seção 6, comentários finais são apresentados. 2. Modelando o problema de câncer de mama O câncer de mama é um problema de saúde pública mundial. Para 2010 são previstos 49.000 novos casos de câncer de mama no Brasil (Brasil, 2010). Na população feminina brasileira o câncer de mama, além de ser a patologia maligna prevalente, apresenta índices crescentes de mortalidade. Esse quadro pode ser explicado, entre outros fatores, pelo estabelecimento tardio do diagnóstico: 60% dos diagnósticos iniciais da doença são compostos por tumores de estadiamento III e IV (TNM – Classificação Internacional de Tumores da União Internacional Contra o Câncer – UICC), na maioria das instituições nacionais de câncer (Brasil, 2008). 1 Detectado o câncer de mama, por mamografia e/ou por biópsia, é definido o tipo do câncer e o estadiamento que são fatores de prognóstico para a doença. Os fatores de prognósticos podem ser compreendidos como parâmetros mensuráveis que podem ser identificados no diagnóstico da doença ou no momento da cirurgia, e são úteis como preditores da sobrevivência total ou do tempo livre da doença. Os fatores preditivos são parâmetros diretamente associados à terapia adotada. Alguns fatores como os receptores de hormônios ovarianos podem ser entendidos como preditivos e de prognóstico (Cianfrocca, 2004). Inúmeros estudos demonstram que o número de linfonodos acometidos como fator de prognostico relacionado diretamente com a sobrevida. Assim sendo, a presença de acometimento axilar serve como indicativo de que o tumor pertence a um grupo de tumores mais agressivos, e o grau de agressividade é avaliado pelo número absoluto de linfonodos comprometidos pelo câncer. Diversos estudos demonstraram que há uma sobrevida menor observada em pacientes que tiveram linfonodos acometidos quando comparadas as pacientes que não apresentam acometimento (Cianfrocca, 2004; Rosenberg,2005; Decker,2006; Murthy,2007). Além disso, esse fator é utilizado para determinar o tratamento adjuvante, previne a recorrência regional e a potencialidade completa da erradicação do câncer de mama, melhorando a sobrevida da mulher. Um linfonodo é parte do sistema linfático do corpo. No sistema linfático uma rede de vasos linfáticos carrega fluido claro chamado linfa. Os vasos linfáticos levam aos linfonodos, os quais são pequenos órgãos redondos que capturam células cancerosas, bactérias, ou outras substâncias danosas que podem estar na linfa. Grupos de linfonodos são encontrados no pescoço, axilas (linfonodos axilares), peito, abdômen e virilha. Para aplicação deste modelo consideraremos a cadeia axilar, e dentro dessa cadeia vários linfonodos competindo para disseminação do câncer. Neste trabalho consideramos a suposição que a cadeia axilar contém um número inicial não aleatório de linfonodos contaminados i expostos ao tratamento quimioterápico de n intervalos de k doses separadas por um intervalo de tempo (). Assumindo que cada linfonodo é exposto a dose k com a mesma probabilidade =(k), dado que o linfonodo não foi afetado diante a uma exposição anterior, e são independentes entre si, que a descontaminação (não afetado) do linfonodo tratado é efetivamente instantânea e que a contaminação da cadeia axilar entre as doses pode ser modelada como um processo de Markov de nascimento-morte com taxa de nascimento >0 e taxa espontânea de morte 0 (no caso dos linfonodos consideramos que = 0). Seja e 𝜑𝑀 a função geradora de probabilidade. Seja M a variável aleatória número de linfonodos contaminados restantes de um tratamento. Assuma que cada linfonodo é não afetado (sobrevivente) pode ser caracterizado por um tempo latente e são i.i.d. Desta forma, a contaminação do linfonodo pode ser vista como o número de causas competitivas latentes relacionadas à contaminação de outro linfonodo. Hanin, 2001, deriva uma expressão explicita para a distribuição da variável aleatória M, onde M é o número de células clonogenicas restantes a um tratamento, como uma distribuição binomial negativa generalizada (BNG). A correspondente função geradora de probabilidade é dada por, 2 𝜑𝑀 𝑢 = 𝑎−𝑏𝑢 𝑖 , 𝑐−𝑑𝑢 |u|≤1. Sugerindo uma função de sobrevivência para o tempo de recorrência do tumor. No nosso caso, assumimos M = m, uma variável aleatória que denota o número de causas competitivas latentes (numero de linfonodos) e Zl; l = 1; : : : m, tempos de ocorrência do evento de interesse devido a l-ésima causa competitiva. Consideramos que Zl são variáveis aleatórias independentes e identicamente distribuídas com função distribuição de parâmetro , que independe de M, dada por em que denota a função de sobrevivência. Assim, o tempo de sobrevivência para cada indivíduo é definido pelo mínimo entre os tempos com uma fração da população não susceptível ocorrência do evento, dada por p0. (1) (2) (3) (4) 3 (5) (6) (2) Nesta formulação os linfonodos agem como causas competitivas para alastrar o câncer pelo corpo. Assumos que o tempo até a contaminação de cada linfonodo tem distribuição Weibull. Neste contexto, o modelo binomial negativa generalizado Weibull (BNGW) permite analisar o efeito dos linfonodos como causas competitivas para predizer a sobrevivência da paciente. A vantagem desta formulação é poder descrever a taxa de proliferação dos linfonodos contaminados, a probabilidade de o linfonodo contaminado sobreviver a cada dose do tratamento (eficácia da dose), além de estimar quais são as covariáveis com efeito significativo. 4 3. Procedimento de Estimação 3.1. Função de Máxima Verossimilhaça (7) (8) (7) (9) (5) (6) (10) (2) 5 3.2. Estimação de Máxima Verossimilhaça Para o momento consideramos a distribuição Weibull para o tempo até a ocorrência da causa de interesse, no caso, contaminação de cada linfonodo, cuja distribuição e função densidade de probabilidade são dadas, respectivamente, por (11) or (12) 6 (13) (14) 4. Estudo de simulação Aarset (1987). 7 (1 ) (2) (3) (Lawless,2002) (1 ) (5) (6) (7) 8 1 2 3 9 4 5 6 7 10 5. Câncer de mama: Aplicação do modelo Apesar dos inúmeros progressos descritos em literatura, as causas da enorme variabilidade verificada na evolução clínica do câncer de mama, não estão inteiramente esclarecidas e, por isso, têm sido intensamente investigada. Essa variação é provavelmente determinada por uma interação complexa de mecanismos – como a velocidade de divisão e o potencial de metastização das células tumorais – influenciados por diferenças observadas nas características anatômica, imunológica, hormonal e nutricional de cada paciente (Kumar, 2008). O conjunto de dados estudado é parte da amostra considerada por Gozzo (2008), consistindo de 40 mulheres com carcinoma ductal invasivo tratadas no Hospital Universitário da Faculdade de Medicina de Ribeirão Preto submetidas a um esquema especial de tratamento quimioterápico no período de 2003 a 2006. As pacientes foram submetidas a tratamento neoadjuvante e adjuvante, que são tratamentos quimioterápicos antes e pós cirurgia. As pacientes tinham em média 50,6 anos e com desvio padrão de 6,0 anos, glóbulos brancos em média 7,5x10000mm3 e 2,1x10000mm3 de desvio-padrão, a 1,6mm2 de superfície corporal, e com desvio padrão 0,1mm2, utilizaram duas drogas durante o tratamento Taxotere (Docetaxel) com média de 121,9mg e desvio padrão de 8,1mg por dose e Epirrubicina, em média 88,8mg e 9,7mg de desvio padrão por dose, sendo que as doses variaram de 4 a 6. Consideramos o tempo livre da doença, que é o tempo decorrido após a cirurgia neste estudo como o tempo de sobrevivência. Nesta amostra 75% das pacientes tiveram seus tempos censurados devido ao acompanhamento encerrar em 2008. Depois de serem tratadas, as pacientes realizaram a cirurgia para a retirada da região atingida pelo câncer onde foi detectado o número de linfonodos acometidos. O gráfico TTTplot foi utilizado como um indicador para verificar a forma da função de risco adequada para estes dados. A curva obtida indica uma função de risco crescente podendo então ser representada pela distribuição Weibull (Figura 1). 11 Figura 1: Gráfico TTTplot dos dados de câncer de mama Os resultados das estimativas de máxima verossimilhança dos parâmetros do ajuste do modelo BNGW, seus desvios padrão e seus intervalos de confiança assintóticos de 95% são apresentados na Tabela 8 e mostram que as variáveis que explicam a sobrevida são os medicamentos Taxotere e Epirrubicina, pois seus intervalos de confiança não contêm o zero. 8 A Figura 2 apresenta a estimativa de Kaplan-Meier e função de sobrevivência estimada pelo modelo BNGW o numero de linfondos igual a 1 e maior que . Observamos que para valores maiores que um o sobrevida apresenta um decréscimo após 2 anos aproximadamente. Figura 2: Estimativa de Kaplan-Meier e funçao de sobrevivência estimada pelo modelo BNGW : i = 1 (- _ - _ -) e i > 1 (- - -). 12 A Tabela 9 apresenta a probabilidade de cura estimada, p0, para diferentes números de linfonodos contaminados inicialmente e para 4 ou 6 doses recebidos de tratamento. Observamos que esta probabilidade decresce à medida que o numero de linfonodos contaminados aumenta. 9 Devido à formulação do modelo BNGW, podemos obter a taxa de proliferação da contaminação do linfonodo, , cuja estimativa é aproximadamente igual a 0,6 linfonodos por mês. O parâmetro denota a probabilidade do linfonodo permanecer contaminado a cada dose do tratamento, com estimativa de aproximadamente 70%. Logo, assumindo doses independentes, a probabilidade do linfonodo resistir ao tratamento depois de 4 doses é igual a 4, ou seja, 24, 1%, e depois de 6 doses é igual a 6, ou seja, 11, 8%. Esta formulação também nos permite calcular a eficiência de cada dose definida por 1-, ou seja, cada dose tem, individualmente, 30% de eficácia. A probabilidade de cura depende do número de doses do tratamento, que se completo é dado em 6 doses. Então, receber o tratamento completo impacta positivamente na sobrevida da paciente, aumentando sua probabilidade de cura. O medicamento Taxotere produz aumento da sobrevivência, o que está em acordo com a literatura, Sparano, et al (2008). A estimativa do parâmetro 1 é aproximadamente igual a 3, significando uma taxa de falha crescente para uma distribuição Weibull, implicando que o risco de morte aumenta com o tempo, o que está em concordância com o gráfico TTT plot. 6. Comentários Finais Neste trabalho abordamos abordar a problemática do câncer de um ponto de vista “macro”, no qual o objetivo era modelar o tempo livre da doença em questão, o câncer de mama. Utilizamos um modelo de sobrevivência geral para acomodar dados de sobrevivência na presença de causas competitivas e uma distribuição Weibull para os tempos de ocorrência, obtendo o modelo BNGW (binomial negativa generalizada Weibull). Esta formulação nos permitiu obter duas importantes quantidades na prática do tratamento de câncer de mama: a velocidade de como a doença se espalha (taxa) e a eficacia de cada dose do tratamento. 13 Consideraremos particularmente o problema do câncer de mama, por ser este um dos cânceres de maior incidência em mulheres no mundo. Referências Aarset, M. V. (1985). The null distribution for a test of constant versus \bathtub" failure rate. Scandinavian Journal of Statistics, 12(1), 55-68. Blamey, R.W. et al.(2007) Reading the prognosis of the individual with breast cancer. European Journal of Cancer. V. 43, i. 10, p. 1545-1547. Brasil (2010). Inca lança estimativa 2010: Incidência de câncer no brasil. Home page. acessado em 14 de janeiro de 2010. Cianfrocca, M.; Goldstein, L.J. Prognostic and Predictive Factors in Early-Stage Breast Cancer Oncologist. 9: 606 – 616, 2004. Decker, T. et al. Prognostic and predictive factors of invasive breast cancer: update 2009. Der Pathologe. 30(1):49-55, 2009. Gozzo, T. O. (2008). Toxicidade ao tratamento quimioterápico em mulheres com câncer de mama. Tese de doutorado, Escola de Enfermagem de Ribeirão Preto, USP, Ribeirão Preto, Brasil. Hanin, L. G. (2001). Iterated birth and death process as a model of radiation cell survival. Mathematical Biosciences, 169(1), 89-107. Kumar, V., Abbas, A.K., Fausto, N., Mitchell, R.N. Robbins – Patologia Básica. 8ª. Ed. Elsevier: Rio de Janeiro. 2008. Lawless, J. F. (2002). Statistical Models and Methods for Lifetime Data. Wiley, New York. Murthy. et al. Post operative wound complications and systemic recurrence in breast cancer. BJCancer. 97:1211-1217, 2007. Rodrigues, J., Cancho, V. G., de Castro, M. and Louzada-Neto, F. (2009a). On the unication of the long-term survival models. Statistics & Probability Letters, 79(6), 753-759. Rosenberg, J. et al. The effect of age, race, tumor size, tumor grade, and disease stage on invasive ductal breast cancer survival in the U.S. SEER database. Breast Cancer Res Treat. 89(1): 47–54, 2005. Sparano, J. A., Wang, M., Martino, S., Jones, V., Perez, E. A., Saphner, T., Wol, A. C. & SledgeJr, G. W. (2008). Weekly paclitaxel in the adjuvant treatment of breast cancer. New England Journal of Medicine, 358(16), 1663-1671. Yakovlev, A. Y. & Tsodikov, A. D. (1996). Stochastic Models of Tumor Latency and Their Biostatistical Applications. World Scientic, Singapore. 14