OBTENÇÃO DE UM SISTEMA FUZZY PARA PROGNÓSTICO DO ESTÁGIO DE CÂNCER DE PRÓSTATA POR MEIO DE ALGORITMOS GENÉTICOS Julio César Araújo Galvão Filho (PIBIC/CNPq-UNICENTRO), Maria José de Paula Castanho (Orientador), e-mail: [email protected] Universidade Estadual do Centro-Oeste/Setor de Ciências Exatas e Tecnologia Palavras-chave: algoritmo genético, câncer de próstata, sistemas Fuzzy. Resumo: O diagnóstico médico tem como uma de suas características a incerteza. Nesse contexto, a teoria dos conjuntos fuzzy é apropriada para o desenvolvimento de tais sistemas. Estes podem ser construídos com auxílio de especialistas ou utilizando técnicas de inteligência artificial e uma base de dados. Neste trabalho, é obtido um Sistema Fuzzy para classificação do estágio do câncer de próstata por meio de um Algoritmo Genético. Os resultados encontrados revelam que o sistema apresenta um desempenho semelhante às outras abordagens da literatura. Introdução O câncer de próstata é o sexto mais comum no mundo, sendo o mais prevalente na população masculina, conforme dados do Instituto Nacional do Câncer [INCA, 2008]. Uma importante decisão a ser tomada pelo médico é a realização ou não de cirurgia para retirada do tumor. Para isto, é necessário ter conhecimento do estágio do câncer, pois a chance de cura é muito alta em pacientes com câncer confinado na próstata, porém, se o câncer já atingiu estruturas adjacentes, outras terapias são mais apropriadas. Os principais indicadores desse estágio são o PSA (Prostate-Specific Antigen), o escore de Gleason (biópsia) e o toque retal. Entretanto, esses indicadores têm como característica a imprecisão. Não há uma maneira clara de definir seus valores limites para os diferentes estágios. Um sistema baseado em regras fuzzy [KLIR, 1995] é apropriado para tratar estas imprecisões. Estes sistemas, compostos por funções de pertinência e regras fuzzy, podem ser definidos utilizando técnicas de inteligência artificial, como Algoritmos Genéticos [HOLLAND, 1975], em especial quando o conhecimento médico na área ainda é insuficiente. Anais da SIEPE – Semana de Integração Ensino, Pesquisa e Extensão 26 a 30 de outubro de 2009 Materiais e Métodos Algoritmos Genéticos é uma técnica de otimização combinatória que visa obter a melhor solução dentre um amplo conjunto de possibilidades, baseando-se em conceitos evolutivos propostos por Darwin. Cada solução corresponde a um indivíduo que, neste caso, é um Sistema Fuzzy completo, com funções de pertinência e regras. Os indivíduos da população inicial são gerados arbitrariamente. Para o PSA, são geradas 4 funções de pertinência, no intervalo de valores [0, 24]. Para o Gleason e o Toque Retal geram-se 3 funções nos intervalos [0, 9] e [0, 3] respectivamente. Estas funções podem ter a forma triangular ou trapezoidal. Todos os indivíduos contêm todas as regras possíveis, combinando as três características. Assim, são 36 regras, e o resultado de cada uma delas (câncer confinado ou não-confinado) é definido aleatoriamente. A melhora das soluções ocorre por meio da aplicação de operadores de mutação e cruzamento, cujos percentuais são definidos ao início da execução. A mutação pode inverter o resultado de uma regra ou selecionar aleatoriamente um ponto de uma função de pertinência qualquer e movê-lo. Em caso de cruzamento, dois indivíduos podem trocar um número aleatório de regras, ou todo o conjunto de funções de pertinência de um indicador. A avaliação da qualidade de cada solução é feita por meio de sua função de aptidão, que é dada pela soma da sensibilidade e especificidade, ou seja: VP VN F= + , VP + FN VN + FP em que: VP é o número de acertos dos casos não confinados; VN é o número de acertos dos casos confinados e FP e FN é o número de erros em pacientes com câncer não-confinado e confinado, respectivamente. Para fazer esta avaliação é utilizada uma base de dados do Hospital das Clínicas da UNICAMP que contém dados clínicos de 217 pacientes, sendo 159 de estágio confinado e 58 de estágio não-confinado. Para manter o tamanho da população, ao fim de cada geração há um ajuste utilizando seleção por torneio. No final do algoritmo, é obtido o melhor indivíduo dentre todos os propostos. Resultados e Discussão O melhor Sistema Fuzzy obtido é composto de funções de pertinência trapezoidais, conforme Figura 1, e as regras constam na Tabela 1. É utilizado o método de inferência de Sugeno. Anais da SIEPE – Semana de Integração Ensino, Pesquisa e Extensão 26 a 30 de outubro de 2009 Figura 1 – Funções de pertinência do melhor sistema fuzzy obtido Tabela 1 – Regras do melhor sistema fuzzy obtido Gleason Indiferenciado Indiferenciado Indiferenciado Indiferenciado Indiferenciado Indiferenciado Indiferenciado Med.Diferenciado Med.Diferenciado Med.Diferenciado Med.Diferenciado Med.Diferenciado Med.Diferenciado Med.Diferenciado Med.Diferenciado Bem Diferenciado Bem Diferenciado PSA Muito alto Muito alto Alto Médio Médio Baixo Baixo Muito alto Muito alto Alto Alto Médio Médio Baixo Baixo Médio Baixo Toque NP ou Palpável Pouco Palpável Irrelevante NP ou Palpável Pouco Palpável Não Palpável PP ou Palpável NP ou PP Palpável Não Palpável PP ou Palpável NP ou Palpável Pouco Palpável Não Palpável MP ou Palpável Não Palpável Não Palpável Resultado Confinado Não confinado Confinado Não confinado Confinado Confinado Não confinado Não confinado Confinado Confinado Não confinado Não confinado Confinado Confinado Não confinado Confinado Confinado Obteve-se um índice de 86% para sensibilidade (probabilidade que o teste classifique corretamente um paciente com câncer não confinado) e 56% para especificidade (probabilidade de classificação correta de um paciente com câncer confinado). Um teste com perfeita discriminação tem área sob a curva ROC igual a 1. Neste caso, a área é 0,7 indicando um desempenho próximo aos obtidos utilizando nomogramas de probabilidade [Augustin et al., 2004]. Conclusões Os resultados obtidos permitem concluir que o uso de uma técnica de inteligência artificial para a definição de um Sistema Fuzzy pode substituir o especialista. Entretanto, o modelo apresentado precisa ser refinado para que Anais da SIEPE – Semana de Integração Ensino, Pesquisa e Extensão 26 a 30 de outubro de 2009 supere o desempenho dos demais trabalhos publicados. Isto pode ocorrer por meio do ajuste de parâmetros do Sistema Fuzzy, ou da aplicação de outras técnicas computacionais. Agradecimentos Agradecemos ao Dr. Athanase Billis, que nos forneceu a base de dados, e ao CNPq, pelo suporte financeiro. Referências Augustin, H. et al. Comparison of accuracy between the Parin Tables of 1997 and 2001 to predict final pathological stage in clinically localized prostate cancer. The Journal of Urology. 2004, 171:177-181. Holland, J. Adaptation in Natural and Artificial Systems. The University of Michigan Press.1975. Instituto Nacional do Câncer - INCA. Estimativa 2008: Incidência de Câncer no Brasil. Disponível em: <http://www.inca.gov.br/estimativa/2008>. Acesso em: 10 jun. 2009. Klir, G. J; Yuan, B. Fuzzy Sets and Fuzzy Logic Theory and Applications Ed.: Prentice Hall (ed.). New Jersey, 1995; 302-356. Anais da SIEPE – Semana de Integração Ensino, Pesquisa e Extensão 26 a 30 de outubro de 2009