título do resumo - Eventos da Unicentro

Propaganda
OBTENÇÃO DE UM SISTEMA FUZZY PARA PROGNÓSTICO DO
ESTÁGIO DE CÂNCER DE PRÓSTATA POR MEIO DE ALGORITMOS
GENÉTICOS
Julio César Araújo Galvão Filho (PIBIC/CNPq-UNICENTRO), Maria José de
Paula Castanho (Orientador), e-mail: [email protected]
Universidade Estadual do Centro-Oeste/Setor de Ciências Exatas e
Tecnologia
Palavras-chave: algoritmo genético, câncer de próstata, sistemas Fuzzy.
Resumo:
O diagnóstico médico tem como uma de suas características a incerteza.
Nesse contexto, a teoria dos conjuntos fuzzy é apropriada para o
desenvolvimento de tais sistemas. Estes podem ser construídos com auxílio
de especialistas ou utilizando técnicas de inteligência artificial e uma base de
dados. Neste trabalho, é obtido um Sistema Fuzzy para classificação do
estágio do câncer de próstata por meio de um Algoritmo Genético. Os
resultados encontrados revelam que o sistema apresenta um desempenho
semelhante às outras abordagens da literatura.
Introdução
O câncer de próstata é o sexto mais comum no mundo, sendo o mais
prevalente na população masculina, conforme dados do Instituto Nacional do
Câncer [INCA, 2008]. Uma importante decisão a ser tomada pelo médico é a
realização ou não de cirurgia para retirada do tumor. Para isto, é necessário
ter conhecimento do estágio do câncer, pois a chance de cura é muito alta
em pacientes com câncer confinado na próstata, porém, se o câncer já
atingiu estruturas adjacentes, outras terapias são mais apropriadas. Os
principais indicadores desse estágio são o PSA (Prostate-Specific Antigen),
o escore de Gleason (biópsia) e o toque retal.
Entretanto, esses indicadores têm como característica a imprecisão.
Não há uma maneira clara de definir seus valores limites para os diferentes
estágios. Um sistema baseado em regras fuzzy [KLIR, 1995] é apropriado
para tratar estas imprecisões. Estes sistemas, compostos por funções de
pertinência e regras fuzzy, podem ser definidos utilizando técnicas de
inteligência artificial, como Algoritmos Genéticos [HOLLAND, 1975], em
especial quando o conhecimento médico na área ainda é insuficiente.
Anais da SIEPE – Semana de Integração Ensino, Pesquisa e Extensão
26 a 30 de outubro de 2009
Materiais e Métodos
Algoritmos Genéticos é uma técnica de otimização combinatória que
visa obter a melhor solução dentre um amplo conjunto de possibilidades,
baseando-se em conceitos evolutivos propostos por Darwin. Cada solução
corresponde a um indivíduo que, neste caso, é um Sistema Fuzzy completo,
com funções de pertinência e regras. Os indivíduos da população inicial são
gerados arbitrariamente. Para o PSA, são geradas 4 funções de pertinência,
no intervalo de valores [0, 24]. Para o Gleason e o Toque Retal geram-se 3
funções nos intervalos [0, 9] e [0, 3] respectivamente. Estas funções podem
ter a forma triangular ou trapezoidal. Todos os indivíduos contêm todas as
regras possíveis, combinando as três características. Assim, são 36 regras,
e o resultado de cada uma delas (câncer confinado ou não-confinado) é
definido aleatoriamente.
A melhora das soluções ocorre por meio da aplicação de operadores
de mutação e cruzamento, cujos percentuais são definidos ao início da
execução. A mutação pode inverter o resultado de uma regra ou selecionar
aleatoriamente um ponto de uma função de pertinência qualquer e movê-lo.
Em caso de cruzamento, dois indivíduos podem trocar um número aleatório
de regras, ou todo o conjunto de funções de pertinência de um indicador.
A avaliação da qualidade de cada solução é feita por meio de sua
função de aptidão, que é dada pela soma da sensibilidade e especificidade,
ou seja:
VP
VN
F=
+
,
VP + FN VN + FP
em que: VP é o número de acertos dos casos não confinados; VN é o
número de acertos dos casos confinados e FP e FN é o número de erros em
pacientes com câncer não-confinado e confinado, respectivamente. Para
fazer esta avaliação é utilizada uma base de dados do Hospital das Clínicas
da UNICAMP que contém dados clínicos de 217 pacientes, sendo 159 de
estágio confinado e 58 de estágio não-confinado.
Para manter o tamanho da população, ao fim de cada geração há um
ajuste utilizando seleção por torneio. No final do algoritmo, é obtido o melhor
indivíduo dentre todos os propostos.
Resultados e Discussão
O melhor Sistema Fuzzy obtido é composto de funções de pertinência
trapezoidais, conforme Figura 1, e as regras constam na Tabela 1. É
utilizado o método de inferência de Sugeno.
Anais da SIEPE – Semana de Integração Ensino, Pesquisa e Extensão
26 a 30 de outubro de 2009
Figura 1 – Funções de pertinência do melhor sistema fuzzy obtido
Tabela 1 – Regras do melhor sistema fuzzy obtido
Gleason
Indiferenciado
Indiferenciado
Indiferenciado
Indiferenciado
Indiferenciado
Indiferenciado
Indiferenciado
Med.Diferenciado
Med.Diferenciado
Med.Diferenciado
Med.Diferenciado
Med.Diferenciado
Med.Diferenciado
Med.Diferenciado
Med.Diferenciado
Bem Diferenciado
Bem Diferenciado
PSA
Muito alto
Muito alto
Alto
Médio
Médio
Baixo
Baixo
Muito alto
Muito alto
Alto
Alto
Médio
Médio
Baixo
Baixo
Médio
Baixo
Toque
NP ou Palpável
Pouco Palpável
Irrelevante
NP ou Palpável
Pouco Palpável
Não Palpável
PP ou Palpável
NP ou PP
Palpável
Não Palpável
PP ou Palpável
NP ou Palpável
Pouco Palpável
Não Palpável
MP ou Palpável
Não Palpável
Não Palpável
Resultado
Confinado
Não confinado
Confinado
Não confinado
Confinado
Confinado
Não confinado
Não confinado
Confinado
Confinado
Não confinado
Não confinado
Confinado
Confinado
Não confinado
Confinado
Confinado
Obteve-se um índice de 86% para sensibilidade (probabilidade que o
teste classifique corretamente um paciente com câncer não confinado) e
56% para especificidade (probabilidade de classificação correta de um
paciente com câncer confinado). Um teste com perfeita discriminação tem
área sob a curva ROC igual a 1. Neste caso, a área é 0,7 indicando um
desempenho próximo aos obtidos utilizando nomogramas de probabilidade
[Augustin et al., 2004].
Conclusões
Os resultados obtidos permitem concluir que o uso de uma técnica de
inteligência artificial para a definição de um Sistema Fuzzy pode substituir o
especialista. Entretanto, o modelo apresentado precisa ser refinado para que
Anais da SIEPE – Semana de Integração Ensino, Pesquisa e Extensão
26 a 30 de outubro de 2009
supere o desempenho dos demais trabalhos publicados. Isto pode ocorrer
por meio do ajuste de parâmetros do Sistema Fuzzy, ou da aplicação de
outras técnicas computacionais.
Agradecimentos
Agradecemos ao Dr. Athanase Billis, que nos forneceu a base de dados, e
ao CNPq, pelo suporte financeiro.
Referências
Augustin, H. et al. Comparison of accuracy between the Parin Tables of
1997 and 2001 to predict final pathological stage in clinically localized
prostate cancer. The Journal of Urology. 2004, 171:177-181.
Holland, J. Adaptation in Natural and Artificial Systems. The University of
Michigan Press.1975.
Instituto Nacional do Câncer - INCA. Estimativa 2008: Incidência de
Câncer no Brasil. Disponível em: <http://www.inca.gov.br/estimativa/2008>.
Acesso em: 10 jun. 2009.
Klir, G. J; Yuan, B. Fuzzy Sets and Fuzzy Logic Theory and Applications
Ed.: Prentice Hall (ed.). New Jersey, 1995; 302-356.
Anais da SIEPE – Semana de Integração Ensino, Pesquisa e Extensão
26 a 30 de outubro de 2009
Download