Universidade Federal de Pernambuco Programa de Pós Graduação em Engenharia Mecânica Classificação e segmentação de termogramas de mama para triagem de pacientes residentes em regiões de poucos recursos médicos Anderson Spinelli Valdevino da Silva Recife 2015 Classificação e segmentação de termogramas de mama para triagem de pacientes residentes em regiões de poucos recursos médicos ANDERSON SPINELLI VALDEVINO DA SILVA Dissertação de Mestrado apresentada ao Programa de Pós-Graduação em Engenharia Mecânica, PPGEM, da Universidade Federal de Pernambuco como parte dos requisitos necessários à obtenção do grau de Mestre em Engenharia Mecânica, na área de concentração: Mecânica Computacional e Projeto Mecânico. Orientadora: Rita de Cássia Fernandes de Lima Co-Orientador: Marcus Costa de Araújo Recife 2015 06 de março de 2015 ―CLASSIFICAÇÃO E SEGMENTAÇÃO DE TERMOGRAMAS DE MAMA PARA TRIAGEM DE PACIENTES RESIDENTES EM REGIÕES DE POUCOS RECURSOS MÉDICOS‖ ANDERSON SPINELLI VALDEVINO DA SILVA ESTA DISSERTAÇÃO FOI JULGADA ADEQUADA PARA OBTENÇÃO DO TÍTULO DE MESTRE EM ENGENHARIA MECÂNICA ÁREA DE CONCENTRAÇÃO: MECÂNICA COMPUTACIONAL E PROJETO MECÂNICO APROVADA EM SUA FORMA FINAL PELO PROGRAMA DE PÓS-GRADUAÇÃO EM ENGENHARIA MECÂNICA/CTG/EEP/UFPE __________________________________________________ PROFª DRª RITA DE CASSIA FERNANDES DE LIMA ORIENTADORA/PRESIDENTE _____________________________________________ PROF. DR. MARCUS COSTA DE ARAÚJO CO-ORIENTADOR _________________________________________________ PROF. DR. JORGE RECARTE HENRÍQUEZ GUERRERO COORDENADOR DO PROGRAMA BANCA EXAMINADORA: _________________________________________________________________ PROFª DRª RITA DE CASSIA FERNANDES DE LIMA (UFPE) _________________________________________________________________ PROF. DR. MARCUS COSTA DE ARAÚJO (UFPE) _________________________________________________________________ PROFª DRª LUCIETE ALVES BEZERRA (UFPE) _________________________________________________________________ PROFª DRª ANA LÚCIA BEZERRA CANDEIAS (UFPE) “Mesmo que o futuro lhe pareça distante, ele está começando nesse exato momento” Mattie J. T. Stepanek AGRADECIMENTOS Agradeço, primeiramente, a Deus por me abençoar. Agradeço à minha filha, Alice, que fez com que eu não desistisse nos momentos difíceis. Agradeço à minha mãe por todo amor, apoio, paciência e esforço feito para proporcionar excelentes condições para meu desenvolvimento. Agradeço a toda minha família pelo apoio em todos os momentos. Agradeço à minha irmã Andrea e ao meu cunhado, Fábio, pelo incentivo e pelos comentários divertidos sobre o mestrado. À minha irmã Adriane e ao meu cunhado Rogério pelo incentivo. Agradeço à Kelly pela ajuda, pelo carinho e pelo incentivo dado durante a elaboração dessa dissertação. Agradeço à Jéssika por toda a ajuda dada durante todo o mestrado, por toda força e confiança passados e também pelas contribuições dadas para a elaboração dessa dissertação. Agradeço à professora e orientadora Dra. Rita de Cássia Fernandes de Lima e ao professor e co-orientador Dr. Marcus Costa de Araújo pela paciência, orientação e amizade. Também ao Dr. George Santos, médico cujo trabalho no HC possibilitou a elaboração dessa dissertação. Agradeço a todos meus amigos que contribuíram de maneira direta ou indireta para o desenvolvimento desse trabalho, especialmente aos amigos do LABTERMO pelas conversas, incentivo e pela ajuda nos momentos difíceis. Agradeço a CAPES pelo apoio financeiro dado para realização deste trabalho. RESUMO O câncer de mama é um dos principais tipos de câncer que levam mulheres a óbito no Brasil e no mundo. O câncer surge a partir do desenvolvimento descontrolado de células malignas no corpo, ocasionando uma maior perfusão sanguínea na região afetada e, consequentemente, aumentando a temperatura local. Tal aumento pode ser medido através de câmeras termográficas. No presente trabalho, realiza-se a classificação estatística de imagens termográficas das mamas, de um grupo de mulheres cujas as imagens foram adquiridas sem um controle adequado das variáveis térmicas do ambiente. Essas imagens termográficas foram classificadas a partir de um grupo formado por imagens de pacientes do Hospital das Clínicas da UFPE, para as quais as condições de aquisição foram controladas. Com a classificação e análise das imagens nesses dois ambientes procura-se investigar se a termografia pode ser utilizada como uma técnica de triagem de possíveis anomalias mamárias em regiões de poucos recursos médicos. Para este fim, foram utilizados três tipos de segmentação das imagens das mamas e dois tipos de classificadores, o classificador Discriminante Linear e um classificador de Distância Mínima baseado em três distâncias: a Euclidiana, a de Mahalanobis e a City Block. Para avaliar a robustez dos classificadores usados também foram analisados casos especiais, que englobaram dois tipos de casos: mulheres que amamentavam com apenas uma das mamas e outro caso onde com imagens de uma mulher que passou por cirurgia prévia da mama. No grupo de teste, composto por 29 pacientes, a maioria das imagens foi de pacientes normais e essa classe apresentou uma grande variabilidade dos dados. Foi então necessário minimizar esses efeitos nos classificadores, sendo feito outro tipo de análise, levando em conta a variância da classe normal. De modo geral, o classificador Discriminante Linear apresentou os melhores resultados, indicando ser o mais robusto para esse tipo de amostra. Foram comparados dois tipos de segmentação de imagens e concluiu-se pelos resultados comparativos, que as segmentações manuais não interferiram de forma significativa na classificação das referidas imagens. Concluiu-se também, que numa triagem às cegas é necessário fazer algumas perguntas simples às pacientes. Os resultados obtidos com os classificadores e com as segmentações dão indícios que a termografia pode ser utilizada como uma ferramenta de triagem em localidades com condições médicas precárias. Palavras-chave: Câncer de mama. Termografia. Classificação de imagem. Técnica de triagem. ABSTRACT Breast cancer is one of the main types of cancer that currently lead women to death in Brazil and in the world. The cancer arises from an uncontrolled growth of malignant cells in the body, leading to an increased blood perfusion in the affected region, and thus increasing the local temperature. This increase can be measured by thermography cameras. In this study, a statistical classification of breast thermographic images was carried out, analyzing a group of women whose images were acquired without adequate control of the thermal environment variables. Those thermographic images were classified using another group of images from patients at the Hospital das ClinicasUFPE. Those images were acquired under measured thermal conditions. With the image analysis and its classification in the referred conditions we intend to investigate if the thermography can be used as a potential screening technique for breast abnormalities in regions of insufficient medical conditions. For this purpose, we used three diferent techniques for segmenting breast images and two types of classifiers, Linear Discriminant classifier, and a Minimum Distance classifier based on three distances: the Euclidean distance, the Mahalanobis distance and the City Block one. To assess the robustness of the used classifiers, specific cases were also analyzed. The first one was breast-feeding women in only one breast. The other case we considered images of a woman who has undergone previous surgery of the breast. In the test group, most images were of normal patients. This class presented a wide variability of the data. It was then necessary to minimize these effects on the classifiers. Another analysis was done taking into account the variance of the normal class. In general, Linear Discriminant Classifier presented the best results. We concluded also that manual types of segmentation did not interfere significantly in the image classification. Furthermore, we concluded that in a blind screening you must do some simple questions to the patients, like if they had previous breast surgery or if they are if they are breastfeeding their children. The present study gives an evidence that thermography can be used as a screening tool in locations with insufficient medical condition. Keywords: Breast cancer. Thermography. Image classification. Screening technique. LISTA DE FIGURAS Figura 1 - Anatomia da mama feminina ......................................................................... 22 Figura 2 - Diagrama de blocos para análise de assimetria de termogramas usando a segmentação apresentada ................................................................................................ 40 Figura 3 - Resultado da segmentação automática apresentada por Kappor et al. (2012)41 Figura 4 - Passos do algoritmo de segmentação desenvolvido por Motta (2010) .......... 42 Figura 5 - Resultado final da segmentação proposta em Dourado Neto (2014)............. 43 Figura 6 - Comparação de segmentações: lado esquerdo, com a utilização do mouse e lado direito, com a segmentação proposta por Marques (2012), usando-se uma caneta em uma tela sensível ao toque. ....................................................................................... 43 Figura 7 - Etapas da classificação................................................................................... 45 Figura 8 - Tipo de protocolo utilizado nos diferentes locais das aquisições das imagens ........................................................................................................................................ 48 Figura 9 - Aparato mecânico utilizado na realização dos exames. ................................. 50 Figura 10 - Imagens T2 da primeira série e da segunda série ........................................ 51 Figura 11 - Matriz de temperaturas obtida do QuickReport ........................................... 53 Figura 12 - Tela inicial do FLIR QuickReport 1.2 SP2 onde são ajustadas as imagens. 53 Figura 13 - Representação da segmentação das mamas de duas pacientes seguindo a metodologia usada por Araújo (2014). ........................................................................... 54 Figura 14 - a) Imagem vista a princípio com Matlab; b) Imagem rotacionada para seleção da mama ............................................................................................................. 55 Figura 15 - Máscara criada a partir da Figura 14a. a) Máscara original; b) Máscara rotacionada...................................................................................................................... 55 Figura 16 - Imagem das mamas segmentadas. a) Mama direita; b) Mama esquerda ..... 55 Figura 17 - Etapas da segmentação desenvolvida por Queiroz (2014) .......................... 56 Figura 18 - Segmentação com estratégia de corte de Dourado Neto (2014) .................. 57 Figura 19 - Representação da extração de características para classificação ................. 58 Figura 20 - Processo morfológico para extração de características da mama com a segmentação por splines. a) Representação da mama em 2D; b) Representação da mama em 3D; c) Representação da mama em 3D com borda reduzida em 5%; d) Representação da mama em curvas de níveis de temperatura. ....................................... 59 Figura 21 - Processamento morfológico obtido a partir da segmentação da imagem térmica ............................................................................................................................ 60 Figura 22 - Etapas do trabalho ........................................................................................ 67 Figura 23 - Representação de três classes ...................................................................... 67 Figura 24 - Representação das quatro classes ................................................................ 68 Figura 25 - Representação gráfica da comparação do número de acertos dos classificadores com as três segmentações e considerando duas classes (Câncer; Não Câncer)............................................................................................................................ 71 Figura 26 - Gráfico comparativo da porcentagem de acertos de cada classificador com as três segmentações, levando em conta a minimização dos efeitos da variabilidade da classe normal e avaliando em nível de duas classes (Câncer; Não - Câncer). ............... 73 Figura 27 - Representação gráfica da comparação das porcentagens de acertos para cada classificador em cada uma das segmentações ................................................................ 75 Figura 28 - Representação gráfica da comparação da porcentagem de acertos dos classificadores para as três segmentações com a minimização dos efeitos da variabilidade da Classe Normal ...................................................................................... 77 Figura 29 - Exemplo de imagem termográfica de paciente em fase de amamentação onde apenas uma das mamas é utilizada na amamentação. ............................................ 78 Figura 30 - Imagem frontal (T2) da paciente que passou por cirurgia na mama esquerda ........................................................................................................................................ 82 Figura 31 - Segmentação por elipses das mamas da paciente ........................................ 82 Figura 32 - Segmentação por splines das mamas da paciente ........................................ 82 LISTA DE TABELAS Tabela 1 - Categorias de imagens de mama - relatório e sistema de dados (BI-RADS). 24 Tabela 2 - Caracteres gerais dos neoplasmas benignos e malignos. .............................. 25 Tabela 3 - Estimativas para o ano de 2014 para as taxas brutas de incidência por mil habitantes e do número dos casos novos de câncer, segundo sexo e localização primária no estado de Pernambuco. .............................................................................................. 28 Tabela 4 - Protocolos de aquisição de imagens termográficas da mama. ...................... 37 Tabela 5 - Classificação em duas classes com a segmentação por elipses ..................... 70 Tabela 6 - Classificação em duas classes com a segmentação por splines..................... 70 Tabela 7- Classificação em duas classes com a segmentação automática ..................... 70 Tabela 8 - Análise em duas variáveis com minimização da influência da variabilidade da Classe Normal e segmentação por elipses ................................................................. 72 Tabela 9 - Análise em duas variáveis com minimização da influência da variabilidade da Classe Normal e segmentação por splines ................................................................. 72 Tabela 10 - Análise em duas variáveis com minimização da influência da variabilidade da Classe Normal e segmentação automática ................................................................. 72 Tabela 11 - Resultados dos quatro classificadores para segmentação por elipses ......... 74 Tabela 12 - Resultados dos quatro classificadores para segmentação por splines ......... 74 Tabela 13 - Resultados dos quatro classificadores para segmentação automática ......... 74 Tabela 14 - Resultado dos classificadores com segmentação por elipses e com a minimização dos efeitos da variabilidade da Classe Normal ......................................... 76 Tabela 15 - Resultado dos classificadores com segmentação por splines com a minimização dos efeitos da variabilidade da Classe Normal ......................................... 76 Tabela 16 - Resultado dos classificadores com segmentação automática e com minimização dos efeitos da variabilidade da Classe Normal ......................................... 76 Tabela 17 - Resultados dos classificadores em duas classes para este caso com segmentação por elipses ................................................................................................. 78 Tabela 18 - Classificação para cada imagem segmentada por elipses ........................... 79 Tabela 19 - Resultados dos classificadores em duas classes para este caso com a segmentação por splines. ................................................................................................ 79 Tabela 20 - Representação da classificação das imagens com segmentação por splines 80 Tabela 21 – Resultados para os classificadores com relação a duas classes e com a utilização da segmentação automática ............................................................................ 80 Tabela 22 - Representação da classificação das imagens com segmentação automática 81 Tabela 23 - Resultados dos classificadores com a segmentação por elipses .................. 83 Tabela 24 - Resultados dos classificadores para cada imagem da paciente segmentada por elipses ....................................................................................................................... 83 Tabela 25 - Resultados dos classificadores com a segmentação por splines.................. 83 Tabela 26 - Resultados dos classificadores para cada imagem com a segmentação splines ............................................................................................................................. 84 Tabela 27- Resultados dos classificadores para cada imagem com a segmentação automática....................................................................................................................... 84 Tabela 28 - Resultados dos classificadores para cada imagem com a segmentação automática....................................................................................................................... 84 LISTA DE SÍMBOLOS gi (x) Função discriminante para o classificador Discriminante Linear x Padrão desconhecido P(wi) Probabilidade da classe wi wi i-ésima classe wj j-ésima classe C Número de classes ui Protótipo ∑i Matriz de covariâncias para a classe wi ∑ Matriz de covariância LISTA DE ABREVIATURAS E SIGLAS ACR American College of Radiology AEM Autoexame da mama B Classe Benigno Bi-RADS Breast Imaging Reporting and Data System Ca Classe Câncer Ci Classe Cisto Core Biopsy Punção por agulha grossa CT Classification Trees DEMEC Departamento de Engenharia Mecânica DNA Ácido desoxirribonucleico ECM Exame clínico das mamas HC Hospital das Clínicas ILT Incremento localizado de temperatura INCA Instituto Nacional do Câncer KNN K- Nearest Neighbours LEMD Imagem lateral externa da mama direita LEME Imagem lateral externa da mama esquerda LIMD Imagem lateral interna da mama direita LIME Imagem lateral interna da mama esquerda MAXVER Classificador de Máxima Verossimilhança N Classe Normal NO Óxido Nítrico OMS Organização Mundial da Saúde PAAF Punção aspirativa por agulha fina PE Pernambuco RM Ressonância magnética RNA Rede Neural Artificial ROC Receiver Operating Characteristic ROI Region of interest SAC Sociedade Americana de Câncer SVM Support Vector Machine TC Tomografia computadorizada TCLE Termo de consentimento livre e esclarecido T1 Imagem frontal da mama (paciente com as mãos na cintura) T2 Imagem frontal das mamas (paciente com as mãos levantadas segurando a barra do aparato mecânico) UFPE Universidade Federal de Pernambuco SUMÁRIO 1 INTRODUÇÃO ...................................................................................................... 17 1.1 CONSIDERAÇÕES GERAIS ......................................................................... 17 1.2 MOTIVAÇÃO ................................................................................................. 18 1.3 OBJETIVOS .................................................................................................... 19 1.3.1 Objetivo geral ........................................................................................... 19 1.3.2 Objetivos específicos ................................................................................ 20 1.4 2 3 ORGANIZAÇÃO DO PRESENTE TRABALHO .......................................... 20 REVISÃO BIBLIOGRÁFICA ............................................................................... 21 2.1 MAMAS .......................................................................................................... 21 2.2 DISTÚRBIOS MAMÁRIOS ........................................................................... 25 2.2.1 Cistos ........................................................................................................ 26 2.2.2 Fibroadenoma ........................................................................................... 26 2.2.3 Carcinoma ................................................................................................. 27 2.3 CÂNCER DE MAMA NO BRASIL ............................................................... 27 2.4 DIAGNÓSTICO POR IMAGEM DA MAMA ............................................... 30 2.5 TERMOGRAFIA ............................................................................................. 33 2.6 PROTOCOLOS DE AQUISIÇÃO DE IMAGENS TERMOGRÁFICAS...... 35 2.7 SEGMENTAÇÃO DE IMAGENS TERMOGRÁFICAS ............................... 38 2.8 CLASSIFICAÇÃO .......................................................................................... 44 METODOLOGIA ................................................................................................... 48 3.1 AQUISIÇÃO DAS IMAGENS ....................................................................... 48 3.2 SEGMENTAÇÃO UTILIZADA ..................................................................... 52 3.3 CLASSIFICADORES UTILIZADOS ............................................................. 60 3.3.1 Classificador Discriminante Linear .......................................................... 61 3.3.2 Classificador de Distância Mínima........................................................... 63 3.4 CARACTERÍSTICAS DAS ETAPAS DE ESTUDO ..................................... 64 4 RESULTADOS E DISCUSSÃO ........................................................................... 69 4.1 ANÁLISE DA CLASSIFICAÇÃO DE DUAS CLASSES PARA TRÊS SEGMENTAÇÕES DISTINTAS .............................................................................. 69 4.2 ANÁLISE DA CLASSIFICAÇÃO DE QUATRO CLASSES COM A UTILIZAÇÃO DE TRÊS SEGMENTAÇÕES DISTINTAS .................................... 73 4.3 CLASSIFICAÇÃO DE CASOS ESPECIAIS COM TRÊS SEGMENTAÇÕES DISTINTAS ............................................................................................................... 77 5 4.3.1 Caso 1 – Imagens de pacientes voluntárias amamentando em uma única mama 77 4.3.2 Caso 2 – Paciente voluntária com cirurgia realizada em uma das mamas 81 CONCLUSÕES ...................................................................................................... 86 5.1 SÍNTESE DOS PRINCIPAIS RESULTADOS ............................................... 86 5.2 TRABALHOS FUTUROS .............................................................................. 87 1 INTRODUÇÃO 1.1 CONSIDERAÇÕES GERAIS O câncer é o nome dado a um conjunto de mais de cem doenças que possuem em comum o crescimento desordenado de células, invadindo tecidos e órgãos. Estas células são bastante agressivas e de crescimento incontrolável. Elas se dividem rapidamente e determinam a formação de tumores malignos. Estes, por sua vez, podem se espalhar por outras regiões do corpo. As causas de câncer são variadas e podem ser externas ou internas ao organismo. As causas externas estão ligadas ao meio ambiente e aos hábitos ou costumes próprios de uma sociedade. As causas internas são geneticamente pré-determinadas, estando relacionadas à capacidade do organismo de se defender das agressões externas. Diferentes tipos de células podem ser a origem inicial dos tumores. Caso comecem em tecidos epiteliais, como pele ou mucosas, são denominados carcinomas. Se o ponto de partida são os tecidos conjuntivos, como osso, músculo ou cartilagem, são chamados sarcomas (INCA, 2014a). Existem dificuldades na prevenção do câncer de mama devido à grande variedade de fatores de risco e das características genéticas dos tumores. Novas metodologias para detecção de câncer de mama vêm sendo estudadas, principalmente abordagens que podem ser feitas em países onde a grande parte da população sobrevive com baixa renda (BORCHARTT, 2013). Os principais métodos atualmente utilizados na detecção do câncer de mama são o autoexame, o exame clínico e a mamografia. Destes, a mamografia é o mais indicado para a detecção precoce da doença. Existem várias campanhas em todo o Brasil para lembrar sobre a importância da detecção e do tratamento precoce. Muitas mulheres são estimuladas desde cedo para que façam o autoexame e que tenham a mamografia como um exame de rotina a partir dos 40 anos (INCA, 2011). Dentre o grupo de mulheres que apresentam algum tipo de distúrbio mamário, parte dele são de jovens. Para esses casos a mamografia não é recomendada, pois ela usa radiação ionizante e não tem grande eficácia em mamas densas, características das mamas jovens. 17 Quando as mulheres estão na menopausa, as mamas são compostas em grande parte por tecido adiposo, fazendo com que microcalcificações e massas fiquem bem visíveis em mamografias. Porém, existe uma grande dificuldade de visualização por Raios-x de possíveis alterações da mama em tecidos densos (NG, 2009). Entre as novas técnicas que vêm sendo testadas no rastreio de câncer de mama encontra-se a termografia que não usa radiação ionizante, acesso venoso ou qualquer outro procedimento invasivo, não existindo qualquer contato com a superfície da pele da paciente. Também não ocasiona dor ou qualquer desconforto. É um exame barato, comparando-se com os métodos usuais, tais como mamografia, ultrassom e ressonância magnética (BORCHARTT, 2013). Nos últimos vinte anos, a termografia atingiu valores médios de sensibilidade e de especificidade de cerca de 90% para detecção de tumores de mama, possuindo vantagens para a detecção de problemas em mamas de mulheres jovens (NG, 2009). Desta forma, ela vem se tornando uma técnica auxiliar importante para o diagnóstico clínico, sendo possível avaliar diversas doenças. É uma modalidade de imagem que vem sendo utilizada em muitas áreas médicas, tais como oncologia, cirurgia, reumatologia, neurologia, urologia, angiologia, ginecologia e oftalmologia. (DIAKIDES & BRONZINO, 2008). 1.2 MOTIVAÇÃO Esse trabalho tem por motivação a avaliação do uso da termografia em localidades carentes, para diagnóstico de câncer de mama. Em 2003, Monteiro et al. realizou, através de questionários, um estudo com 505 mulheres, referentes ao conhecimento e prática do auto exame das mamas (AEM) e possíveis fatores associados. Os resultados mostraram que apenas um terço dessas mulheres o faziam de maneira correta. Em estudo similar, feito por Manrique Abril et al. (2012) com 810 mulheres na Colômbia, foi verificado que apenas 27,8% faziam o AEM e destas, apenas 6,2% realizam de maneira correta. Os principais motivos encontrados para a não realização do AEM foram o desconhecimento a respeito da técnica, o nível de escolaridade e o desconhecimento do câncer de mama. 18 A rotina diária de trabalho, a desinformação, algumas vezes a acomodação com a própria saúde, somando-se o costume de apenas procurar o médico quando se está doente fazem com que o AEM tenha uma prática e aplicação correta tão baixa. Barros et al. (2012) e Acharya et al. (2012) defendem que o câncer de mama é um problema de saúde pública. Unger & Infante (2009) e Barros et al. (2012) afirmam que considerando o cenário de aumento constante da incidência do câncer de mama são necessários uma criteriosa organização e um aprimoramento dos serviços de assistência à saúde, a fim de garantir acesso ao diagnóstico e tratamento precoce promovendo um tratamento com melhor custo benefício e minimizando qualquer atraso que possa ocorrer no diagnóstico das pacientes, pois esse atraso está ligado a menor sobrevida e ao maior avanço da doença. Segundo Ng (2009), além de a termografia ter potencial para detecção do câncer de mama de forma precoce, ela é capaz de identificar o câncer dez anos antes quando comparado a outras formas de diagnóstico, como a mamografia. Esse trabalho busca mostrar que a termografia pode ser facilmente utilizada em regiões com condições médicas precárias com o objetivo de ser uma ferramenta de triagem para anomalias mamárias. Fatores como custo, a não-emissão de radiação ionizante, ausência de contato físico com o paciente, de ser não-invasivo, econômico, rápido e de não infligir qualquer tipo de dor ao mesmo podem ser responsáveis pela maior aceitação da técnica nas regiões carentes. 1.3 OBJETIVOS 1.3.1 Objetivo geral O objetivo geral desse trabalho é segmentar e classificar imagens termográficas de mamas, analisando os resultados obtidos com diferentes tipos de segmentadores e classificadores estatísticos, a fim de investigar se a termografia pode ser utilizada como uma técnica de triagem de possíveis anomalias de mama, quando tais imagens são 19 adquiridas em regiões de poucos recursos médicos e/ou em ambientes com condições térmicas desfavoráveis. 1.3.2 Objetivos específicos Os objetivos específicos desse trabalho são: Acrescentar a classe das pacientes normais, que não apresentam patologias mamárias, no grupo de treino da metodologia apresentada por Araújo (2014), onde as patologias mamárias foram inicialmente classificadas a partir somente das classes cisto, benigno e maligno. Classificar as pacientes do Assentamento Veneza (São Lourenço da Mata) e da cidade de Chã de Alegria, ambas no Estado de Pernambuco, com imagens obtidas em local com condições térmicas desfavoráveis para aquisição de imagens termográficas, usando como grupo de treino as imagens de pacientes do Ambulatório de Mastologia do Hospital das Clínicas da Universidade Federal de Pernambuco (HC/UFPE) obtidas seguindo o protocolo estabelecido por Oliveira (2012). Comparar as segmentações manual por splines apresentada em Queiroz (2014), a segmentação manual por elipses proposta por Araújo (2014) e a segmentação automática desenvolvida por Dourado Neto (2014). 1.4 ORGANIZAÇÃO DO PRESENTE TRABALHO Essa dissertação possui um total de cinco capítulos. O primeiro deles é o capítulo introdutório, onde são feitas algumas considerações iniciais, a motivação a qual levou a elaboração desse trabalho, além dos objetivos a serem alcançados e a forma como todo o trabalho foi organizado. O segundo capítulo apresenta uma revisão bibliográfica a respeito das mamas, do câncer de mama, dos métodos utilizados para o diagnóstico do câncer, da termografia, dos protocolos de aquisição de imagens, da segmentação de imagens e dos classificadores estatísticos usados para classificar patologias mamárias. O terceiro capítulo descreve as metodologias utilizadas na aquisição das imagens termográficas, na segmentação e na classificação estatística dessas imagens. 20 No quarto capítulo são apresentados os resultados obtidos e discussão a respeito dos mesmos, com base na metodologia utilizada. O quinto e último capítulo apresenta as conclusões deste trabalho e sugestões de trabalhos futuros. 2 REVISÃO BIBLIOGRÁFICA 2.1 MAMAS As mamas são anexos da pele. É formada por glândulas cutâneas modificadas que se especializaram na produção de leite após a gestação. É uma proeminência bilateral formada por tecido glandular, tecido conjuntivo e tecido adiposo (DANGELO & FATTINI, 2007). As mamas estão situadas na região peitoral, no estrato areolar da tela subcutânea, e são separadas pelo sulco intermamário. Seus componentes são o parênquima, o estroma e a pele (DANGELO & FATTINI, 2007). As estruturas histológicas variam de acordo com o sexo, a idade e o estado fisiológico (JUNQUEIRA & CARNEIRO, 2008). A seguir, estão descritas tais estruturas. a) Parênquima: também chamado de glândula mamária, é constituído por 15 a 25 lobos de glândulas túbulo-alveolares compostas, cuja função é secretar leite. Cada lóbulo possui vários alvéolos (produtores do leite), envoltos por tecido conjuntivo frouxo. Os alvéolos se conectam por meio de ductos intralobulares. Os vários ductos interlobulares, dão origem ao ducto galactóforo (ou ducto mamário) e sua extremidade apresenta uma dilatação e muda para seio galactóforo. Este último desemboca no mamilo. Cada ducto galactóforo representa uma glândula individual (JUNQUEIRA & CARNEIRO, 2008); b) Estroma: é o tecido conjuntivo que envolve os lobos e as glândulas mamárias como um todo. Há predominância do tecido adiposo sustentado por tecido conjuntivo denso. O tamanho e a forma da mama estão diretamente relacionados à quantidade de tecido adiposo envolvido (DANGELO & FATTINI, 2007); 21 c) Pele: possui glândulas sebáceas e sudoríparas, é fina e possibilita a visualização dos vasos superficiais (DANGELO & FATTINI, 2007). A pele ao redor do mamilo constitui a aréola. Esta pode variar a coloração (após a gestação raramente volta à sua tonalidade anterior) (JUNQUEIRA & CARNEIRO, 2008). A Figura 1 apresenta a anatomia da mama feminina e a apresenta de forma esquemática: Figura 1 - Anatomia da mama feminina Fonte: Guyton & Hall, 2011. 22 A forma da mama é cônica, variando com a quantidade de tecido adiposo, o estado fisiológico e a idade. Na mulher, o desenvolvimento da mama tem início da ovulação. As gestações e a idade facilitam a perda de elasticidade do estroma (estrutura de sustentação) (JUNQUEIRA & CARNEIRO, 2008). As mamas começam a se desenvolver na puberdade por ação dos estrógenos. Estes estimulam o desenvolvimento dos ductos galactóforos e o acúmulo de gordura, proporcionando o aumento de volume (GUYTON & HALL, 2011). O maior aumento de volume da mama ocorre ao final da gestação, todavia, não há correlação entre seu tamanho e uma maior produção de leite. Seu aumento pode ser explicado pelo acúmulo de gordura. Os hormônios no período pré-menstrual podem levar ao aumento doloroso de tamanho; assim como o início da menopausa leva à involução das glândulas, seguidos de redução do tamanho e atrofia dos alvéolos, dos ductos e do tecido conjuntivo interlobular (JUNQUEIRA & CARNEIRO, 2008). O mamilo é uma projeção dos ductos galactóforos, e sua pele possui uma camada de tecido conjuntivo com fibras musculares lisas e rica em terminações nervosas sensoriais (DANGELO & FATTINI, 2007; JUNQUEIRA & CARNEIRO, 2008). Ao redor do mamilo está a aréola, rica em melanócitos, o que dá a coloração diferente da pele. Ela também possui glândulas sudoríparas e sebáceas. Em homens e crianças, a mama é pouco desenvolvida, diminuta, restringindo-se ao mamilo e à aréola (JUNQUEIRA & CARNEIRO, 2008). Um conjunto de hormônios, destacando-se o estrógeno secretado pela placenta durante a gestação, estimula o crescimento e a ramificação dos ductos mamários, assim como o maior depósito de gorduras (GUYTON & HALL, 2011). A progesterona desenvolve completamente o sistema tubulo-alveolar, inclusive um crescimento adicional dos lóbulos, o rebrotamento de alvéolos e a função secretora das células desses alvéolos (GUYTON & HALL, 2011). A prolactina estimula a secreção do leite, apesar dos hormônios supracitados inibirem tal ação e nunca permite que a glândula secrete mais que poucos mililitros diários antes do nascimento da criança. Após o nascimento, com a queda dos estrógenos 23 e progesterona, a prolactina pode exercer sua função, regulada pelo hipotálamo. O ato de amamentar estimula a produção do leite (GUYTON & HALL, 2011). O Breast Imaging Reporting and Data System (BI-RADS), do American College of Radiology (ACR), foi desenvolvido para padronizar o laudo mamográfico e reduzir os fatores de confusão na descrição e interpretação das imagens, além de facilitar o monitoramento do resultado final do exame (GODINHO & KOCH, 2004). Este sistema foi desenvolvido para melhorar a qualidade dos diagnósticos, para tanto, é estruturado em quatro seções: a) Seção I - Léxico da imagem mamográfica: padronização dos termos utilizados para os laudos mamográficos, descrevendo as lesões encontradas; b) Seção II - Sistematização do laudo mamográfico: refere-se à organização e redação do laudo, de modo a ser compreendido mundialmente; c) Seção III - Acompanhamento e monitoramento do resultado final: as lesões deverão ser descritas, classificadas para monitoramento; d) Seção IV - Criação de um banco de dados nacional: armazenamento de imagens em um banco de dados nacional, com acesso para médicos e grupos de pesquisa. A seguir, pode-se observar a classificação, por categorias, a partir da avaliação dos laudos, além de suas recomendações. Tabela 1 - Categorias de imagens de mama - relatório e sistema de dados (BI-RADS). Categoria Avaliação Descrição Recomendação 1 Negativo Nada a comentar Exame de rotina 2 Benigno Achado benigno observado Exame de rotina 3 Provavelmente Achado com uma alta probabilidade de Acompanhamento benigno benignidade (>98%) em intervalo de seis meses 4 5 6 Suspeita de Sem característica de câncer de mama, mas Biópsia deve ser anormalidade probabilidade razoável de malignidade considerada Suspeita de Lesão com alta probabilidade de ser Tomar medidas malignidade alta maligno (≥95%) apropriadas Biopsia de Lesão conhecida como maligna e sendo Garantia de malignidade exibida antes do tratamento definitivo tratamento está 24 comprovada completa Fonte: American College of Radiology (1998). Uma classificação à parte, seria a Categoria 0 (zero) e a 6 (seis). A zero refere-se a uma avaliação incompleta, indicando a necessidade de avaliação adicional por imagem. Entretanto, a seis, já existe diagnóstico do câncer confirmado anteriormente por exame histopatológico, sendo suficientes exames feitos apenas para acompanhamento. 2.2 DISTÚRBIOS MAMÁRIOS Neoplasias são neoformações teciduais provenientes de células do organismo. Possuem crescimento ilimitado e autônomo, que acaba alterando a estrutura, a forma e a função do local. Não possuem utilidade para o organismo, à custa do qual se nutrem. São também conhecidas como blastomas ou tumores verdadeiros (FARIA, 2003; KITT, 1954). Baseado em características reveladas por métodos clínicos e morfológicos as neoplasias são classificadas em benignas ou malignas. Essas características estão resumidas na Tabela 2 (FARIA, 2003). Tabela 2 - Caracteres gerais dos neoplasmas benignos e malignos. Benignos Malignos Crescimento Lento e expansivo Rápido e infiltrativo Delimitação Nítida Imprecisa Tamanho Maior possibilidade de atingir grandes Menor possibilidade de atingir volumes grandes volumes Ulceração Rara Frequente Consistência A do tecido matriz Tendência a ser mais mole Cor A do tecido matriz Tendência à cor branca Necrose Rara Frequente 25 Recidiva Ausente Presente Metástase Falta Presente Função Mantém a célula-matriz Abolida ou diminuída da célulamatriz Aspecto macroscópico Células maduras, homotípicas Células imaturas, heterotípica Fonte: Faria (2003) Dentre as patologias mamárias mais frequentes, pode-se citar: os cistos, os adenomas e os carcinomas. 2.2.1 Cistos É uma modificação benigna da estrutura da mama, de formato redondo ou ovalar, múltipla ou solitária, de cavidade única contendo líquido pardo e opaco. O tratamento, geralmente, é por punção aspirativa (SERRANO, 2010). A frequência dos cistos se encontra em mulheres entre 40 e 50 anos de idade, assintomático, com raros casos de dor na região. A detecção pode ser pela palpação da mama, e sua confirmação por punção e análise do conteúdo (SERRANO, 2010). Em caso confirmado, é possível o acompanhamento sem necessidade de tratamento, e não é certeza de evolução para uma neoplasia maligna. A cirurgia é indicada em casos de recidiva ou nódulo residual (SERRANO, 2010). 2.2.2 Fibroadenoma É uma neoplasia benigna de formato definido e, na maioria dos casos, palpável. Na mamografia, apresenta-se com formato de pipoca arredondada ou oval, delimitado, radiopaco (por sua maior densidade). Na ultrassonografia, seu formato é oval, hipoecóico em seu interior. Na termografia, a região possui temperatura mais elevada e diferente do resto da mama (SERRANO, 2010), da mesma forma que o cisto e o câncer (BEZERRA, 2013). 26 2.2.3 Carcinoma É uma neoplasia maligna de crescimento rápido, desorganizado e infiltrativo, de limite indefinido e irregular, podendo resultar em metástase (disseminação de células neoplásicas no organismo) (SERRANO, 2010). Na mamografia, o carcinoma se apresenta radiopaco. Na ultrassonografia, este se apresenta hipoecóico sem contornos delimitados. Na termografia, o carcinoma apresenta temperatura diferente da do tecido normal, sendo possível visualizar a alteração da vascularização, acentuando a assimetria de temperatura entre as mamas. Não é possível visualizar a neoplasia, mas a biópsia pode confirmar o diagnóstico. Os tipos de carcinoma são: Carcinoma in situ: estágio inicial, referente ao local de aparição; Carcinoma ductal in situ: neoplasia não-invasiva, comum e curável. Restringe- se aos ductos, não atingindo tecido adiposo; Carcinoma lobular in situ: neoplasia restrita aos lóbulos; Carcinoma ductal invasivo: atravessa os ductos e envolve o tecido adiposo, podendo se disseminar no organismo; Carcinoma lobular invasivo: inicia nos lóbulos, podendo se disseminar no organismo. 2.3 CÂNCER DE MAMA NO BRASIL O câncer de mama é o segundo tipo mais frequente de câncer no mundo, sendo mais comum entre mulheres e respondendo por 22% dos casos novos a cada ano. As taxas de mortalidade por câncer de mama no Brasil continuam elevadas, provavelmente devido ao diagnóstico tardio da doença. Após cinco anos, é de 61% a sobrevida média da população mundial (INCA, 2014a). Acima da faixa etária de 35 anos, a incidência do câncer de mama cresce de maneira rápida e progressiva. Estatísticas indicam aumento de sua incidência tanto nos países desenvolvidos quanto nos em desenvolvimento. Segundo a Organização Mundial da Saúde (OMS), foi registrado um aumento de dez vezes nas taxas de incidência 27 ajustadas por idade, nos Registros de Câncer de Base Populacional de diversos continentes nas décadas de 60 e 70 (INCA, 2014b). Podemos observar na Tabela 3 que a estimativa de casos de câncer de mama no estado de Pernambuco é bastante elevada. No Recife, essa estimativa para esse tipo de câncer no ano de 2014 superou qualquer outra. No sexo feminino, os tumores com maior prevalência são o de pele não melanoma com 71 mil casos novos, mama com 53 mil, colo do útero com 18 mil, cólon e reto com 16 mil e pulmão com 10 mil (INCA, 2014a). Apesar de existirem mais de cem formas de câncer, o processo básico do surgimento da doença é muito similar. Células normais coordenam as suas atividades com as das células vizinhas, no que diz respeito ao crescimento e à divisão, fazendo parte de uma comunidade celular. Resultado de uma acumulação de pequenas alterações no genoma celular, que se perpetua na reprodução celular, o comportamento errôneo das células cancerígenas faz com que elas ignorem os controles celulares e produzem falsos sinais que coagem os seus vizinhos a colaborar com elas (BAPTISTA, 2006). Tabela 3 - Estimativas para o ano de 2014 para as taxas brutas de incidência por mil habitantes e do número dos casos novos de câncer, segundo sexo e localização primária no estado de Pernambuco. Localização primária Estimativas dos casos novos da neoplasia maligna Homens Estado Casos Mulheres Capital Taxa Casos Bruta Estado Taxa Casos bruta Capital Taxa Casos Bruta Taxa Bruta Próstata 2.560 58,19 620 84,74 - - - - Mama feminina - - - - 2.450 51,64 780 90,25 Colo do útero - - - - 970 20,47 180 20,43 Traqueia, brônquio e 510 11,65 150 20,66 380 8,06 110 12,06 Colon e reto 330 7,63 110 14,05 520 10,88 210 23,91 Estômago 480 11,01 80 10,54 330 7,06 60 6,95 pulmão 28 Cavidade oral 410 9,23 80 10,64 200 4,17 40 4,76 Laringe 270 6,18 70 9,42 40 0,93 ** 1,19 Bexiga 210 4,59 60 8,07 80 1,72 20 2,18 Esôfago 230 5,18 40 5,61 110 2,33 20 2,28 Ovário - - - - 270 5,75 110 12,35 Linfoma de Hodgkin 30 0,80 ** 0,97 20 0,52 ** 1,14 Linfoma não-Hodgkin 210 4,63 60 7,67 190 4,00 60 6,53 Glândula tireoide 70 1,56 ** 1,74 330 7,00 90 11,07 Sistema nervoso 210 4,66 50 6,39 160 3,39 110 12,38 Leucemias 190 4,42 40 5,31 190 3,93 40 4,94 Corpo do útero - - - - 290 6,12 90 10,91 Pele melanoma 90 2,06 20 2,71 60 1,24 ** 1,48 Outras localizações 1.480 33,76 350 47,71 1.590 33,49 320 37,56 Subtotal 7.280 165,67 1.750 237,37 8.180 172,49 2.270 263,99 Pele não-melanoma 2.030 46,21 380 51,28 2.580 54,40 360 42,40 Todas as neoplasias 9.310 211,88 2.130 288,65 10.760 226,89 2.630 306,39 central Fonte: INCA - Estimativa 2014: Incidência de câncer no Brasil A Sociedade Brasileira de Mastologia afirma que a formação de um câncer de mama depende de um processo sequencial contendo três etapas: iniciação, promoção e progressão. A iniciação é de origem genética, sendo assim, pode ser herdada ou adquirida e depende de uma lesão no DNA cromossômico que levará a uma desregulação do ritmo de multiplicação celular. A lesão do DNA é esporádica, não-hereditária e ocorre durante a vida do indivíduo, na maioria dos casos. Entre 5% e 10% dos casos, dependem de uma alteração genética familiar, já herdada no nascimento e que faz com que a mulher seja mais propensa ao câncer de mama. 29 Por fim, na fase de progressão, as células tumorais tendem a invadir uma camada que dá sustentação ao tecido dos ductos mamários, chamada membrana basal. Se não houver infiltração de membrana basal, o tumor é considerado não invasor, ou "in situ". Se houver infiltração, é invasor. Só neste caso passa a existir chance de se atingir pequenos vasos sanguíneos e capilares linfáticos, que podem deportar as células alteradas até outros órgãos, como ossos, pulmões e fígado. O câncer de mama pode ocorrer tanto em homens quanto em mulheres. Aproximadamente para cada 200 casos de câncer de mama em mulheres existe um em homens. Existem vários fatores de risco relacionados ao câncer de mama, tais como: a hereditariedade, especialmente se parentes de primeiro grau já possuírem histórico da doença antes dos 50 anos; a idade, com o aumento da idade há uma maior incidência; a ingestão de álcool, de mesma forma que a exposição a radiações ionizantes antes dos 35 anos (INCA, 2014c), tabagismo, uso de medicamentos, hábitos alimentares e fatores ocupacionais (ARAÚJO, 2009). O câncer de mama tem tratamento. Caso seja diagnosticado precocemente, o paciente tem 97% de chance de sobrevivência (NG, 2009). O exame clínico e a mamografia são as formas mais usadas para a detecção precoce do câncer de mama (MOTTA, 2010), podendo ser utilizados exames complementares para confirmação do diagnóstico, tais como a ultrassonografia, punção aspirativa por agulha fina (PAAF), punção por agulha grossa (Core Biopsy), e biópsia cirúrgica de acordo com os resultados do exame clínico e da mamografia (DOURADO NETO, 2014). Mesmo com a melhoria dos equipamentos de mamografia, a subjetividade da interpretação e o tipo de tecido mamário podem afetar a eficácia da mesma. Surge então a necessidade de desenvolver novas formas de diagnóstico. Uma dessas possibilidades é a utilização das câmeras de infravermelho (MOTTA, 2010). 2.4 DIAGNÓSTICO POR IMAGEM DA MAMA Existem atualmente vários tipos de exame para o diagnóstico por imagem da mama. Contudo, devem-se observar as virtudes e limitações de cada um. Um método 30 ideal deve ser inócuo, devendo proporcionar o mínimo de desconforto, deve possuir uma boa sensibilidade e especificidade, desta forma indicando uma possível lesão e apontando a sua origem, e ainda deve ter um custo compatível com os benefícios que trará para os usuários. O diagnóstico médico é baseado em estrutural, bem como em informações funcionais. Os métodos estruturais são radiografia, ultrassonografia, ressonância magnética e microscopia (histologia). Os métodos funcionais são eletrocardiograma, medição da pressão arterial, eletroencefalograma, testes de fluxo de ar pulmonares e termografia. Para tanto, nosso foco será nos exames referentes à mama (BERZ & SAUER, 2007). Os métodos de interesse atualmente são a mamografia, a ultrassonografia, tomografia computadorizada e a ressonância nuclear magnética que se adequam aos três requisitos ditos anteriormente. Contudo, a mamografia de alta resolução é o método mais utilizado mundialmente em mulheres com idade superior aos 35 anos. A ultrassonografia, a tomografia computadorizada e a ressonância magnética seguem em ordem de importância e utilização, sendo eles complementares à mamografia. A ultrassonografia é a mais indicada para pacientes jovens, pois não é indicado radiografar pacientes com menos de 35 anos. Sendo assim a ultrassonografia pode ser utilizada como primeiro exame para essas pacientes (OLIVEIRA et al., 2011). A ultrassonografia utiliza ondas sonoras de alta frequência para examinar o parênquima mamário e confirma a presença de nódulos. Como limitação, apresenta baixa detecção de pequenos tumores e o excesso de resultados falso-positivos. Segundo Tartar (2008), a triagem feita com a ultrassonografia parece mais sensível na detecção de câncer invasivo precoce, sendo um exame complementar de rastreamento, ao invés de substituir a mamografia. Já Silva (2010) afirma que não consegue detectar câncer em estágio muito precoce. Apesar de possuir menor sensibilidade se comparada à ressonância, esse exame auxilia em mamas densas, bem como técnicas recentes (por exemplo a elastografia) podem melhorar a especificidade, diminuir resultados falso-positivos e o uso de biópsias. A tomografia computadorizada é uma técnica de imagem que reproduz imagens tridimensionais que utiliza emissão de positróns, sendo o mais usado o isótopo F18 pelo seu tempo de meia vida de 109,8 minutos. Os cânceres malignos podem ser originários 31 de mutação de células que desregularam sua programação fisiológica e apresentam maior metabolismo de glicose, por necessitar de grande quantidade de energia para crescer, levando a contraste destas células anômalas (FASS, 2008; BORCHARTT, 2013). Para os exames relativos à mama, este é melhor aproveitado em estágio inicial, no tratamento e no monitoramento. É indicado quando a mamografia não pode ser realizada, em caso de mamas densas, próteses de silicone ou tendência por hereditariedade. Mas seus custos são elevados e a imagem é de baixa resolução (FASS, 2008; BORCHARTT, 2013). A ressonância magnética mostrou-se altamente sensível na detecção de câncer de mama invasivo e não é limitada pela densidade do parênquima mamário. No caso de carcinoma ductal in situ, devido a seu intervalo de precisão ser amplo, não se recomenda esse exame como substituto à mamografia. Este fator corrobora para o seu uso como ferramenta complementar. A Sociedade Americana de Câncer (SAC) recomenda a ressonância magnética anualmente para mulheres com risco de desenvolvimento, incluindo os genes para o câncer, histórico familiar de câncer mamário ou ovariano. Os casos questionados pela SAC se deve à insuficiência de dados, incluindo mulheres com histórico, biópsia atípica ou alta densidade na mamografia. Embora tenha havido melhorias significativas em técnica de mamografia, as limitações fundamentais permanecem. Estes incluem as baixas diferenças de contraste entre as estruturas de tecido inerentes na mama e o fato de que a detecção mamográfica de câncer de mama (sensibilidade) baseia-se na capacidade de visualizar câncer através do fundo de tecido normal sobrejacente. Especificidade da mamografia baseia-se na capacidade de distinguir lesões benignas de malignas de mama com base em suas margens e características morfológicas (SICKLES, 1990). No entanto, lesões malignas e benignas podem ter aparências semelhantes, reduzindo assim especificidade (ROSENERG, 2006). A sensibilidade da mamografia de alta resolução varia entre 91% e 96% dependendo da idade, tipo da mama e tamanho da lesão (OLIVEIRA et al, 2011). 32 2.5 TERMOGRAFIA A medição da temperatura da pele por contato ou à distância através do uso de materiais luminescentes é nomeada de termografia. Os métodos tradicionais como termômetros, termopares e termistores necessitam da temperatura do ponto de detecção por ponto para criar um mapa térmico. Este procedimento termográfico fornece uma exibição imediata de todos os pontos térmicos, mesmo sobre uma grande área. Neste caso, é mais fácil identificar a presença de pontos quentes e frios, as diferenças térmicas entre as duas partes simétricas da superfície do corpo e definição de padrões específicos (ALDO DI CARLO, 1995). As pesquisas com termografia infravermelha foram incentivadas para o uso militar a partir do Século XIX. Por volta da década de 60, ficou disponível para o uso industrial e civil, sendo de grande utilidade para Engenharia e outras áreas (ARAÚJO et al., 2009). A termografia também pode ser utilizada para obter informação sobre o estado de funcionamento de um componente, equipamento ou processo. Ela utiliza a radiação infravermelha que é emitida pelos organismos a fim de medir as temperaturas ou ainda identificar diferenças no padrão de distribuição de calor. Ainda, não emite radiação ionizante e é uma técnica não-invasiva (BRONZINO, 2006). Associa-se a radiação térmica (que pode compreender a faixa do infravermelho, luz visível e ultravioleta, no espectro da onda eletromagnética) à taxa na qual a energia é emitida pela matéria como resultado de sua temperatura não-nula, isto é, a radiação térmica é constantemente emitida por todo corpo com temperatura acima do zero absoluto (INCROPERA et al., 2008; NG, 2009). A radiação infravermelha emitida pela pele pode ser convertida em um valor de temperatura, devido ao alto valor de emissividade do corpo humano (BEZERRA, 2007). A utilização da termografia na medicina ocorre por dois fatores essenciais: é uma técnica não invasiva e que permite investigar efeitos fisiológicos invisíveis a outros exames. Estas características podem ser complementares a outros tipos de investigações. Entre as aplicações médicas dela, a detecção de câncer de mama é uma das mais promissoras e mais antigas (NG, 2009). 33 As mudanças na temperatura da mama podem estar relacionadas a uma possível gravidez e com o ciclo menstrual, sendo que em mamas saudáveis a distribuição de temperatura ocorre de forma simétrica, ou seja, essas mudanças atingem de alguma forma a ambas as mamas. Havendo uma grande assimetria na distribuição de temperaturas das mamas, possivelmente, alguma delas apresenta algum tipo de patologia (GAUTHERIE, 1989, in: BEZERRA, 2013). Essa assimetria ocorre em virtude de que as células cancerígenas produzem excessivamente o óxido nítrico (NO), ocasionando uma nova vascularização, para esta damos o nome de angiogênese, em torno do tumor (YAHARA et al., 2003). Segundo Ng (2004) e Araújo (2014), a angiogênese é necessária para ocorrer o fluxo constante de nutrientes necessários para o desenvolvimento dos tumores. Esses novos vasos elevam o fluxo de sangue naquela região, causando assim um aumento da temperatura local. Em tumores de mama, o aumento da temperatura local sobre a superfície da mama pode ser observado com o uso da termografia, sendo que a diferença de temperatura entre o tecido normal e doente pode diferir de 2º C a 3º C, com o valor mais altos sendo identificado na superfície da pele onde está localizado o tumor (HARRIS et al., 1996, in: BEZERRA, 2013). A formação dos novos vasos ocorre antes do aparecimento dos nódulos, fazendo com que a termografia possa ter um papel importante no diagnóstico precoce desse tipo de câncer. Portanto, em conjunto com o exame clínico, a técnica tem uma sensibilidade para detecção de câncer de mama próxima à da mamografia para mulheres com menos de 50 anos (NG & SUDHARSAN, 2004). Sinais térmicos assimétricos persistentes, obtidos de exames termográficos, que indicam anormalidades fisiológicas que se mantêm inalteráveis são dez vezes mais significativos do que o histórico familiar da doença no indicativo do futuro desenvolvimento de um tumor cancerígeno (AMALU, 2002; NG, 2009). 34 2.6 PROTOCOLOS DE AQUISIÇÃO DE IMAGENS TERMOGRÁFICAS Os primeiros estudos com imagem térmica foram focados no potencial da câmera termográfica para auxiliar no diagnóstico do câncer de mama, mas os sistemas das câmeras eram ainda incipientes. Algumas propostas para identificação de câncer foram embasadas na transferência de calor entre a lesão maligna e a superfície ou no reconhecimento de padrões, mas até então não fora utilizada em grandes amostras (RING & AMMER, 2012). Existe um número elevado de protocolos utilizados, o que dificulta a utilização de somente um padrão. Cada grupo de pesquisa adquire as imagens em posições distintas, adequadas à sua realidade. Uns utilizam aparatos para padronizar a aquisição de imagens, outros deixam a paciente de pé, fixando sua posição no chão (expressos nos autores consultados). A maior parte necessita usar termo de consentimento assinado pelos pacientes como forma de utilizar as imagens de forma anônima, sendo tal fato exigido por Comitês de Ética (BORCHARTT, 2013). Por essa diversidade, se fez necessária uma padronização para comparação de imagens entre centros de pesquisa, começando em 1978, pela Associação Europeia de Termografia, que publicou uma terminologia comum, assim como características de equipamentos e imagens (OLIVEIRA, 2012; BORCHARTT, 2013). Ammer (2008) descreve o protocolo Glamorgan, um projeto de 2001, para determinar a distribuição normal de temperatura da pele. Para isso, aplicou marcos anatômicos alinhados à borda da pele para assegurar o mesmo ponto de vista independente da proporção do corpo. O objetivo era permitir a reprodução das imagens. A Organização Internacional de Padronização publicou dois novos documentos que definem o uso de uma câmera termográfica para triagem de febre. A primeira, em 2008, descreve o desempenho essencial de uma câmera infravermelha radiométrica para o rastreio. A segunda, em 2009, define o modo recomendado de implantação incluindo o sistema e a formação de pessoal técnico (RING & AMMER, 2012). De acordo com Borchartt (2013) e de modo geral, os protocolos podem ser divididos em: 35 Quanto ao comportamento do corpo, em relação à transferência de calor (métodos estático ou dinâmico); Quanto à repetição de aquisição das imagens (simples, sequencial, ou de acompanhamento). Quanto ao comportamento do corpo em relação à essa transferência de calor, os protocolos estáticos levam em consideração o equilíbrio térmico com o ambiente. Os dinâmicos se referem à recuperação da temperatura do corpo após um estresse (térmico ou químico) (BORCHARTT, 2013; OLIVEIRA, 2012). Uma única imagem da mama não determina a temperatura da superfície facilmente, pela presença de superfícies curvadas. Isto justifica a série de imagens com posições anterior e oblíqua, de forma a maximizar os dados térmicos (RING & AMMER, 2012). Quanto à repetição da aquisição de imagens, os protocolos simples se aplicam à captura de imagens, em determinado tempo, para indicar flutuações térmicas (pontos quentes e frios) e com objetivo de medir assimetria na distribuição de temperaturas. Os sequenciais se referem à captura de imagens em série, durante alguns minutos, e a configuração é feita na própria câmera térmica. Já no acompanhamento, as imagens são capturadas após um intervalo de tempo mais expressivo, com o objetivo de monitorar tratamentos, doenças ou detecção precoce de alterações na mama (BORCHARTT, 2013). Durante a aquisição de imagens, algumas situações devem ser controladas para permitir a comparação com outros estudos mundiais, sendo elas: adequação da sala; preparação do paciente; e aquisição de imagens. Estes parâmetros surgiram a partir de características de itens dos protocolos encontrados na literatura (OLIVEIRA, 2012). A temperatura da mama, a ser registrada na termografia, é sensível às variações ambientais, tais como a temperatura ambiente, a umidade e a eventual circulação de ar no ambiente. Uma forma de evitar essas variações seriam protocolos para controle térmico do ambiente (BORCHARTT, 2013). No ambiente, se faz necessário o controle das temperaturas da pele e do ambiente (lembrando da interação existente); com sala com condicionador de ar para controle da temperatura; medição da umidade e controle do movimento de ar dentro da sala. O tamanho da sala deve ser o suficiente para o equipamento necessário, a paciente 36 e a equipe técnica. A abertura da porta deve ser controlada por um membro da equipe. Também é necessário calibrar o equipamento de acordo com o fabricante da câmera, estabilizando os sistemas eletrônico e mecânico. Devem-se registrar os níveis de temperatura, e a distância da paciente para a câmera. Lembrar que todos dentro da sala assim como o equipamento são fontes de calor. Devem-se manter as lâmpadas apagadas durante a climatização. Deve haver um local mais reservado para a paciente trocar de vestimentas (OLIVEIRA, 2012; BEZERRA, 2013). A preparação da paciente, de uma forma geral, inicia-se pela consulta com o médico para anamnese, encaminhamento para os exames termográficos, com uso de bata descartável, aclimatização da paciente por volta de 10 minutos, e um termo de consentimento a ser assinado por cada paciente (OLIVEIRA, 2012; BEZERRA, 2013). A aquisição de imagens deve ser padronizada, com distância fixa e registro dos dados da paciente. Borchartt (2013) criou uma tabela apresentando um resumo dos principais protocolos presentes na literatura. Na Tabela 4, a seguir, apresenta-se uma síntese de alguns dos principais autores encontrados na tabela original. Tabela 4 - Protocolos de aquisição de imagens termográficas da mama. Autores - Ano Aquisição Temperatura Recomendações especiais ambiente Koay et al. - Simples/dinâmico: as mamas são 2004 resfriadas por ventilador, por álcool, cafeína, analgésicos, aproximadamente 20 minutos. loções e fumo. Ng e Kee - 2008 Simples/estático: paciente aguarda 20 minutos 22ºC 20 a 22ºC Umidade em 60% As pacientes devem evitar Redução de fontes de calor ambientais durante a aquisição. Recomenda não usar álcool, cigarro e produtos para a pele. Agostini et al. – Sequencial/dinâmico: 50 Informação 2009 quadros/s a 200 quadros/s desconhecida Kapoor e Simples/dinâmico: paciente 22ºC Prasad - 2010 permanece de 7 a 10 minutos sala escura para minimizar com ar frio direcionado nas as interferências ambientais. Informação desconhecida. Imagens capturadas em uma mamas. 37 ACCT – 2012 Acompanhamento/estático: Informação termogramas a cada 3 meses desconhecida Bezerra et al. – Simples/estático: aguarda 10 25 a 28ºC 2013 minutos para estabilizar a Informação desconhecida. Sem recomendações especiais. temperatura corporal Silva et al. – Simples/estático: aguarda 10 2013 minutos para estabilizar a 20 a 24ºC Evitar álcool, cafeína, analgésicos, loções e cigarro temperatura corporal Sequencial/dinâmico: ar frio direcionado às mamas por 5 minutos Fonte: Adaptado de Borchartt (2013). 2.7 SEGMENTAÇÃO DE IMAGENS TERMOGRÁFICAS A segmentação de imagens abrange um campo muito diversificado, sendo utilizada tanto em imagens médicas quanto em imagens de satélite. Atualmente existem vários métodos e abordagens sendo utilizadas. A escolha deles varia de acordo com as características dos problemas a serem resolvidos. Dois tipos de abordagem vêm sendo bastante utilizadas: métodos baseados em regiões, onde são detectadas semelhanças; e os métodos baseados em contornos, aos quais as bordas são detectadas e unidas para formar limites em torno de uma região. A segmentação é um passo essencial antes da descrição, do reconhecimento ou da classificação de uma imagem ou de seus componentes (DOUGHERTY, 2009). O processo de segmentação, no processamento de imagens digitais, vem sendo definido como uma separação entre as estruturas de interesse e o plano de fundo da imagem (ARAÚJO, 2014). Esse processo subdivide uma imagem em seus objetos e regiões constituintes. O nível a que esta subdivisão é levada vai depender do problema que se têm o interesse de resolver, ou seja, deve-se parar a segmentação quando os objetos de interesse tiverem sido isolados (GONZALEZ & WOODS, 2002). 38 Da mesma forma, o nome segmentação pode ser atribuído também para o particionamento de uma imagem em regiões significativas. Desta forma, extrai-se a área de maior relevância para um estudo, distinguindo-a de todo o resto. Na tomografia computadorizada a segmentação é utilizada para a detecção de órgãos, como o cérebro, coração, pulmões ou fígado. Também pode ser utilizada em imagens de ressonância magnética (RM) para distinguir tecido patológico a partir de tecido normal; e ainda no planejamento de tratamentos médicos (DOUGHERTY, 2009). O uso da termografia, como ferramenta auxiliar para o diagnóstico de câncer de mama iniciou-se na década de 90, quando começaram a serem fabricadas as câmeras termográficas mais modernas. Com esse objetivo faz-se necessária a aplicação de ferramentas automáticas de segmentação e também de técnicas de segmentação semiautomáticas ou manuais. Quando é necessário definir uma área de interesse junto com um médico ou quando há a necessidade de obter-se a área total da mama, a segmentação manual pode ser aplicada (ARAÚJO, 2014). Kappor & Prasad (2010) utilizaram como técnica de segmentação das mamas na imagem térmica a detecção de bordas de Canny e posteriormente a transformada de Hough para identificar as parábolas que melhor representem as pregas inframamárias. Essa abordagem foi descrita pelos autores em alguns passos. Primeiro deve haver um reconhecimento da borda para que seja possível a extração dos contornos das mamas. Em seguida, utilizaram a transformada de Hough para retirar os limites inferiores das mamas. Posteriormente se faz a classificação de cada pixel segmentado em certo número de aglomerados. No final há o diagnóstico das doenças da mama com base na análise assimétrica dos pixels de cada cluster. A Figura 2 mostra um sistema de orientação para as etapas anteriores. 39 Figura 2 - Diagrama de blocos para análise de assimetria de termogramas usando a segmentação apresentada Fonte: Adaptado de Kappor & Prassad (2010) Kappor et al. (2012) implementaram uma nova abordagem para a segmentação automática da região de interesse e análise de assimetria de termogramas de mama buscando eliminar a dependência do operador e melhorar a precisão do diagnóstico. Os autores utilizaram o operador de detecção de borda de Canny e um operador de gradiente para o primeiro segmento da região de interesse. Utilizaram sete características que indicavam bem a anormalidade do termograma. Essas características foram classificadas em três grupos, parâmetros de ordens estatísticas superiores, tais como curtose, assimetria e entropia, parâmetros de cálculo de histograma e centro. Para a análise de assimetria existem cinco etapas principais de seleção da ROI (Region of interest). A primeira delas é o pré-processamento, no qual inicialmente é necessário converter cada imagem de termograma em jpeg para que possam ser processados no MatLab. Em seguida, é retirado o fundo e, posteriormente, é feito o redimensionamento da imagem para remover a porção de corpo indesejada. Usando a paleta de cores é criada uma matriz correspondente ao valor da temperatura de cada pixel na imagem. No segundo passo utilizaram a detecção de bordas de Canny para extrair os limites das mamas. Na terceira etapa eles extrairam as curvas de fronteira esquerda e direita com o operador de gradiente. A etapa quatro é constituída pela extração de duas curvas parabólicas que descrevem os limites inferiores das mamas. Por fim, na última etapa, 40 após a detecção dos limites inferiores da mama, as porções indesejadas abaixo das curvas da mama são removidas e uma linha de separação do meio é criada para separar entre os segmentos direito e esquerdo ao longo do ponto de contato das duas curvas de mama. Isso gera a imagem segmentada final sobre as duas mamas diferentes, dos quais recursos podem ser extraídos e análise das assimetrias pode ser realizada. Na Figura 3 podemos observar a segmentação obtida com a metodologia apresentada por Kappor et al. (2012). Figura 3 - Resultado da segmentação automática apresentada por Kappor et al. (2012) Fonte: Kappor et al. (2012) Motta (2010) também desenvolveu uma metodologia automática para segmentação de imagens termográficas utilizando a linguagem C, com o objetivo de auxiliar métodos de diagnóstico assistido por computador. As imagens utilizadas para aplicação da segmentação foram do tipo T1 (frontal com mãos na cintura), sendo utilizadas 151 imagens para os testes. Inicialmente, todas as imagens foram convertidas para tons de cinza, sendo excluídos caracteres, tais como, logomarca e ilustração da paleta no intervalo de temperatura detectado. Com uma imagem de entrada selecionada, o algoritmo de segmentação desenvolvido por Motta (2010) segue sete passos básicos podendo ser visualizados na Figura 4 e descritos a seguir. A primeira etapa consiste em obter, a partir da imagem de entrada, a coordenada inferior da segmentação. Em seguida, há a remoção do fundo da imagem. Na terceira etapa é obtida a coordenada superior da segmentação. Na quarta etapa são removidas as regiões externas a ROI. Posteriormente há a separação das mamas. Na etapa seis é feita 41 a detecção da prega inframamária. Por fim, na etapa sete, é feito um descolamento vertical e é obtida a ROI. Figura 4 - Passos do algoritmo de segmentação desenvolvido por Motta (2010) Fonte: Adaptado de Motta (2010) Dourado Neto (2014) desenvolveu um método de segmentação automática com uma rotina em Matlab. Inicialmente, separa-se a região corporal do fundo da imagem. Em seguida, a região de procura é reduzida com a determinação de limites superiores e inferiores fazendo com que sejam descartadas regiões do pescoço, das axilas e a borda inferior das mamas. Posteriormente, possíveis regiões laterais superiores remanescentes são retiradas. A etapa de retirada da borda inferior é considerada a mais crítica da segmentação, por haver uma maior diferença entre os tons de cinza nessa região pela diversidade de biótipos das pacientes. Iniciando na região central, a seleção das bordas desce para as regiões externas excluindo cada pixel e toda sua linha abaixo se este tiver valor maior ou igual que uma diferença anteriormente determinada. Na última etapa há ainda à retirada de possíveis regiões laterais superiores. Na Figura 5 temos um exemplo da segmentação das mamas de uma paciente com a metodologia proposta por Dourado Neto (2014). 42 Figura 5 - Resultado final da segmentação proposta em Dourado Neto (2014). Fonte: Dourado Neto (2014) Além de Kappor & Prasad (2010), Qi & Head (2001) também desenvolveram uma abordagem para análise das assimetrias em termogramas para ajudar a identificar anormalidades. Realizaram uma segmentação automática usando transformada de Hough e um padrão de classificação não supervisionado. Marques (2012) desenvolveu uma abordagem de segmentação manual para tablets com touch screen para que fosse possível a utilização de todas as vantagens dessa tecnologia, tais como, o armazenamento digital instantâneo de imagens, a sensibilidade proporcionada pela tecnologia de touch screen, a mobilidade proporcionada pela utilização desse tipo de equipamento e a flexibilidade proporcionada pela execução do aplicativo em um dispositivo móvel. A Figura 6 representa uma comparação de um método tradicional de segmentação utilizando um software de edição simples e a metodologia proposta. Figura 6 - Comparação de segmentações: lado esquerdo, com a utilização do mouse e lado direito, com a segmentação proposta por Marques (2012), usando-se uma caneta em uma tela sensível ao toque. Editor de imagens (mouse) Aplicativo para Tablet Fonte: Marques (2012) 43 Segundo Marques (2012), a utilização desse método proposto não se resume apenas às imagens térmicas, ele também pode ser utilizado em diversas outras técnicas de visão computacional, principalmente em métodos relacionados à detecção de contornos e segmentação de imagens para extração da região de interesse. Um resumo de vários autores que tratam de segmentação é encontrado em Borchartt (2013). 2.8 CLASSIFICAÇÃO Um classificador é um método capaz de decidir em qual grupo ou população um objeto ou pessoa pode ser alocado, considerando características em comum, anteriormente fornecidas. Portanto, com o objetivo de classificar novos objetos, uma regra de classificação é construída baseada em uma determinada amostra de dados. Seres humanos são capazes de identificar vários caracteres de diferentes formas, desordenados e algumas vezes até parcialmente escondidos. Por isso, podem ser considerados os melhores classificadores que existem, mas ainda não se sabe qual o mecanismo que os torna capazes de reconhecer esses padrões (FERREIRA, 2007). Com respeito aos classificadores, qualquer método que adquira informação a partir de um grupo de treino se baseia em um processo de aprendizagem (DUDA et al., 2000). Adquirido a partir de experiências anteriores, o aprendizado é uma das principais características no reconhecimento de padrões pelos humanos. Isso inspirou a criação de máquinas que são capazes de também realizar essa tarefa (SIMÕES, 2007). Dependendo do algoritmo utilizado, uma classificação pode ser dividida em supervisionada e não-supervisionada (LORENA & CARVALHO, 2007; WEBB, 2001). Na primeira, as classes são previamente conhecidas e na segunda são desconhecidas (DOURADO NETO, 2014). Em ambos os casos, é necessária a etapa de treinamento e a de classificação (MOREIRA, 2003). 44 A classificação pode ser dividida em algumas etapas, que podem ser observadas em sequência na Figura 7. Figura 7 - Etapas da classificação Aquisição dos dados de entrada Eliminação das informações irrelevantes Teste com um grupo de dados independentes Extração de características relevantes ao processo Construção de uma regra de classificação Muitos autores, como Serrano (2010), Borchartt (2013), Araújo (2014) e Dourado Neto (2014), obtiveram imagens termográficas em hospitais universitários através de projetos aprovados por comitês de ética das universidades, obtendo desta forma os dados de entrada para os classificadores. A eliminação das informações irrelevantes se dá através da segmentação das imagens, podendo ser manual, semiautomática ou automática. O objetivo da extração de características é selecionar, das imagens, características relevantes para a classificação. Segundo Dougherty (2009), a escolha dessas características depende dos tipos de imagens e das aplicações, sendo procuradas, de maneira geral, características robustas, discriminantes, confiáveis e independentes. As características robustas são aquelas invariantes sob translação, orientação, escala e iluminação e, pelo menos, invariantes à presença de ruído. As características discriminantes são aquelas nas quais o intervalo de valores para objetos de diferentes classes deve ter a menor sobreposição possível. As características confiáveis são aquelas as quais todos os objetos de uma classe devem ter valores parecidos. As características independentes devem evitar redundância, sendo independentes entre si. A construção de uma regra de classificação se dá através da aprendizagem de máquina. Nela, um determinado padrão é aprendido através de um conjunto de 45 exemplos dados anteriormente. A aprendizagem permite que o classificador aprenda a identificar características através de uma amostra de treinamento, gerando uma regra de classificação que será aplicada para classificar um grupo de dados independentes ou grupo de teste. Os classificadores podem ser usados em uma grande variedade de áreas, como por exemplo, para classificação de documentos como em Salles et al. (2009), no qual foram utilizados os classificadores Rocchio e K-Nearest Neighbours (KNN). Em Botelho & Centeno (2005) foi usado um algoritmo de classificação baseado em Rede Neural Artificial (RNA) e classificador de Distância Mínima Euclidiana e de Máxima Verossimilhança (MAXVER) para classificação de edifícios, vias e árvores em áreas urbanas. Em Grondona (2009) foram utilizados os classificadores de Distância Mínima Euclidiana e o MAXVER para classificar imagens de um pantanal. Com relação à utilização para imagens de origem médica, mais precisamente as imagens termográficas de mamas, há diversos trabalhos que abordam classificações de anomalias mamárias com os mais variados tipos de classificadores. Resmine et al. (2012) utilizou o classificador Support Vector Machine (SVM), KNN e Naive Bayes para classificar uma amostra de 34 pacientes, sendo 24 doentes e 10 saudáveis. A classificação ocorreu para duas classes: doente, ou com patologia, e saudáveis, ou sem patologia. Acharya et al. (2014) realizou classificações do tipo câncer e não câncer para um grupo de 50 mulheres, sendo 25 com câncer e 25 sem câncer com os classificadores SVM e RNA. Como critério de validação da classificação foi usado o leave-one-out e 90% de acertos foram obtidos. Krawczyk & Schaefer (2014) utilizaram 146 imagens sendo 29 imagens da Classe Maligno e 117 da Classe Benigno, onde a classificação foi realizada por uma fusão de classificadores SVM e RNA. Em Dourado Neto (2014) foram utilizadas 234 imagens de onde foram extraídas características baseadas em temperaturas máximas e mínimas, intervalos de temperatura, medidas de estatísticas básicas de média e desvio padrão, obliquidade e curtose. Para a classificação das imagens foram utilizados cinco classificadores, são eles 46 Classification Trees (CT), SVM com núcleo polinomial de ordem 5, Discriminant Analysis (DA), Naive Bayes com estimativa de densidade de probabilidade do tipo kernel, KNN com distância do tipo "Mahalanobis" que podem ser encontrados no Statistics ToolboxTM do Matlab. Em Araújo (2014) e Queiroz (2014) foram utilizados classificadores de distância mínima e o classificador discriminante linear para classificação de imagens termográficas de pacientes do Hospital das Clínicas – UFPE nas classes Benigno, Cisto e Maligno. 47 3 METODOLOGIA Esta dissertação está relacionada ao projeto "Análise da viabilidade do uso de câmera termográfica como ferramenta auxiliar no diagnóstico de câncer de mama em hospital público localizado em clima tropical", aprovado pelo Comitê de Ética da UFPE, com registro no Ministério da Saúde CEP/CCS/UFPE No279/05, em andamento desde novembro de 2005 sob a coordenação da Professora Rita de Cássia Fernandes de Lima. 3.1 AQUISIÇÃO DAS IMAGENS As imagens termográficas usadas no presente trabalho foram adquiridas tanto no Hospital das Clínicas (HC) – UFPE, quanto no Assentamento Veneza, no município de São Lourenço da Mata - PE e na cidade de Chã de Alegria - PE. As imagens obtidas no HC seguiram o protocolo de aquisição de imagens definido por Oliveira (2012). As imagens obtidas no Assentamento Veneza não seguiram protocolo padrão de aquisição. Em ambas as locações, foram selecionadas imagens frontais das pacientes. Na Figura 8 há a representação dos protocolos utilizados durante a aquisição das imagens nos diferentes lugares onde foram realizados esse procedimento. Figura 8 - Tipo de protocolo utilizado nos diferentes locais das aquisições das imagens 48 Todas as imagens foram obtidas através da utilização de uma câmera de infravermelho Flir S45, adquirida pelo Departamento de Engenharia Mecânica da UFPE através do Edital Finep 2003 de Laboratório Multiusuários, cuja última calibração ocorreu no ano de 2013. A obtenção de uma parte dessas imagens foi feita em uma sala disponibilizada para o projeto no HC-UFPE. Para a realização dos exames termográficos foram seguidos alguns procedimentos em relação às condições térmicas da sala de exames e aos cuidados com a preparação das pacientes assim como para a aquisição das imagens. O método adotado para a aquisição de imagens foi o estático. Um estudo realizado por Araújo (2009) não encontrou melhorias significativas na qualidade das imagens quando o método é dinâmico. Tal método demanda de um tempo maior para a realização do exame e ainda pode ocasionar um desconforto térmico aos pacientes. Para cada imagem adquirida de pacientes do HC segue-se o protocolo de Oliveira (2012), que é descrito a seguir: Com relação à adequação da sala: A sala é um ambiente fechado, onde deve existir espaço suficiente para o paciente, a equipe técnica e aparato da câmera termográfica. A sala utilizada para a aquisição das imagens mede aproximadamente 12 m²; A abertura e o fechamento da porta são controlados pela equipe técnica, permanecendo na sala apenas a equipe e a paciente; Um aparelho de ar condicionado realiza a climatização do ambiente; Um termo-higro-anemômetro-luxímetro digital, modelo THAL-300, afere a temperatura e umidade relativa da sala; A equipe técnica, o paciente, a câmera e o projetor multimídia, que é utilizado para explicação ao paciente sobre o exame a ser realizado e para auxiliar a aquisição das imagens, são fontes de calor dentro da sala; O ambiente possui um espaço reservado, mas não fechado para o paciente trocar de roupa, sendo este ambiente separado do restante da sala por um biombo; A sala dispõe de um aparato mecânico para a realização do exame, projetado por Oliveira (2012) e construído na oficina mecânica do Departamento de Engenharia Mecânica da UFPE (DEMEC/UFPE). 49 Figura 9 - Aparato mecânico utilizado na realização dos exames. Fonte: Oliveira (2012) Com relação à preparação da paciente: As pacientes encaminham-se para realização da consulta com o médico responsável, logo em seguida se dirigem para a sala de realização dos exames termográficos, onde são dadas as primeiras instruções sobre o exame e como ela deve se portar durante a realização do mesmo. A paciente troca a parte superior de sua roupa por uma bata descartável disponibilizada pela equipe técnica, sendo essa troca realizada na área reservada da sala para evitar qualquer tipo de constrangimento. A paciente deve aguardar dez minutos sem tocar na mama, que é considerado o tempo de aclimatação. Nesse tempo é preparado o documento de ―Termo de consentimento livre e esclarecido‖ (TCLE), como solicitado pelo Ministério da Saúde do Brasil, para que a paciente assine no final do exame caso concorde em participar da pesquisa, no caso de aceitarem realizar a pesquisa também são feitas cópias da anamnese e dos laudos de outros exames, como ultrassom, mamografia, biópsia ou punção caso paciente tenha levado alguns desses exames. Com essas cópias são feitas comparações com as termografias para a validação dos classificadores. Nesse tempo também é aferida a temperatura da paciente com um termômetro clínico. O procedimento de atendimento do Ambulatório de Mastologia do HC faz com que as pacientes passem tempo suficiente sem a exposição à luz solar, sem realizarem exercícios físicos, sem a ingestão acima da média de alimentos e bebidas e sem tomarem banhos. Com isso, essas e outras precauções que devem ser tomadas antes dos 50 exames são atendidas independentemente do conhecimento prévio da paciente (OLIVEIRA, 2012). Com relação à aquisição das imagens: Para cada paciente são realizadas duas séries de imagens, obtendo um número mínimo de doze imagens. A primeira série usa uma distância (D1), com a câmera posicionada a uma maior distância do paciente. Essa distância depende da anatomia do paciente, devendo conseguir um enquadramento frontal das duas mamas. Nessa série são realizadas as imagens T1 (frontal com as mãos na cintura), T2 (frontal com as mãos levantadas segurando uma barra localizada acima da cabeça); T2 com grade, sendo esta grade utilizada para medir dimensões das mamas a serem usadas em simulações envolvendo tumores (difere da T2 por ter uma grade na frente da paciente), lateral interna da mama direita (LIMD), lateral interna da mama esquerda (LIME), lateral externa da mama direita (LEMD), lateral externa da mama esquerda (LEME). Nas imagens laterais, uma das pessoas do grupo técnico é orientada pelo operador da câmera para girar o aparato com a paciente até obter uma melhor posição para aquisição das imagens laterais, focando o perfil das mesmas. Na segunda série, a câmera é posicionada mais próxima da paciente, e são obtidas novas imagens com uma distância menor. Algumas vezes são realizadas imagens extras de algumas das posições citadas. Para esse trabalho só foram analisadas imagens do tipo T2, tanto da primeira quanto da segunda série. Algumas imagens T2 extras também foram utilizadas. As imagens T2 de uma paciente podem ser vistas na Figura 10. Figura 10 - Imagens T2 da primeira série e da segunda série 51 No HC, foram obtidas as imagens que foram utilizadas para o grupo de treino na metodologia proposta por Araújo (2014). Para a análise feita no presente trabalho foi necessário acrescentar imagens de pacientes consideradas normais mediante análise médica. Esse acréscimo foi necessário pelo fato de o número de imagens normais apresentadas no grupo de treino ser bem inferior ao número de imagens das outras classes apresentadas (cisto, maligno e benigno). Todas as imagens utilizadas no grupo de treino tiveram diagnóstico fechado e foram divididas em quatro classes: Maligno, Benigno, Cisto e Normal. A Classe Maligno compreende todos os casos de câncer de mama, comprovados por biópsia. A Classe Benigno refere-se aos casos de tumores com benignidade, também comprovada por biópsia. A Classe Cisto inclui os casos com este diagnóstico comprovado por punção aspirativa com agulha fina (PAAF) ou ultrassonografia. Na Classe Normal estão todos os indivíduos que tiveram ECM sem alteração suspeita, e resultados dos exames de mamografia e ultrassonografia classificados como BI-RADS 1 (sem achados). 3.2 SEGMENTAÇÃO UTILIZADA As imagens termográficas foram analisadas através do software proprietário da FLIR, ThermaCAM QuickReport, onde são ajustadas as informações de temperatura atmosférica, umidade relativa, distâncias medidas durante o ato da aquisição das imagens. Das imagens é possível extrair a matriz de temperatura da imagem através do software FLIR QuickReport e que pode ser observada na Figura 11. As metodologias de segmentação utilizadas nesse trabalho foram desenvolvidas por Araújo (2014), Queiroz (2014) e Dourado Neto (2014). A escolha da segmentação manual por Araújo (2014) ocorreu pelo fato de serem observados erros de segmentação a partir do uso de ferramentas automáticas em Motta (2010). Araújo (2014) justificou que esses erros ocorrem muitas vezes pelas mamas apresentarem uma assimetria natural e também por causa das variações anatômicas do corpo humano que podem ser observadas de indivíduo para indivíduo. Queiroz (2014) desenvolveu sua segmentação de forma que fosse possível adquirir a região da mama da maneira mais completa possível e Dourado Neto (2014) desenvolveu um método automático, para uma maior praticidade na segmentação. 52 Figura 11 - Matriz de temperaturas obtida do QuickReport Figura 12 - Tela inicial do FLIR QuickReport 1.2 SP2 onde são ajustadas as imagens. Uma vez extraídas as matrizes de temperatura, nas quais cada elemento representa a temperatura de um determinado pixel da imagem original. Essas matrizes possuem um tamanho de 320×240pixels. Esse arquivo é nomeado e salvo no formato csv, como por exemplo, IR_6200.csv, onde o valor numérico representa o número da 53 imagem e o csv o tipo de arquivo. Posteriormente, esse arquivo é exportado para o Matlab, onde é feita a segmentação das duas mamas das pacientes como mostra a Figura 13. Figura 13 - Representação da segmentação das mamas de duas pacientes seguindo a metodologia usada por Araújo (2014). Fonte: Araújo (2014) Os passos para a segmentação da mama na imagem abordados por Araújo (2014) são descritos em detalhes abaixo: 1) Efetuar a exportação para o Matlab da matriz de temperaturas T, obtida a partir da imagem térmica. Em seguida, é feita uma associação de valores numéricos da matriz com uma escala de cor fixa, através da função imagesc( ). E então, é chamada uma nova imagem. 2) Para selecionar a região de interesse da mama, uma área em forma de elipse é criada. Na maioria das vezes é necessário realizar rotações da imagem das mamas para que dessa maneira obtenha-se o ajuste mais preciso entre a área da mama e a área da elipse, sendo feitas uma vez para cada mama. Para isso, tem-se uma função associada ao botão scroll do mouse para rotação da imagem. 3) Em seguida, a área elíptica é selecionada, sendo utilizada para se representar cada mama. 4) Com a seleção da área das mamas sobre a imagem é criada uma máscara. Esta, por sua vez, é rotacionada de volta para a posição original, o que permite a extração da área de seleção a partir da interseção da máscara sobre a imagem original. 54 Figura 14 - a) Imagem vista a princípio com Matlab; b) Imagem rotacionada para seleção da mama Fonte: Adaptado de Araújo (2014) Figura 15 - Máscara criada a partir da Figura 14a. a) Máscara original; b) Máscara rotacionada. Fonte: Adaptado de Araújo (2014) Figura 16 - Imagem das mamas segmentadas. a) Mama direita; b) Mama esquerda Fonte: Adaptado de Araújo (2014) A outra abordagem de segmentação que foi utilizada, pode ser encontrada em Queiroz (2014). Para um melhor entendimento da técnica, segue uma sequência onde são descritas as etapas de segmentação das mamas por essa abordagem. 1) Assim como em Araújo (2014) a matriz de temperatura é obtida do termograma com a utilização do software FLIR Quick Report, sendo processada no Matlab; 2) São selecionadas as mamas e os pontos de controle, estes correspondentes ao contorno da região de interesse; 55 3) A curva de interpolação por spline linear é criada com os pontos de controle anteriormente selecionados, definindo então a máscara. 4) Com a geração dessa máscara se obtém a matriz correspondente a região selecionada; 5) Por fim, através da segmentação são obtidas duas matrizes de temperatura, uma para mama direita (MD) e outra para mama esquerda (ME). A Figura 17 apresenta as etapas descritas anteriormente para a segmentação desenvolvida por Queiroz (2014). Figura 17 - Etapas da segmentação desenvolvida por Queiroz (2014) A B C D E F Fonte: Queiroz (2014) 56 Também foi realizada uma adaptação da segmentação desenvolvida por Dourado Neto (2014) a fim de que as características extraídas a partir dessa segmentação fossem as mesmas utilizadas por Araújo (2014) e Queiroz (2014). A estratégia de corte da imagem foi mantida e pode ser encontrada na revisão bibliográfica, na seção de segmentação. Essa adaptação consiste em multiplicar a matriz originada a partir da segmentação realizada por Dourado Neto (2014) pela matriz da imagem colorida original. A imagem em escala de cinza é representada por uma matriz composta pelos algarismos zero e um, o zero representando a parte que não é de interesse e o algarismo um, a parte de interesse que foi adquirida a partir da segmentação. Sendo assim a matriz correspondente à imagem original terá a mesma segmentação da imagem em escala de cinza quando realizada essa multiplicação. No entanto, diferentemente de Dourado (2014), as mamas foram separadas após a segmentação, obtendo dessa forma uma imagem para mama direita e outra imagem para mama esquerda. Figura 18 - Segmentação com estratégia de corte de Dourado Neto (2014) pixels pixels A segmentação é realizada para que, a partir dela, seja possível extrair características relevantes ao processo de classificação. Araújo (2014) desenvolveu um processamento morfológico para que fosse possível a extração de algumas características adicionais para o processo de classificação. 57 Para os três tipos de segmentação são extraídas características obtidas das matrizes MD e ME (matrizes da mama direita e da mama esquerda, respectivamente) originadas da segmentação das imagens termográficas originais. A partir dessas duas matrizes é aplicado um processo morfológico sobre as matrizes das imagens segmentadas MD e ME com a intenção de obterem-se informações referentes ao aumento de temperatura local, sendo entendido também como a altura dos máximos locais de temperatura com relação à temperatura da sua vizinhança. Tang et al. (2008, in: Araújo, 2014) chamou esse pico de temperatura de incremento localizado de temperatura (ILT) na região mamária, sendo calculado por Araújo (2014) em toda a área da mama. A partir desse processamento morfológico sobre as matrizes ME e MD são obtidas duas matrizes independentes, as matrizes morfológicas, MME e MMD que irão conter a informação ILT para a mama esquerda e para a mama direita. A Figura 19 apresenta as variáveis de entrada extraídas das matrizes MD, ME, MME e MMD, a partir da segmentação das mamas, e que são utilizadas como dados de entrada para o classificador. Figura 19 - Representação da extração de características para classificação 58 Com os dados de entrada adquiridos a partir do processo de segmentação foi criado um vetor de características, composto por variáveis simbólicas de natureza intervalar. Cada matriz de entrada dá origem a uma variável intervalar, gerando um vetor de característica intervalar de quatro dimensões. Em seguida, os intervalos são separados em suas componentes de centro e raio, gerando dois novos vetores contínuos de quatro dimensões. Estes são transformados para um novo espaço bidimensional de características a partir do critério de Fisher, onde as projeções das observações individuais podem ser mais facilmente separadas. São originados com essa etapa dois vetores bidimensionais, uma para os centros e outro para os raios, sendo então, posteriormente realocados para se obter um novo vetor intervalar que representará a projeção dos intervalos originais em um espaço de características alternativo. Uma descrição mais detalhada sobre essas etapas pode ser encontrada em Araújo (2014). A Figura 20 representa por várias ópticas, os resultados da operação morfológica processada por cada elemento da região segmentada com splines. Figura 20 - Processo morfológico para extração de características da mama com a segmentação por splines. a) Representação da mama em 2D; b) Representação da mama em 3D; c) Representação da mama em 3D com borda reduzida em 5%; d) Representação da mama em curvas de níveis de temperatura. Fonte: Queiroz (2014) 59 Na Figura 21, pode-se observar o processamento morfológico a segmentação das mamas obtida por elipses. Figura 21 - Processamento morfológico obtido a partir da segmentação da imagem térmica 3.3 CLASSIFICADORES UTILIZADOS A classificação está associada à triagem de objetos em classes distintas, correspondendo muitas vezes à etapa final de um processo de análise de imagens. Dividem-se as técnicas de classificação em técnicas estatísticas, técnicas estruturais e técnicas de aprendizagem de máquina. As técnicas estatísticas são utilizadas quando as informações disponíveis para tomar uma decisão são imprecisas e os processos de decisão são de natureza estatística. As técnicas estruturais são utilizadas quando as informações fundamentais são fornecidas pela estrutura do objeto. Há ainda as técnicas de aprendizagem de máquina, tais como redes neurais e algoritmos genéticos, que se utilizam das duas abordagens anteriores. O método de classificação usado nesta dissertação foi o supervisionado. Neste trabalho, foram utilizados os mesmos classificadores usados por Araújo (2014), com excessão do classificador Janela de Parzen, que não apresentou bons resultados no trabalho citado anteriormente. Esses classificadores foram: classificador 60 discriminante linear e classificadores de distância mínima, nos quais as distâncias avaliadas foram a distância Euclidiana, a distância de Mahalanobis e a distância de City-Block. A seguir apresenta-se uma descrição dos classificadores citados. 3.3.1 Classificador Discriminante Linear A análise discriminante é utilizada para discriminar e classificar objetos, sendo uma técnica estatística multivariada que estuda a separação de objetos de uma população em duas ou mais classes. O problema de classificação consiste em alocar uma observação individual em uma das C possíveis classes , i = 1,..., C, divididas em C regiões distintas no espaço de entrada (espaço de características). Para a utilização desse classificador deve-se supor que os dados seguem uma distribuição normal multivariada. Devido a essa suposição inicial, Araújo (2014) avaliou a normalidade dos dados de entrada aplicando o teste multivariado de HenzeZirkler ao conjunto de dados de treino, sendo esse teste repetido n vezes, para cada grupo de treino gerado pelo critério de validação leave-one-out. O teste de normalidade de Henze-Zirkler avalia a hipótese nula de que o conjunto de dados apresenta uma distribuição normal multivariada, contra a hipótese alternativa de que ele não apresenta uma distribuição normal. Um classificador discriminante baseia-se em um conjunto de funções discriminantes para a classe , i = 1,..., C, uma para cada classe, e atribui um vetor de entrada x se > , j ≠ i, ou seja, o classificador computa C funções discriminantes e atribui o objeto desconhecido x à categoria correspondente ao maior valor discriminante encontrado. A classificação é conseguida a partir da associação de um padrão individual a uma determinada classe, onde a probabilidade é máxima. Pelo Teorema de Bayes, segue que: 61 (3.1) Aplicando logaritmo natural, temos que: (3.2) e fazendo = e supondo que é o mesmo para todo x, temos: (3.3) Onde x representa o objeto desconhecido, corresponde à i-ésima classe e depende da distribuição considerada para os dados. De acordo com Duda et al., (2001, in: Araújo (2014)), a Equação (3.3), pode ser avaliada, se as densidades são multivariadas, ou seja, se ~N( , ), podendo ser definida como: = onde p é o número de variáveis, (3.4) é a matriz de covariância da i-ésima classe e éa média da i-ésima classe. Logo, (3.5) assim, (3.6) que rearranjando, temos: (3.7) 62 Considerando-se que = ∑, ou seja, fazendo-se a troca de uma matriz de covariância individual de cada classe por uma matriz de covariância comum, esta última podendo ser definida em função das matrizes individuais como: (3.8) Como p e ∑ são constantes para cada classe considerada, pode-se escrever: (3.9) o padrão x é alocado para a classe se (3.10) 3.3.2 Classificador de Distância Mínima Com a intenção de alocar novos indivíduos em uma das classes anteriormente definidas, a função de proximidade se torna um importante instrumento e é usado em técnicas de classificação supervisionada. Essas funções são índices de similaridade e de dissimilaridade, retratando diferentes graus de semelhança ou de diferença entre duas observações (ARAÚJO, 2014). Esse tipo de classificador atribui um padrão desconhecido x para a classe baseando-se na minimização de uma distância entre o padrão x e um protótipo ui de uma classe. Esse método é vantajoso por não depender da distribuição dos dados, sendo dependente apenas dos elementos de treino. A classe é representada pelo protótipo ui que consiste no vetor de médias de seus elementos, definido na equação abaixo. (3.11) 63 Neste trabalho foram usadas as distâncias Euclidiana, distância de Mahalanobis e a distância de City-Block para avaliação do classificador de distância mínima. A distância Euclidiana pode ser definida como: (3.12) A distância de Mahalanobis, é definida como: (3.13) onde corresponde à matriz de covariâncias para a classe ωi. A terceira distância utilizada foi a distância City-Block, que é definida como: (3.14) Para cada distância, o padrão x é atribuído para a classe ωj se )= (3.15) ou seja, x é atribuído à classe para a qual a distância é a mínima entre x e o protótipo da referida classe. 3.4 CARACTERÍSTICAS DAS ETAPAS DE ESTUDO O grupo de treino foi composto por quatro classes de tamanhos aproximados. Todas as pacientes deste grupo são pacientes do Ambulatório de Mastologia do HC/ UFPE. Foram 29 amostras de malignidade, 30 amostras referentes a cistos, 32 amostras de casos benignos e 55 amostras de casos normais. Já o grupo de teste foi composto por 24 amostras de normalidade, 2 amostras de cisto e 3 amostras de casos benignos. Todas as imagens termográficas das mamas das pacientes do grupo de teste foram obtidas em ambiente com condições térmicas desfavoráveis, ou seja, onde não houve a utilização de protocolos para aquisição das mesmas. As variáveis de entrada para o processo de classificação são as diferenças de temperaturas das mamas esquerda e direita, estas sendo extraídas das matrizes ME e 64 MD obtidas com a segmentação da imagem termográfica. Outras variáveis extraídas são as diferenças dos valores máximos das temperaturas presentes nas matrizes MME e MMD. Estas matrizes foram originadas pelo processamento morfológico aplicado sobre as duas matrizes anteriores. Nesta dissertação foram realizadas duas análises para a classificação, além do tratamento de dois casos especiais. A primeira análise baseia-se na classificação em duas classes: Classe Câncer e Classe Não-Câncer, e é bastante abordada na literatura. A segunda análise foi feita com a classificação dos casos em quatro tipos de classe: Classe Cisto, Classe Maligno, Classe Benigno e Classe Normal. Esse trabalho levou em conta duas abordagens com relação à aquisição das imagens termográficas. A primeira, que se dá através das imagens adquiridas no HC/UFPE e a segunda, com respeito às imagens que foram adquiridas no Assentamento Veneza e na Cidade de Chã de Alegria. Com relação à aquisição do primeiro grupo de imagens, ela foi realizada com a utilização do aparato mecânico e com o protocolo desenvolvido por Oliveira (2012), o que minimiza os erros associados à aquisição e à medição. A maioria das imagens foi utilizada em Araújo (2014) no desenvolvimento de seu estudo. Como o mesmo não utilizou imagens da Classe Normal foi necessário acrescentar algumas imagens desse tipo. Pacientes que são atendidas no HC, no Setor de Mastologia, geralmente vão encaminhadas ao serviço por apresentarem alguma anormalidade, observada por médico de outra especialidade. Desta forma, existe uma dificuldade em encontrar pacientes classificadas como da Classe Normal neste grupo de pacientes. Por este motivo, as imagens das pacientes da Classe Normal acrescentadas foram, em sua maioria, as imagens das pacientes do Assentamento que foram diagnosticadas normais, após terem sido examinadas pelo mastologista e terem novas imagens adquiridas no HC. A aquisição do segundo grupo de imagens ocorreu no Assentamento Veneza e na Cidade de Chã de Alegria, em ambientes não-refrigerados. Não houve a utilização do aparato mecânico, o que dificultou a aquisição das imagens, pois o membro da equipe responsável por esse trabalho precisou movimentar-se e abaixar-se para capturar as imagens nos diferentes ângulos necessários. Eliminou-se assim a padronização existente no hospital. As distâncias foram medidas com possíveis erros associados, assim como a temperatura e a umidade. As pacientes locais foram bastante receptivas e interessadas 65 no exame, apesar de se mostrarem envergonhadas com a presença dos participantes masculinos da equipe, fato determinante para que eles ficassem apenas com o trabalho de anotação das informações na planilha. Em ambas as comunidades, a receptividade das pessoas líderes, responsáveis por nos receber foi muito boa, o que facilitou o trabalho. As imagens adquiridas nesses dois locais compuseram o grupo de teste. Na sua maior parte, este grupo é composto por imagens de pacientes normais. Isto pode ser justificado pelo fato de que em uma amostra real da população, a maioria das mulheres não apresentam anormalidades na mama, apesar de que, esse tipo de câncer ser um dos que mais ocorrem em mulheres. Houve muitas dificuldades para aquisição das imagens do grupo de treino, inerentes ao deslocamento da equipe para as localidades acima citadas. Entre elas é possível citar os períodos chuvosos, quando a ida da equipe para os locais ficava comprometida pela precariedade das pistas de acesso. Além disso, durante o desenvolvimento desta dissertação, houve duas greves dos servidores técnicos federais, que tiveram longa duração: dois meses e três meses e meio, o que impossibilitou a vinda de pacientes dessas localidades para realização do cadastro e atendimento médico no HC/UFPE. Outra dificuldade foi pouca frequência nos dias aos quais as pacientes deveriam vir para o HC, possivelmente pelo fato do transporte que as traziam sair durante a madrugada, por volta das 3h da manhã, das suas respectivas cidades. Esses fatores tem influência determinante no tamanho da amostra que compõem o grupo de teste. Podemos sintetizar o que foi feito no presente trabalho na figura a seguir: 66 Figura 22 - Etapas do trabalho Na Figura 23 estão dispostos os dados referentes às Classes Maligno, Benigno e Cisto. Figura 23 - Representação de três classes Na Figura 24 a classe normal foi acrescentada à Figura 23. Pode-se observar que há uma grande sobreposição de dados da classe normal sobre os dados das outras 67 classes, ou seja, existe uma maior variabilidade da Classe Normal, enquanto as Classes Maligno, Benigno e Cisto apresentam-se mais agrupadas. Figura 24 - Representação das quatro classes Visando minimizar os efeitos dessa grande variabilidade da classe normal sobre os classificadores de Distância Mínima, utilizaram-se distâncias ponderadas pela máxima variância da classe (ROCHA & SOUSA, 2007). Dessa forma, um indivíduo desconhecido que está à mesma distância de várias classes, quando projetado no espaço de características, é alocado àquela classe cuja variância é máxima. Em Rocha & Sousa (2007) pode-se observar que essa grande variância de uma determinada classe torna a classificação menos robusta, e que é necessário contornar esse problema. Sendo assim, ponderam-se as distâncias pela variância da classe, minimizando dessa forma possíveis erros. 68 4 RESULTADOS E DISCUSSÃO Neste capítulo apresentam-se os resultados obtidos no presente trabalho. Com esses resultados, tenta-se investigar se a termografia pode ser utilizada como exame de triagem de câncer de mama, em lugares com poucos recursos médicos. Aqui também foram analisados alguns casos especiais: imagens obtidas de mulheres voluntárias que supostamente têm mamas normais, mas que relataram que amamentavam seus filhos em apenas uma delas; e também foi feita a análise de uma paciente que havia feito cirurgia há mais de cinco anos em uma mama, mas que apresentava um fibroadenoma, na outra. As imagens foram classificadas usando a metodologia desenvolvida por Araújo (2014). Para tal foram usados três tipos de segmentação da mama nas imagens. A primeira está descrita em Araújo (2014), na qual as mamas foram selecionadas através de elipses. A segunda, apresentada por Queiroz (2014), na qual as mamas foram selecionadas através de splines. A terceira forma de segmentação, automática, foi desenvolvida por Dourado Neto (2014), sendo adaptada para seleção da mama em imagem colorida. Foram utilizados os classificadores Discriminante Linear e de Distância Mínima para obtenção dos resultados, apresentados seguir. 4.1 ANÁLISE DA CLASSIFICAÇÃO DE DUAS CLASSES PARA TRÊS SEGMENTAÇÕES DISTINTAS Muitos autores, tais como Kappor et al. (2012), Francis et al. (2014), Acharya et al. (2014) e Dourado-Neto (2014), têm feito trabalhos de classificação binária, ou seja, trabalhos onde a classificação é feita apenas para duas classes: Câncer e Não-Câncer. Tendo por base esses estudos, procurou-se também fazer uma abordagem com apenas duas classes para a amostra tratada nesta dissertação. A análise binária realizada divide as classes existentes entre Classe Câncer e Classe Não-Câncer. Neste caso, imagens cuja classificação inicial foi Benigno, Cisto ou Normal pertencerão a Classe Não-Câncer. A Classe Câncer será composta pelas 69 imagens com classificação Maligno. Vale salientar que o grupo de teste usado no trabalho é constituído neste caso apenas com imagens da Classe Não-Câncer. Ou seja, para que um classificador tenha um bom resultado, ele deverá classificar o maior número de imagens como Não-Câncer. Na Tabela 5, 6 e 7, a seguir, encontram-se os resultados para classificação binária utilizando as três segmentações. Tabela 5 - Classificação em duas classes com a segmentação por elipses Discriminante Distância Distância Distância linear Mahalanobis Euclidiana City Block Acertos 27 12 17 22 Erros 2 17 12 7 Acertos em % 93,1% 41,37% 58,62% 75,86% Tabela 6 - Classificação em duas classes com a segmentação por splines Discriminante Distância Distância Distância linear Mahalanobis Euclidiana City Block Acertos 27 10 13 13 Erros 2 19 16 16 Acertos em % 93,1% 34,48% 44,82% 44,82% Tabela 7- Classificação em duas classes com a segmentação automática Discriminante Distância Distância Distância linear Mahalanobis Euclidiana City Block Acertos 23 9 9 7 Erros 6 20 20 22 Acertos em % 79,31% 31,03% 31,03% 24,14% 70 Figura 25 - Representação gráfica da comparação do número de acertos dos classificadores com as três segmentações e considerando duas classes (Câncer; Não Câncer). Observa-se que para o classificador Discriminante Linear, o mesmo resultado foi obtido para segmentação por elipses e splines, tendo a segmentação automática um resultado inferior na porcentagem de acertos. Com respeito aos classificadores de distância Mínima, a segmentação automática apresentou os piores resultados, indicando uma maior precisão das outras duas segmentações. Com relação à análise em duas variáveis (Câncer e Não-Câncer), a minimização da influência da variabilidade da Classe Normal apresentou os resultados exibidos na Tabela 8, na Tabela 9 e na Tabela 10. A Tabela 8 exibe os resultados obtidos a partir dessa análise utilizando a segmentação por elipses, a Tabela 9 traz os resultados referentes à segmentação por splines e a Tabela 10 mostra os resultados obtidos a partir da segmentação automática. 71 Tabela 8 - Análise em duas variáveis com minimização da influência da variabilidade da Classe Normal e segmentação por elipses Discriminante Distância Distância Distância City linear Mahalanobis Euclidiana Block Acertos 29 25 26 22 Erros 0 4 3 7 Acertos em % 100% 86,2% 89,65% 75,86% Tabela 9 - Análise em duas variáveis com minimização da influência da variabilidade da Classe Normal e segmentação por splines Discriminante Distância Distância Distância City linear Mahalanobis Euclidiana Block Acertos 29 25 27 20 Erros 0 4 2 9 Acertos em % 100% 86,2% 93,1% 68,99% Tabela 10 - Análise em duas variáveis com minimização da influência da variabilidade da Classe Normal e segmentação automática Discriminante Distância Distancia Distância City linear Mahalanobis Euclidiana Block Acertos 29 16 21 8 Erros 0 13 8 21 Acertos em % 100% 55,17% 72,41% 27,59% Na Figura 26 é possível observar a comparação dos resultados obtidos com as três segmentações. 72 Figura 26 - Gráfico comparativo da porcentagem de acertos de cada classificador com as três segmentações, levando em conta a minimização dos efeitos da variabilidade da classe normal e avaliando em nível de duas classes (Câncer; Não - Câncer). Pode-se observar que para o classificador Discriminante Linear o total de acertos (100%) foi o mesmo com os três tipos de segmentação. Para todos os outros segmentadores a segmentação automática obteve os piores resultados. 4.2 ANÁLISE DA CLASSIFICAÇÃO DE QUATRO CLASSES COM A UTILIZAÇÃO DE TRÊS SEGMENTAÇÕES DISTINTAS Nesta seção são apresentados os resultados obtidos a partir da classificação do grupo de teste em quatro classes distintas, sendo elas a Classe Normal, Classe Cisto, Classe Benigno e a Classe Maligno. Na Tabela 11 estão apresentados os resultados com a utilização da segmentação por elipses. 73 Tabela 11 - Resultados dos quatro classificadores para segmentação por elipses Discriminante Distância Distância Distância linear Mahalanobis Euclidiana City Block Acertos 22 4 4 4 Erros 7 25 25 25 Acertos em % 75,86% 13,79% 13,79% 13,79% Na Tabela 11 pode-se observar que o classificador Discriminante Linear obteve uma taxa de acertos bem superior em comparação aos demais classificadores, com a segmentação realizada por elipses. A Tabela 12 e a Tabela 13 fornecem os resultados obtidos com os quatro tipos de classificadores para a segmentação por splines e automática, respectivamente. Tabela 12 - Resultados dos quatro classificadores para segmentação por splines Discriminante Distância Distância Distância linear Mahalanobis Euclidiana City Block Acertos 22 6 5 2 Erros 7 23 24 27 Acertos em % 75,86% 20,69% 17,24% 6,9% Tabela 13 - Resultados dos quatro classificadores para segmentação automática Discriminante Distância Distância Distância linear Mahalanobis Euclidiana City Block Acertos 18 7 6 1 Erros 11 22 23 28 Acertos em % 62,07% 24,14% 20,69% 3,45% . 74 Figura 27 - Representação gráfica da comparação das porcentagens de acertos para cada classificador em cada uma das segmentações Nota-se, que não houve diferença significativa nos resultados obtidos com as formas de segmentar por elipses e splines quando se considera o discriminante linear. Em um estudo comparativo realizado (QUEIROZ et al, 2014) foi observado que, apesar da segmentação por splines ser considerada mais segura pelo fato de se escolherem os pontos manualmente, não houve diferença significativa entre essas duas abordagens de segmentação. Observando-se a Tabela 11, a Tabela 12 e a Tabela 13, percebe-se que os classificadores de Distância Mínima (Distância Mahalanobis, Distância Euclidiana e Distância City Block) apresentaram um baixo desempenho. Isto ocorre devido à grande variabilidade observada para a classe de pacientes normais, somado ao fato de que esses tipos de classificadores ignoram a distribuição dos dados (SOUTH et al., 2004 in: CATTANI et al., 2013); (ROCHA & SOUSA, 2007). 75 Aplicando-se o conceito de minimização da variabilidade da Classe Normal, obtiveram-se os resultados para os classificadores e as três segmentações abordadas, representados na Tabela 14, na Tabela 15 e na Tabela 16. Tabela 14 - Resultado dos classificadores com segmentação por elipses e com a minimização dos efeitos da variabilidade da Classe Normal Discriminante Distância Distancia Distância linear Mahalanobis Euclidiana City Block Acertos 24 20 21 13 Erros 5 9 8 16 Acertos em % 82,76% 68,97% 72,41% 44,83% Tabela 15 - Resultado dos classificadores com segmentação por splines com a minimização dos efeitos da variabilidade da Classe Normal Discriminante Distância Distancia Distância City linear Mahalanobis Euclidiana Block Acertos 24 20 22 15 Erros 5 9 7 14 Acertos em % 82,76% 68,97% 75,86% 51,72% Tabela 16 - Resultado dos classificadores com segmentação automática e com minimização dos efeitos da variabilidade da Classe Normal Discriminante Distância Distancia Distância City linear Mahalanobis Euclidiana Block Acertos 24 13 17 4 Erros 5 16 12 25 Acertos em % 82,76% 44,83% 58,62% 13,79% Comparando-se as Tabela 11, 12 e 13, respectivamente, com as Tabela 14, Tabela 15 e 16 é perceptível que, com a minimização dos efeitos da variabilidade da 76 Classe Normal, houve uma melhora significativa dos resultados de classificação de todos os classificadores utilizados. Figura 28 - Representação gráfica da comparação da porcentagem de acertos dos classificadores para as três segmentações com a minimização dos efeitos da variabilidade da Classe Normal 4.3 CLASSIFICAÇÃO DE CASOS ESPECIAIS COM TRÊS SEGMENTAÇÕES DISTINTAS 4.3.1 Caso 1 – Imagens de pacientes voluntárias amamentando em uma única mama Sabe-se que a presença de um tumor maligno acarreta um aumento de temperatura da mama, maior que a existente para outra anormalidade mamária. A amamentação também afeta a temperatura das mamas, isto faz com que exista um desequilíbrio na simetria existente em mamas sem que haja, necessariamente, algum tipo de patologia. 77 Imagens de pacientes do Assentamento Veneza que declararam que estar amamentando, em apenas uma das mamas, apresentaram uma característica bastante interessante. A mama na qual a criança mamava tinha uma temperatura superior à outra. Tendo como base esse princípio, esses casos foram investigados de forma separada, no intuito de não induzir o classificador ao erro ou acrescentando um falso positivo. Na Figura 29 percebe-se visivelmente essa diferença de temperatura entre as mamas. Figura 29 - Exemplo de imagem termográfica de paciente em fase de amamentação onde apenas uma das mamas é utilizada na amamentação. Neste caso, foram realizados testes de classificação com os três tipos de segmentação e apenas com duas classes: Câncer e Não-Câncer. Foram quatro imagens analisadas. Os resultados estão representados na Tabela 17 e 19. Tabela 17 - Resultados dos classificadores em duas classes para este caso com segmentação por elipses Discriminante Distância Distância Distância linear Mahalanobis Euclidiana City Block Acertos 2 1 1 1 Erros 2 3 3 3 Acertos em % 50% 25% 25% 25% 78 O classificador Discriminante Linear classificou duas imagens como sendo da Classe Não-Câncer e outras duas como sendo da Classe Câncer. O classificador com Distância Mahalanobis, Euclidiana e City Block atribuíram três imagens à Classe Câncer. Neste caso, mesmo errando, os classificadores de distâncias Mahalanobis, Euclidiana e City Block mostraram a classificação esperada. Na Tabela 18 é possível ver a classificação atribuída para cada imagem. Devemos considerar as representações: Nc - Classe-Não Câncer e Ca – Classe Câncer. Tabela 18 - Classificação para cada imagem segmentada por elipses Diagnóstico Real Nc Nc Nc Nc Discriminante Linear Nc Ca Ca Nc Distância Mahalanobis Ca Ca Ca Nc Distância Euclidiana Ca Ca Ca Nc Distância City Block Ca Ca Ca Nc Nc - Classe Não-Câncer; Ca – Classe Câncer Tabela 19 - Resultados dos classificadores em duas classes para este caso com a segmentação por splines. Discriminante Distância Distancia Distância linear Mahalanobis Euclidiana City Block Acertos 1 1 1 1 Erros 3 3 3 3 Acertos em % 25% 25% 25% 25% Neste caso, todos os classificadores erraram na maioria das imagens pelo fato de a mama ser normal, apesar dessa grande diferença de temperatura apresentada, devida à amamentação. Todos eles classificaram a maioria das imagens como câncer, o que era um resultado esperado. 79 Os exemplos apresentados são uma demonstração de que determinadas pacientes com situações como as da amamentação, não devem ser incluídas na amostra de estudo já que conduzem a resultados falso-positivos. Tabela 20 - Representação da classificação das imagens com segmentação por splines Diagnóstico Real Nc Nc Nc Nc Discriminante Linear Ca Ca Ca Nc Distância Mahalanobis Ca Ca Ca Nc Distância Euclidiana Ca Ca Ca Nc Distância City Block Ca Ca Ca Nc Nc - Classe Não-Câncer; Ca – Classe Câncer Na Tabela 21 são apresentados os resultados dos classificadores com a utilização da segmentação automática. Tabela 21 – Resultados para os classificadores com relação a duas classes e com a utilização da segmentação automática Discriminante Distância Distancia Distância linear Mahalanobis Euclidiana City Block Acertos 2 2 2 3 Erros 2 2 2 1 Acertos em % 50% 50% 50% 75% A Tabela 22 mostra a representação da classe à qual a imagem foi atribuída. 80 Tabela 22 - Representação da classificação das imagens com segmentação automática Diagnóstico Real Nc Nc Nc Nc Discriminante Linear Nc Ca Ca Nc Distância Mahalanobis Nc Ca Ca Nc Distância Euclidiana Nc Ca Ca Nc Distância City Block Nc Nc Ca Nc Nc - Classe Não-Câncer; Ca – Classe Câncer Nota-se, de maneira geral, que a segmentação automática obteve um maior número de acertos em comparação com as outras segmentações. Percebe-se também que em uma análise binária onde as duas classes analisadas fossem ―Presença de patologia‖ e ―Ausência de patologia‖, representando respectivamente a união das classes Cisto, Câncer e Benigno e a outra a classe Normal, o número de erros seria bem maior. Os classificadores indicaram, na maioria das vezes, anormalidades para essas imagens, pois todos os distúrbios mamários apresentam uma alteração de temperatura. 4.3.2 Caso 2 – Paciente voluntária com cirurgia realizada em uma das mamas Neste caso serão analisadas três imagens de uma paciente voluntária que realizou uma cirurgia na mama esquerda há mais de cinco anos. Este fato gerou a retirada de parte da mama esquerda onde havia um fibroadenoma. Posteriormente, encontrou-se um achado benigno na outra mama. Sendo assim, é de se esperar que os classificadores errem no diagnóstico por causa da diferença de temperatura visível entre as duas mamas. A análise será feita em relação a duas classes (Câncer; Não-Câncer). Na Figura 30 é vista uma das imagens das mamas dessa paciente. 81 Figura 30 - Imagem frontal (T2) da paciente que passou por cirurgia na mama esquerda Na Figura 31 apresenta-se a segmentação de uma das imagens por elipses e na Figura 32 observa-se a segmentação por splines. Figura 31 - Segmentação por elipses das mamas da paciente pixels pixels °C pixels pixels Figura 32 - Segmentação por splines das mamas da paciente pixels pixels °C pixels pixels 82 Na Tabela 23 observam-se os resultados obtidos para a respectiva paciente, com a segmentação por elipses. Tabela 23 - Resultados dos classificadores com a segmentação por elipses Discriminante Distância Distância Distância Linear Mahalanobis Euclidiana Block Acertos 3 3 3 3 Erros 0 0 0 0 % Acertos 100% 100% 100% 100% City Na Tabela 24 apresentam-se as classificações para cada imagem da paciente. Tabela 24 - Resultados dos classificadores para cada imagem da paciente segmentada por elipses Diagnóstico pretendido Nc Nc Nc Discriminante Linear Nc Nc Nc Distância Mahalanobis Nc Nc Nc Distância Euclidiana Nc Nc Nc Distância City Block Nc Nc Nc Nc - Classe Não-Câncer; Ca - Classe Câncer Na Tabela 25 são apresentados os resultados obtidos com a segmentação por splines. Tabela 25 - Resultados dos classificadores com a segmentação por splines Discriminante Distância Distância Distância Linear Mahalanobis Euclidiana Block Acertos 3 3 3 2 Erros 0 0 0 1 % Acertos 100% 100% 100% 66,66% City 83 Na Tabela 26 apresentam-se os resultados obtidos para cada imagem. Tabela 26 - Resultados dos classificadores para cada imagem com a segmentação splines Diagnóstico pretendido Nc Nc Nc Discriminante Linear Nc Nc Nc Distância Mahalanobis Nc Nc Nc Distância Euclidiana Nc Nc Nc Distância City Block Nc Ca Nc Nc - Classe Não-Cârcer, Ca-Classe Câncer Tabela 27- Resultados dos classificadores para cada imagem com a segmentação automática Discriminante Distância Distância Distância Linear Mahalanobis Euclidiana Block Acertos 3 3 3 3 Erros 0 0 0 0 % Acertos 100% 100% 100% 100% City Tabela 28 - Resultados dos classificadores para cada imagem com a segmentação automática Diagnóstico pretendido Nc Nc Nc Discriminante Linear Nc Nc Nc Distância Mahalanobis Nc Nc Nc Distância Euclidiana Nc Nc Nc Distância City Block Nc Nc Nc Nc-Classe Não-Câncer 84 Pode-se concluir com as análises realizadas que com segmentação por elipses os classificadores obtiveram, de maneira geral, resultados semelhantes aos obtidos com a segmentação por splines, onde acertaram a grande maioria dos resultados. 85 5 CONCLUSÕES A seguir apresentam-se as conclusões do presente trabalho, assim como sugestões para a continuidade do mesmo. 5.1 SÍNTESE DOS PRINCIPAIS RESULTADOS Conclui-se com esta dissertação que os dois tipos de segmentação manuais abordados não ofereceram grande influência na hora de classificação das patologias mamárias analisadas e apresentam resultados superiores aos de uma segmentação automática. Conclui-se também que apesar de a maioria dos classificadores oferecerem bons resultados, faz-se necessário uma melhor análise dos mesmos com uma amostra de número similar para pacientes de classes diferentes, para que se defina o classificador que melhor se adeque às condições encontradas para as pacientes do grupo de teste. Nesta dissertação foi possível observar que o Classificador Discriminante Linear obteve os melhores resultados, tanto na classificação de forma direta quando na classificação ajustada para minimizar a influência de uma determinada característica do grupo de teste, formado quase inteiramente por pacientes da classe normal. Os outros três classificadores abordados, os de Distância Mínima (Distância Euclidiana, Distância City Block e Distância Mahalanobis) melhoraram a taxa de acertos quando foi feita essa última análise. Nas condições específicas do grupo de teste, com muitas amostras normais, o Classificador Discriminante Linear se mostrou o mais adequado para a utilização. Foi possível observar também que a utilização de um protocolo mais flexível para aquisição das imagens termográficas, como o utilizado neste trabalho em locais distintos do HC/UFPE, não exerceu influência significativa na classificação das mesmas imagens. Apesar do reduzido número de amostras, este estudo dá indícios que a termografia pode ser utilizada, em regiões de difícil acesso e com precariedade médica, com o objetivo de realizar uma triagem de câncer de mama nas mulheres residentes 86 nestes locais. Dessa forma, é possível identificar quais pacientes devem ser enviadas com maior urgência a centros de diagnóstico mais avançados. Um resultado importante é a indicação de que o Classificador Discriminante Linear pode ser usado em um sistema computacional rápido de triagem de imagens termográficas de mama, para auxílio ao diagnóstico. Percebe-se que numa triagem às cegas, em localidades isoladas é importante que algumas perguntas simples sejam feitas às pacientes, sendo devidamente registradas. Entre elas, se a paciente está amamentando e/ou se já realizou alguma cirurgia prévia da mama. Esse cuidado visa separar pacientes que possam apresentar resultados falsopositivos. 5.2 TRABALHOS FUTUROS Como sugestão para trabalhos futuros pode-se citar esse estudo com uma amostra de teste maior e mais balanceada, ou seja, onde se possa ter um número similar de elementos em cada classe. Pode-se também estender esse trabalho no intuito de realizar mais estudos comparativos em relação aos classificadores, buscando dentro de um grande número desses os que apresentam as melhores respostas para distinguir de maneira ótima tanto a Classes Câncer e Não-Câncer, como também as Classes Benigno, Cisto, Maligno e Normal. Pode-se também comparar outros tipos de segmentação manual e automática encontrados na literatura, a fim de encontrar a que ofereça o melhor resultado possível. Sendo assim, a partir dos melhores resultados obtidos de um classificador submetido aos diferentes tipos de segmentação, definir qual tipo da segmentação oferece um melhor resultado. Todas as informações decorrentes da continuidade do presente projeto podem ser utilizadas na construção de um sistema computacional de auxílio ao diagnóstico (CAD) para ser usado como triagem rápida e mais segura de anomalias da mama, incluindo câncer, a partir de imagens termográficas. 87 REFERÊNCIAS ACHARYA, U. R; NG, E. Y. K.; TAN, J.-H.; SREE, S. V. Thermography based breast cancer detection using texture features and support vector machine. Journal of Medical Systems, v. 36, n. 3, p. 1503–1510, Jun. 2012. Disponível em: <http://link.springer.com/article/10.1007/s10916-010-9611-z/fulltext.html>. ACHARYA, U. R.; NG, E. Y. K.; SREE, S. V.; CHUA, C. K.; CHATTOPADHYAY, S. Higher order spectra analysis of breast thermograms for the automated identification of breast cancer. Expert Systems, v. 31, n. 1, p. 37–47, Fev. 2014. Disponível em: <http://onlinelibrary.wiley.com/doi/10.1111/j.14680394.2012.00654.x/abstract>. ALDO DI CARLO, M. D., Thermography and the possibilities for its applications in clinical and experimental dermatology. Clinics in Dermatology, v. 13, n. 4, p. 329 - 336, Jul. 1995. Disponível em: <http://www.sciencedirect.com/science/article/pii/ 0738081X9500073O>. AMALU, W. C. A Review of Breast Thermography. Redwood City (EUA), International Academy of Clinical Thermography (IACT), 2002. Disponível em: < http://www.iact-org.org/articles/articles-review-btherm.html>. AMALU, W. C; HOBBINS, W. B.; J. F.; ELLIOT, R. L. Infrared imaging of the breast – an overview. In: BRONZINO, J.D. The Biomedical Engineering handbook – Medical Systems and Devices, 3 ed. Boca Raton: CRC, 2006. p. 25-1 - 25-20. American College of Radiology. Breast Imaging Reporting and Data System. BIRADS™. 3rd ed. Reston, VA: ACR, 1998. AMMER, K. The Glamorgan Protocol for recording and evaluation of thermal images of the human body. Thermology international, Wien, v. 18, n. 4. p. 125- 144, Out. 2008. Disponível em: <http://www.researchgate.net/publication/233420893_The_ Glamorgan_Protocol_for_recording_and_evaluation_of_thermal_images_of_the_huma n_body >. ARAÚJO, M. C. Uso de imagens termográficas para classificação de anormalidades de mama baseado em variáveis simbólicas intervalares. 166 p. Tese de Doutorado, Departamento de Engenharia Mecânica, Universidade Federal de Pernambuco, Recife, PE, 2014. ARAÚJO, M. C. Utilização de câmera por infravermelho para avaliação de diferentes patologias em clima tropical e uso conjunto de sistemas de banco de dados para detecção de câncer de mama. 54 p. Dissertação de Mestrado, Departamento de Engenharia Mecânica, Universidade Federal de Pernambuco, Recife, PE, 2009. BAPTISTA, M. C. V. Métodos de visualização de desorganizações estruturais mamarias. 87 p. Dissertação de Mestrado, Departamento de Física, Universidade de Aveiro, Aveiro, 2006. Disponível em: <http://hdl.handle.net/10773/2582>. 88 BARROS, A. F.; UEMURA, G.; MACEDO, J. L. S. Atraso no diagnóstico e tratamento do câncer de mama e estratégias para a sua redução. FEMINA - Revista da Federação Brasileira das Associações de Ginecologia e Obstetrícia, v. 40, n. 1, p. 31 – 36, JanFev. 2012. Disponível em : <http://files.bvs.br/upload/S/0100-7254/2012/v40n1 /a3077.pdf>. BERZ, R; SAUER, H. The medical use of infrared-thermography -history and recent applications. Thermografie-Kolloquium 2007 - Vortrag 04, [online]. Disponível em: < http://www.ndt.net/article/dgzfp-irt-2007/Inhalt/v04.pdf>. BEZERRA, L.A. Estimação de parâmetros termofísicos da mama e de distúrbios mamários a partir de termografia por infravermelho utilizando técnicas de otimização. 176 p. Tese de doutorado, Universidade Federal de Pernambuco, Recife, PE, 2013. BEZERRA, L.A. Uso de imagens termográficas em tumores mamários para validação de simulação computacional. 59 p. Dissertação de Mestrado, Departamento de Engenharia Mecânica, Universidade Federal de Pernambuco, Recife, PE, 2007. BORCHARTT, T.B. Análise de imagens termográficas para a classificação de alterações na mama. Tese de Doutorado, Universidade Federal Fluminense, Niterói, RJ, 2013. BOTELHO, M. F.; CENTENO, J. A. S. Uso integrado de imagem de alta resolução espacial e altura derivada do laser scanner na escolha do classificador orientado a região. Boletim de Ciências Geodésicas, Curitiba, v. 11, n. 1, p.71-87, Jan-Jun. 2005. CATTANI, C. E. V.; MERCANTE, E.; SOUZA, C. H. W.; WRUBLACK. Desempenho de algoritmos de classificação supervisionada para imagens dos satélites RapidEye. In: Anais XVI Simpósio Brasileiro de Sensoriamento Remoto - SBSR, Foz do Iguaçu, PR, Brasil, 2013. DANGELO, J. G; FATTINI, C. A. Anatomia humana sistêmica e segmentar. 3 ed. São Paulo: Editora Atheneu, 2007. DIAKIDES, N. A.; BRONZINO, J. D. Medical Infrared Imaging. Boca Raton: CRC Press, 2008. DOUGHERTY G. Digital image processing for medical applications. 1. ed. Cambridge: University Press, 2009. DOURADO NETO, H. M. Segmentação e análise automáticas de termogramas: um método auxiliar na detecção do câncer de mama. 99 p. Dissertação de Mestrado, Departamento de Engenharia Mecânica, Universidade Federal de Pernambuco, Recife, 2014. DUDA, R. O.; HART, P. E.; STORK, D. G. Pattern Classification. 2 ed. New York: John Wiley and Sons, 2000. FARIA, J. L. Patologia Geral - fundamentos das doenças, com aplicações clínicas. 4 ed. Rio de Janeiro: Guanabara Koogan, 2003. 89 FASS, L. Imaging and cancer: a review. Molecular Oncolology. v. 2, n. 2, p. 115–152, Abr. 2008. Disponível em: <http://www.sciencedirect.com/science/article/pii/S157 4789108000598>. FERREIRA, M. R. P. Análise discriminante clássica e de núcleo: avaliações e algumas contribuições relativas aos métodos Boosting e Bootstrap. Dissertação (Mestrado) — Universidade Federal de Pernambuco, Recife, 2007 FRANCIS, S. V.; SASIKALA, M.; SARANYA, S. Detection of breast abnormality from thermograms using curvelet transform based feature extraction. Journal of Medical Systems, v. 38, n. 4, 2014. GAUTHERIE, M. Atlas of breast thermography with specific guidelines for examination and interpretation. Milan, Italy: PAPUSA, 1989. GODINHO, E. R; KOCH, H. A. Breast imaging reporting and data system (BIRADS™): como tem sido utilizado? Radiologia Brasileira, São Paulo, v.37, n.6, p. 413-417, Dez. 2004. Disponível em: <http://www.scielo.br/scielo.php?script=sci_ arttext&pid=S010039842004000600006&lng=en&nrm=iso>. GONZALEZ, R. C.; WOODS, R. E. Digital imaging processing. 2 ed. Upper Saddle River: Prentice Hall, 2002. GRONDONA, A. E. B. Avaliação da acurácia dos classificadores de máxima verossimilhança, mínima distância euclidiana e isodata na classificação de imagens da região do Pantanal. Anais 2º Simpósio de Geotecnologias no Pantanal, Corumbá, 7-11 novembro 2009, Embrapa Informática Agropecuária/INPE, p.433-442. GUYTON, A. C; HALL, J. E. Tratado de fisiología médica. 12a ed. Barcelona: Elsevier, 2011. HARRIS, D. L.; GREEINING, W. P.; AICHROTH, P. M. Infra-red in the diagnosis of a lump in the breast. Br. J. Cancer,, v. 20(4), p. 710–721, 1966. (INCA, 2011) Instituto Nacional de Câncer José Alencar Gomes da Silva. Estimativa 2012: Incidência de Câncer no Brasil. Rio de Janeiro: Divisão de Tecnologia da Informação, 2011 (INCA, 2014a). Instituto Nacional de Câncer José Alencar Gomes da Silva. Tipos de câncer - Mama. Disponível em: <http://www2.inca.gov.br/wps/wcm/connect/ tiposdecancer/site/home/mama> Acesso em: 20 jan. 2015. (INCA, 2014b). Instituto Nacional de Câncer José Alencar Gomes da Silva. Detecção precoce do câncer de mama. Disponível em: <http://www.inca.gov.br/conteudo_view.asp?id=1932> Acesso em: 20 jan. 2015. (INCA, 2014c). Instituto Nacional de Câncer José Alencar Gomes da Silva. Câncer - o que é. Disponível em: <http://www2.inca.gov.br/wps/wcm/connect/cancer/site/oquee> Acesso em: 20 jan. 2015. 90 INCROPERA, F. P.; DEWITT, D. P.; BERGMAN, T. L.; LANINE, A. S. Fundamentos de transferência de calor e massa. 6. ed. Rio de Janeiro: LTC, 2008. JUNQUEIRA, L. C. U; CARNEIRO, J. Histologia básica. 11 ed. Rio de Janeiro: Guanabara Koogan, 2008. KAPOOR, P.; PRASAD, S.V.A.V. Image processing for early diagnosis of breast cancer using infrared images. In: 2nd International Conference on Computer and Automation Engineering, v. 3, n. 1, p. 564-566. Fev. 2010. KAPOOR, P.; PRASAD, S. V. A. V.; PATNI, S. Image Segmentation and Asymmetry Analysis of Breast Thermograms for Tumor Detection. In: International Journal of Computer Applications, Volume 50 – No.9, July 2012. KITT, T. Tratado de Patologia General Veterinária. 2a ed. Barcelona: Editorial Labor, 1954. KOAY, J.; HERRY, C.; FRIZE, M. Analysis of Breast Thermography with an Artificial Neural Network. In: Proceedings of the 26th Annual International Conference of the IEEE EMBS, 2 p. 1159-1162, Set. 2004. KRAWCZYK, B.; SCHAEFER, G. A hybrid classifier committee for analysing asymmetry features in breast thermograms. Applied Soft Computing, v. 20, p. 112-118, Jul. 2014. LORENA, A. C.; CARVALHO, A. C. P. L. F. Uma Introdução às Support Vector Machines. RITA, Volume XIV, n. 2, 2007. MANRIQUE ABRIL, F.G; DÍAZ, J. M. O.; FUENTES, N. A. V.; PACHECO, A. L. M.; AMAYA, G. H. Factores asociados a la práctica correcta del autoexamende mama en mujeres de Tunja (Colombia). Investigación y educación in enfermería, Medellín, v. 30, n. 1, p. 18 – 27, Mar. 2012. Disponível em: <http://www.scielo.org.co/scielo.php?script=sci_arttext&pid=S01205307201200010000 3&lng=en&nrm=iso>. MARQUES, R. S.; RESMINI, R.; CONCI, A.; FONTES, C. A. P.; LIMA, R. C. F. Método para segmentação manual de imagens térmicas para geração de GroundTruth, 2012. MONTEIRO, A. P. S.; ARRAES, E. P. P.; PONTES, L. B.; CAMPOS, M. S. S.; RIBEIRO, R. T.; GONÇALVES, R. E. B. Breast self-examination: frenquency of knowledge, practice and associated factors, Revista Brasileira de ginecologia e obstetrícia, v. 25, n. 3, p. 201-205, Abr. 2003. Disponível em: <http://www.scielo.br/scielo.php?script=sci_arttext&pid=S0100-72032003000300009>. MOREIRA, M. A. Fundamentos de Sensoriamento Remoto e Metodologias de Aplicação. 2ª ed. Viçosa: UFV, 2003. 91 MOTTA, L. S. Obtenção automática da região de interesse em termogramas frontais da mama para o auxílio à detecção precoce de doenças. 104p. Dissertação de mestrado, Departamento de Computação, Universidade Federal Fluminense, Niterói, Rj, 2010. NG, E. Y. K. A review of thermography as promising non-invasive detection modality for breast tumor. International Journal of Thermal Sciences, v. 48, n. 5, p. 849–859, Mai. 2009. Disponível em: <http://www.sciencedirect.com/science/article/pii/S1 29007290800149X> NG, E. Y. K.; KEE, E. C.; ACHARYA, R.U. Advanced Technique in Breast Thermography Analysis. In: Proceedings of the 2005 IEEE Engineering in Medicine and Biology 27th Annual Conference Shanghai. China, p. 710-713, 2005. NG, E. Y. K., SUDHARSAN, N. M. Computer simulation in conjunction with medical thermography as an adjunct tool for early detection of breast cancer. BMC Cancer. v. 4, n. 17, Abr. 2004. Disponível em: <http://www.ncbi.nlm.nih.gov/pmc/articles/ PMC416480/pdf/1471-2407-4-17.pdf>. OLIVEIRA, M. M. Desenvolvimento de protocolo e construção de um aparato mecânico para padronização da aquisição de imagens teográficas de mama. 94 p. Dissertação de mestrado, Departamento de Engenharia Mecânica, Universidade Federal de Pernambuco, Recife, PE, 2012. OLIVEIRA, C; ALMEIDA, L; LIMA, M. Diagnóstico por imagem da mama. In: RIBEIRO, R.C; SALTZ, R. Cirurgia da mama - estética e reconstrutiva. Rio de Janeiro: Revienter, 2011. QI, H.; HEAD, J. F. Asymmetry analysis using automatic segmentation and classification for breast cancer detection in thermograms, In: Proceedings of the 23rd IEEE Annual International Conference on Engineering in Medicine and Biology. vol. 3, p. 2866-2869, 2001. QI, H.; KURUGANTI, P. T.; SNYDER, W. E. Detecting breast cancer from thermal infrared images by asymmetry analysis. In: DIAKIDES, N. A.; BRONZINO, J. D. Medical Infrared Imaging. Boca Raton: CRC Press, 2008. cap. 11, p. 11.1–11.14. QUEIROZ, K. F. F. C.; ARAÚJO, M. C.; LIMA, R. C. F. Análise da influência da segmentação sobre o problema da classificação de anomalias em imagens termográficas de mama. XXIV Congresso Brasileiro de Engenharia Biomédica – CBEB, 2014. QUEIROZ, K. F. F. C. Análise da repetitividade e melhoria de segmentação semiautomática de ROIS em imagens termográficas de mama. 2014. Trabalho de conclusão de curso (Monografia) – Universidade Federal de Pernambuco, Recife, 2014. RESMINI, R.; CONCI, A.; BORCHARTT, T. B.; LIMA, R. C. F.; MONTENEGRO, A. A.; PANTALEÃO, C. A. Diagnóstico precoce de doenças mamárias usando imagens térmicas e aprendizado de máquina. Revista eletrônica do Alto Vale do Itajaí, v. 1, n.1, p. 55-67, Ago. 2012. Disponível em: <http://www.revistas.udesc.br/index.php/reavi/ article/view/2630/2090>. 92 RING, E. F. J; AMMER, K. Infrared thermal imaging in medicine. Physiological Measurement, v. 33, n. 3, p.33–46, Fev. 2012. Disponível em: <http://iopscience.iop.org/0967-3334/33/3/R33/pdf/0967-3334_33_3_R33.pdf>. ROCHA, J.; SOUSA, P. M. Integração de dados estatísticos na classificação de imagens de satélite. Centro de Estudos Geográficos, Universidade de Lisboa, 2007. Disponível em: <www.academia.edu/423593/Integração_de_dados_estatísticos_na_classificação_de_i magens_de_satelite > SALLES, T.; ROCHA L.; MOURÃO, F.; PAPPA, G. L.; CUNHA, L.; GONÇALVES, M. A.; MEIRA JR, W. Classificação Automática de Documentos Robusta Temporalmente, XXIV Simpósio Brasileiro de Banco de Dados, 2009. SERRANO, R. C. Viabilidade do uso do coeficiente de Hurst e da lacunaridade no diagnóstico precoce de patologias da mama. 76 p. Dissertação de Mestrado, Departamento de Computação, Universidade Federal Fluminense, Niterói, RJ, 2010. SILVA, S. V. Reconstrução da Mama a partir de Imagens Termográficas. 127 p. Tese de Doutorado, Departamento de Computação, Universidade Federal Fluminense, Niterói, RJ, 2010. SIMÕES, S. C. B. Agregação via bootstrap: uma investigação de desempenho em classificadores estatísticos e redes neurais, avaliação numérica e aplicação no suporte ao diagnóstico de câncer de mama. Dissertação de mestrado, Departamento de Biometria e Estatística Aplicada, Universidade Federal Rural de Pernambuco, Recife, 2007. Sociedade Brasileira de Mastologia (SBM). Como se forma o câncer de mama. 2015. Disponível em: <http://www.sbmastologia.com.br/formacao-do-cancer-da-mama.php> Acesso em: 20 jan. 2015. TARTAR, M; COMSTOCK, C.E; KIPPER, M.S. Breast cancer imaging: a multidisciplinary, multimodality approach. 1ed. Philadelphia: Elsevier, 2008. UNGER, S. K.; INFANTE, C. C. Delay of medical care for symptomatic breast cancer: a literature review. Salud Pública de México. Cuernvaca, v. 51, n. 2, p. s270-s285, Dez. 2009. Disponível em: < http://www.scielosp.org/pdf/spm/v51s2/v51s2a18.pdf>. WEBB, A. R.; COPSEY, K. D. Statistical pattern recognition. 3 ed. New York: Wiley, 2011. YAHARA, T.; KOGA, T.; YOSHIDA, S.; NAKAGAWA, S.; DEGUCHI, H.; SHIROUZO, K. Relationship between microvessel density and thermographic hot areas in breast cancer. Surgery Today. v. 33, n. 4, p. 243-248, Jul. 2003. Disponível em: <http://www.calgarythermography.com/articles/Surgery%20Today%202003%20%20Relationship%20Between%20Mirovessel%20Density%20and%20Thermographic %20Hot%20Areas.pdf>. 93