Descoberta de Conhecimento em Base de Imagens Mamográficas Adriana Cristina Giusti Corrêa Prof. Dr. Homero Schiabel Contextualização Utilização de uma ferramenta de mineração de dados baseada em regras de associação; Regras de Associação base de imagens mamográficas descoberta de conhecimento implícito; Base de imagens = informações dos laudos radiológicos de mamografias, as imagens mamográficas digitalizadas, e dados do prontuário médico de cada paciente; Objetivo: descobrir uma pré-disposição ao câncer de mama. Base de Imagens Mamográficas (LAPIMO) Elaboração da base: início em 1998 Alimentada com imagens mamográficas digitalizadas e informações provenientes de laudos radiológicos Digitalização: scanners laser armazenadas em formato TIFF do tipo Lumiscan, Obtenção: Diversos hospitais, tais como Hospital São Paulo e Hospital Pérola Byington em SP, Hospital das Clínicas da FMRP/USP em Ribeirão Preto/SP, Santa Casa de São Carlos/SP e Hospital das Clínicas da UNESP em Botucatu/SP Total de imagens: mais de 3300 imagens referentes a mais de 700 pacientes. Descoberta de Conhecimento (KDD) KDD informações implícitas em Banco de Dados suporte às decisões KDD & CAD Image Mining Data Mining Datawarehouse Mamográfico KDD Etapas da KDD Regras de Associação Possibilitam encontrar regras do tipo X Y Suporte e Confiança: restrição de regras Suporte: elimina regras com pouca freqüência Confiança: indica o grau de acerto da regra Regra de associação = X Y X={x1,x2,...,xn} e Y={y1,y2,...,ym} são conjuntos de itens se a característica X está característica Y também estará. presente, provavelmente a Exemplo: imagens de raios-X Algoritmo: APriori - é o mais conhecido e de fácil utilização para encontrar regras associativas. WEKA Waikato Environment for Knowledge Analysis Formato ARFF @relation table @attribute field1 {option1,option2,option3} @attribute field2 numeric ... @data option1,20 option3,40 option2,10 ... Metodologia 1. Dados: base (LAPIMO) de imagens mamográficas 2. Seleção: informações dos laudos radiológicos 3. Processamento: padronização, eliminação de dados duplicados 4. Transformação: formato ARFF 5. Mineração: WEKA (APriori) 6. Interpretação / Avaliação Resultados Amostragem: 100 pacientes 13 casos onde: Pacientes relataram nódulos palpáveis, não foram encontrados nódulos e nem calcificações nos laudos Havia antecedentes familiares em 12 destes casos. Grau de acerto da regra: 92%. 11 casos onde: Pacientes não relataram nódulos palpáveis, não há precedentes de câncer na família Foram encontrados nódulos em 11 casos e calcificações em 10 casos. Grau de acerto: 91%. Atenção do médico: pacientes com ausência de nódulos palpáveis, ausência de câncer na família podem apresentar nódulos nas mamografias e calcificações mamárias. Outras informações: utilização de anticoncepcionais, idade da telarca, paciente submetida a tratamento de reposição hormonal, etc, também poderiam ser integrantes das informações de entrada para a mineração. Tal procedimento possibilita a produção de regras envolvendo tais informações, as quais podem ser utilizadas pelos médicos no auxílio às decisões. Conclusão Utilização de KDD para extrair informações implícitas que auxiliam o médico na tomada de decisões Avaliação detalhada da paciente: Utilização de anticoncepcionais Densidade da mama Reposições hormonais Nódulos palpáveis Câncer na família Idade da telarca Etc. Agradecimentos Departamento de Engenharia Elétrica Escola de Engenharia Elétrica EESC/USP – São Carlos Contatos: Adriana – [email protected] Prof. Homero – [email protected] Laboratório de Análise e Processamento de Imagens Médicas e Odontológicas http://ladi.sel.eesc.usp.br/lapimo/lapimo.htm