902

Propaganda
Descoberta de Conhecimento
em Base de Imagens
Mamográficas
Adriana Cristina Giusti Corrêa
Prof. Dr. Homero Schiabel
Contextualização
 Utilização de uma ferramenta de mineração de
dados baseada em regras de associação;
 Regras de Associação  base de imagens
mamográficas  descoberta de conhecimento
implícito;
 Base de imagens = informações dos laudos
radiológicos de mamografias, as imagens
mamográficas digitalizadas, e dados do prontuário
médico de cada paciente;
 Objetivo: descobrir uma pré-disposição ao câncer
de mama.
Base de Imagens
Mamográficas (LAPIMO)
 Elaboração da base: início em 1998
 Alimentada com imagens mamográficas digitalizadas e
informações provenientes de laudos radiológicos
 Digitalização: scanners laser
armazenadas em formato TIFF
do
tipo
Lumiscan,
 Obtenção: Diversos hospitais, tais como Hospital São
Paulo e Hospital Pérola Byington em SP, Hospital das
Clínicas da FMRP/USP em Ribeirão Preto/SP, Santa
Casa de São Carlos/SP e Hospital das Clínicas da
UNESP em Botucatu/SP
 Total de imagens: mais de 3300 imagens referentes a
mais de 700 pacientes.
Descoberta de
Conhecimento (KDD)
 KDD  informações implícitas em Banco de
Dados  suporte às decisões
 KDD & CAD
 Image Mining
 Data Mining
Datawarehouse
Mamográfico
KDD
Etapas da KDD
Regras de Associação
 Possibilitam encontrar regras do tipo X  Y
 Suporte e Confiança: restrição de regras
 Suporte: elimina regras com pouca freqüência
 Confiança: indica o grau de acerto da regra
 Regra de associação = X  Y
 X={x1,x2,...,xn} e Y={y1,y2,...,ym} são conjuntos de itens
 se a característica X está
característica Y também estará.
presente,
provavelmente
a
 Exemplo: imagens de raios-X
 Algoritmo: APriori - é o mais conhecido e de fácil
utilização para encontrar regras associativas.
WEKA
Waikato Environment for Knowledge Analysis
 Formato ARFF
@relation table
@attribute field1 {option1,option2,option3}
@attribute field2 numeric
...
@data
option1,20
option3,40
option2,10
...
Metodologia
1. Dados: base
(LAPIMO)
de
imagens
mamográficas
2. Seleção: informações dos laudos radiológicos
3. Processamento: padronização, eliminação de
dados duplicados
4. Transformação: formato ARFF
5. Mineração: WEKA (APriori)
6. Interpretação / Avaliação
Resultados

Amostragem: 100 pacientes

13 casos onde:


Pacientes relataram nódulos palpáveis, não foram encontrados nódulos e nem
calcificações nos laudos

Havia antecedentes familiares em 12 destes casos. Grau de acerto da regra: 92%.
11 casos onde:

Pacientes não relataram nódulos palpáveis, não há precedentes de câncer na família

Foram encontrados nódulos em 11 casos e calcificações em 10 casos. Grau de
acerto: 91%.

Atenção do médico: pacientes com ausência de nódulos palpáveis, ausência de
câncer na família podem apresentar nódulos nas mamografias e calcificações
mamárias.

Outras informações: utilização de anticoncepcionais, idade da telarca, paciente
submetida a tratamento de reposição hormonal, etc, também poderiam ser
integrantes das informações de entrada para a mineração.

Tal procedimento possibilita a produção de regras envolvendo tais informações,
as quais podem ser utilizadas pelos médicos no auxílio às decisões.
Conclusão
 Utilização de KDD para extrair informações implícitas
que auxiliam o médico na tomada de decisões
 Avaliação detalhada da paciente:
 Utilização de anticoncepcionais
 Densidade da mama
 Reposições hormonais
 Nódulos palpáveis
 Câncer na família
 Idade da telarca
 Etc.
Agradecimentos
Departamento de Engenharia Elétrica
Escola de Engenharia Elétrica
EESC/USP – São Carlos
Contatos:
Adriana – [email protected]
Prof. Homero – [email protected]
Laboratório de Análise e Processamento de
Imagens Médicas e Odontológicas
http://ladi.sel.eesc.usp.br/lapimo/lapimo.htm
Download