Uma ferramenta de mineração de imagens para suporte ao cálculo

Propaganda
Uma ferramenta de mineração de imagens para suporte ao
cálculo de idade gestacional de recém-nascidos
*
Bellon, Olga R. P.; Silva, Luciano; Cat, Mônica;
Vieira, Everton V.; Araújo, Anderson V.
Departamento de Informática – Grupo Imago – Universidade Federal do Paraná (UFPR)
Caixa Postal: 19.081 - CEP 81531-980 – Curitiba – PR – Brasil
{olga,luciano,anderson}@inf.ufpr.br, [email protected],
[email protected]
Abstract. The correct gestational age determination is one of the most used
measures to guide diagnostics of the specialists in neonatology to guarantee
the newborn surveillance. In this context, the FootScanAge system presents a
new alternative to actual methods, because it is a less invasive method and it
is based on features extracted from newborns plantar surface images. This
article presents the FootScanAge tool and its functionalities, emphasizing the
use of data mining algorithms on a database of image features, and how
image mining can help the determination of the final gestational age score.
Resumo. A correta determinação da idade gestacional é um dos principais
recursos utilizados pelos especialistas de Neonatologia para orientá-los nos
diagnósticos e medidas terapêuticas para garantir a sobrevida de recémnascidos. Neste contexto, o sistema FootScanAge se apresenta como uma
alternativa aos métodos atuais por ser um método menos invasivo baseado em
características extraídas das imagens de superfície plantar de neonatos. Neste
trabalho é demonstrado o sistema FootScanAge e suas funcionalidades,
enfatizando o uso de algoritmos de mineração de dados, em uma base de
características extraídas dessas imagens e as estratégias de apresentação dos
resultados para auxiliar no cálculo da idade gestacional.
1. Introdução
Os métodos atualmente em uso para determinação da idade gestacional (IG) de recémnascidos ainda são imprecisos, exigem muita manipulação dos neonatos e foram
baseados em pesquisas sobre populações que envolviam poucos prematuros [Cat 03].
Baseado em estudos iniciais que demonstraram a importância de dimensões do pé e de
suas sub-regiões, bem como, informações sobre cisuras e poros [Bellon et al. 05], foi
desenvolvido o método FootScanAge. Este método se propõe a ser menos invasivo e
menos subjetivo que os demais ao utilizar como referência as características da
superfície plantar de neonatos para sugerir uma idade gestacional.
*
Agradecimentos ao CNPq e FINEP pelo suporte financeiro ao projeto
33
Para servir de ferramenta ao método foi desenvolvido o sistema FootScanAge,
que combina Mineração de Dados e Processamento de Imagens, em uma técnica
conhecida como Mineração de Imagens [Zhang et al. 01]. Trata-se de um sistema de
suporte à decisão que permite a manipulação de uma base de características extraídas
das imagens dos pés de recém-nascidos e a análise desses dados através de algoritmos
de mineração de dados. De maneira resumida, o sistema FootScanAge processa as
imagens de superfície plantar, faz a extração de suas características, armazena-as em um
banco de dados e posteriormente utiliza algoritmos de mineração para identificar a
idade gestacional da nova instância sendo processada.
O objetivo deste trabalho é descrever a ferramenta de mineração de imagens do
FootScanAge, enfatizando o uso de algoritmos de mineração sobre uma base de
imagens, bem como, as estratégias de apresentação e avaliação dos resultados para
auxiliar no cálculo da idade gestacional. Na segunda seção serão apresentados os
conceitos de Mineração de Imagens e que técnicas foram adotadas no projeto
FootScanAge. Na seção seguinte, são descritos os passos de mineração e do
processamento de imagens dentro do sistema FootScanAge. Em especial, é apresentado
como os algoritmos de mineração são combinados e como os resultados da mineração
são utilizados para orientar a determinação da idade gestacional. Na quarta seção são
discutidos alguns testes preliminares com a ferramenta. O artigo se encerra com os
comentários finais de conclusão.
2. Conceitos
A essência do método FootScanAge é a obtenção de características relevantes da
superfície plantar de recém-nascidos para a construção de um modelo que oriente o
especialista para o cálculo de um escore definitivo de idade gestacional. Portanto, existe
a necessidade de construir uma base de dados para validação do método. A
fim
de
tornar viável essa validação e garantir a ampliação da base de dados, optou-se pela
construção de um sistema que também evoluísse junto com o método. A solução
adotada foi incorporação de técnicas de Mineração de Dados, integrando o usuário em
um processo que vai desde a aquisição dos dados até a aplicação do modelo de
mineração aprendido. Todavia, para obter os dados a serem minerados, é necessário
executar atividades de processamento de imagens, gerando um processo híbrido de
Mineração de Dados e Processamento de Imagens, conhecido como Mineração de
Imagens.
A Mineração de Imagens é um processo multidisciplinar que se relaciona com
várias outras áreas de conhecimento, tais como: Visão Computacional, Processamento
de Imagens, Mineração de Dados, Bancos de Dados, Aprendizado de Máquina e
Sistemas de Recuperação de Imagens (SRIC) [Vieira et al. 02]. Embora na Mineração
de Dados exista um processo de seleção e obtenção de atributos a partir de várias
tabelas ou bases de dados [Fayyad et al. 96] para gerar as instâncias a serem avaliadas,
na Mineração de Imagens a obtenção dessas características também utiliza técnicas de
Processamento de Imagens [Gonzales & Woods 00]. Assim, de uma maneira mais
formal, Mineração de Imagens [Zhang et al. 01] trata da extração de conhecimento
implícito, relacionamento entre dados de imagens, ou outros padrões não explicitamente
armazenados em banco de dados de imagens. Seu foco é determinar como a
representação de baixo nível (pixels) de uma imagem pode ser eficientemente e
34
efetivamente processada para identificar objetos e seus relacionamentos. De fato, a
Mineração de Imagens está contida em uma disciplina ainda mais abrangente, que seria
a Mineração de Dados Multimídia [Zaïane et al. 98].
Uma outra abordagem utilizada pelo sistema FootScanAge é a combinação de
classificadores, numa técnica conhecida como ensemble [Dietterich 00]. Nesta técnica,
vários algoritmos de classificação são executados sobre uma mesma base de
treinamento, partições da mesma base ou até dados gerados dinamicamente. Quando
uma nova instância precisa ser classificada, o ensemble utiliza um mecanismo de
votação que combina o resultado dos classificadores. No caso específico do
FootScanAge, o sistema permite a combinação de algoritmos provenientes de duas
estratégias de mineração: classificação e regressão [Witten & Frank 05]. Para a primeira
estratégia, as classes correspondem às idades gestacionais discretizadas e o resultado
utilizado pelo especialista pode ser tanto a classificação final sugerida pelo sistema
quanto à distribuição de probabilidade ou pertinência da imagem a cada classe. Para a
regressão, o resultado final é o escore calculado diretamente pelo sistema.
3 Arquitetura
3.1 Módulos
Para tornar mais robusta e flexível a sua implementação, o sistema foi dividido em 2
módulos integrados, FootScanAgeWeb e FootScanAgeDesktop, que compartilham uma
base de dados comum cuja modelagem é voltada não apenas para cálculo de IG, como
também para outras pesquisas na área de Pediatria e Neonatologia.
O primeiro módulo, FootAgeScanWeb, é voltado para a manutenção da base de
dados maternos, gestacionais e de neonatos incluindo diagnósticos e avaliações das
fases pré-natal e pós-parto. Este módulo é disponibilizado como uma aplicação
executada em um servidor Web utilizando o servidor de páginas Tomcat2 e
implementada em Java 3 com o auxílio da ferramenta JBanana4. O segundo módulo,
FootScanAgeDesktop, também desenvolvido em Java, é responsável pelo
processamento das imagens, mineração dos dados e o cálculo da IG. Para o
processamento de imagens foi utilizada a biblioteca JAI 5 (Java Advanced Imaging) e os
algoritmos de mineração foram obtidos da biblioteca WEKA [Witten & Frank 05].
3.2 Implementação
3.2.1 Processamento de Imagens
As características usadas pela mineração são produtos das etapas de processamento de
imagens descritos a seguir, conforme a figura 1:
Pré-processamento: elimina ruídos e rotaciona a imagem de entrada.
2
http://jakarta.apache.org/tomcat/ - Jakarta Apache Tomcat
3
http://java.sun.com - Java 2 Platform, Standard Edition (J2SE)
4
http://www.jbanana.org – JBanana Framework
5
http://java.sun.com/products/java-media/jai/index.jsp - Java Advanced Imaging API
35
Binarização: converte a imagem para o formato preto-e-branco. O usuário poderá
informar o valor do limiar ou escolher um algoritmo pré-definido.
Rotulação: a imagem binária passa por um algoritmo de detecção de regiões conexas,
com o objetivo de identificar e auxiliar a retirada dos dedos.
Retirada dos dedos: nesta fase aplica-se um algoritmo de corte que usa uma parábola
para eliminar os dedos da imagem.
Detecção das Regiões: já com a imagem do pé sem os dedos, nesta fase o sistema
determina 3 regiões dentro da imagem para auxiliar a extração de características.
Extração de características: cálculo de medidas e propriedades da imagem completa e
para cada sub-região.
A intervenção do usuário é feita apenas quando necessário - devido a imagens
de baixa qualidade ou com excesso de ruídos – através da modificação dos parâmetros
de cada fase do processamento ou através da validação do processamento feita antes da
conclusão. Como observado durante a validação do sistema, em apenas 10% das
imagens foi necessária alguma mudança dos parâmetros.
Figura 1. Etapas do processamento de imagens e geração de características
Ao final do processamento, as características são apresentadas ao especialista
que confirma os dados e os salva em banco. Inicialmente o sistema trabalha com
características como dimensões, áreas e percentuais de ocupação. Entretanto, a
variedade de características tende a aumentar com a evolução da ferramenta e do
método.
3.2.2 Cálculo da Idade Gestacional
A interface entre as características extraídas pelo processamento e o cálculo da idade é o
modelo de mineração, uma estrutura de dados que identifica os algoritmos de
mineração, bem como o conjunto de características e a consulta a ser executada no
banco para gerar as instâncias a serem mineradas.
Um modelo, para ser usado, deve passar por três etapas: geração; seleção, e;
aplicação. Na primeira fase, o usuário pode gerar vários modelos de classificação ou
regressão (ensemble) com diferentes combinações de atributos, instâncias e algoritmos.
36
Na segunda etapa, o modelo (de classificação e/ou regressão) gerado na fase anterior,
ou um outro modelo já existente, é selecionado pelo usuário. O modelo é então
aplicado, na terceira etapa, sobre os dados da nova imagem, gerando dois tipos de saída:
no caso do modelo de classificação, a distribuição de probabilidade por idade/classe; no
modelo de regressão, o valor sugerido é a idade gestacional propriamente dita.
Figura 2. Combinação de abordagens para cálculo da Idade Gestacional
O uso combinado de estratégias de mineração tem o intuito de modelar a
incerteza inerente ao processo de cálculo da IG, como também dar ao especialista a
flexibilidade de ponderar os valores calculados pelo sistema. É um processo análogo ao
de dispor da opinião de vários especialistas para gerar algum tipo de diagnóstico. Com
base na análise desses resultados, bem como da consulta de outros dados do recémnascido, o especialista indicará qual a idade gestacional para o neonato, conforme a
figura 2. Uma vez confirmada a avaliação, o escore é salvo em banco e o sistema poderá
usar essa nova imagem como base para geração de um novo modelo.
4. Análise
O aprendizado dos algoritmos de mineração depende de um atributo-alvo, que neste
caso é a própria idade gestacional. Entretanto, a IG ideal não é necessariamente a
indicada pelo especialista e sim o que é conhecido como idade gestacional padrão-ouro,
obtida a partir de gestações que tenham tido um acompanhamento pré-natal consistente.
Para realizar os testes preliminares, foi construída uma base de dados a partir de
259 imagens de recém-nascidos obtidas ao longo dos estudos iniciais do projeto, sendo
o atributo-alvo derivado a partir de idades calculadas por outros métodos. Nesta seção
são apresentados dois tipos de resultados: um comparativo de algoritmos e um exemplo
de resultado apresentado pela ferramenta.
4.1 Comparativo de algoritmos
A base de dados de referência foi exportada em 3 arquivos para ser analisada por meio
da ferramenta WEKA: um arquivo completo, para testes de validação cruzada (crossvalidation) [Schaffer 93]; um de treino, com 171 instâncias (66% do total) para o
aprendizado dos algoritmos, e; outro de testes, com as instâncias restantes. A tabela 1
mostra os resultados para os algoritmos de regressão M5P [Quinlan 92] e o
LinearRegression (Regressão Linear) [Witten & Frank 05].
Para utilizar os algoritmos de classificação foi necessário discretizar o atributoalvo em 3 classes, que representam o espaço de possibilidades das instâncias existentes
na base de dados: até 32 semanas, entre 32 e 37 semanas e maiores que 37 semanas. Na
37
tabela 2 estão os resultados dos algoritmos de classificação REPTree [Quinlan 93], J4.8
[Quinlan 93] e LMT [Landwehr et al. 03] e sua respectiva porcentagem de acerto.
Tabela 1. Resultados obtidos pelos algoritmos de regressão.
Algoritmo
M5P
LinearRegression
Base de Teste
1,5406
1,8656
Validação cruzada (10 conjuntos)
1,4385
1,6743
Os resultados se mostram promissores se comparados com outros métodos de
descoberta de idade gestacional. No caso da regressão, chegou-se a um valor próximo
de 1,5 semanas. Os desempenhos dos algoritmos de classificação são aparentemente
piores, mas isso se deve ao tipo de discretização. Com uma discretização mais granular
(vide próxima seção), observa-se que a distância entre a classe encontrada e a classe
correta é semelhante ao valor de erro da regressão.
Tabela 2. Resultados obtidos pelos algoritmos de classificação.
Algoritmo
REPTree
J4.8
LMT
Base de Teste
69,31%
63,63%
73,86%
Validação cruzada (10 conjuntos)
74,51%
74,13%
72,97%
Contudo, ainda existe uma gama de desafios e dificuldades a serem enfrentados
para tornar o método mais robusto e preciso: a necessidade uma coleta sistemática de
imagens de recém-nascidos, principalmente prematuros, para ampliar a base a ser
analisada; melhoria do processo de obtenção de impressões digitais dos neonatos,
(embora tenha havido uma grande evolução da qualidade dos métodos graças aos
estudos iniciais do projeto FootScanAge); necessidade de descoberta de novos atributos
que ampliem a precisão do método ou que ainda torne o método adaptável a diferentes
populações de recém-nascidos, e ; dificuldade de obtenção do padrão-ouro.
4.2 Visualização de resultados
Atuando como um sistema de suporte à decisão, a ferramenta FootScanAge tem como
objetivo gerar subsídios ao especialista para efetuar um cálculo de escore mais preciso.
O usuário final pode tomar a sua decisão com base na distribuição das probabilidades
dos algoritmos de classificação ou a partir do valor calculado pelos algoritmos de
regressão.
Na primeira abordagem, um ou mais algoritmos de classificação são aplicados
sobre as características do recém-nascido sendo avaliado e o sistema exibe para cada
classe de idade gestacional o percentual de probabilidade ou pertinência para cada
classe de IG. O sistema também sugere uma IG ponderando as classes retornadas por
cada algoritmo, somando-se a probabilidade calculada para cada classe e normalizandose os valores finais: a classe com maior valor é a idade sugerida. No caso da regressão,
um ou mais algoritmos podem ser executados e o escore sugerido final é a média dos
valores retornados.
38
Figura 3. Apresentação de resultados: exibição tabular das distribuições de
probabilidade e gráfico com resultados de regressão/classificação
Os resultados são apresentados em um formato tabular e gráfico, combinando as
duas abordagens. Embora o sistema calcule uma IG (uma para classificação e outra para
regressão), o sistema permite ao usuário avaliar conflitos e incertezas. Algumas
imagens, por exemplo, podem possuir características comuns a mais de uma idade
gestacional e essa similaridade é evidenciada pelos gráficos e tabelas apresentadas. Na
figura 3, é possível observar que cada algoritmo gera uma distribuição de probabilidade
diferente, mas a tendência é um idade gestacional em torno de 38-40 semanas.
5. Conclusão
O método FootScanAge é uma inovação em relação aos métodos tradicionais de
determinação de idade gestacional pois se trata de um método menos invasivo com
regras obtidas diretamente a partir de uma base de dados adaptada a realidade dos
hospitais. Para viabilizar a implantação do método, foi desenvolvido um sistema que
auxiliasse a execução de todas as etapas do processo e permitisse a manutenção e
evolução das regras que auxiliam o especialista no cálculo da idade gestacional.
De fato, um dos diferenciais do sistema é o uso da Mineração de Imagens por
meio da aplicação de algoritmos tradicionais de aprendizado de máquina a uma base de
dados multi-modal, utilizando técnicas de processamento de imagens para obtenção dos
atributos de mineração. É importante observar que essas características são derivadas a
partir dos dados de baixo nível da imagem (pixels) sem que o usuário complemente ou
altere os dados.
Outra contribuição da solução adotada é a liberdade de escolha de diferentes
algoritmos de mineração (tanto de classificação quanto regressão) e a combinação
desses resultados (ensemble). A apresentação combinada dos resultados da mineração,
de forma tabular e gráfica, também facilita a tomada de decisão do especialista. A
exibição da distribuição das probabilidades dos algoritmos de classificação para cada
classe de idade gestacional em conjunto com o valor determinado pelos algoritmos de
39
regressão servem de insumo para o especialista determinar o escore da idade
gestacional.
Desta maneira, o projeto FootScanAge fez um uso promissor e efetivo de
técnicas de Mineração de Imagens e, com uma evolução cuidadosa dos modelos de
mineração e a adoção do método em diferentes regiões ou países, o sistema tende a
aprender modelos cada vez mais robustos e precisos. Além disso, existe a possibilidade
de utilizar tanto as características das imagens como também diagnósticos e escores de
outros métodos para a geração dos modelos de mineração, permitindo um uso mais
amplo da ferramenta.
Referências
Bellon, O. R. P. Cat, M., Silva, L., Boyer, K. L. (2005) “Using computer vision to help
the determination of the gestational age of newborns”, Academic Radiology, v. 12, n.
5, p. 544-553
Cat, M. (2003) “Método FootScanAge para Determinação da Idade Gestacional”, Tese
de Doutorado em Medicina (Pediatria). Universidade Federal do Paraná, UFPR,
Brasil. Orientador: Olga Regina Pereira Bellon
Dietterich, T. G. (2000) “Ensemble Methods in Machine Learning”, Lecture Notes in
Computer Science, v.1857, p. 1-15
Fayyad, U. M., Piatestsky-Shapiro, G., Smyth, P. (1996) “From Data Mining to
Knowledge Discovery: An Overview”, In: Advances in Knowledge Discovery and
Data Mining, p. 1-34
Gonzales, R. C, Woods, R. E. (2000) “Processamento de imagens digitais”, Edgard
Blücher
Landwehr, N., Hall M., Frank, E. (2003) “Logistic Model Trees”, In: 14th European
Conference on Machine Learning, p. 241-252
Quinlan, R. (1992) “Learning with continuous classes”, In: Proceedings in AI'92,
Adams & Sterlings, World Scientific, Singapore, p. 343-348
Quinlan, R. (1993) “C4.5: Programs for Machine Learning”, Morgan Kaufmann
Publishers, San Mateo, CA
Schaffer, C. (1993) “Selecting a Classification Method by Cross-Validation”, Machine
Learning, v. 13, p. 135-143
Vieira, E.V.; Bellon, O. R. P., Silva, L. (2002) “Mineração de imagens”, Revista de
Informatica Teórica e Aplicada, Porto Alegre - RS, v. 9, n. 2, p. 67-96
Witten, I. H., Frank, E. (2005) “Data Mining: Practical machine learning tools and
techniques”, 2nd Edition, Morgan Kaufmann, San Francisco
Zaïane, O.R., Han, J, Li, Z. (1998) “Multimedia-miner: a system prototype for
multimedia data mining”, In: ACM SIGMOD Conference on Management Data, v.
27, n. 2, p. 581-583
Zhang, J., Hsu, W., Lee, M. L. (2001) “Image mining: issues, frameworks and
techniques”, In: Proceedings of the 2nd International Workshop on Multimedia Data
Mining, p. 13-20
40
Download