Emparelhamento e Alinhamento de Estruturas em Visão

Propaganda
Faculdade de Engenharia da Universidade do Porto
Programa Doutoral em Engenharia Biomédica
2008/2009
Disciplina: Monografia
Emparelhamento e Alinhamento de Estruturas em Visão
Computacional: Aplicações em Imagens Médicas
Francisco Paulo Marques de Oliveira
Orientador: Prof. João Manuel R. S. Tavares
Prof. Auxiliar do Departamento de Engenharia Mecânica
Faculdade de Engenharia da Universidade do Porto
Gab. M205
Tel. 225081487
Email: [email protected]
URL: http://www.fe.up.pt/~tavares
Co-orientador:
Doutor Prof. Durval C. Costa
HPP-Medicina Molecular, SA
Email: [email protected]
ii
Resumo
O tema central desta Monografia relaciona-se com o emparelhamento e alinhamento de
estruturas em imagens (2D/3D); nomeadamente, em imagens médicas, uma das áreas da
Visão Computacional com maior potencial e relevo. O principal objectivo que se pretendeu
alcançar com a sua realização foi o estudo e análise de técnicas de alinhamento de imagem
que poderão vir a ser usadas no âmbito do projecto de Doutoramento em Engenharia
Biomédica em perspectiva. Deste modo, este estudo pode ser considerado como uma
primeira introdução ao tema da Tese de Doutoramento definida.
O primeiro capítulo desta Monografia é dedicado à introdução. Atendendo que o trabalho
de Doutoramento previsto incidirá essencialmente sobre o alinhamento de imagens
médicas, os principais equipamentos de aquisição e os seus princípios básicos de
funcionamento são abordados no segundo capítulo; nomeadamente, o raio X, a tomografia
computorizada, a ressonância magnética, a imagiologia nuclear a ultra-sonografia.
No terceiro capítulo é realizado um estudo sobre algumas das metodologias
frequentemente usadas no alinhamento de imagens, dando-se especial relevo às mais
usadas no alinhamento de imagens médicas. O estudo exposto aborda as principais
fases/processos
de
alinhamento:
em
particular,
transformações
geométricas,
emparelhamento, técnicas de optimização e medidas de similaridade. As metodologias
apresentadas foram classificadas em dois grandes grupos: baseadas na geometria, isto é,
com base no emparelhamento de estruturas ou marcadores obtidos das imagens; e baseadas
na intensidade da imagem, ou seja, uma abordagem mais ligada ao sinal que representa a
distribuição da intensidade dos píxeis na imagem.
Finalmente, esta Monografia encerra com um capítulo dedicado às conclusões e proposta
de trabalho futuro no âmbito da Tese de Doutoramento prevista.
iii
Índice
1 Introdução e estrutura da Monografia .......................................................................... 1
1.1 Apresentação .......................................................................................................... 1
1.2 Estrutura da Monografia ......................................................................................... 2
2 Tecnologias/equipamentos de aquisição de imagens médicas ..................................... 4
2.1 Introdução ............................................................................................................... 4
2.2 Raio X ..................................................................................................................... 5
2.2.1 Radiografia convencional ................................................................................ 5
2.2.2 Angiografia ...................................................................................................... 6
2.2.3 Tomografia computorizada.............................................................................. 7
2.3 Ressonância magnética nuclear .............................................................................. 9
2.4 Imagiologia nuclear .............................................................................................. 13
2.5 Ultra-sonografia .................................................................................................... 15
2.6 Outros equipamentos ............................................................................................ 16
3 Alinhamento de imagens médicas .............................................................................. 18
3.1 Introdução ............................................................................................................. 18
3.2 Classificação dos algoritmos ................................................................................ 20
3.2 Metodologias baseadas na geometria ................................................................... 23
3.2.1 Alinhamento baseado na correspondência entre pontos ................................ 23
3.2.1.1 Emparelhamento ..................................................................................... 23
3.2.1.2 Determinação da transformação geométrica .......................................... 25
3.2.1.2.1 Transformação de similaridade baseada na correspondência entre
iv
ÍNDICE
_____________________________________________________________________________________
dois segmentos de recta .................................................................................. 26
3.2.1.2.2 Transformação rígida ou afim usando decomposição em valores
singulares e mínimos quadrados ..................................................................... 27
3.2.1.2.4 Transformação de similaridade no plano complexo ........................ 28
3.2.1.2.5 Método de eliminação de outliers: algoritmo RANSAC ................. 29
3.2.1.3 Transformação usando coordenadas homogéneas .................................. 30
3.2.2 Eixos principais ............................................................................................. 32
3.2.3 Aproximação pontual iterativa ...................................................................... 33
3.3 Metodologias baseadas em intensidade ................................................................ 35
3.3.1 Domínio espacial ........................................................................................... 35
3.3.1.1 Estratégias dos algoritmos de optimização............................................. 35
3.3.1.2 Medidas de similaridade ......................................................................... 41
3.3.1.2.1 Soma dos quadrados das diferenças ................................................ 42
3.3.1.2.2 Correlação cruzada .......................................................................... 43
3.3.1.2.3 Entropia conjunta............................................................................. 43
3.3.1.2.4 Informação mútua ............................................................................ 45
3.3.2 Domínio das frequências ............................................................................... 47
3.4 Conclusões ............................................................................................................ 52
4 Conclusões finais e perspectivas de trabalho futuro ................................................... 53
4.1 Conclusões ............................................................................................................ 53
4.2 Perspectivas de trabalho para a Tese de Doutoramento ....................................... 53
Referências ..................................................................................................................... 56
v
Índice de figuras
Figura 2.1: Esquema básico de obtenção de imagens de raio X (adaptado de [Jan,
2006]). .............................................................................................................................. 6
Figura 2.2: Esquema simplificado da projecção dos raios X sobre o corpo dos pacientes
nos equipamentos de tomografia computorizada de terceira geração (adaptado de [Jan,
2006]). .............................................................................................................................. 8
Figura 2.3: Esquema de funcionamento de um scanner de CT helicoidal (obtida de [Jan,
2006]). .............................................................................................................................. 9
Figura 2.4: À esquerda, uma representação do spin com momento magnético μ quando
sujeito a um campo magnético externo B0. À direita, esquema da magnetização
resultante, M. A razão entre o número de spins com orientação paralela e anti-paralela é
dada pela equação de Boltzman (adaptado de [Block, 2006]). ..................................... 10
Figura 2.5: Esquema do princípio de funcionamento de um equipamento de MRI: a
bobine principal orientada segundo um dos eixos e as outras duas bobines laterais
orientadas segundo os outros dois eixos (obtida de [Jan, 2006]). ................................. 12
Figura 2.6: Esquema simplificado da obtenção de imagens em imagiologia nuclear
convencional (adaptado de [Jan, 2006]). ........................................................................ 14
Figura 2.7: Imagem de um paciente obtida usando um equipamento de PET (obtida de
[Gonzalez, 2008]). .......................................................................................................... 15
Figura 2.8: Imagem de ultra-sonografia de um feto (obtida de [Gonzalez, 2008]). ....... 16
Figura 2.9: Esquema de um equipamento óptico de aquisição de imagens de
pedobarografia (adaptado de [Tavares, 2000]). ............................................................. 17
Figura 3.1: Na linha superior, duas imagens de pedobarografia, os respectivos
centróides e eixos principais. Na linha inferior, do lado esquerdo as duas mesmas
imagens sobrepostas antes do alinhamento e do lado direito as duas imagens após o
vi
ÍNDICE DE FIGURAS
_____________________________________________________________________________________
alinhamento usando e metodologia baseada nos eixos principais. (As cores das imagens
foram modificadas para facilitar a sua visualização.)..................................................... 34
Figura 3.2: Duas imagens e os seus histogramas conjuntos: (a) imagem de raio X do
peito; (b) a mesma imagem de raio X após uma pequena translação vertical; (d)
representação plana do histograma conjunto da imagem (a) com ela própria; (c)
representação plana do histograma conjunto da imagem (a) com a imagem (b); (e)
representação 3D do histograma conjunto das imagens (a) e (b). .................................. 45
Figura 3.3: Por linha, três sequências de imagens exemplo: Da esquerda para a direita:
imagens originais no domínio espacial, espectro das imagens no domínio das
frequências e finalmente a fase das imagens no domínio das frequências. .................... 49
Figura 3.4: Exemplo de uma imagem obtida determinando a correlação de fases
directamente. A posição do ponto mais claro indica a translação da imagem a alinhar
relativamente à imagem modelo. .................................................................................... 50
Figura 3.5: Alinhamento de duas imagens de CT da cabeça: Na linha superior, duas
imagens originais; na linha à inferior, à esquerda as duas imagens sobrepostas antes do
alinhamento e à direita as mesmas após o alinhamento. (A imagem modelo foi
representada em tons de azul e a imagem a alinhar em tons de vermelho para facilitar a
visualização.) .................................................................................................................. 51
vii
CAPÍTULO I
Introdução e estrutura da Monografia
1.1 Apresentação
Esta Monografia relaciona-se essencialmente com o emparelhamento e alinhamento de
estruturas em imagens (2D/3D); nomeadamente, em imagens médicas, uma das áreas da
Visão Computacional com maior potencial e relevo.
Na literatura, por vezes os termos matching e registration são usados como sinónimos
quando aplicados a imagens. Neste trabalho, considera-se emparelhamento (matching)
como sendo o processo de estabelecimento de correspondências. Por alinhamento
(registration), considera-se o processo de transformação do sistema de coordenadas de
uma imagem de modo que estruturas homólogas passem a ter as mesmas coordenadas
relativamente ao sistema de coordenadas considerado. Com base num alinhamento que
se tenha definido, as correspondências entre as diversas estruturas representadas nas
imagens alinhadas fica automaticamente estabelecida, quer estas estruturas tenham sido
identificadas ou não. No entanto, o estabelecimento de correspondências entre estruturas
representadas em duas imagens não define automaticamente a correspondência entre os
píxeis. Além disso, as correspondências entre píxeis dependem do tipo de transformação
geométrica considerada.
Na área médica, o emparelhamento e alinhamento de imagens têm diversas aplicações,
nomeadamente, fusão de informação obtida de diferentes modalidades; monitorização
do tamanho, forma e variação ao longo do tempo de órgãos; preparação de intervenções
cirúrgicas; comparação com uma base de dados; estabelecimento de correspondências
1
CAPÍTULO I − INTRODUÇÃO E ESTRUTURA DA MONOGRAFIA
_____________________________________________________________________________________
com modelos virtuais; etc., [Hajnal, 2001].
Há vários critérios de classificação dos métodos de alinhamento de imagem médica, por
exemplo, em [Maintz, 1998] são usados nove critérios distintos. Uma classificação
comum é: baseados em características geométricas ou físicas das estruturas a alinhar
(como pontos, contornos, curvas ou superfícies) e baseados em intensidade ou sinal
(usualmente associados à utilização de uma medida de similaridade com base na
comparação da intensidade dos píxeis correspondentes), [Hajnal, 2001].
Os métodos baseados em características geométricas ou físicas precisam de determinar
essas características nas imagens a alinhar e depois realizar o emparelhamento entre as
mesmas, o que permitirá posteriormente estimar a transformação geométrica pretendida.
Os métodos baseados em intensidade usualmente determinam a transformação
envolvida directamente a partir das imagens, ou seja, aplicam transformações
geométricas a uma das imagens no sentido de optimizar uma medida de similaridade,
[Hajnal, 2001], [McLaughlin, 2005].
Além do estudo e análise de metodologias de alinhamento de imagens, nesta
Monografia é também realizada uma breve apresentação de algumas das principais
técnicas de imagiologia.
1.2 Estrutura da Monografia
Os objectivos desta Monografia são essencialmente: introduzir o tema definido para a
Tese de Doutoramento prevista e apresentar algumas possíveis linhas de trabalho e
serem seguidas tendo em vista a consecução dos objectivos delineados para a mesma.
O trabalho aqui apresentado pode ser resumido em dois temas principais: estudo das
principais técnicas existentes para a recolha de imagem médica e estudo de
metodologias de emparelhamento e alinhamento de imagens médicas. Assim, esta
Monografia, além deste capítulo, está dividida em mais três capítulos:
Capítulo 2 − Tecnologias/equipamentos de aquisição de imagens médicas
Neste capítulo é feita uma breve referência às principais técnicas de imagiologia usadas
na actualidade. É dada uma breve explicação dos seus fundamentos e processos de
construção das imagens, não sendo abordadas questões técnicas. Sempre que pertinente,
é realizada uma comparação entre as técnicas de aquisição de imagem referidas.
2
CAPÍTULO I − INTRODUÇÃO E ESTRUTURA DA MONOGRAFIA
_____________________________________________________________________________________
Capítulo 3 − Alinhamento de imagens médicas
Neste capítulo é realizado um estudo sobre algumas metodologias de emparelhamento e
alinhamento de imagens médicas. São também apresentados alguns exemplos de
alinhamento
usando
metodologias
que
entretanto
foram
desenvolvidas
ou
implementadas. A ênfase não foi colocada num estudo exaustivo das técnicas e
trabalhos realizados neste domínio, mas sim nas ideias base de algumas das
metodologias mais comuns.
Capítulo 4 − Conclusões finais e perspectivas de trabalho futuro
Neste capítulo são analisados os resultados do trabalho desenvolvido. É também
definida a estratégia a seguir para a elaboração da Tese de Doutoramento, assim como
os objectivos que se desejam alcançar com a mesma.
3
CAPÍTULO II
Tecnologias/equipamentos de aquisição de imagens
médicas
Neste capítulo é feita uma breve referência às principais técnicas de imagiologia usadas
na actualidade. É dada uma breve explicação dos seus fundamentos e processos de
construção das imagens adquiridas, não sendo abordadas questões técnicas. Sempre que
pertinente, é realizada uma comparação entre as mesmas.
2.1 Introdução
A imagiologia médica, conjunto de técnicas e sistemas de obtenção de imagens
médicas, é actualmente indispensável no diagnóstico de inúmeras doenças (esclerose
múltipla, Alzheimer, fracturas, cancros, aneurismas, etc.). Usualmente, na imagiologia
médica consideram-se apenas as técnicas não invasivas, como por exemplo, o raio X, a
tomografia computorizada, a ressonância magnética, a ultra-sonografia e a medicina
nuclear, [Prince, 2006].
As técnicas de imagiologia podem ser divididas em anatómicas ou funcionais. As
anatómicas são aquelas que essencialmente descrevem a morfologia, como por exemplo
o raio X. As técnicas de imagiologia funcionais descrevem essencialmente informação
do metabolismo, como por exemplo a medicina nuclear, [Maintz, 1998]. Alguns
equipamentos actuais combinam os dois tipos de imagiologia, como é o caso dos
scanners PET/CT (positron emission tomography / computed tomography).
4
CAPÍTULO II − TECNOLOGIAS/EQUIPAMENTOS DE AQUISIÇÃO DE IMAGENS MÉDICAS
_____________________________________________________________________________________
2.2 Raio X
A imagem obtida recorrendo ao raio X é considerada a primeira modalidade de imagem
médica. A sua descoberta remonta à última década do século XIX, quando Roentgen
fazia experiência no seu laboratório com tubos de raios catódicos, [Jan, 2006], [Prince,
2006]. O seu funcionamento é facilmente compreensível e o método de obtenção das
imagens é directo; isto é, não é necessário usar tecnologias de construção da imagem
como em outras modalidades de imagiologia que serão referidas mais à frente.
O raio X é uma onda electromagnética de natureza semelhante à da luz visível com
comprimentos de onda menores do que os da radiação ultravioleta, na ordem de 5 pm a
1 nm. As ondas electromagnéticas do espectro do raio X, conforme o seu comprimento
de onda, têm a particularidade de penetrarem mais ou menos facilmente a matéria e, por
consequência, os tecidos. Deste modo, alguns tecidos são mais transparentes para essas
radiações do que outros. Como o raio X não está dentro do espectro do visível, é
necessário usar um material sensível ao mesmo para se poder observar a imagem.
2.2.1 Radiografia convencional
A radiografia convencional é aquela que resulta directamente da aplicação do raio X
sobre a região cujo interior se pretende visualizar, sendo a imagem captada directamente
por uma película fotossensível, ou filme radiográfico, o qual, após ser revelado, dá
origem à imagem. A figura 2.1 dá uma ideia do princípio básico de funcionamento desta
técnica.
Em equipamentos mais modernos, em vez de uma película fotográfica é usada uma
tecnologia semelhante à das máquinas de fotográficas digitais (foto-sensores
electrónicos). Deste modo, a imagem é directamente convertida para o formato digital,
facilitando assim o seu tratamento e manipulação.
Nas imagens de raio X, os diversos órgãos ou tecidos ficam representados sobrepostos,
não sendo possível separá-los. No entanto, o conhecimento anatómico da estrutura sobre
a qual incidem os raios X ajuda os médicos e radiologistas a fazerem essa separação
mentalmente.
5
CAPÍTULO II − TECNOLOGIAS/EQUIPAMENTOS DE AQUISIÇÃO DE IMAGENS MÉDICAS
_____________________________________________________________________________________
Figura 2.1: Esquema básico de obtenção de imagens de raio X (adaptado de [Jan, 2006]).
Nos equipamentos convencionais de raio X, a imagem obtida sofre uma distorção
geométrica, pois o ângulo de incidência dos raios X não é igual em toda a película ou
placa sensora. Nos equipamentos analógicos a imagem não pode ser corrigida, mas nos
equipamentos digitais tal operação pode ser facilmente efectuada, desde que conhecidos
alguns parâmetros.
2.2.2 Angiografia
A angiografia é uma tecnologia baseada nos raios X. A principal diferença consiste na
injecção de produtos no paciente que façam aumentar o contraste das imagens.
Usualmente, estes produtos são conhecidos simplesmente por contrastes.
Esta técnica é usada para obter imagens de vasos sanguíneos. Sem a aplicação do
contraste, as diferenças entre os tons de cinzento dos vasos sanguíneos e os restantes
tecidos registados nas imagens são muito ténues. Ao injectar o contraste nos vasos
sanguíneos que se pretendem visualizar, o contraste vai absorver mais radiação do que o
sangue sem aditivos, pelo que na imagem obtida surge uma maior diferenciação entre os
respectivos vasos sanguíneos e os restantes tecidos.
Para melhor analisar as imagens obtidas, pode ser realizada uma subtracção entre a
imagem obtida com o contraste e a imagem da mesma região sem o contraste. Assim
6
CAPÍTULO II − TECNOLOGIAS/EQUIPAMENTOS DE AQUISIÇÃO DE IMAGENS MÉDICAS
_____________________________________________________________________________________
obtém-se uma imagem só com a diferença das duas, ou seja, os vasos sanguíneos. Esta
técnica é chamada de angiografia subtractiva [Jan, 2006].
Naturalmente, para que a operação de subtracção possa ser realizada, é necessário que
ambas as imagens estejam alinhadas, o que pode ser conseguido mais ou menos
facilmente se o paciente ficar imóvel. Caso haja movimento do paciente, as imagens
têm de ser previamente alinhadas por um qualquer processo, manual, automático ou
semi-automático. O alinhamento puramente manual pode não permitir a obtenção de
bons resultados, basta pensar na possibilidade de rotação do paciente. Assim, os
sistemas automáticos ou semi-automáticos podem ser muito úteis para melhorar os
resultados desta técnica.
2.2.3 Tomografia computorizada
A tomografia computorizada de raios X foi a primeira modalidade tomográfica
inteiramente baseada na reconstrução digital da imagem. O seu aparecimento veio
modificar significativamente a imagiologia médica, [Jan, 2006]. É amplamente usada,
pois apresenta boa resolução espacial e o processo de aquisição é rápido. Além disso, é
muito versátil, adaptando-se à generalidade das situações. A sua principal desvantagem
advém da utilização de radiação ionizante (raios X), a qual pode contribuir para um
posterior aparecimento de lesões ou tumores nos pacientes.
A Figura 2.2 apresenta o princípio de funcionamento dos equipamentos de tomografia
de terceira geração, os actualmente mais utilizados, [Jan, 2006]. O foco dos raios X e os
sensores rodam simultaneamente em função do ângulo θ. Deste modo, a distância entre
o foco e os detectores é mantida e os raios incidem sempre perpendicularmente nos
detectores. Para impedir que radiação dispersa possa incidir nos detectores, usam-se os
collimators. Estes funcionam como filtros pois só permitem que os detectores sejam
atingidos por radiação que lhes é perpendicular. Assim, consegue-se uma diminuição
significativa do ruído da imagem. Usualmente, a fila de detectores é constituída por
várias centenas ou milhares de detectores, [Jan, 2006].
O ângulo de abertura do foco tem que ser tal que permita que o feixe “varra” a região
com a forma de uma fatia −slice− do corpo do paciente que se pretende observar. A
rotação do equipamento em torno do paciente vai permitir a obtenção de um conjunto de
dados diferentes da mesma slice em função do ângulo θ. Assim, combinando esta
7
CAPÍTULO II − TECNOLOGIAS/EQUIPAMENTOS DE AQUISIÇÃO DE IMAGENS MÉDICAS
_____________________________________________________________________________________
informação com o ângulo correspondente, é possível reconstruir uma slice na totalidade.
Para a obtenção de uma imagem tridimensional, é provocado um deslocamento do
corpo em relação ao sistema foco-detectores. Deste modo, obtém-se uma série de slices
espaçadas umas das outras segundo o valor pretendido. Usando um algoritmo
computacional adequado, as slices são colocadas nas respectivas posições e
renderizadas segundo um modelo 3D.
Figura 2.2: Esquema simplificado da projecção dos raios X sobre o corpo dos pacientes nos equipamentos
de tomografia computorizada de terceira geração (adaptado de [Jan, 2006]).
Nos scanners helicoidais, em vez de se obter uma slice de cada vez, o processo de
aquisição é contínuo. O foco emissor de raios X e os receptores estão continuamente em
rotação em torno do paciente enquanto que este se desloca continuamente ao longo do
eixo de rotação. Deste modo, o movimento relativo do sistema foco-detectores em
relação ao paciente é helicoidal. Como resultado, a imagem 3D obtida tem essa forma,
ao contrário dos outros sistemas em que a imagem 3D era definida por uma série de
slices paralelas. Para obter slices paralelas e perpendiculares ao corpo do paciente, pode
ser usada interpolação, [Jan, 2006]. A Figura 2.3 ilustra o funcionamento deste tipo de
scanner.
8
CAPÍTULO II − TECNOLOGIAS/EQUIPAMENTOS DE AQUISIÇÃO DE IMAGENS MÉDICAS
_____________________________________________________________________________________
Figura 2.3: Esquema de funcionamento de um scanner de CT helicoidal (obtida de [Jan, 2006]).
2.3 Ressonância magnética nuclear
As imagens de ressonância magnética nuclear (NMR) resultam do fenómeno de
ressonância magnética nuclear descoberto na década de 40 do século passado, [Jan,
2006], [Block, 2006]. De um modo simplificado, este fenómeno consiste na troca de
energia entre partículas quando sujeitas a um campo magnético forte e uma irradiação
por ondas, geralmente de radiofrequência (RF). Este fenómeno permite a identificação
de alguns constituintes da matéria em análise e a sua localização, [Jan, 2006], [Block,
2006]. A designação de ressonância magnética nuclear (NMR) foi posteriormente
substituída por imagiologia de ressonância magnética (MRI) para evitar a associação
que o público em geral fazia com a radiação ionizante, [Block, 2006].
Nesta secção, apresentam-se os princípios básicos deste fenómeno que são considerados
na imagiologia médica.
Os núcleos dos átomos, além da sua carga positiva, têm também uma propriedade
conhecida por spin, por analogia com a física clássica, [Block, 2006]. Para facilitar a
compreensão desta propriedade, é comum interpretar-se a mesma como o movimento de
rotação da partícula sobre ela mesma. Esta carga eléctrica em movimento cria um
campo magnético. Este campo magnético vai ter um sentido, pelo que pode ser
entendido como um dipolo.
Na ausência de um campo magnético externo a orientação do spin é aleatória. Mas
quando os núcleos com spin diferente de zero estão sujeitos a um campo magnético
externo, estes tendem a alinhar-se na direcção desse campo. Podendo alinhar-se de
9
CAPÍTULO II − TECNOLOGIAS/EQUIPAMENTOS DE AQUISIÇÃO DE IMAGENS MÉDICAS
_____________________________________________________________________________________
modo anti-paralelo, o que corresponde a um nível de energia mais alto, ou de modo
paralelo, o que corresponde a um nível de energia mais baixo. A razão entre o número
de núcleos que ficam orientados de modo paralelo ao campo magnético externo e os
núcleos que ficam orientados de modo anti-paralelo com o campo magnético externo
pode ser dado pela equação de probabilidade de Boltzman, [Jan, 2006],[Block, 2006].
Em MRI é possível usar qualquer núcleo com spin diferente de zero, o que possibilita
fazer espectroscopia com base no fenómeno de ressonância magnética, mas por
questões de abundância e distribuição em todo o corpo, em geral usa-se o hidrogénio.
Os núcleos dos átomos de hidrogénio, constituídos por um só protão, têm spin diferente
de zero, portanto têm tendência a alinhar-se pelo campo magnético externo. O conjunto
dos núcleos de hidrogénio que se alinha paralelamente ao campo magnético externo, B0,
por corresponder a uma energia mais baixa, é ligeiramente maior do que o conjunto dos
que se alinham anti-paralelamente, obtendo-se assim uma magnetização resultante, M,
diferente de zero e alinhada com o campo magnético externo, [Block, 2006]. A Figura
2.4 é uma representação simbólica da orientação dos núcleos de hidrogénio quando
sujeitos a um campo magnético externo.
Figura 2.4: À esquerda, uma representação do spin com momento magnético μ quando sujeito a um
campo magnético externo B0. À direita, esquema da magnetização resultante, M. A razão entre o
número de spins com orientação paralela e anti-paralela é dada pela equação
de Boltzman (adaptado de [Block, 2006]).
Assim, quando um ser humano é sujeito a um campo magnético forte, os núcleos dos
átomos de hidrogénio tendem a ficar alinhados pelo campo magnético. A magnetização
10
CAPÍTULO II − TECNOLOGIAS/EQUIPAMENTOS DE AQUISIÇÃO DE IMAGENS MÉDICAS
_____________________________________________________________________________________
resultante é proporcional ao número de protões existentes.
Ao sujeitar o corpo a uma radiação electromagnética, podem acontecer duas situações,
em função da frequência da radiação e da constituição dos núcleos da matéria: o corpo
não absorve radiação ou absorve radiação. Um factor que condiciona a frequência da
radiação que é absorvida pelos núcleos dos átomos é a intensidade do campo magnético
a que estão sujeitos. Esta relação é dada pela equação de Larmor:
ω =γ B,
onde ω representa a frequência de Larmor, γ é a constante giromagnética que depende
do tipo de núcleo e B é a magnitude do campo magnético.
Assim, se um impulso electromagnético com a frequência de Larmor for aplicado aos
núcleos, eles tendem a alterar o seu alinhamento, colocando-se em fase com a onda
electromagnética. Quando tentam regressar ao estado de energia mais baixo, isto é,
alinhados paralelamente com o campo magnético externo, libertam energia na
frequência de Larmor.
Assim, ao sujeitar o corpo a impulsos de 90º (ou outros) de uma onda electromagnética
na frequência de Larmor, alguns núcleos absorvem essa energia pelo que mudam a
direcção de rotação criando uma componente perpendicular, sendo esta medida por
bobines transversais. Logo que o campo electromagnético é desligado verifica-se um
decaimento do campo magnético transversal à medida que os núcleos tendem a libertar
a energia absorvida na forma de radiação. Assim, após algum tempo, os núcleos voltam
a estar alinhados pelo campo magnético externo. Situação análoga acontece com a
aplicação de impulsos de 180º, que tem o efeito de inverter a direcção da magnetização
resultante.
Atendendo que a magnetização resultante é proporcional ao número de átomos de
hidrogénio presentes, é possível fazer a discriminação entre vários tipos de tecido. Outro
facto importante é que embora alguns tecidos doentes, por exemplo devido a tumores, e
tecidos sãos tenham idêntica composição em termos de quantidade de núcleos de
hidrogénio, e portanto idêntica magnetização resultante, estes tipos de tecidos têm
tempos de decaimento diferentes, isto é, diferentes velocidades de regresso ao estado de
equilíbrio. Assim, ajustando o scanner e medindo as velocidades de decaimento para os
diversos impulsos de RF é possível diferenciar esses tecidos, [Block, 2006].
11
CAPÍTULO II − TECNOLOGIAS/EQUIPAMENTOS DE AQUISIÇÃO DE IMAGENS MÉDICAS
_____________________________________________________________________________________
Existem vários métodos para obter a localização espacial dos tecidos e assim permitir a
criação de uma imagem. Nos equipamentos de MRI mais comuns, para seleccionar uma
dada região, slice, ao mesmo tempo que é aplicado o impulso de RF, são ligadas
bobines que são percorridas por corrente em sentido contrário à que origina o campo
magnético base, [Jan, 2006]. Assim, a soma do campo magnético base com os campos
magnéticos criados por estas bobines originam uma variação (gradiente) da intensidade
do campo magnético resultante ao longo do corpo do paciente. A pequena variação
conseguida na intensidade do campo magnético ao longo do corpo vai permitir que as
diferentes regiões do corpo respondam de forma diferente aos impulsos de RF emitidos,
pois como já referido, a frequência de Larmor depende da intensidade do campo
magnético. Deste modo, através da frequência do sinal excitar apenas as regiões do
corpo que se pretende.
Provocando um gradiente no campo magnético ao longo das três direcções, x-y-z, é
possível obter slices perpendiculares a qualquer um dos eixos. Este processo permite
obter uma a uma a resposta individual de cada pequena região. Geralmente, este método
não é usado por ser muito moroso. Na Figura 2.5 está ilustrado um esquema de um
equipamento de MRI, no que diz respeito à colocação das bobines responsáveis pelo
processo de controlo do campo magnético.
Figura 2.5: Esquema do princípio de funcionamento de um equipamento de MRI: a bobine principal
orientada segundo um dos eixos e as outras duas bobines laterais orientadas segundo
os outros dois eixos (obtida de [Jan, 2006]).
12
CAPÍTULO II − TECNOLOGIAS/EQUIPAMENTOS DE AQUISIÇÃO DE IMAGENS MÉDICAS
_____________________________________________________________________________________
Nos equipamentos de MRI actuais a imagem pode ser obtida slice a slice (2D) ou de
uma só vez (3D), [Prince, 2006]. Com base na frequência de Larmor e usando a
transformada de Fourier, é possível determinar localização individual de cada píxel
através da frequência e da fase dos coeficientes de Fourier, [Block, 2006].
Uma característica importante dos equipamentos de MRI é o facto de usarem apenas
campos magnéticos e ondas electromagnéticas na gama da frequência de Larmor (ondas
de RF), sendo estas ondas não ionizantes. Deste modo, estes equipamentos são inócuos
para o paciente. No entanto, podem causar danos ou provocar o mau funcionamento de
equipamentos electrónicos, pelo que pacientes com pace-makers, por exemplo, não
devem recorrer a este tipo de equipamento.
2.4 Imagiologia nuclear
A imagiologia nuclear distingue-se das outras modalidades de imagiologia pelo facto de
as imagens só poderem ser obtidas quando substâncias radioactivas apropriadas são
administradas no corpo do paciente. Estas substâncias, que podem ser injectadas,
ingeridas ou inaladas, são marcadores, tracers, e são compostas por radio-nuclídeos que
emitem raios gama. A radiação emitida é então utilizada para a obtenção das imagens
do corpo do paciente.
Este processo começa com a administração ao paciente de substâncias radioactivas com
curtos tempos de meia-vida. À medida que estas substâncias atingem a região que se
pretende analisar e se alojam nela, vão libertando energia devido ao decaimento
radioactivo. Os fotões de alta energia libertados devido ao decaimento radioactivo das
substâncias administradas, como os raios gama, são capazes de atravessar os tecidos.
Assim, usando equipamento adequado colocado no exterior do corpo do paciente, esta
radiação é captada.
Este processo permite a obtenção de dados em função do tempo. Deste modo, obtém-se
informação da distribuição temporal das substâncias administradas e dos órgãos onde
elas circulam ou se depositam.
Os raios gama têm uma energia equivalente à dos raios X. Contudo, como nos
equipamentos de imagiologia de raios gama a radioactividade das substâncias usadas é
muito baixa, a intensidade dos raios gama produzidos é muito inferior à intensidade dos
raios X utilizados nos equipamentos de radiologia convencional.
13
CAPÍTULO II − TECNOLOGIAS/EQUIPAMENTOS DE AQUISIÇÃO DE IMAGENS MÉDICAS
_____________________________________________________________________________________
Nos equipamentos de raio X convencionais, o fluxo de fotões é contínuo, direccionado e
de elevada intensidade, enquanto na imagiologia de raios gama a emissão de fotões é
discreta e de baixa intensidade. Além disso, os fotões são emitidos em qualquer
direcção, o que provoca uma grande dispersão dos mesmos. Estes factos contribuem
para que a qualidade das imagens na imagiologia nuclear seja inferior à da radiografia
convencional. No entanto, como a radiação ionizante a que o paciente é submetido na
imagiologia nuclear é muito menor do que na radiografia convencional, as
consequências negativas da exposição à radiação são portanto muito menores. A Figura
2.6 apresenta um esquema simplificado do processo de obtenção de imagens médicas
em imagiologia nuclear convencional.
Tal como através da projecção de raios X se criou a tomografia computorizada de raios
X, também baseada nesta técnica de emissão de raios gama se desenvolveu tomografia
computorizada de raios gama. Há dois tipos de tomografia baseados na emissão de raios
gama: tomografia computorizada baseada apenas na emissão de fotões −single-photon
emission computed tomography− (SPECT) e a tomografia de emissão de positrões
−positron emission tomography− (PET).
Figura 2.6: Esquema simplificado da obtenção de imagens em imagiologia nuclear convencional
(adaptado de [Jan, 2006]).
O princípio da SPECT é idêntico ao da CT de raios X, residindo a diferença
essencialmente na fonte da radiação. O princípio da PET é diferente, pois as substâncias
radioactivas administradas ao paciente ao decaírem radioactivamente provocam, entre
outros elementos radioactivos, a emissão de positrões com uma certa energia cinética.
14
CAPÍTULO II − TECNOLOGIAS/EQUIPAMENTOS DE AQUISIÇÃO DE IMAGENS MÉDICAS
_____________________________________________________________________________________
Este positrão ao embater com a matéria circundante é rapidamente anulado por um
electrão próximo. Este processo origina a emissão de dois raios gama em sentidos
opostos. O scanner do equipamento PET, em forma de anel, procura por detecções
temporalmente coincidentes de raios gama em detectores opostos. Assim, quando tal
acontecer, é possível determinar a linha que passa pela região onde a anulação do
positrão pelo electrão ocorreu, [Pince, 2006], [Jan, 2006]. Combinando estes dados, é
possível construir uma imagem da região onde estão as substâncias radioactivas que
foram administradas. A Figura 2.7 é um exemplo de uma imagem obtida usando um
equipamento PET.
Figura 2.7: Imagem de um paciente obtida usando um equipamento
de PET (obtida de [Gonzalez, 2008]).
2.5 Ultra-sonografia
O princípio da ultra-sonografia baseia-se na emissão de impulsos sonoros (ondas
mecânicas) à superfície da região do corpo que se pretende estudar e consequente
medição do respectivo eco por um transdutor. O tempo que passa entre a emissão da
onda e a recepção do eco permite determinar a profundidade do tecido reflector e a
intensidade dá informação acerca da força do tecido reflector. Movendo rapidamente o
transdutor ou fazendo um varrimento do mesmo pode-se construir uma imagem em
tempo real da região em estudo.
Alguns dos equipamentos de ultra-sonografia usam o efeito de Doppler para medir a
15
CAPÍTULO II − TECNOLOGIAS/EQUIPAMENTOS DE AQUISIÇÃO DE IMAGENS MÉDICAS
_____________________________________________________________________________________
velocidade de movimento, por exemplo do sangue e do movimento do coração. O efeito
Doppler caracteriza-se pela diferença entre a frequência do sinal reflectido em relação à
frequência do sinal emitido. Este facto verifica-se quando o sinal é reflectido por
objectos que estão em movimento relativamente à fonte emissora/receptora.
Os equipamentos de ultra-sonografia usados para obtenção de imagens médicas são
relativamente de baixo custo e totalmente inofensivos nas suas aplicações típicas,
[Prince, 2006]; no entanto, a qualidade das imagens é inferior às obtidas em tomografia
computorizada ou ressonância magnética. A Figura 2.8 é um exemplo de uma imagem
de ultra-sonografia numa das suas aplicações mais comuns, a visualização de um feto no
útero materno.
Figura 2.8: Imagem de ultra-sonografia de um feto (obtida de [Gonzalez, 2008]).
2.6 Outros equipamentos
Embora usualmente não incluídos no grupo dos equipamentos de imagiologia, há outros
equipamentos com relevância para a aquisição de imagens com finalidades médicas.
Como exemplos, pode-se referir a microscopia electrónica −electron microscopy−, as
câmaras de infravermelhos e sensores de pressão.
A microscopia óptica atinge o seu limite de resolução espacial para valores na ordem da
fracção do micro milímetro devido ao comprimento de onda da luz visível. Assim, a
16
CAPÍTULO II − TECNOLOGIAS/EQUIPAMENTOS DE AQUISIÇÃO DE IMAGENS MÉDICAS
_____________________________________________________________________________________
microscopia electrónica é uma extensão da microscopia óptica para permitir a
visualização de estruturas muito pequenas, podendo ir até valores inferiores ao nano
metro. A microscopia electrónica baseia-se na emissão de um feixe de electrões e na sua
interacção com a matéria que se pretende visualizar.
As câmaras de infravermelhos baseiam-se na detecção das ondas electromagnéticas do
espectro do infravermelho que os corpos emitem. As imagens obtidas podem ser muito
importantes pois permitem uma análise à distância da distribuição da temperatura no
corpo do paciente. Deste modo, facilitam o diagnóstico de doenças e a detecção de
regiões anómalas/doentes.
Os sensores de pressão medem a força exercida por unidade de área e são
frequentemente usados em pedobarografia. O paciente ao caminhar sobre um tapete
onde estão incorporados sensores de pressão vai permitir a leitura de um conjunto de
dados sobre a distribuição do seu peso ao longo do pé e a forma como coloca o mesmo.
Usualmente, esta informação é convertida numa imagem sendo depois analisada pelos
especialistas. Os dados obtidos podem depois ser um auxílio no diagnóstico do pé de
diabético, na análise de postura, na análise de marcha e na elaboração de calçado com
fins terapêuticos.
Também há equipamentos sensores de pressão ópticos. Um sistema básico consiste
numa placa de vidro ou acrílico polida de forma que a luz que lhe é aplicada seja
reflectida internamente. A placa é coberta por uma ou duas camadas finas de plástico
poroso nas regiões onde a pressão é exercida (Figura 2.9). O sistema, quando observado
de baixo, na ausência de pressão é negro, mas quando é exercida pressão na parte de
cima da camada de plástico, este adquire brilho nas áreas correspondentes, [Tavares,
2000].
Figura 2.9: Esquema de um equipamento óptico de aquisição de imagens de pedobarografia
(adaptado de [Tavares, 2000]).
17
CAPÍTULO III
Alinhamento de imagens médicas
Neste capítulo é realizado um estudo sobre algumas das metodologias frequentemente
usadas no alinhamento de imagem, especialmente as de origem médica. Embora sejam
apresentados diversos critérios de classificação dos algoritmos de alinhamento, neste
capítulo, a divisão é realizada em metodologias baseadas essencialmente na localização
de características geométricas e metodologia baseadas essencialmente na intensidade.
São apresentadas várias metodologias de cada tipo, abordados os princípios básicos das
mesmas. As transformações geométricas permitidas no alinhamento e as medidas de
similaridade utilizadas são também abordadas.
3.1 Introdução
Alinhamento de imagens (normalmente referido como registration) é o processo de
determinar a transformação geométrica que melhor sobrepõe duas imagens que têm uma
região comum. Por outras palavras, é um processo de transformação do sistema de
coordenadas de pelo menos uma das imagens de modo que estruturas homólogas das
imagens a alinhar passem a ter as mesmas coordenadas relativamente ao sistema de
coordenadas considerado. Deste modo, a correspondência entre os píxeis ou vóxeis
(para imagens 3D) de uma imagem modelo ou referência ficam indexados aos píxeis da
imagem que se pretende alinhar. Assim, o alinhamento é muitas vezes necessário para
integrar informação obtida de diferentes equipamentos; detectar variações em imagens
obtidas em diferentes intervalos de tempo ou sob diferentes condições; inferir
18
CAPÍTULO III − ALINHAMENTO DE IMAGENS MÉDICAS
_____________________________________________________________________________________
informação de imagens 2D ou 3D em que a câmara ou o objecto se moveram; comparar
as imagens com uma base de dados; reconhecimento automático de estruturas; etc. Em
[Brown, 1992] e [Zitová, 2003] são apresentados dois dos primeiros estudos exaustivos
sobre as técnicas de alinhamento de imagem.
No alinhamento de imagens médicas, as imagens a alinhar são obtidas de pacientes
através de equipamentos de imagiologia como o raio X, a tomografia computorizada
(CT), a imagiologia de ressonância magnética (MRI), a tomografia de emissão de
positrões (PET), a ultra-sonografia (US), etc. Este processo de alinhamento de imagens
médicas apresenta vários desafios devido às diferentes realidades físicas dos
equipamento utilizados, diferenças de posicionamento dos pacientes, variação dos
parâmetros de aquisição, alterações sofridas pelas estruturas a analisar devido a doenças
ou variações naturais ao longo do tempo, ou ainda devido a diferenças anatómicas entre
diferentes indivíduos. Nos últimos anos a publicação de trabalhos relacionados com o
alinhamento de imagem médica tem crescido de forma considerável, ocupando agora
uma grande parte da investigação realizada em processamento e análise de imagem
médica, como mostra o estudo apresentado em [Pluim, 2003a].
Conforme os equipamentos de imagiologia, as imagens obtidas podem ser 2D ou 3D (as
imagens 3D são frequentemente referidas como volumes) o que levou ao
desenvolvimento de técnicas de alinhamento específicas para cada tipo de imagem. O
alinhamento de imagens é uma componente importante num largo número de
aplicações, tais como, [Hajnal, 2001]:
− Auxílio ao diagnóstico de patologias (por exemplo, comparando a imagens obtidas
com as de base de dados, comparando imagens obtidas em diferentes instantes de
tempo);
− Integração de informação de diferentes modalidades (por exemplo, relacionando
informação funcional obtida de um scanner PET com imagens de alta resolução obtidas
com CT ou MRI);
− Monitorização de alterações de tamanho, forma ou constituição de tecidos/órgãos ao
longo do tempo;
− Preparação de intervenções cirúrgicas e procedimentos radio-terapêuticos (por
exemplo, determinando a localização de um tumor que poderá posteriormente ser
19
CAPÍTULO III − ALINHAMENTO DE IMAGENS MÉDICAS
_____________________________________________________________________________________
eliminado com terapêutica adequada);
− Relacionar as imagens de pré-operatório com os planos da cirurgia, realidade física do
paciente, estruturas anatómicas, posição dos instrumentos cirúrgicos e a sala de
operações durante uma cirurgia guiada por computador, [Livyatan, 2003].
Na secção seguinte é feita uma classificação das técnicas de alinhamento de imagem
médica. Nas secções 3.3 e 3.4 são apresentadas algumas metodologias de alinhamento
baseadas em características geométricas e na intensidade dos píxeis, respectivamente. O
objectivo principal destas duas secções não é fazer um estudo exaustivo das técnicas de
alinhamento existentes, mas sim apresentar algumas metodologias comuns, explicar
como funcionam e apresentar algumas vantagens e desvantagens das mesmas.
3.2 Classificação dos algoritmos
Na literatura, uma grande variedade de metodologias de alinhamento de imagens
médicas tem sido apresentada. Podem ser utilizados diversos critérios para classificar
essas metodologias, dependendo das características consideradas. Seguindo a
classificação feita em [Elsen, 1993], as técnicas de alinhamento podem ser divididas
pela dimensionalidade (1D, 2D, 3D), origem das propriedades da imagem (marcadores
intrínsecos ou extrínsecos ao paciente), domínio da transformação geométrica (local ou
global); elasticidade da transformação geométrica (rígida, projectiva, curvada, etc.);
rigidez do emparelhamento (interpolação ou aproximação); determinação dos
parâmetros (directo ou baseado em procura orientada) e interacção (interactivos, semiautomáticos ou automáticos).
Em [Maintz, 1998] a classificação realizada em [Elsen, 1993] foi consideravelmente
estendida e detalhada. Maintz usou nove critérios básicos sendo que cada um deles foi
ainda subdividido em um ou mais níveis. Os nove critérios considerados são:
dimensionalidade, base do alinhamento, natureza da transformação, domínio da
transformação, interacção, procedimento de optimização, modalidades envolvidas,
sujeitos, e objectos. Na Tabela 1 é apresentada informação mais pormenorizada sobre
estes critérios.
Uma transformação do sistema de coordenadas de uma imagem diz-se projectiva
quando transforma rectas em rectas e curvada ou elástica quando transforma rectas em
20
CAPÍTULO III − ALINHAMENTO DE IMAGENS MÉDICAS
_____________________________________________________________________________________
curvas ou vice-versa. As transformações projectivas que transformam rectas paralelas
em rectas paralelas dizem-se afim, as que preservam os ângulos e a proporcionalidade
entre as dimensões dos objectos dizem-se de semelhança ou de similaridade e
finalmente aquelas que preservam os ângulos e dimensões dos objectos dizem-se
rígidas.
Tabela 3.1: Critérios de classificação para o alinhamento de imagens médicas baseados
nos apresentados em [Maintz, 1998].
Critério de
classificação
Dimensionalidade
Base do
alinhamento
Natureza da
transformação
Domínio da
transformação
Subdivisão
Dimensão espacial: 2D/2D, 2D/3D, 3D/3D
Séries temporais de dimensão espacial: 2D/2D, 2D/3D, 3D/3D
Stereotactic frame (muito usada
Extrínseca
em neurocirurgia)
(baseia-se Invasiva
Marcas fiduciais (parafusos)
em
objectos
Modelos, molduras, dentes
colocados
adaptadores, etc.
Não-invasiva
no
Marcas fiduciais (marcas na
paciente)
pele)
Baseada em pontos Anatómicos
de referência
Geométricos
Modelos rígidos (pontos,
Baseada em
curvas, superfícies)
segmentação
Intrínseca
Modelos deformáveis
Redução para escalares ou
Baseada em
vectores
propriedades dos
Usando todo o conteúdo da
píxeis ou vóxeis
imagem
Não baseada nas imagens adquiridas (calibração dos sistemas de
aquisição)
Rígida (rotação e translação)
Similaridade Não-rígida (rotação,
Afim
translação e escalamento)
Projectiva
Não-similaridade
Não-afim
Curvada
Local (diferentes transformações para diferentes regiões da
imagem)
Global (a mesma transformação em toda a imagem)
21
CAPÍTULO III − ALINHAMENTO DE IMAGENS MÉDICAS
_____________________________________________________________________________________
Tabela 3.1: (continuação)
Interactiva
Interacção
Semi-automática
Inicialização fornecida pelo utilizador
Inicialização automática
Inicialização fornecida pelo utilizador
Orientada/corrigida pelo utilizador
Ambos
Automática
Determinação dos parâmetros (determinados de um modo explícito)
Procura dos parâmetros que optimizam uma função
Monomodal (CT/CT, MRI/MRI, PET/PET, etc.)
Multimodal (CT/MRI, CT/PET, CT/SPECT, PET/MRI, etc.)
Modalidade para um modelo
Paciente para modalidade
Intra-sujeito
Inter-sujeitos
Atlas
Cabeça: cérebro ou crânio, olhos, maxilares
Tórax: tórax na totalidade, coração, peitos
Abdómen: abdómen em geral, rins, fígado
Membros: membros em geral, fémur, úmero, mão, pé
Pélvis e perineu
Coluna vertebral
Procedimento de
optimização
Modalidades
envolvidas
Sujeitos
Objectos
Matematicamente, uma função, aplicação ou transformação L de um espaço vectorial V
para um espaço vectorial W sobre um corpo K diz-se linear se:
∀u , v ∈ V e ∀α , β ∈ K ⇒ L(αu + βv ) = αL(u ) + βL(v ) .
Em particular, uma função L do espaço vectorial IR n para espaço vectorial IR m sobre
IR é linear se L(u ) = Au , onde u ∈ IR n e A é uma matriz real de dimensão m × n . Uma
função afim T de IR n em IR n é dada por:
T (u ) = L(u ) + t = Au + t ,
onde A é uma matriz real de dimensão n × n e t ∈ IR n . O vector t ∈ IR n representa a
translação e a matriz A representa a deformação da forma: rotação, escalamento e outras
deformações que preservam a colinearidade. Pelas definições apresentadas, uma
transformação afim pode ser vista como uma composição de uma transformação linear e
de uma translação.
22
CAPÍTULO III − ALINHAMENTO DE IMAGENS MÉDICAS
_____________________________________________________________________________________
Usualmente, as metodologias de alinhamento de imagens podem também ser
classificadas com base no espaço de características utilizadas −feature-space used− e
medidas de similaridade usadas −similarity metric used− para comparar as imagens. Os
espaços de características mais comuns incluem intensidade, pontos de referência,
gradientes, regiões limites, cantos, regiões, contornos; bifurcações [Laliberté, 2003],
[Matsopoulos, 2004]; e superfícies, [Wong, 2006a].
Outra classificação comum para as metodologias de alinhamento é: baseadas na
geometria das estruturas presentes nas imagens e baseadas na intensidade. As
metodologias baseadas na geometria usam a localização das características extraídas das
imagens. As metodologias baseadas na intensidade usam a totalidade ou uma parte
significativa da informação de intensidade presente na imagem.
As metodologias podem ainda ser divididas com base no espaço de trabalho
considerado: domínio espacial, domínio das frequências (usando transformadas de
Fourier ou onduleta) ou ambos.
Nas duas secções seguintes são apresentadas e analisadas algumas das técnicas de
alinhamento usadas. São também apresentados alguns exemplos de aplicação exemplos
de aplicação e citados vários trabalhos relacionados com esta área. As metodologias
apresentadas são divididas em baseadas na geometria e baseadas na intensidade.
3.2 Metodologias baseadas na geometria
3.2.1 Alinhamento baseado na correspondência entre pontos
Para realizar o alinhamento baseado na correspondência entre pontos, obviamente o
primeiro passo é a identificação dos pontos a considerar ou qual se segue a definição
das correspondências. Os pontos usados podem ser marcas naturais, tais como ossos, ou
marcas artificiais colocadas no corpo do paciente com o intuito de ajudar ao
alinhamento. As correspondências podem ser determinadas manualmente ou
automaticamente,
dependendo
do
algoritmo
de
alinhamento
considerado,
[Maintz,1998].
3.2.1.1 Emparelhamento
Antes do processo de emparelhamento é necessário extrair características dos objectos
23
CAPÍTULO III − ALINHAMENTO DE IMAGENS MÉDICAS
_____________________________________________________________________________________
representados nas imagens, tais como, pontos, linhas, fronteiras, contornos, superfícies
ou esqueletos. Em Visão Computacional, esta tarefa é usualmente referida com
segmentação.
Há muitas técnicas para fazer a segmentação dos objectos representados em imagens.
Frequentemente, estas técnicas são classificadas em baseadas em regiões e baseadas em
fronteiras, seguindo-se uma série de subdivisões. No entanto, outras classificações
existem, como por exemplo, técnicas baseadas em características e técnicas baseadas na
imagem, [Monteiro, 2007].
Como exemplos de trabalhos na área das técnicas baseadas em fronteiras pode-se
considerar: [Marr, 1980], onde a passagem por zero da segunda derivada é usada para
definir a fronteira, usando a composição de um filtro gaussiano com o laplaciano da
imagem; [Canny, 1986], onde o gradiente da imagem em conjunto com duplo limiar são
usados para definir as fronteiras; [Kass, 1988], [Cootes, 1992], [Xu, 1998], [Tavares,
2007], [Vasconcelos, 2008], [Gonçalves, 2008], onde conjuntos de pontos são
modelados, frequentemente por curvas, usando, por exemplo, princípios físicos ou
estatísticos; [Wang, 2006], [Wang, 2007], onde a forma é tratada como uma estrutura
topológica, sendo estes métodos conhecidos por level set methods.
Exemplos de segmentação baseada nas regiões, temos os métodos de thresholding,
[Otsu, 1979], [Wellner, 1993]; watershed, [Beucher, 1992], [Grau, 2004], baseia-se na
analogia com o enchimento de albufeiras/barragens; region growing, [Adams, 1994],
baseia-se no crescimento de uma semente dentro de uma região que apresenta
determinada afinidade.
Estudos aprofundados e revisões sobre segmentação de imagem podem ser consultadas,
por exemplo, em [Zhang, 2001], [Zhang, 2004], [Monteiro, 2007], [Gonzalez, 2008],
[Ma, 2009].
Após a segmentação das imagens, o passo seguinte é o emparelhamento entre as
estruturas extraídas das imagens a emparelhar. O processo de determinação do
emparelhamento tem levado ao surgimento de várias metodologias no sentido de ser
obtido o melhor emparelhamento possível para a aplicação em concreto. Algumas das
técnicas usadas são: informação espacial da intensidade do vector gradiente, [Lucas,
1981]; emparelhamento modal, [Scott, 1991], [Shapiro, 1992], [Sclaroff, 1995],
[Carcassoni, 2003], [Bastos, 2006]; shape context, [Belongie, 2002]; shape signature,
24
CAPÍTULO III − ALINHAMENTO DE IMAGENS MÉDICAS
_____________________________________________________________________________________
[Otterloo, 1991], [Cohen, 1997], [Oliveira, 2009a], [Oliveira, 2009b], [Oliveira, 2009c];
critérios estocásticos, [Moisan, 2004], [Keren, 2009]; eixos médios e shock graphs,
[Zhu, 1996], [Chung, 2000], [Sebastian, 2004].
Frequentemente, a similaridade entre as características extraídas das duas imagens é
quantificada numa matriz de afinidade ou de custos de emparelhamentos. Nestas
situações, é comum o problema do emparelhamento ser tratado como um problema de
optimização. Assim, os algoritmos de afectação são frequentemente usados no sentido
de ser encontrado o emparelhamento de custo mínimo. Há dois tipos fundamentais de
algoritmos de optimização usados nestes casos, os optimais e não-optimais. Como
exemplos de trabalhos onde são usados algoritmos optimais temos: programação linear,
[Bastos, 2006]; baseados em grafos, [Roy, 1998], [Fielding, 2000]; optimização
concava, [Maciel, 2003]; programação dinâmica, [Scott 2006], [Oliveira, 2008],
[Oliveira, 2009a], [Oliveira, 2009b], [Oliveira, 2009c]. Como exemplos de aplicação de
algoritmos não optimais tem-se: greedy algorithms, [Wu, 1995]; simulated annealing,
[Starink, 1995].
Muitos algoritmos de alinhamento baseiam-se na localização de marcas fiduciais nas
imagens consideradas e na sua correspondência, manual ou automática. No entanto, há
sempre algum erro relativamente à sua posição exacta e, portanto, um erro no
alinhamento que é consequência do erro de localização. O erro de localização é
conhecido por fiducial localization error (FLE) e o resíduo, segundo os mínimos
quadrados, entre as marcas após alinhamento é conhecido por fiducial registration error
(FRE). Contudo, em [Fitzpatrick, 1998] é referido que o que realmente importa não é o
valor de FRE mas aquilo a que chamaram target registration error (TRE). Um estudo
pormenorizado sobre a teoria de erros relacionada com o alinhamento de imagens pode
ser consultado em [Fitzpatrick, 1998] e [Wiles, 2008].
3.2.1.2 Determinação da transformação geométrica
Para determinar a transformação geométrica que melhor alinha dois conjuntos de pontos
há várias soluções. Algumas das soluções mais frequentes têm por base o seguinte
procedimento:
1 − Determinar os centróides;
2 − Usar a diferença entre as coordenadas dos centróides como o vector
25
CAPÍTULO III − ALINHAMENTO DE IMAGENS MÉDICAS
_____________________________________________________________________________________
translação e deslocar um dos objectos no sentido do outro, ou centrar os dois
objectos na origem subtraindo às coordenadas de cada ponto as coordenadas do
respectivo centróide;
3 − Rodar um dos conjuntos de pontos até que a soma dos desvios quadráticos
entre cada para de pontos correspondidos seja mínima. Simultaneamente poderá
ser aplicado um escalamento.
3.2.1.2.1 Transformação de similaridade baseada na correspondência entre dois
segmentos de recta
Para uma estrutura rígida (apenas translações e rotações), a identificação de dois pontos
de referência numa imagem e os correspondentes pontos na outra imagem é suficiente
para determinar a transformação, tanto em 2D como em 3D, como se vê na situação
seguinte:
Suponhamos que temos dois pontos, p1 e p2 , na imagem modelo e os correspondentes
pontos, q1 e q2 , na imagem a alinhar. Os centróides são dados por:
p = 0.5 × ( p1 + p2 ) e q = 0.5 × (q1 + q2 ) .
O passo seguinte consiste em centrar ambos os pares de pontos na origem:
pi ← pi − p , qi ← qi − q , para i = 1,2 .
Para determinar a rotação, o produto vectorial p1 p2 × q1q2 dá o eixo de rotação, sendo
que a amplitude do ângulo de rotação pode ser dada por:

 p p ⋅q q
θ = arccos 1 2 1 2
 p1 p2 q1q2



,


onde (⋅) representa o produto escalar.
Se for permitido escalamento homogéneo, as mesmas duas correspondências são
suficientes. A escala pode ser dada pelo quociente das distâncias entre os dois pontos de
cada imagem.
26
CAPÍTULO III − ALINHAMENTO DE IMAGENS MÉDICAS
_____________________________________________________________________________________
3.2.1.2.2 Transformação rígida ou afim usando decomposição em valores singulares e
mínimos quadrados
Na prática é usual utilizar mais do que dois pontos em cada imagem. Geralmente,
quanto maior for o número de pontos utilizados, menor será o erro médio de localização
dos mesmos e consequentemente menor será a influência dos erros de localização no
alinhamento final, [Hajnal, 2001]. O valor da raiz quadrada da média das distâncias
quadradas é usualmente guardado pelo algoritmo e é o já referido anteriormente FRE,
embora também seja comum esse erro ser referido como root mean squared error
(RMS).
Uma solução matemática muito usada para calcular a transformação rígida quando há
várias correspondências definidas é conhecida por orthogonal Procrustes problem,
[Hajnal, 2001]. A sua formulação é a seguinte:
Suponha-se que se tem dois conjuntos, P e Q, cada um constituído por n pontos e
devidamente correspondidos. Sejam p e q os seus centróides. O primeiro passo é
centrar os dois conjuntos de pontos na origem:
pi ← pi − p
qi ← qi − q
.
Agora o problema resume-se a determinar a rotação. Para tal, calcula-se a matriz de
correlação C:
[
C = p1
T
p2
T
...
pn
T
]
 q1 
q 
 2.
 ... 
 
q n 
Considerando a decomposição em valores singulares de C, tem-se: C = UDV T . A
matriz de rotação R é dada por R = VDU T , onde:
0
1 0
0
1


0
ou D = 0 1
D=
T 
0 det UV 
0 0 det UV T
(
)
(

,


)
para pontos 2D ou 3D, respectivamente, [Hajnal, 2001]. Consequentemente, tem-se que
Rpi = qi , ou seja, rodando os pontos do conjunto P segundo a rotação definida pela
27
CAPÍTULO III − ALINHAMENTO DE IMAGENS MÉDICAS
_____________________________________________________________________________________
matriz R, esses pontos irão sobrepor-se aos pontos correspondentes do conjunto Q.
Se o número de pontos em cada conjunto é dois, então R representa a rotação exacta. Se
o número de pontos for maior do que dois, então R representa a rotação óptima no
sentido dos mínimos quadrados. Em [Dorst, 2005] é realizada uma análise dos erros de
primeira ordem do método referido.
Suponha-se agora que se quer determinar a transformação afim que melhor alinha os
dois conjuntos de pontos P e Q anteriormente definidos e que estes já estão centrados na
origem. Assim, deseja-se uma transformação linear que aplique P em Q (ou o oposto).
Seja A uma matriz de dimensão 2 × 2 ou 3× 3 , conforme os pontos sejam 2D ou 3D.
Considerando as coordenadas dos pontos de P e Q dispostos em coluna e ordenados,
[
T
P = p1
p2
T
...
pn
T
] e Q = [q
T
1
q2
T
T
]
... qn ,
pretende-se resolver o problema linear XP = Q . Se P é invertível, então a solução
exacta é dada por X = Q P −1 . Contudo, os conjuntos de pontos P e Q são definidos por
vários pontos para que o erro médio de localização dos pontos seja pequeno. Deste
modo, normalmente a matriz P não é quadrada e portanto não é invertível. Neste caso,
considera-se a solução do sistema de equações XP = Q obtida no sentido dos mínimos
quadrados.
3.2.1.2.4 Transformação de similaridade no plano complexo
Em [Oliveira, 2009a] é usado um procedimento distinto do anterior para determinar a
transformação rígida ou de similaridade que melhor alinha dois conjuntos de pontos 2D
previamente correspondidos. De um modo simplificado, a metodologia implementada
considera os pontos definidos no plano complexo, C, onde uma transformação de
similaridade T pode ser representada simplesmente por:
T :C → C
,
z  z ' = wz + u
onde w e u são números complexos. A transformação T pode ser vista como uma função
que aplica uma rotação e um escalamento em torno da origem seguindo-se uma
translação.
Se o ponto p1 corresponde ao ponto q1 e o ponto p 2 corresponde ao ponto q 2 , então,
28
CAPÍTULO III − ALINHAMENTO DE IMAGENS MÉDICAS
_____________________________________________________________________________________
através da definição de T, tem-se:
T ( p1 ) = q1
wp + u = q1
⇔ 1
.

T ( p 2 ) = q 2
wp 2 + u = q 2
Resolvendo este sistema de equações lineares, em ordem a u e w obtém-se os
parâmetros da transformação T. O valor absoluto de w representa o escalamento, o
argumento de w representa o ângulo de rotação e a translação em x e y é definida,
respectivamente, por Re(u ) e Im(u ) .
Pelas razões já enunciadas, geralmente são usados mais do que dois pontos. A solução
proposta em [Oliveira, 2009a] consiste em calcular a transformação geométrica que
alinha cada par de pontos de um conjunto com o respectivo par de pontos do outro
conjunto. Seguidamente, é realizado o tratamento estatístico das soluções obtidas,
eliminando-se assim a influência dos outliers. Repare-se que n correspondências
implicam n pontos em cada conjunto e com n pontos é possível definir n(n − 1) / 2 pares.
A título de exemplo, repare-se que com 10 correspondências é possível obter 45
estimativas para a transformação geométrica.
Uma vantagem deste método relativamente aos anteriores é o facto de não basear todas
as transformações nos mesmos centróides, aliás, os centróides nunca são considerados.
Note-se que as deformações que as imagens possam ter sofrido geralmente originam um
movimento dos centróides relativamente aos restantes pontos do respectivo conjunto.
Assim, nos métodos que usam o centróide, como a rotação é calculada após centrar os
conjuntos de pontos, tendo por base os seus centróides, o erro de determinação dos
centróides vai influenciar a rotação, aumentando assim o erro final. Tal situação não se
verifica no algoritmo apresentado em [Oliveira, 2009a].
3.2.1.2.5 Método de eliminação de outliers: algoritmo RANSAC
Os métodos que optimizam a transformação geométrica no sentido dos mínimos
quadrados, isto é, minimizando a soma dos erros quadráticos, são muito sensíveis à
presença de outliers. Como o erro é quadrático, um ponto outlier muito afastado tem um
enorme efeito no erro e consequentemente na transformação geométrica determinada.
Uma solução para este problema é eliminar os outliers do conjunto das
correspondências. Para tal, em [Fischler, 1981] é proposto um algoritmo de eliminação
de outliers conhecido por Random Sample Consensus (RANSAC). Este algoritmo pode
29
CAPÍTULO III − ALINHAMENTO DE IMAGENS MÉDICAS
_____________________________________________________________________________________
ser dividido nos seguintes passos:
1 − Escolher aleatoriamente um subconjunto de pontos em função do modelo de
transformação geométrica pretendida e calcular a transformação com base nesses
pontos (note-se que a escolha de um subconjunto de pontos, na prática
corresponde à escolha de um subconjunto de correspondências de entre todas as
conhecidas);
2 − Aplicar a transformação determinada a todos os pontos de um dos conjuntos;
3 − Determinar o conjunto de pontos, S, que estão a uma distância inferior a uma
determinada tolerância dos seus correspondentes no outro conjunto (mais uma
vez, a escolha dos pontos do conjunto S corresponde à escolha de
correspondências);
4 − Se o número de pontos de S é maior ou igual a um valor pré-estabelecido,
então S é usado para calcular transformação geométrica final pretendida, usando
por exemplo os mínimos quadrados. Se o número de pontos de S é menor do que
o valor pré-estabelecido, então regressa-se ao ponto 1 ignorando a transformação
previamente determinada.
3.2.1.3 Transformação usando coordenadas homogéneas
Na Secção 3.2 foi referido que uma transformação afim pode ser definida como uma
aplicação linear seguida de uma translação, sendo que se a translação não for nula, a
transformação afim não é uma aplicação linear. No entanto, elevando a dimensão do
espaço é possível tratar as transformações projectivas, e por consequência as
transformações afim, como transformações lineares. A título de exemplo, tem-se que
uma transformação rígida T em 2D pode ser definida por:
 a   cosθ
T     = 
 b    sin θ
− sin θ  a  t x   a cosθ − b sin θ + t x 
+ =
,
cosθ  b  t y  a sin θ + b cosθ + t y 
onde θ representa o ângulo de rotação e t x e t y a translação segundo os eixos das
abcissas e das ordenadas, respectivamente.
Considerando os pontos do plano R2 definidos em coordenadas homogéneas, tem-se que
o vector:
30
CAPÍTULO III − ALINHAMENTO DE IMAGENS MÉDICAS
_____________________________________________________________________________________
a 
b  ,
 
ficará representado pelo vector:
a 
b  .
 
1 
A transformação T anteriormente definida ficará definida por:
 a   cos θ


T '  b   =  sin θ
 1    0
  
− sin θ
cos θ
0
t x  a   a cos θ − b sin θ + t x 
t y  b  = a sin θ + b cos θ + t y  ,

1  1  
1
o que mostra que a transformação não linear T pode ser substituída pela transformação
linear T '.
A consideração das transformações geométricas usando coordenadas homogéneas tem a
vantagem de definir todas as transformações como o produto de uma matriz, que
representa a transformação, pelas coordenadas dos pontos as transformar.
A Tabela 3.2 sintetiza a forma das matrizes que representam as transformações
geométricas 2D quando definidas usando coordenadas homogéneas.
A determinação dos elementos da matriz de transformação pode ser alcançada
resolvendo os sistemas de equações originados. Por exemplo, para a transformação
afim, com o conhecimento de três correspondências definem-se seis equações
linearmente independentes nas mesmas seis incógnitas. Assim, o sistema de equações
resultante poderá ser facilmente resolvido usando o método de eliminação de Gauss,
[Press, 2002], por exemplo.
No caso de transformações projectivas, para determinar a matriz da transformação
conhecendo quatro correspondências, faz-se h33 = 1 (ver Tabela 3.2), obtendo-se assim
um sistema linear de oito equações com oito incógnitas que pode ser resolvido
facilmente. No caso de serem conhecidas mais de que quatro correspondências, é
normal não existir uma solução exacta, determinando-se uma solução aproximada
usando, por exemplo, mínimos quadrados. Outra técnica frequentemente usada para
determinar a transformação geométrica pretendida consiste no algoritmo DLT −direct
31
CAPÍTULO III − ALINHAMENTO DE IMAGENS MÉDICAS
_____________________________________________________________________________________
linear transform. Informação sobre este algoritmo e teoria subjacente poderá ser
consultada, por exemplo, em [Hartley, 2003].
Tabela 3.2: Relação entre o tipo de transformação geométrica, definida usando
coordenadas homogéneas, com a forma da matriz que a representa e os graus de
liberdade, em transformações geométricas 2D.
Transformação
Matriz
Graus de liberdade
Projectiva
 h11 h12
h
 21 h22
h31 h32
h13 
h23 
h33 
8 (necessário quatro
correspondências, [Hartley,
2003])
Afim
 h11 h12
h
 21 h22
 0
0
tx 
t y 
1 
6 (necessário três
correspondências)
Similaridade
Rígida
 s cosθ
 s sin θ

 0
− s sin θ
s cosθ
cosθ
 sin θ

 0
− sin θ
cosθ
0
0
tx 
t y 
1 
tx 
t y 
1 
4 (necessário duas
correspondências)
3 (necessário duas
correspondências)
3.2.2 Eixos principais
Os eixos principais são muito usados para realizar o alinhamento de duas imagens 2D
ou 3D. A sua aplicação é muito simples e não necessita da determinação de
correspondências. Pode ser usado apenas um conjunto de pontos característicos, como
por exemplo, pontos de contornos, pontos de bifurcação ou vértices, etc. Pode também
ser usada a imagem na totalidade e características globais extraídas da mesma, como o
nível de cinzento e o gradiente, por exemplo.
Na formulação seguinte considera-se todos os píxeis de cada imagem 2D sendo
atribuído um peso, f ( x, y ) e g ( x, y ) , a cada píxel das mesmas. Para o caso de imagens
32
CAPÍTULO III − ALINHAMENTO DE IMAGENS MÉDICAS
_____________________________________________________________________________________
3D, o procedimento é equivalente. Por simplicidade, suponha-se que f ( x, y ) e g ( x, y )
representam a intensidade das respectivas imagens f e g; no entanto, podem representar
outra característica da imagem. O centróide da imagem f, (x f , y f ) , é dado por:
n −1 m −1
(x
f
, yf )=
∑∑ f (x, y ) × (x, y )
x =0 y =0
n −1 m −1
∑∑ f (x, y )
.
x =0 y =0
De modo análogo, calcula-se o centróide da imagem g, (x g , y g ) . O passo seguinte
consiste em calcular a matriz de correlação das coordenadas de cada imagem, C f e C g .
Para a imagem f tem-se:
n −1 m −1
∑∑
Cf =
x =0 y =0
x − x f 
f ( x, y ) × 
 × x − xf
 y − y f 
[
y − yf
]
n −1 m −1
∑∑ f (x, y )
x =0 y =0
Os vectores próprios de C f são os eixos principais da imagem f. De mesmo modo,
determinam-se os eixos principais da imagem g.
Para alinhar as imagens, tem-se que a diferença das coordenadas dos centróides indica a
translação. O alinhamento rotacional das imagens é obtido alinhando os eixos principais
das mesmas.
Na Figura 3.1 é apresentado um exemplo de duas imagens de pedobarografia, os
respectivos centróides, os eixos principais e o alinhamento final obtido considerando o
nível de intensidade de todos os píxeis das imagens originais.
3.2.3 Aproximação pontual iterativa
O algoritmo iterative closest point algorithm (ICP) foi proposto em [Besl, 1992] para o
alinhamento de formas 3D. No artigo original é realizado o alinhamento de um conjunto
de dados com um modelo. A ideia principal é iterativamente aproximar o conjunto de
pontos do modelo. Os dados poderão ser oriundos de diversas fontes, nomeadamente
sensores que forneçam a localização 3D da estrutura a alinhar pelo modelo. Seja qual
for o tipo de estrutura a alinhar, esta tem que ser convertida para um conjunto de pontos.
33
CAPÍTULO III − ALINHAMENTO DE IMAGENS MÉDICAS
_____________________________________________________________________________________
Figura 3.1: Na linha superior, duas imagens de pedobarografia, os respectivos centróides e eixos
principais. Na linha inferior, do lado esquerdo as duas mesmas imagens sobrepostas antes do
alinhamento e do lado direito as duas imagens após o alinhamento usando e metodologia
baseada nos eixos principais. (As cores das imagens foram modificadas
para facilitar a sua visualização.)
O algoritmo adoptado pode ser descrito nos seguintes passos:
1 − Para cada ponto do conjunto de dados a alinhar, identificar o ponto do
modelo que lhe está mais próximo;
2 − Determinar a transformação rígida que melhor alinha o conjunto de pontos
com o modelo, com base correspondência estabelecidas no ponto anterior;
3 − Aplicar a transformação rígida ao conjunto de pontos;
4 − Se a distância entre o conjunto de pontos e o modelo (poderá ser calculada
usando mínimos quadrados) for superior a uma dada tolerância, regressa-se ao
ponto 1. Caso contrário, considera-se que o alinhamento está concluído.
Este algoritmo vai iterativamente aproximando o conjunto de pontos a alinhar da região
do modelo que lhe está mais próxima. Assim, é natural que a solução encontrada seja a
34
CAPÍTULO III − ALINHAMENTO DE IMAGENS MÉDICAS
_____________________________________________________________________________________
melhor local, no entanto não há garantia alguma que é a melhor solução global. A
solução proposta em [Besl, 1992] para aumentar a probabilidade do algoritmo convergir
para a melhor solução global é inicializar o algoritmo várias vezes com diferentes
estimativas para a rotação e depois escolher para transformação final a que originou
menor distância entre o conjunto de pontos a alinhar e o modelo, de entre todas as
transformações determinadas.
Em [McLaughlin, 2005] é realizada uma comparação entre os métodos baseados em
características que usam ICP e os métodos baseados em intensidade para o alinhamento
2D−3D em neuro-intervenções.
3.3 Metodologias baseadas em intensidade
Os métodos de alinhamento baseados em intensidade podem ser classificados segundo
dois critérios fundamentais: a estratégia seguida para procurar a melhor solução de
alinhamento e a medida de similaridade (qualidade do alinhamento) considerada. Nesta
secção optou-se por dividir esses métodos em: domínio espacial (trabalham com a
localização dos píxeis) e domínio das frequências (trabalham com o espectro e a fase
das imagens).
3.3.1 Domínio espacial
3.3.1.1 Estratégias dos algoritmos de optimização
Uma ideia muito simples para alinhar duas imagens consiste em aplicar a uma delas um
conjunto de deformações/transformações geométricas e posteriormente escolher a
transformação que originou melhores resultados em termos da medida de similaridade
considerada.
A estratégia de alinhamento mais simples é talvez a estratégia da força “bruta”, isto é,
testam-se todas as deformações possíveis e escolhe-se aquela que originar melhores
resultados em termos da medida de similaridade utilizada. Naturalmente, não é possível
testar todas as hipóteses de deformação no domínio contínuo. Assim, os parâmetros da
transformação a aplicar tem que ser discretizados. Obviamente, quanto maior for o
conjunto discreto de valores testados maior é o tempo dispendido para calcular as
transformações correspondentes. Geralmente, este tipo de estratégia de alinhamento não
é utilizada. No entanto, em algumas situações particulares, nomeadamente, em situações
35
CAPÍTULO III − ALINHAMENTO DE IMAGENS MÉDICAS
_____________________________________________________________________________________
em que a faixa de variação dos parâmetros da transformação é muito estreita, esta
estratégia poderá ser uma escolha adequada.
Para transformações rígidas ou de similaridade, uma solução que diminui os graus de
liberdade do algoritmo de procura da solução óptima consiste em transformar o sistema
de coordenadas rectangulares para o sistema de coordenadas log-polar, [Wolberg,
2000]. Se o centro de rotação escolhido para cada imagem for o mesmo em ambas,
então a rotação e o escalamento podem ser facilmente determinadas pois manifestam-se
como deslocações no espaço log-polar. Um dos problemas desta metodologia é a
dificuldade em encontrar o centro de rotação correcto. Em [Wolberg, 2000] é adoptada
uma metodologia de multi-resolução com uma procura exaustiva pela melhor
localização para o centro de uma das imagens tendo como referência o centro
geométrico da outra imagem.
Outra possível solução para o centro de rotação poderia ser o centróide pesado em
função da intensidade ou gradiente. No entanto esta solução, tal como a apresentada
[Wolberg, 2000] é bastante sensível a condições de iluminação e à janela de
visualização, pois podem estar representados objectos numa imagem e não estarem
representados na outra imagem. Outro ponto fraco deste tipo de métodos é o facto de
geralmente não funcionarem com alinhamento de imagens obtidas em diferentes
modalidades (multimodal registration).
Algumas das estratégias/técnicas de optimização frequentemente usadas nos métodos
baseados em intensidade são: método de Powell, gradiente descendente/ascendente,
gradiente descendente/ascendente conjugado e simulated annealing, combinadas com
uma estratégia de multi-resolução, [Hellier, 2004]. A juntar a estas técnicas ainda se tem
a possibilidade de utilizar toda a imagem ou apenas uma região de interesse (ROI).
A ideia principal do método de Powell, [Press, 2002], é simples, contudo eficiente em
muitas situações. Pode-se resumi-la do seguinte modo. Seja F uma função real que se
pretende minimizar (ou maximizar) e
X 0 = ( x1 , x2 ,..., xn ) ,
a estimativa inicial. Para inicializar, sejam:
u i = e i , com i = 1,..., n ,
36
CAPÍTULO III − ALINHAMENTO DE IMAGENS MÉDICAS
_____________________________________________________________________________________
onde e i representa o vector i da base canónica do espaço de procura considerado. Temse assim que a solução inicial dada em relação às direcções u i é:
X 0 = ( x1 , x2 ,..., xn ) = x1u1 + x2u 2 + ... + xn u n .
Terminada agora a fase de inicialização, o algoritmo prossegue fazendo variar
sucessivamente cada uma das variáveis xi até que seja atingido o mínimo, obtendo
sucessivamente uma nova estimativa X i em relação à base definida pelos u i ' s . Após
ajustar as n variáveis, faz-se:
u i −1 ← u i , com i = 2,..., n , u n = X n − X 0
e procura-se o mínimo ao longo desta nova direcção u n , pois foi esta que originou
melhores resultados. A nova estimativa passa a ser o ponto de partida, X 0 , para a nova
iteração, considerando agora as novas direcções. Este processo é repetido
sucessivamente até que o critério de paragem seja satisfeito.
Dependendo da aplicação, a ordem pela qual se colocam ou fazem variar as variáveis xi
no sentido de procurar o valor óptimo da função F deve ser adaptada para aumentar a
velocidade de convergência e diminuir a inter-dependência entre as variáveis. Por
exemplo, nas aplicações de alinhamento de imagens, é de esperar que a procura do valor
óptimo seja mais eficiente se se começar pelo ajuste das variáveis que representam a
translação e só depois a(s) que representa(m) a rotação. Em [Press, 2002], por exemplo,
são apresentadas algumas soluções para melhorar este método.
O método gradiente descendentte usa informação do gradiente para estimar a nova
aproximação em cada passo do processo iterativo de optimização. Seja F uma função
real que se pretende minimizar. Suponhamos que F está definida, é monótona e
diferenciável numa vizinhança do ponto A. Tem-se assim que F decresce quando se vai
de A no sentido contrário ao dado pelo vector gradiente de F em A, − ∇F ( A) . Assim,
se:
B = A − α ∇F ( A ) ,
e α > 0 é um número suficientemente pequeno, então:
37
CAPÍTULO III − ALINHAMENTO DE IMAGENS MÉDICAS
_____________________________________________________________________________________
F ( A) ≥ F ( B ) .
Baseado no que se acabou de descrever, para o alinhamento de imagens, começa-se com
um valor inicial X 0 para o alinhamento e depois iterativamente constrói-se a sequência
de estimativas para a transformação, X 0 , X 1 ,..., X n , até que o critério de paragem seja
satisfeito, onde:
X n+1 = X n − α n ∇F ( X n ), n ≥ 0 ,
tendo-se assim, consequentemente:
F ( X 0 ) ≥ F ( X 1 ) ≥ F ( X 2 ) ≥ ... ≥ F ( X n ) .
Assim, é de esperar que a sequência F ( X 0 ), F ( X 1 ), F ( X 2 ),..., F ( X n ) convirja para um
mínimo. Para melhorar o processo, o valor de α i pode ser ajustado em cada iteração.
Na exposição deste método considerou-se que a função F é diferenciável, mas se F
representa a similaridade entre duas imagens discretas, é de esperar que não seja
diferenciável. No entanto, esta situação não constitui problema pois pode-se usar a
derivada discreta para estimar a derivada.
O método baseado no gradiente ascendente é baseado na mesma ideia do gradiente
descendente. Neste caso, o objectivo é maximizar a medida de similaridade.
Consequentemente, constrói-se a sequência de valores:
X n+1 = X n + α n ∇F ( X n ), n ≥ 0 ,
obtendo-se:
F ( X 0 ) ≤ F ( X 1 ) ≤ F ( X 2 ) ≤ ... ≤ F ( X n ) .
O método baseado no gradiente descendente/ascendente é um algoritmo de optimização
de primeira ordem e portanto não é adequado para optimizar funções de graus mais
elevados. Por exemplo, para uma função quadrática, o método do gradiente
ascendente/descendente realiza muitos pequenos passos na direcção da solução óptima,
não usando as propriedades deste tipo de função. Assim, para este tipo de situações, os
métodos do gradiente conjugado são uma melhor alternativa. Uma apresentação deste
método pode ser consultada em [Press, 2002].
38
CAPÍTULO III − ALINHAMENTO DE IMAGENS MÉDICAS
_____________________________________________________________________________________
Os algoritmos de optimização frequentemente convergem para mínimos (ou máximos)
locais, dificultando assim que o mínimo global seja alcançado. A optimização baseada
em simulated annealing é uma técnica cuja principal característica é permitir encontrar
o mínimo (ou máximo) global de funções que têm muitos mínimos (máximos) locais.
Precisamente devido a esta faceta, esta técnica tem atraído a atenção da comunidade
científica. Na base deste algoritmo de optimização está a distribuição de probabilidade
de Boltzmann, [Press, 2002]:
P (E ) ≈ e
−
E
kT
.
Nas aplicações cujo objectivo é minimizar o valor de uma medida similaridade (ou dessimilaridade) de duas imagens representado por uma função F, tem-se que:
E = ∆F = F ( X i +1 ) − F ( X i ) ,
onde F é a função a minimizar. O parâmetro k ( k > 0 ) é uma constante que depende do
sistema e da implementação e o parâmetro T ( T > 0 ) controla a velocidade do sistema.
Em termodinâmica, T representa a temperatura do sistema, sendo que este valor vai
diminuindo lentamente ao longo do tempo para obrigar o sistema a lentamente a perder
energia e convergir para um estado de energia mínima.
Pela fórmula da distribuição de probabilidade de Botlzmann, pode-se concluir que
quando E ≤ 0 , isto é, a estimativa X i +1 origina um valor menor ou igual para a função
F do que a estimativa X i , a probabilidade é igual a 1 (um). Assim, a nova estimativa
X i +1 é aceite. Quando E > 0 , a nova estimativa X i +1 é aceite com a probabilidade dada
pela fórmula de Boltzmann. Esta situação pode originar que o algoritmo aceite uma
nova estimativa pior do que a anterior, o que parece fazer pouco sentido. No entanto,
este facto é a chave do sucesso deste algoritmo, pois assim permite que o algoritmo
possa sair de um mínimo local.
A fórmula de probabilidade de Boltzmann apenas decide se a nova estimativa é ou não
aceite. Assim, é necessário incluir uma estratégia de cálculo das sucessivas novas
estimativas para o valor óptimo. Na implementação base da técnica simulated
annealing, o processo de determinação das novas estimativas é aleatório. No entanto,
dependendo da aplicação, podem ser usados outros mecanismos mais eficientes de
determinação das sucessivas estimativas. Um exemplo de aplicação na área do
39
CAPÍTULO III − ALINHAMENTO DE IMAGENS MÉDICAS
_____________________________________________________________________________________
alinhamento de imagens médicas pode ser visto em [Loeckx, 2003].
A ideia principal dos métodos de multi-resolução é a seguinte: Inicialmente é realizado
um alinhamento considerando as imagens definidas em baixa resolução, estimando-se
assim um alinhamento grosseiro. Seguidamente, consideram-se as imagens com uma
resolução maior e alinhadas segundo a transformação determinada no passo anterior.
Este processo é repetido até que finalmente se faz o alinhamento das imagens originais.
A título de exemplo, na primeira iteração pode-se usar uma amostra das imagens onde
cada píxel representa uma região de 8 × 8 píxeis da imagem original. Na segunda
iteração, cada píxel representa uma região de 4 × 4 píxeis da imagem original, e assim
sucessivamente.
Frequentemente, os algoritmos de alinhamento de imagem baseados em intensidade
usam uma estratégia de multi-resolução devido a dois factores principais:
− A probabilidade do algoritmo multi-resolução convergir para um mínimo local
é menor do que nos métodos que operam sempre sobre a imagem original;
− Geralmente a velocidade de convergência é maior, pois o algoritmo dá passos
maiores na direcção da convergência aquando da utilização das imagens de
baixa resolução comparativamente aos dados pelos algoritmos que trabalham
sempre com a imagem de alta resolução. Além disso, como o algoritmo de
multi-resolução na fase final já está a trabalhar com as imagens originais de
elevada resolução e estas já estão relativamente bem alinhadas, a solução óptima
é facilmente encontrada.
Frequentemente, a procura pelo melhor alinhamento possível não é realizada tendo em
conta toda a imagem mas apenas uma região de interesse (ROI). Este tipo de estratégia
tem algumas vantagens relativamente às técnicas que consideram toda a imagem,
nomeadamente:
− Ao utilizarem uma imagem constituída por menor número de píxeis (ou
vóxeis) diminui o esforço computacional e consequentemente aumenta a
velocidade de execução do algoritmo;
40
CAPÍTULO III − ALINHAMENTO DE IMAGENS MÉDICAS
_____________________________________________________________________________________
− Quando uma imagem tem objectos adicionais que não estão presentes na outra
imagem que se pretende alinhar, a escolha de uma ROI que não considere esses
objectos vai permitir obter melhores resultados no alinhamento;
− A presença de um tumor apenas em uma das imagens pode fazer com que o
algoritmo de alinhamento das imagens fracasse no caso de considerar a
totalidade das imagens. Assim, a escolha de uma ROI que não tenha o tumor
conduzirá a melhores resultados no alinhamento;
− O campo de visão representado nas duas imagens a alinhar pode ser
significativamente diferente. Assim, é fundamental que seja escolhida uma ROI
representada em ambas as imagens;
− Se as imagens são obtidas de diferentes modalidades, poderá ser escolhida
uma ROI em que a similaridade das intensidades entre as imagens das diferentes
modalidades esteja mais relacionada.
3.3.1.2 Medidas de similaridade
O alinhamento de imagens usando a similaridade entre píxeis envolve o cálculo da
transformação geométrica através da optimização de uma medida de similaridade
calculada directamente sobre a intensidade dos píxeis. Em algumas situações, em vez da
intensidade dos píxeis originais, são usadas outras características extraídas da própria
intensidade, como por exemplo, imagens suavizadas ou imagens relacionadas com o
gradiente. No alinhamento multimodal, são por vezes realizadas operações sobre a
intensidade de modo a tornar as duas imagens mais compatíveis. Nesta secção não será
feita distinção entre imagem original e imagem obtida da original através de uma
qualquer operação de transformação de intensidade.
Ao longo dos anos têm sido propostas diferentes medidas para quantificar a
similaridade entre imagens com base na comparação das intensidades dos píxeis
correspondentes de ambas as imagens. Algumas das medidas mais usadas são: soma dos
quadrados das diferenças (SSD); correlação cruzada (CC); entropia conjunta ;
informação mútua (MI). Esta medidas podem ser obtidas usando as duas imagens na
totalidade ou apenas utilizado uma ROI. Em [Penney, 1998] pode ser consultado um
estudo aprofundado relacionado com este tema.
41
CAPÍTULO III − ALINHAMENTO DE IMAGENS MÉDICAS
_____________________________________________________________________________________
3.3.1.2.1 Soma dos quadrados das diferenças
A função de custo soma dos quadrados das diferenças (SSD), por vezes referida apenas
como “least squares,” tem sido largamente usada em alinhamento de imagem, [Woods,
1998], [Hajnal, 1995], [Friston, 1995], [Orchard, 2005], [Fitch, 2005], [Orchard,
2007b], [Lucas, 1981]. A fórmula é:
N
SSD = ∑ ( f i − g i ) ,
2
i =1
onde N representa o número total de píxeis no domínio considerado, f i representa a
intensidade do píxel da imagem f indexado por i, g i a intensidade do píxel
correspondente da imagem g.
Geralmente é utilizada a SSD normalizada e referida apenas como SSD. A sua fórmula
é a seguinte:
SSD =
1
N
N
∑( f
i =1
− gi ) .
2
i
Também é comum considerar-se a soma pesada do quadrado das diferenças. Nestes
casos é usada a fórmula:
N
SSD = ∑ ( f i − g i ) wi ,
2
i =1
onde wi é o peso atribuído.
A medida SSD é muito sensível a píxeis cuja diferença entre as intensidades
correspondentes seja muito elevada, por exemplo devido a ruído. Para reduzir esses
efeitos pode ser usada a soma das diferenças absolutas (SAD) em vez da SSD. As
imagens são consideradas optimamente alinhadas quando estas medidas, SSD ou SAD,
atingem o seu valor mínimo.
A medida SSD tem por base o pressuposto que os píxeis correspondentes às mesmas
regiões do corpo devem ter idênticas intensidades na imagem que representa essas
regiões. Assim, esta medida é mais adequada para o alinhamento monomodal do que
multimodal. No entanto, têm sido realizados alguns trabalhos na área do alinhamento
multimodal usando a SSD, [Guimond, 2001], [Periaswamy, 2003].
42
CAPÍTULO III − ALINHAMENTO DE IMAGENS MÉDICAS
_____________________________________________________________________________________
3.3.1.2.2 Correlação cruzada
A correlação cruzada não é mais do que o coeficiente de correlação linear de Pearson,
[Press, 2002]. O coeficiente de correlação é uma medida de dependência linear entre
duas variáveis. Para o caso concreto das aplicações de alinhamento de imagens, mede a
relação de dependência linear da intensidade dos píxeis correspondentes. A fórmula
considerada é:
∑( f
N
CC =
i =1
∑( f
N
i =1
i
− f )( g i − g )
− f) ×
2
i
N
∑ (g
i =1
− g)
,
2
i
onde f i , g i e N são os mesmos parâmetros que foram definidos para a SSD e f e g
são as médias das intensidades das imagens f e g nos domínios considerados.
Como é bem conhecido, o CC varia entre − 1 e 1. Um valor próximo de − 1 significa
que há uma correlação linear forte mas negativa, isto é, há uma forte dependência linear
entre as intensidades das duas imagens mas quando a intensidade de um píxel aumenta
numa das imagens, a intensidade do píxel correspondente da outra imagem diminui. Um
valor próximo de 1 (um) significa que há uma correlação linear forte positiva, isto é, há
uma forte dependência linear entre as intensidades das duas imagens e quando a
intensidade de um píxel aumenta numa das imagens, a intensidade do píxel
correspondente da outra imagem também aumenta. Já um valor próximo de 0 (zero)
significa que não há dependência linear entre as intensidades das imagens.
Como exemplos de trabalhos onde é usado a CC podem ser considerados: [Cideciyan,
1995], [Solaiyappan, 2000] e [Maintz, 1996].
3.3.1.2.3 Entropia conjunta
Talvez a maior parte das medidas de similaridade actualmente usadas seja baseadas na
medida de entropia Shannon-Wiener, H, originalmente desenvolvida como no âmbito
da teoria de comunicação na década de 40 do século passado, [Hajnal, 2001]. No
entanto, há outras medidas de entropia que em alguns casos são consideradas por alguns
autores como mais adequadas para as aplicações de alinhamento de imagem médica,
nomeadamente, Rényi entropy, [Hamza, 2003], [Wachowiak, 2003] e Tsallis entropy,
[Tsallis, 1988], [Martin, 2004], [Cvejic, 2006], [Sun, 2007].
43
CAPÍTULO III − ALINHAMENTO DE IMAGENS MÉDICAS
_____________________________________________________________________________________
Nas aplicações de alinhamento de imagem, a entropia Shannon-Wiener é dada por:
E ( f ) = −∑ p f (i ) log( p f (i )) ,
N
i =0
onde p f (i ) é a probabilidade de existir um píxel com intensidade i na imagem f (ou
ROI considerada na imagem f), isto é:
p f (i ) =
número de píxeis com intensidade i em f
.
número total de píxeis em f
A entropia atinge o máximo se todos os píxeis tiveram diferentes níveis de intensidade e
atinge o mínimo se todos os píxeis tiverem a mesma intensidade.
Considere-se agora duas imagens, f e g, e o histograma conjunto das intensidades das
mesmas. A probabilidade conjunta p f , g (i, j ) representa a probabilidade de um píxel na
imagem f ter intensidade i e o seu correspondente na imagem g ter intensidade j, isto é:
p f , g (i, j ) =
número de pares de píxeis com intensidade (i, j ) no histograma conjunto
.
(número de níveis de intensidade considerados )2
A entropia conjunta de duas imagens f e g é calculada em função do seu histograma
conjunto e é dada por:
H ( f , g ) = −∑∑ p f , g (i, j ) log( p f , g (i, j )) .
N
N
i =0 j =0
Para duas imagens optimamente alinhadas, os píxeis no histograma conjunto das duas
imagens tendem a concentrar-se sobre uma linha recta e portanto a entropia conjunta
atinge o mínimo. Se as duas imagens não estão alinhadas, os píxeis no histograma
conjunto tendem a dispersar-se e consequentemente a entropia conjunta é maior do que
seria se as imagens estivessem alinhadas.
Na Figura 3.2 é apresentado um exemplo de duas imagens e os respectivos histogramas
conjuntos para as situações em que as imagens estão alinhadas e não alinhadas.
Geralmente, a entropia conjunta não é usada individualmente nas aplicações de
alinhamento de imagem, mas sim combinada com a entropia individual de cada
imagem, originando assim a uma nova medida de similaridade chamada informação
mútua.
44
CAPÍTULO III − ALINHAMENTO DE IMAGENS MÉDICAS
_____________________________________________________________________________________
(a)
(b)
(c)
(d)
(e)
Figura 3.2: Duas imagens e os seus histogramas conjuntos: (a) imagem de raio X do peito; (b) a mesma
imagem de raio X após uma pequena translação vertical; (d) representação plana do histograma
conjunto da imagem (a) com ela própria; (c) representação plana do histograma conjunto da
imagem (a) com a imagem (b); (e) representação 3D do histograma conjunto
das imagens (a) e (b).
3.3.1.2.4 Informação mútua
A entropia conjunta pode ser usada directamente como medida de similaridade, no
entanto tal é pouco comum porque esta é muito dependente da região de interesse
considerada. Por exemplo, se a região de interesse considerada na imagem modelo f
engloba uma grande porção do fundo da imagem e a região correspondente da imagem a
alinhar g também, então a probabilidade conjunta correspondente à intensidade do
fundo das imagens será elevada e consequentemente a entropia conjunta H ( f , g ) será
baixa. Obviamente, se a área de fundo diminuir, a entropia conjunta tem tendência a
aumentar. Assim, um algoritmo de alinhamento que procure minimizar a entropia
conjunta terá tendência para maximizar a quantidade de área de fundo das imagens
presente nas regiões de interesse e portanto pode originar soluções de alinhamento
45
CAPÍTULO III − ALINHAMENTO DE IMAGENS MÉDICAS
_____________________________________________________________________________________
incorrectas. A informação mútua é uma solução para este ponto fraco da entropia
conjunta.
A informação mútua foi introduzida como taxa de transmissão de informação por
Shannon em 1948, [Shannon, 1948], tornando-se conhecida posteriormente por
informação mútua. Esta medida foi simultaneamente proposta para o alinhamento
multimodal de imagens médicas por Viola e colaboradores, [Viola, 1995a], [Viola,
1995b], [Wells, 1995], [Viola, 1997]; e por Collignon e colaboradores, [Collignon,
1995], [Maes, 1997], [Collignon, 1998]. De um modo simplificado, a informação mútua
quantifica a qualidade com que uma imagem pode explicar a outra, atingindo o seu
máximo quando as imagens estão correctamente alinhadas.
Na literatura, a informação mútua é geralmente representada de três formas distintas,
mas todas equivalentes quando usada e medida de entropia de Shannon-Wiener:
MI ( f , g ) = H ( f ) + H ( g ) − H ( f , g ) ;
MI ( f , g ) = H ( g ) − H ( g | f ) ;
N N
 p f , g (i, j ) 
.
MI ( f , g ) = ∑∑ p f , g (i, j ) log
 p (i ) p ( j ) 
i =0 j =0
f
g


O termo H (g | f ) representa a entropia condicional, a qual é baseada na probabilidade
condicional p g , f ( j | i ) , ou seja, a probabilidade de um valor de intensidade j existir na
imagem g sabendo que o píxel correspondente da imagem f tem intensidade i. Os
restantes termos são os mesmos que foram definidos na entropia conjunta.
É importante relembrar que, regra geral, f e g representam a região de interesse e que
esta não é fixa. Assim, as entropias H ( f ) e H ( g ) não são constantes durante o
processo de alinhamento, embora a informação contida nas imagens o seja, obviamente.
A dimensão da região de interesse considerada influencia o valor da medida de
similaridade informação mútua. Assim, em [Studholme, 1999] é proposta um medida de
informação mútua normalizada (NMI) a qual é menos sensível à variação da dimensão
das regiões consideradas:
NMI ( f , g ) =
H ( f ) + H (g )
.
H( f , g)
46
CAPÍTULO III − ALINHAMENTO DE IMAGENS MÉDICAS
_____________________________________________________________________________________
Em [Pluim, 2003b] é realizado um estudo sobre a utilização da informação mútua no
alinhamento de imagens médicas. Esse estudo considera trabalhos até 2002. Como
exemplos de trabalhos mais recentes onde é usada a informação mútua, pode-se referir,
[Shekhar, 2002] e [Hellier, 2004].
A informação mútua é talvez a medida de similaridade mais usada no alinhamento de
imagens médicas. No entanto, a teoria de informação dispõe de outras medidas
adequadas para o alinhamento de imagens médicas baseadas na divergência da
distribuição conjunta da intensidade das imagens a alinhar. Em [Pluim, 2004] é
realizado um estudo comparativo entre a informação mútua e outras medidas baseadas
em informação, relativamente ao alinhamento de imagens médicas.
3.3.2 Domínio das frequências
Um sinal periódico pode ser representado por uma soma de funções periódicas. A
transformada de Fourier e as várias transformadas de onduleta são exemplos disso.
Nesta secção vai ser abordada apenas a transformação de uma imagem do domínio
espacial para o domínio das frequências usando transformadas de Fourier e de que
modo essa transformação pode ser uma ferramenta para o alinhamento de imagens.
A transformada de Fourier é uma transformação do sinal representado no domínio
temporal ou espacial para o domínio das frequências. Uma imagem bidimensional f no
domínio espacial pode ser vista como uma função que a cada par de coordenadas
representando uma localização espacial faz corresponder uma intensidade:
f : D ⊂ IR 2 → IR
.
( x, y )  f ( x, y )
Para imagens discretas, D é um subconjunto de Z e usualmente é rectangular. No
domínio das frequências, a mesma imagem f pode ser representada por:
F : Γ ⊂ IR 2 → C
,
(u, v )  F (u, v )
onde cada valor de F (u , v ) é um número complexo z = a + ib para o qual o seu valor
absoluto representa a amplitude ou espectro e a expressão arctan(b / a ) representa a fase
do sinal. A conversão entre as duas formas é simples e rápida usando a transformada
rápida de Fourier (FFT) sem que informação seja perdida. As fórmulas seguintes
47
CAPÍTULO III − ALINHAMENTO DE IMAGENS MÉDICAS
_____________________________________________________________________________________
representam a relação entre as duas formas de definir uma imagem, considerando que a
imagens f é discreta e está definida num rectângulo de dimensões, M × N , [Gonzalez,
2008]:
F (u , v ) =
M −1 N −1
∑∑ f (x, y )e
 ux vy 
− i 2π  + 
M N 
,
x =0 y =0
1
f ( x, y ) =
MN
M −1 N −1
∑∑ F (u, v )e
 ux . vy 
+ 
i 2π 
M N
.
u =0 v =0
A Figura 3.3 mostra três imagens exemplo, e os respectivos espectros e fases. Nas
imagens representando os espectros, a frequência aumenta do centro da imagem para a
periferia e quanto mais branco é um píxel, maior é a magnitude do espectro
correspondente,
F (u , v ) . Optou-se por centrar as frequências representadas nas
imagens obtidas por ser esta a forma mais comum de as representar e também porque
facilita a compreensão das propriedades a seguir indicadas. Nas imagens da fase, o
ângulo varia linearmente de − π rad (preto) até + π rad (branco).
Como pode ser visto na Figura 3.3, uma rotação no domínio espacial corresponde à
mesma rotação do espectro no domínio das frequências. Assim, a rotação pode ser
determinada também no domínio das frequências. Outro facto que se pode observar é
que os espectros de duas imagens cuja diferença entre elas é apenas uma translação é
exactamente o mesmo. Esta propriedade é importante em aplicações de alinhamento de
imagens porque permite determinar a rotação que melhor alinha as imagens
independentemente da translação que as imagens possam ter sofrido.
Se as coordenadas rectangulares ( x, y ) da imagem do espectro forem transformadas
para coordenadas polares (rho, theta ) , a rotação em coordenadas cartesianas converte-se
numa translação em coordenadas polares ao longo do eixo do theta. Assim, usando
SSD, correlação cruzada ou correlação de fase, por exemplo, facilmente se pode
encontrar o ângulo de rotação óptimo.
Observado as imagens da fase, parece que não há informação relevante que possa
auxiliar no alinhamento. No entanto, estando duas imagens alinhadas em termos de
rotação, a translação pode ser pode ser determinada usando a correlação entre as fases,
[Kuglin, 1975], [Foroosh, 2002], [Reddy, 1996], [Orchard, 2007a].
48
CAPÍTULO III − ALINHAMENTO DE IMAGENS MÉDICAS
_____________________________________________________________________________________
Figura 3.3: Por linha, três sequências de imagens exemplo: Da esquerda para a direita: imagens originais
no domínio espacial, espectro das imagens no domínio das frequências e finalmente
a fase das imagens no domínio das frequências.
Usualmente, os métodos baseados na correlação da fase são directos, isto é, determinam
o melhor alinhamento de uma só vez em vez de irem aos poucos aproximando-se da
melhor solução como muitos outros métodos. Este método é simples, basta considerar a
transformada de Fourier de ambas as imagens, dividir um a um os coeficientes
correspondentes das respectivas imagens e depois calcular a inversa da transformada de
Fourier. Se as duas imagens diferirem apenas de uma translação, a imagem final obtida
deverá apresentar um píxel ou um conjunto de píxeis, normalmente adjacentes, com
uma intensidade muito maior do que os restantes. Com base na localização desses píxeis
pode-se determinar translação, [Kuglin, 1975], [Foroosh, 2002], [Reddy, 1996],
[Orchard, 2007a]. Para ilustrar a propriedade acabada de descrever, observe-se a Figura
3.4. Esta imagem foi obtida usando as duas imagens de rectângulos paralelos aos eixos
coordenados representados na Figura 3.3.
49
CAPÍTULO III − ALINHAMENTO DE IMAGENS MÉDICAS
_____________________________________________________________________________________
Figura 3.4: Exemplo de uma imagem obtida determinando a correlação de fases directamente.
A posição do ponto mais claro indica a translação da imagem a alinhar
relativamente à imagem modelo.
Repare-se que na base da propriedade acabada de descrever está o facto de que o
quociente de dois números complexo é um número complexo cuja fase é igual à
diferença entre as fases de ambos. Em termos matemáticos, sejam z = r e iθ e w = ρ e iα
dois números complexos quaisquer. Aplicando-se propriedades básicas das operações
com potências, tem-se que:
z / w = (r / ρ )e i (θ −α ) .
A Figura 3.5 mostra o alinhamento de duas imagens de CT da cabeça e o alinhamento
obtido usando a metodologia acabada de descrever.
Nos exemplos apresentados foi utilizada a intensidade dos píxeis para realizar o
alinhamento usando a transformada de Fourier. No entanto, mesmo usando a
transformada de Fourier, podem ser usadas características extraída da imagem, como
por exemplo contornos, [Orchard, 2007a].
A metodologia apresentada é adequada para alinhar imagens onde há apenas uma
deformação rígida de uma imagem para a outra. Alguns autores apresentam soluções
usando directamente ou indirectamente a transformada de Fourier para realizarem
alinhamento não necessariamente rígido.
Uma solução, não necessariamente usando transformadas de Fourier, consiste em
determinar a correspondência (neste caso alinhamento) de cada uma das pequenas
regiões características em que se divide a imagem modelo (considerando essas pequenas
regiões como se fossem uma ROI) com a imagem a alinhar. Note-se que neste tipo de
alinhamento é necessário optimizar uma medida de similaridade. Depois, considerando
as coordenadas dos centróides das pequenas regiões, é possível obter um conjunto de
correspondências que serão usadas para determinar a transformação. O problema deste
50
CAPÍTULO III − ALINHAMENTO DE IMAGENS MÉDICAS
_____________________________________________________________________________________
método é o elevado esforço computacional requerido. Em [Wong, 2006b] é apresentada
uma solução deste género. A principal diferença consiste no método de determinação da
translação óptima. Nesse trabalho, Wong e Orchard transformam o cálculo da SSD
numa convulsão, a qual é avaliada eficientemente no domínio das frequências, pois uma
convulsão no domínio espacial corresponde a uma multiplicação no domínio das
frequências. Note-se que se as regiões forem muito pequenas relativamente à imagem,
estas podem ser consideradas como pontos numa imagem de menor resolução e
portanto as rotações não são consideradas.
Além dos trabalhos já referidos, existem muitos outros trabalhos nesta área como, por
exemplo, os propostos em [Apicella, 1989], [Kassan, 1996].
Figura 3.5: Alinhamento de duas imagens de CT da cabeça: Na linha superior, duas imagens originais; na
linha à inferior, à esquerda as duas imagens sobrepostas antes do alinhamento e à direita as mesmas
após o alinhamento. (A imagem modelo foi representada em tons de azul e a imagem a alinhar
em tons de vermelho para facilitar a visualização.)
51
CAPÍTULO III − ALINHAMENTO DE IMAGENS MÉDICAS
_____________________________________________________________________________________
3.4 Conclusões
Existem várias técnicas de alinhamento de imagens. As apresentadas nesta monografia
foram divididas em baseadas em características geométricas e as baseadas na
intensidade. No entanto, existem muitas metodologias de alinhamento onde ambas as
técnicas trabalham em conjunto e outras em que a classificação se torna algo ambígua.
Como paradigmas das técnicas onde ambos os tipos de metodologia trabalham em
conjunto, vai-se indicar dois trabalhos. No primeiro, [Auer, 2005], é apresentada uma
metodologia de alinhamento hierárquica não rígida. A metodologia proposta pode ser
dividida em dois passos principais. No primeiro é realizado um rápido alinhamento
rígido grosseiro e no segundo um alinhamento mais lento mas mais fino. No primeiro
passo, o alinhamento é realizado com base na maximização da informação mútua
modificada e normalizada entre as duas imagens, [Likar, 2000], adoptando um esquema
de multi-resolução. Neste mesmo passo é usado o algoritmo de optimização de Powell,
[Press, 2002]. No segundo passo, é feita a combinação entre um alinhamento baseado
na correspondência pontual com uma interpolação thin-plate spline.
No segundo trabalho, [Andreetto, 2004], é apresentado outro exemplo de integração de
várias metodologias. O método proposto inicia com a extracção (segmentação) de uma
superfície seguida da transformada de Fourier 3D para estimar de forma grosseira a
transformação rígida. Seguidamente, é realizado o alinhamento fino das iso-superfícies
que descrevem os ossos usando o algoritmo ICP.
As várias técnicas/metodologias de alinhamento apresentadas têm pontos fortes e
fracos. A decisão de usar uma delas numa determinada aplicação em desfavor das outras
depende de características particulares da aplicação, tais como, velocidade de execução
pretendida, facilidade/dificuldade de realizar a segmentação das imagens, deformações
geométricas admitidas, existência ou não de oclusão de objectos numa imagem
relativamente à outra, existência de artefactos numa das imagens, modalidades
envolvidas, etc.
52
CAPÍTULO IV
Conclusões finais e perspectivas de trabalho futuro
4.1 Conclusões
A realização do estudo de investigação que está na base desta monografia, assim como
as soluções de alinhamento de imagem entretanto desenvolvidas e implementadas,
permitiram ter uma ideia bastante clara desta área de investigação.
Foram estudadas técnicas cujo desenvolvimento já se processou há alguns anos, assim
como técnicas cujo desenvolvimento é muito mais recente. Esta opção teve como
principal objectivo promover um desenvolvimento equilibrado de competências na área
do alinhamento de imagens, em especial as de origem médica.
4.2 Perspectivas de trabalho para a Tese de Doutoramento
A primeira fase do presente trabalho de Doutoramento, correspondente ao estudo
bibliográfico detalhado sobre as várias técnicas, metodologias e modelizações
computacionais, existentes em Visão Computacional, para o emparelhamento e
alinhamento de imagens/estruturas, está praticamente concluído, como se comprova
pelos capítulos anteriores. No entanto, um estudo mais aprofundado será realizado
relativamente às técnicas que venham a ser implementadas.
Na etapa seguinte deste projecto será construída a base da plataforma computacional a
utilizar no desenvolvimento, ensaio, comparação e validação das técnicas, modelações e
metodologias a considerar. Assim, serão identificadas e seleccionadas as bibliotecas
53
CAPÍTULO IV − CONCLUSÕES FINAIS E PERSPECTIVAS DE TRABALHO FUTURO
_____________________________________________________________________________________
computacionais que a mesma poderá integrar. Caso a plataforma seja construída em
C++, poderão ser consideradas a bibliotecas Newmat (para cálculo matricial), OpenCV
(de processamento e análise de imagem), VTK (para a visualização e o processamento
de objectos gráficos 2D/3D), Free DICOM (para a importação e exportação de ficheiros
de imagem em formato DICOM) e ezDICOM (para importação e exportação de
ficheiros de imagens médicas de ressonância magnética, tomografia computorizada e
ultra-sons).
Após o desenvolvimento da base da plataforma computacional de desenvolvimento,
serão definidos vários casos reais de aplicação existentes na área médica. Assim, serão
identificados vários casos de aplicação de emparelhamento e alinhamento de estruturas
em imagens médicas 2D, 3D e 4D (3D mais tempo), considerando vários pacientes e
diferentes técnicas de aquisição de imagem. Exemplos de estruturas a considerar são:
coração, cérebro, pulmões, órgãos da cavidade pélvica, artérias e pés.
Na fase seguinte deste projecto, serão desenvolvidas, integradas na plataforma de
desenvolvimento, ensaiadas e validadas, técnicas, metodologias e modelizações
computacionais que permitam o emparelhamento e o alinhamento de estruturas
representadas em imagens médicas 2D/3D/4D.
Assim, serão consideradas as seguintes etapas, objectivos, técnicas e métodos:
− Emparelhamento de estruturas representadas em imagens médicas 2D,
considerando-se para tal características chave das mesmas, como pontos de
elevada curvatura, contornos e regiões. Com este fim, poderão ser consideradas,
entre outras possibilidades, modelizações estatísticas, geométricas e físicas,
complementadas com técnicas de optimização;
− Alinhamento de estruturas representadas em imagens médicas 2D; após o
emparelhamento de estruturas representadas em imagens médicas 2D, a
transformação espacial que melhor mapeia os dados envolvidos deverá ser
obtida, obtendo-se a sua componente rígida e as deformações não rígidas locais;
descritores canónicos robustos poderão também ser desenvolvidos e obtidos,
quer para as estruturas em causa quer para a transformação espacial obtida; nesta
etapa, serão consideradas técnicas de optimização;
− As técnicas, metodologias e modelizações desenvolvidas nas etapas anteriores
54
CAPÍTULO IV − CONCLUSÕES FINAIS E PERSPECTIVAS DE TRABALHO FUTURO
_____________________________________________________________________________________
para emparelhar e alinhar estruturas representadas em imagens 2D deverão ser
agora adequadas, se possível, para imagens 3D; poderão ser implementadas
técnicas específicas para imagens 3D;
− Após os desenvolvimentos anteriores para emparelhar e alinhar estruturas
representadas em imagens 2D e 3D, nesta etapa serão desenvolvidas técnicas,
metodologias e modelizações para realizar o emparelhamento e alinhamento de
estruturas ao longo do tempo; isto é, ao longo de sequências de imagens
médicas; para tal, os desenvolvimentos anteriores poderão ser complementados
com a utilização de métodos estocásticos, como filtragem de Kalman e suas
variantes, para prever em cada instante o comportamento dos modelos
construídos para as estruturas, e modelizações de movimento.
Ao longo de todos os desenvolvimentos e implementações efectuadas, as técnicas,
metodologias e modelizações consideradas serão cuidadosamente ensaiadas e validadas
recorrendo-se a casos sintéticos adequados e aos casos reais da área da imagem médica
previamente identificados e seleccionados.
55
Referências
[Adams, 1994] − R. Adams, L. Bischof. Seeded region growing. IEEE Transactions on
Pattern Analysis and Machine Intelligence, vol. 16, no. 6, pp. 641-647, June
1994.
[Andreetto, 2004] − Marco Andreetto, Guido M. Cortelazzo. Frequency domain
registration of computer tomography data. Proceedings of the 2nd
International Symposium on 3D Data Processing, Visualization, and
Transmission (3DPVT’04).
[Apicella, 1989] − A. Apicella, J. S. Kippenhan, J. H. Nagel. Fast multi-modality image
matching. Med. Imaging III: Image Process., vol. Proc. SPIE 1092, pp. 252263, 1989.
[Auer, 2005] − Martin Auer, Peter Regitnig, Gerhard A. Holzapfel. An automatic
nonrigid registration for stained histological sections. IEEE Transactions on
Image Processing, vol. 14, no. 4, pp. 475-486, April 2005.
[Bastos, 2006] − L. Bastos, J. M. R. S. Tavares. Matching of objects nodal points
improvement using optimization. Inverse Problems in Science and Engineering,
vol. 14, no. 5, pp. 529-541, 2006.
[Belongie, 2002] − S. Belongie, J. Malik, J. Puzicha. Shape matching and object
recognition using shape contexts. IEEE Transactions on Pattern Analysis and
Machine Intelligence, vol. 24, no. 24, pp. 509-522, 2002.
56
REFERÊNCIAS
_____________________________________________________________________________________
[Besl, 1992] − P. J. Besl, N. D. McKay. A method for registration of 3-D shapes. IEEE
Transactions on Pattern Analysis and Machine Intelligence, vol. 14, pp. 239256, 1992.
[Beucher, 1992] − S. Beucher. The watershed transformation applied to image
segmentation. 10th Pfefferkorn Conference on Signal and Image Processing in
Microscopy and Microanalysis, 16-19 sept. 1991, Cambridge, UK, Scanning
Microscopy International, suppl. 6, pp. 299-314, 1992.
[Block, 2006] − W. F. Block, A. L. Alexander, S. B. Fain, M. E. Meyerend, C. J.
Moran, S. B. Reeder, K. K. Vigen, O. Wieben, J. H. Brittain. Magnetic
Resonance Imaging. Enclyclopedia of Medical Devices and Instrumentation,
Second Edition, Volume 4. Wiley-Interscience, A John Wiley & Sons Inc.
Publication, 2006.
[Brown, 1992] − Lisa Gottesfeld Brown. A survey of image registration techniques.
ACM Computing Surveys, vol. 24, no. 4, pp. 325-376, 1992.
[Canny, 1986] − J. F. Canny. A computational approach to edge detection. IEEE
Transactions on Pattern Analysis and Machine Intelligence, vol. 8, no. 6, pp.
679-698, November 1986.
[Carcassoni, 2003] − M. Carcassoni, E. Hancock. Correspondence matching with modal
clusters. IEEE Transactions on Pattern Analysis and Machine Intelligence, vol.
25, no. 12, pp. 1609-1615, 2003.
[Chung, 2000] – Jae-Moon Chung, Noboru Ohnishi. Matching and recognition of
planar shapes using medial axis properties. Bio-Mimetic Control Research
Center, The Institute of Physical and Chemical Research (Riken), 2000.
[Cideciyan, 1995] − A. Cideciyan. Registration of ocular fundus images: an algorithm
using cross-correlation of triple invariant image descriptors. IEEE
Engineering in Medicine and Biology Magazine, vol. 14, no. 1, pp. 52-58,
1995.
57
REFERÊNCIAS
_____________________________________________________________________________________
[Cohen, 1997] − S. Cohen, L. Guibas. Partial matching of planar polylines under
similarity transformations. Proceeding of the 8th Annual Symposium on
Discrete Algorithms, pp. 777-786, 1997.
[Collignon, 1995] − A. Collignon, F. Maes, D. Delaere, D. Vandermeulen, P. Suetens,
G. Marchal. Automated multi-modality image registration based on
information theory. Information Processing in Medical Imaging, Y. Bizais, C.
Barillot, and R. Di Paola, Eds., pp. 263-274, Kluwer Academic Publishers,
Dordrecht, Netherlands, 1995.
[Collignon, 1998] − A. Collignon. Multi-modality medical image registration by
maximization of mutual information. PhD. Thesis, Catholic University of
Leuven, Leuven, Belgium, 1998.
[Cootes, 1992] − T. Cootes, C. Taylor. Active shape models – smart snakes.
Proceedings of the British Machine Vision Conference, Leeds, 1992.
[Cvejic, 2006] − N. Cvejic, C N. Cangarajah, D. R. Bull. Image fusion metric based on
mutual information and Tsallis entropy. Electronics Letters, vol. 42, no. 11, pp.
626-627, 2006.
[Dorst, 2005] − Leo Dorst. First order error propagation of the Procrustes method for
3D attitude estimation. IEEE Transactions on Pattern Analysis and Machine
Intelligence, vol. 27, no. 2, pp. 221-229, February 2005.
[Elsen, 1993] − Petra A. van Elsen, Evert-Jan D. Pol, Max A. Viergever. Medical image
matching − a review with classification. IEEE Engineering in Medicine and
Biology, vol. 12, no. 1, pp. 26-39, March 1993.
[Fielding, 2000] − G. Fielding, M. Kam. Weighted matching for dense stereo
correspondence. Pattern Recognition, vol. 33, no. 9, pp. 1511-1524, 2000.
[Fischler, 1981] − M. Fischler, R. Bolles. Random sample consensus: a paradigm for
model fitting with applications to image analysis and automated cartography.
Comm. of the ACM, 1981, vol. 24, pp. 381-395, 1981.
58
REFERÊNCIAS
_____________________________________________________________________________________
[Fitch, 2005] − A. Fitch, A. Kadyrov, W. Christmas, J. Kittler. Fast robust correlation.
IEEE Transactions on Image Processing, vol. 14, no. 8, pp. 1063-1073, 2005.
[Fitzpatrick, 1998] − J. Fitzpatrick, J. West, C. Maurer. Predicting error in rigid-body,
point-based registration. IEEE Transactions on Medical Imaging, vol. 17, pp.
694-702, 1998.
[Foroosh, 2002] − H. Foroosh, J. B. Zerubia, M. Berthod. Extension of phase
correlation to subpixel registration. IEEE Transactions on Image Processing,
vol. 11, no. 3, pp. 188-200, March 2002.
[Friston, 1995] − K. J. Friston, J. Ashburner, J. B. Poline, C. D. Frith, J. D. Heather, R.
S. J. Frackowiak. Spatial registration and normalization of images. Human
Brain Mapping, vol. 2, pp. 165-189, 1995.
[Gonçalves, 2008] − P. Gonçalves, J. Tavares, R Jorge. Segmentation and simulation of
objects represented in images using physical principles. CMES: Computer
Modeling in Engineering & Sciences, vol. 32, no. 1, pp. 45-55, 2008.
[Gonzalez, 2008] − R. Gonzalez, R. Woods. Digital image processing, Third Edition,
Prentice Hall, 2008.
[Grau, 2004] − V. Grau, A.U. J. Mewes, M. Alcaniz, R. Kikinis, S. K. Warfield.
Improved watershed transform for medical image segmentation using prior
information. IEEE Transactions on Medical Imaging, vol. 23, no. 4, pp. 447458, April 2004.
[Guimond, 2001] − A. Guimond, A. Roche, N. Ayache, J. Meunier. Three-dimensional
multimodal brain warping using the demons algorithm and adaptive intensity
corrections. IEEE Transactions on Medical Imaging, vol. 20, no. 1, pp. 58-69,
January 2001.
[Hajnal, 1995] − Joseph. V. Hajnal, N. Saeed, A. Oatridge, E. J. Williams, I. R. Young,
G. M. Bydder. Detection of subtle brain changes using subvoxel registration
and subtraction of serial MR images. Journal of Computer Assisted
Tomography, vol. 19, pp. 677-691, 1995.
59
REFERÊNCIAS
_____________________________________________________________________________________
[Hajnal, 2001] − Joseph V. Hajnal, Derek Hill, David J. Hawkes. Medical Image
Registration. CRC Press, 2001.
[Hamza, 2003] − Y. He, A. B. Hamza, H. Krim. A generalized divergence measure for
robust image registration. IEEE Transactions on Signal Processing, vol. 51,
no. 5, pp. 1211-1220, 2003.
[Hartley, 2003] − Richard Hartley, Andrew Zisserman. Multiple view geometry in
computer vision, Second Edition. Cambridge, 2003
[Hellier, 2004] − Pierre Hellier, Christian Barillot. A hierarchical parametric algorithm
for deformable multimodal image registration. Computer Methods and
Programs in Biomedicine vol. 75, no. 2, pp. 107-115, 2004.
[Jan, 2006] − Jiří Jan. Medical image processing, reconstruction and restoration:
concepts and methods. CRC Press - Taylor & Francis Group, 2006.
[Kass, 1988] − M. Kass, A. Witkin, D. Terzopoulos. Snakes: active contour models.
International Journal of Computer Vision, vol. 1, pp. 321-331, 1988.
[Kassan, 1996] − A. Kassam, M. L. Wood. Fourier registration of three-dimensional
brain MR images: exploiting the axis of rotation. Journal of Magnetic
Resonance Imaging, vol. 6, pp. 894-902, 1996.
[Keren, 2009] − D. Keren. A probabilistic method for point matching in the presence of
noise and degeneracy. Journal of Mathematical Imaging and Vision, vol. 33,
pp. 338-346, 2009.
[Kuglin, 1975] − C. D. Kuglin, D. C. Hines. The phase correlation image alignment
method. Proceedings International. Conference. Cybernetics and Society, pp.
163-165, 1975.
[Laliberté, 2003] − France Laliberté, Langis Gagnon, Yunlong Sheng. Registration and
fusion of retinal images − an evaluation study. IEEE Transactions on Medical
Imaging, vol. 22, no. 5, pp. 661-673, May 2003.
60
REFERÊNCIAS
_____________________________________________________________________________________
[Likar, 2000] − B. Likar, F. Pernus. A hierarchical approach to elastic registration
based on mutual information. Image and Vision Computing, vol. 19, pp. 33-44,
2000.
[Livyatan, 2003] − H. Livyatan, Z. Yaniv. Gradient-based 2-D/3-D rigid registration of
fluoroscopic X-ray to CT. IEEE Transactions on Medical Imaging, vol. 22, no.
11, pp. 1395-1406, November 2003.
[Loeckx, 2003] − D. Loeckx, F. Maes, D. Vandermeulen, P. Suetens. Temporal
subtraction of thorax CR images Uusing a statistical deformation model. IEEE
Transactions on Medical Imaging, vol. 22, no. 11, November 2003.
[Lucas, 1981] − B. Lucas, T. Kanade. An interative image registration technique with
an application to stereo vision. Proceedings Imaging Understanding
Workshop, 1988, pp. 121-130.
[Ma, 2009] − Zhen Ma, J. Tavares, R. Jorge, T. Mascarenhas. A review of algorithms
for medical image segmentation and their applications to the female pelvic
cavity. Computer Methods in Biomechanics and Biomedical Engineering, DOI:
10.1080/10255840903131878, 2009 (in press).
[Maciel, 2003] − J. Maciel, J. Costeira. A global solution to sparse correspondence
problems. IEEE Transactions on Pattern Analysis and Machine Intelligence,
vol. 25, no. 2, pp. 187-199, 2003.
[Maes, 1997] − F. Maes, A. Collignon, D. Vandermeulen, G. Marchal, P. Suetens.
Multi-modality medical image registration by maximization of mutual
information. IEEE Transactions on Medical Imaging, vol. 16, no. 2, pp. 187198, 1997.
[Maintz, 1996] − J. B. A. Maintz, P. A. van Elsen, M. A. Viergever. Evaluation of ridge
seeking operators for multimodality medical image matching. IEEE
Transactions on Pattern Analysis and Machine Intelligence, vol. 18, no. 4, 353365, 1996.
61
REFERÊNCIAS
_____________________________________________________________________________________
[Maintz, 1998] − J. B. A. Maintz, M. A. Viergever. A survey of medical image
registration. Medical Image Analysis, Oxford, vol. 2, no. 1, pp. 1-36, 1998.
[Marr, 1980] − D. Marr, E. Hildreth. Theory of edge detection. Proceedings of the Royal
Society of London. Series B, Biological Sciences, vol. 207, no. 1167, pp. 187217, February, 1980.
[Martin, 2004] − S. Martin, G. Morison, W. Nailon, T. Durrani. Fast and accurate
image registration using Tsallis entropy and simultaneous perturbation
stochastic approximation. Electronics Letters, vol. 40, no. 10, pp. 595-597,
2004.
[Matsopoulos, 2004] − George K. Matsopoulos, Pantelis A. Asvestas, Nikolaos A.
Mouravliansky, Konstantinos K. Delibasis. Multimodal registration of retinal
images using self organizing maps. IEEE Transactions on Medical Imaging,
vol. 23, no. 12, December 2004.
[McLaughlin, 2005] − Robert A. McLaughlin, John Hipwell, David J. Hawkes, J.
Alison Noble, James V. Byrne, Tim C. Cox. A Comparison of a similaritybased
and
a
feature-Based
2-D–3-D
registration
method
for
neurointerventional use. IEEE Transactions on Medical Imaging, vol. 24, no.
8, August 2005.
[Moisan, 2004] − L. Moisan, S. Bérenger. A probabilistic criterion to detect rigid point
matches between two images and estimate the fundamental matrix.
International Journal of Computer Vision, vol. 57, no. 3, pp. 201-218, 2004.
[Monteiro, 2007] − Fernando J. C. Monteiro. Region-based spatial and temporal image
segmentation. PhD Thesis, Faculdade de Engenharia da Universidade do Porto,
2007.
[Oliveira, 2008] − Francisco P. M. Oliveira, João Manuel R. S. Tavares. Algorithm of
dynamic programming for optimization of the global matching between two
contours defined by ordered points. CMES: Computer Modeling in
Engineering & Sciences, vol. 31, no. 1, pp. 1-11, 2008.
62
REFERÊNCIAS
_____________________________________________________________________________________
[Oliveira, 2009a] − Francisco P. M. Oliveira, João Manuel R. S. Tavares. Matching
contours in images through the use of curvature, distance to centroid and
global optimization with order-preserving constraint. CMES: Computer
Modeling in Engineering & Sciences, vol. 43, no. 1, pp. 91-110, 2009.
[Oliveira, 2009b] − Francisco P. M. Oliveira, João Manuel R. S. Tavares, Todd C.
Paraky. Rapid pedobarographic image registration based on contour curvature
and optimization. Journal of Biomechanics (aceite).
[Oliveira, 2009c] − Francisco P. M. Oliveira, João Manuel R. S. Tavares, Todd C.
Pataky. A versatile matching algorithm based on dynamic programming with
circular order preserving. VIPimage 2009 – II ECCOMAS Thematic
Conference on Computational Vision and Medical Image Processing, Porto,
Portugal, 14-16 October, 2009 (aceite).
[Orchard, 2005] − Jeff Orchard. Efficient global weighted least-squares translation
registration in the frequency domain. Proceedings of International Conference
Image Analysis and Recognition ICIAR, 2005, Toronto, Canada, vol. 3656, pp.
116-124.
[Orchard, 2007a] − Jeff Orchard. Globally optimal multimodal rigid registration: an
analytic solution using edge information. Proceedings of IEEE International
Conference on Image Processing, 2007, vol. 1, pp. I – 485-488.
[Orchard, 2007b] − Jeff Orchard. Efficient least squares multimodal registration with a
globally exhaustive alignment search. IEEE Transactions on Image Processing,
vol. 16, no. 10, October 2007.
[Otsu, 1979] − Nobuyuki Otsu. A threshold selection method from gray-level histogram.
IEEE Transactions on Systems Man Cybernetics, vol. 9, pp. 62-66, 1979.
[Otterloo, 1991] − P. Otterloo. A contour-oriented approach to shape analysis, Prentice
Hall International (UK) Ltd, Englewood Cliffs, NJ, pp. 90-108, 1991.
63
REFERÊNCIAS
_____________________________________________________________________________________
[Penney, 1998] − G. P. Penney, J. Weese, J. A. Little, P. Desmedt, D. L. G. Hill, D. J.
Hawkes. A comparison of similarity measures for use in 2-D-3-D medical
image registration. IEEE Transactions on Medical Imaging, vol. 17, no. 4, pp.
586–595, August 1998.
[Periaswamy, 2003] − S. Periaswamy, H. Farid. Elastic registration in the presence of
intensity variations. IEEE Transactions on Medical Imaging, vol. 22, no. 7, pp.
865-874, July 2003.
[Pluim, 2003a] − Josien P. W. Pluim, J. Michael Fitzpatrick. Image registration. IEEE
Transactions on Medical Imaging, vol. 22, no. 11, pp. 1341-1343, 2003.
[Pluim, 2003b] − Josien P. W. Pluim, J. B. Antoine Maintz, Max A. Viergever. Mutual
information based registration of medical images: a survey. IEEE Transactions
on Medical Imaging, vol. 22, no. 8, pp. 986-1004, 2003.
[Pluim, 2004] − Josien P. W. Pluim, J. B. Antoine Maintz, Max A. Viergever. fInformation measures in medical image registration. IEEE Transactions on
Medical Imaging, vol. 23, no. 12, pp. 1508-1516, December 2004
[Press, 2002] − William H. Press, Saul A. Teukolsky, William T. Vetterling, Brian P.
Flannery. Numerical recipes in C: the art of scientific computing. Cambridge
University Press, 2002.
[Prince, 2006] − Jerry L. Prince, Jonathan M. Links. Medical imaging signals and
systems. Pearson Prentice Hall Bioengineering, 2006.
[Reddy, 1996] − B. Reddy, B. Chatterji. An FFT-based technique for translation,
rotation, and scale-invariant image registration. IEEE Transactions on Image
Processing, vol. 5, no. 8, pp. 1266-1271, August 1996.
[Roy, 1998] − S. Roy, I. Cox. A maximum-flow formulation of the n-camera stereo
correspondence problem. IEEE Proceedings of International Conference on
Computer Vision, Bombai, January, 1998.
64
REFERÊNCIAS
_____________________________________________________________________________________
[Sclaroff, 1995] − S. Sclaroff, A. Pentland. Modal matching for correspondence and
recognition. IEEE Transactions on Pattern Analysis and Machine Intelligence,
vol. 17, no. 6, pp. 545-561, 1995.
[Scott, 1991] − G. Scott, H. Longuet-Higgins. An algorithm for associating the features
of two patterns. Proc Roy Soc Lond, vol. B244, pp. 21-26, 1991.
[Scott, 2006] − C. Scott, R. Nowak. Robust contour matching via the order-preserving
assignment problem. IEEE Transactions on Image Processing, vol. 15, no. 7,
pp. 1831-1838, 2006.
[Sebastian, 2004] – Thomas B. Sebastian, Philip N. Klein, Benjamin B. Kimia.
Recognition of shape by editing their shock graphs. IEEE Transactions on
Pattern Analysis and Machine Intelligence, vol. 26, no. 5, May 2004.
[Shannon, 1948] − C. E. Shannon. The mathematical theory of communication (parts 1
and 2), Bell Syst. Tech. J., vol. 27, pp. 379-423&623-656, 1948.
[Shapiro, 1992] − L. Shapiro, M. Brady. Feature-based correspondence: an eigenvector
approach. Image and Vision Computing, vol. 10, no. 5, pp. 283-288, 1992.
[Shekhar, 2002] − R. Shekhar, V. Zagrodsky. Mutual information-based rigid and
nonrigid registration of ultrasound volumes. IEEE Transactions on Medical
Imaging, vol. 21, no. 1, pp. 9-22, 2002.
[Solaiyappan, 2000] − M. Solaiyappan, S. Gupta. Predictive registration of cardiac MR
perfusion images using geometric invariants. Proceedings of ISMRM 2000,
Denver, Colorado, USA, vol. 1, pp. 37, 2000.
[Starink, 1995] − J. Starink, E. Backer. Finding point correspondences using simulated
annealing. Pattern Recognition, vol. 8, no. 2, pp. 231-240, 1995.
[Studholme, 1999] − C Studholme, D. G. Hill, D. J. Hawkes. An overlap invariant
entropy measure of 3D medical image alignment. Pattern Recognition, vol. 32,
no. 1, pp. 71-86, January 1999.
65
REFERÊNCIAS
_____________________________________________________________________________________
[Sun, 2007] − Shaoyan Sun, Liwei Zhang, Chonghui Guo. Medical image registration
by minimizing divergence measure based on Tsallis entropy. International
Journal of Biological and Medical Sciences vol. 2, no. 2, pp. 75-80, 2007.
[Tavares, 2000] − J. Tavares, J. Barbosa, A. Padilha, Matching image objects in
dynamic pedobarography, RecPad 2000, 11th Portuguese Conference on
Pattern Recognition, Porto, Portugal, 2000.
[Tavares, 2007] − J. Tavares, F. Carvalho, F. Oliveira, M. Vasconcelos, P. Gonçalves,
R. Pinho. Computer analysis of objects’ movement in image sequences:
methods and applications. DSM 2007 – Conferência Nacional de Dinâmica de
Sistemas Multicorpo, ISBN: 978-989-20-0968-1, pp. 33-40, Guimarães,
Portugal, 6-7 Dezembro 2007.
[Tsallis, 1988] − C. Tsallis. Possible generalization of Boltzmann-Gibbs statistics. J.
Stat. Phys., vol. 52, pp. 479-487, 1988.
[Vasconcelos, 2008] − M. Vasconcelos, J. Tavares. Methods to automatically built point
distribution models for objects like hand palms and faces represented in
images. CMES: Computer Modeling in Engineering & Sciences, vol. 36, no. 3,
pp. 213-241, 2008.
[Viola, 1995a] − Paul Viola. Alignment by maximization of mutual information. PhD
Thesis, Massachusetts Institute of Technology, 1995.
[Viola, 1995b] − Paul Viola, William M. Wells III. Alignment by maximization of
mutual information. International Conference on Computer Vision, E.
Grimson, S. Shafer, A. Blake, and K. Sugihara, Eds., pp. 16-23, IEEE
Computer Society Press, Los Alamitos, CA, 1995.
[Viola, 1997] − Paul Viola and William M. Wells III. Alignment by maximization of
mutual information. International Journal of Computer Vision, vol. 24, no. 2
pp. 137-154, 1997.
66
REFERÊNCIAS
_____________________________________________________________________________________
[Wachowiak, 2003] − M. P. Wachowiak, R. Smolikova, T. M. Peters. Multiresolution
biomedical image registration using generalized information measures.
Proceedings of Medical Image Computing and Computer Assisted Intervention
(MICCAI), pp. 846-853, Montréal, 2003.
[Wang, 2006] − S. Wang, M. Wang: Structural shape and topology optimization using
an implicit free boundary parametrization method. CMES: Computer
Modeling in Engineering & Sciences, vol. 13, no. 2, pp. 119-147, 2006.
[Wang, 2007] − S. Wang, K. Lim, B. Khoo, M. Wang. A geometric deformation
constrained level set method for structural shape and topology optimization.
CMES: Computer Modeling in Engineering & Sciences, vol. 18, no. 3, pp.
155-181, 2007.
[Wellner, 1993] − Pierre Wellner. Adaptive thresholding for the digital desk. Rank
Xerox Technical Report EPC-1993-110, 1993.
[Wells, 1995] − William M. Wells III, Paul Viola, R. Kikinis. Multi-modal volume
registration by maximization of mutual information. Medical Robotics and
Computer Assisted Surgery, pp. 55-62, John Wiley & Sons, New York, 1995.
[Wiles, 2008] − Andrew D. Wiles, Alexander Likholyot, Donald D. Frantz, Terry M.
Peters. A statistical model for point-based target registration error with
anisotropic fiducial localizer error. IEEE Transactions on Medical Imaging,
vol. 27, no. 3, March 2008.
[Wolberg, 2000] − G. Wolberg, S. Zokai. Robust image registration using log-polar
transform. Proceedings of International Conference on Image Processing,
2000, vol. 1, pp. 493-496, 2000.
[Wong, 2006a] − Alexander Wong, William Bishop, Jeff Orchard. Efficient multi-modal
least-squares alignment of medical images using quasi-orientation maps.
Proceedings of the 2006 International Conference on Image Processing,
Computer Vision, & Pattern Recognition, Las Vegas, Nevada, USA, June 2629, 2006.
67
REFERÊNCIAS
_____________________________________________________________________________________
[Wong, 2006b] − Alexander Wong, Jeff Orchard. Efficient and robust non-rigid leastsquares rectification of medical images. Proceedings of the 2006 International
Conference on Image Processing, Computer Vision, & Pattern Recognition,
Las Vegas, Nevada, USA, June 26-29, 2006
[Woods, 1998] − R. P. Woods, S. T. Grafton, C. J. Holmes, S. R. Cherry, J. C.
Mazziotta. Automated image registration: I. general methods and intrasubject,
intramodality validation. Journal of Computer Assisted Tomography, vol. 22,
pp. 139-152, 1998.
[Wu, 1995] − M. Wu, J. Leou. A bipartite matching approach to feature
correspondence in stereo vision. Pattern Recognition Letters, vol. 16, pp. 2331, 1995.
[Xu, 1998] − C. Xu, J. Prince. Snakes, shapes, and gradient vector flow. IEEE
Transactions on Image Processing, vol. 7, no. 3, pp. 359-369, 1998.
[Zhang, 2001] − Y. Zhang. A review of recent evaluation methods for image
segmentation. Sixth International Symposium on Signal Processing and its
Applications, Kuala Lumpur, Malaysia: IEEE, 2001.
[Zhang, 2004] − D. Zhang, G. Lu. Review of shape representation and description
techniques. Pattern Recognition, vol. 37, pp. 1-19, 2004.
[Zhu, 1996] – Song Chun Zhu, A. L. Yuille. FORMS: Flexible object recognition and
modeling system. International Journal of Computer Vision, vol. 20, n. 3,
December 1996.
[Zitová, 2003] − Barbara Zitová, Jan Flusser. Image registration methods: a survey.
Image and Vision Computing, vol. 21, pp. 977-1000, 2003.
68
Download