Faculdade de Engenharia da Universidade do Porto Programa Doutoral em Engenharia Biomédica 2008/2009 Disciplina: Monografia Emparelhamento e Alinhamento de Estruturas em Visão Computacional: Aplicações em Imagens Médicas Francisco Paulo Marques de Oliveira Orientador: Prof. João Manuel R. S. Tavares Prof. Auxiliar do Departamento de Engenharia Mecânica Faculdade de Engenharia da Universidade do Porto Gab. M205 Tel. 225081487 Email: [email protected] URL: http://www.fe.up.pt/~tavares Co-orientador: Doutor Prof. Durval C. Costa HPP-Medicina Molecular, SA Email: [email protected] ii Resumo O tema central desta Monografia relaciona-se com o emparelhamento e alinhamento de estruturas em imagens (2D/3D); nomeadamente, em imagens médicas, uma das áreas da Visão Computacional com maior potencial e relevo. O principal objectivo que se pretendeu alcançar com a sua realização foi o estudo e análise de técnicas de alinhamento de imagem que poderão vir a ser usadas no âmbito do projecto de Doutoramento em Engenharia Biomédica em perspectiva. Deste modo, este estudo pode ser considerado como uma primeira introdução ao tema da Tese de Doutoramento definida. O primeiro capítulo desta Monografia é dedicado à introdução. Atendendo que o trabalho de Doutoramento previsto incidirá essencialmente sobre o alinhamento de imagens médicas, os principais equipamentos de aquisição e os seus princípios básicos de funcionamento são abordados no segundo capítulo; nomeadamente, o raio X, a tomografia computorizada, a ressonância magnética, a imagiologia nuclear a ultra-sonografia. No terceiro capítulo é realizado um estudo sobre algumas das metodologias frequentemente usadas no alinhamento de imagens, dando-se especial relevo às mais usadas no alinhamento de imagens médicas. O estudo exposto aborda as principais fases/processos de alinhamento: em particular, transformações geométricas, emparelhamento, técnicas de optimização e medidas de similaridade. As metodologias apresentadas foram classificadas em dois grandes grupos: baseadas na geometria, isto é, com base no emparelhamento de estruturas ou marcadores obtidos das imagens; e baseadas na intensidade da imagem, ou seja, uma abordagem mais ligada ao sinal que representa a distribuição da intensidade dos píxeis na imagem. Finalmente, esta Monografia encerra com um capítulo dedicado às conclusões e proposta de trabalho futuro no âmbito da Tese de Doutoramento prevista. iii Índice 1 Introdução e estrutura da Monografia .......................................................................... 1 1.1 Apresentação .......................................................................................................... 1 1.2 Estrutura da Monografia ......................................................................................... 2 2 Tecnologias/equipamentos de aquisição de imagens médicas ..................................... 4 2.1 Introdução ............................................................................................................... 4 2.2 Raio X ..................................................................................................................... 5 2.2.1 Radiografia convencional ................................................................................ 5 2.2.2 Angiografia ...................................................................................................... 6 2.2.3 Tomografia computorizada.............................................................................. 7 2.3 Ressonância magnética nuclear .............................................................................. 9 2.4 Imagiologia nuclear .............................................................................................. 13 2.5 Ultra-sonografia .................................................................................................... 15 2.6 Outros equipamentos ............................................................................................ 16 3 Alinhamento de imagens médicas .............................................................................. 18 3.1 Introdução ............................................................................................................. 18 3.2 Classificação dos algoritmos ................................................................................ 20 3.2 Metodologias baseadas na geometria ................................................................... 23 3.2.1 Alinhamento baseado na correspondência entre pontos ................................ 23 3.2.1.1 Emparelhamento ..................................................................................... 23 3.2.1.2 Determinação da transformação geométrica .......................................... 25 3.2.1.2.1 Transformação de similaridade baseada na correspondência entre iv ÍNDICE _____________________________________________________________________________________ dois segmentos de recta .................................................................................. 26 3.2.1.2.2 Transformação rígida ou afim usando decomposição em valores singulares e mínimos quadrados ..................................................................... 27 3.2.1.2.4 Transformação de similaridade no plano complexo ........................ 28 3.2.1.2.5 Método de eliminação de outliers: algoritmo RANSAC ................. 29 3.2.1.3 Transformação usando coordenadas homogéneas .................................. 30 3.2.2 Eixos principais ............................................................................................. 32 3.2.3 Aproximação pontual iterativa ...................................................................... 33 3.3 Metodologias baseadas em intensidade ................................................................ 35 3.3.1 Domínio espacial ........................................................................................... 35 3.3.1.1 Estratégias dos algoritmos de optimização............................................. 35 3.3.1.2 Medidas de similaridade ......................................................................... 41 3.3.1.2.1 Soma dos quadrados das diferenças ................................................ 42 3.3.1.2.2 Correlação cruzada .......................................................................... 43 3.3.1.2.3 Entropia conjunta............................................................................. 43 3.3.1.2.4 Informação mútua ............................................................................ 45 3.3.2 Domínio das frequências ............................................................................... 47 3.4 Conclusões ............................................................................................................ 52 4 Conclusões finais e perspectivas de trabalho futuro ................................................... 53 4.1 Conclusões ............................................................................................................ 53 4.2 Perspectivas de trabalho para a Tese de Doutoramento ....................................... 53 Referências ..................................................................................................................... 56 v Índice de figuras Figura 2.1: Esquema básico de obtenção de imagens de raio X (adaptado de [Jan, 2006]). .............................................................................................................................. 6 Figura 2.2: Esquema simplificado da projecção dos raios X sobre o corpo dos pacientes nos equipamentos de tomografia computorizada de terceira geração (adaptado de [Jan, 2006]). .............................................................................................................................. 8 Figura 2.3: Esquema de funcionamento de um scanner de CT helicoidal (obtida de [Jan, 2006]). .............................................................................................................................. 9 Figura 2.4: À esquerda, uma representação do spin com momento magnético μ quando sujeito a um campo magnético externo B0. À direita, esquema da magnetização resultante, M. A razão entre o número de spins com orientação paralela e anti-paralela é dada pela equação de Boltzman (adaptado de [Block, 2006]). ..................................... 10 Figura 2.5: Esquema do princípio de funcionamento de um equipamento de MRI: a bobine principal orientada segundo um dos eixos e as outras duas bobines laterais orientadas segundo os outros dois eixos (obtida de [Jan, 2006]). ................................. 12 Figura 2.6: Esquema simplificado da obtenção de imagens em imagiologia nuclear convencional (adaptado de [Jan, 2006]). ........................................................................ 14 Figura 2.7: Imagem de um paciente obtida usando um equipamento de PET (obtida de [Gonzalez, 2008]). .......................................................................................................... 15 Figura 2.8: Imagem de ultra-sonografia de um feto (obtida de [Gonzalez, 2008]). ....... 16 Figura 2.9: Esquema de um equipamento óptico de aquisição de imagens de pedobarografia (adaptado de [Tavares, 2000]). ............................................................. 17 Figura 3.1: Na linha superior, duas imagens de pedobarografia, os respectivos centróides e eixos principais. Na linha inferior, do lado esquerdo as duas mesmas imagens sobrepostas antes do alinhamento e do lado direito as duas imagens após o vi ÍNDICE DE FIGURAS _____________________________________________________________________________________ alinhamento usando e metodologia baseada nos eixos principais. (As cores das imagens foram modificadas para facilitar a sua visualização.)..................................................... 34 Figura 3.2: Duas imagens e os seus histogramas conjuntos: (a) imagem de raio X do peito; (b) a mesma imagem de raio X após uma pequena translação vertical; (d) representação plana do histograma conjunto da imagem (a) com ela própria; (c) representação plana do histograma conjunto da imagem (a) com a imagem (b); (e) representação 3D do histograma conjunto das imagens (a) e (b). .................................. 45 Figura 3.3: Por linha, três sequências de imagens exemplo: Da esquerda para a direita: imagens originais no domínio espacial, espectro das imagens no domínio das frequências e finalmente a fase das imagens no domínio das frequências. .................... 49 Figura 3.4: Exemplo de uma imagem obtida determinando a correlação de fases directamente. A posição do ponto mais claro indica a translação da imagem a alinhar relativamente à imagem modelo. .................................................................................... 50 Figura 3.5: Alinhamento de duas imagens de CT da cabeça: Na linha superior, duas imagens originais; na linha à inferior, à esquerda as duas imagens sobrepostas antes do alinhamento e à direita as mesmas após o alinhamento. (A imagem modelo foi representada em tons de azul e a imagem a alinhar em tons de vermelho para facilitar a visualização.) .................................................................................................................. 51 vii CAPÍTULO I Introdução e estrutura da Monografia 1.1 Apresentação Esta Monografia relaciona-se essencialmente com o emparelhamento e alinhamento de estruturas em imagens (2D/3D); nomeadamente, em imagens médicas, uma das áreas da Visão Computacional com maior potencial e relevo. Na literatura, por vezes os termos matching e registration são usados como sinónimos quando aplicados a imagens. Neste trabalho, considera-se emparelhamento (matching) como sendo o processo de estabelecimento de correspondências. Por alinhamento (registration), considera-se o processo de transformação do sistema de coordenadas de uma imagem de modo que estruturas homólogas passem a ter as mesmas coordenadas relativamente ao sistema de coordenadas considerado. Com base num alinhamento que se tenha definido, as correspondências entre as diversas estruturas representadas nas imagens alinhadas fica automaticamente estabelecida, quer estas estruturas tenham sido identificadas ou não. No entanto, o estabelecimento de correspondências entre estruturas representadas em duas imagens não define automaticamente a correspondência entre os píxeis. Além disso, as correspondências entre píxeis dependem do tipo de transformação geométrica considerada. Na área médica, o emparelhamento e alinhamento de imagens têm diversas aplicações, nomeadamente, fusão de informação obtida de diferentes modalidades; monitorização do tamanho, forma e variação ao longo do tempo de órgãos; preparação de intervenções cirúrgicas; comparação com uma base de dados; estabelecimento de correspondências 1 CAPÍTULO I − INTRODUÇÃO E ESTRUTURA DA MONOGRAFIA _____________________________________________________________________________________ com modelos virtuais; etc., [Hajnal, 2001]. Há vários critérios de classificação dos métodos de alinhamento de imagem médica, por exemplo, em [Maintz, 1998] são usados nove critérios distintos. Uma classificação comum é: baseados em características geométricas ou físicas das estruturas a alinhar (como pontos, contornos, curvas ou superfícies) e baseados em intensidade ou sinal (usualmente associados à utilização de uma medida de similaridade com base na comparação da intensidade dos píxeis correspondentes), [Hajnal, 2001]. Os métodos baseados em características geométricas ou físicas precisam de determinar essas características nas imagens a alinhar e depois realizar o emparelhamento entre as mesmas, o que permitirá posteriormente estimar a transformação geométrica pretendida. Os métodos baseados em intensidade usualmente determinam a transformação envolvida directamente a partir das imagens, ou seja, aplicam transformações geométricas a uma das imagens no sentido de optimizar uma medida de similaridade, [Hajnal, 2001], [McLaughlin, 2005]. Além do estudo e análise de metodologias de alinhamento de imagens, nesta Monografia é também realizada uma breve apresentação de algumas das principais técnicas de imagiologia. 1.2 Estrutura da Monografia Os objectivos desta Monografia são essencialmente: introduzir o tema definido para a Tese de Doutoramento prevista e apresentar algumas possíveis linhas de trabalho e serem seguidas tendo em vista a consecução dos objectivos delineados para a mesma. O trabalho aqui apresentado pode ser resumido em dois temas principais: estudo das principais técnicas existentes para a recolha de imagem médica e estudo de metodologias de emparelhamento e alinhamento de imagens médicas. Assim, esta Monografia, além deste capítulo, está dividida em mais três capítulos: Capítulo 2 − Tecnologias/equipamentos de aquisição de imagens médicas Neste capítulo é feita uma breve referência às principais técnicas de imagiologia usadas na actualidade. É dada uma breve explicação dos seus fundamentos e processos de construção das imagens, não sendo abordadas questões técnicas. Sempre que pertinente, é realizada uma comparação entre as técnicas de aquisição de imagem referidas. 2 CAPÍTULO I − INTRODUÇÃO E ESTRUTURA DA MONOGRAFIA _____________________________________________________________________________________ Capítulo 3 − Alinhamento de imagens médicas Neste capítulo é realizado um estudo sobre algumas metodologias de emparelhamento e alinhamento de imagens médicas. São também apresentados alguns exemplos de alinhamento usando metodologias que entretanto foram desenvolvidas ou implementadas. A ênfase não foi colocada num estudo exaustivo das técnicas e trabalhos realizados neste domínio, mas sim nas ideias base de algumas das metodologias mais comuns. Capítulo 4 − Conclusões finais e perspectivas de trabalho futuro Neste capítulo são analisados os resultados do trabalho desenvolvido. É também definida a estratégia a seguir para a elaboração da Tese de Doutoramento, assim como os objectivos que se desejam alcançar com a mesma. 3 CAPÍTULO II Tecnologias/equipamentos de aquisição de imagens médicas Neste capítulo é feita uma breve referência às principais técnicas de imagiologia usadas na actualidade. É dada uma breve explicação dos seus fundamentos e processos de construção das imagens adquiridas, não sendo abordadas questões técnicas. Sempre que pertinente, é realizada uma comparação entre as mesmas. 2.1 Introdução A imagiologia médica, conjunto de técnicas e sistemas de obtenção de imagens médicas, é actualmente indispensável no diagnóstico de inúmeras doenças (esclerose múltipla, Alzheimer, fracturas, cancros, aneurismas, etc.). Usualmente, na imagiologia médica consideram-se apenas as técnicas não invasivas, como por exemplo, o raio X, a tomografia computorizada, a ressonância magnética, a ultra-sonografia e a medicina nuclear, [Prince, 2006]. As técnicas de imagiologia podem ser divididas em anatómicas ou funcionais. As anatómicas são aquelas que essencialmente descrevem a morfologia, como por exemplo o raio X. As técnicas de imagiologia funcionais descrevem essencialmente informação do metabolismo, como por exemplo a medicina nuclear, [Maintz, 1998]. Alguns equipamentos actuais combinam os dois tipos de imagiologia, como é o caso dos scanners PET/CT (positron emission tomography / computed tomography). 4 CAPÍTULO II − TECNOLOGIAS/EQUIPAMENTOS DE AQUISIÇÃO DE IMAGENS MÉDICAS _____________________________________________________________________________________ 2.2 Raio X A imagem obtida recorrendo ao raio X é considerada a primeira modalidade de imagem médica. A sua descoberta remonta à última década do século XIX, quando Roentgen fazia experiência no seu laboratório com tubos de raios catódicos, [Jan, 2006], [Prince, 2006]. O seu funcionamento é facilmente compreensível e o método de obtenção das imagens é directo; isto é, não é necessário usar tecnologias de construção da imagem como em outras modalidades de imagiologia que serão referidas mais à frente. O raio X é uma onda electromagnética de natureza semelhante à da luz visível com comprimentos de onda menores do que os da radiação ultravioleta, na ordem de 5 pm a 1 nm. As ondas electromagnéticas do espectro do raio X, conforme o seu comprimento de onda, têm a particularidade de penetrarem mais ou menos facilmente a matéria e, por consequência, os tecidos. Deste modo, alguns tecidos são mais transparentes para essas radiações do que outros. Como o raio X não está dentro do espectro do visível, é necessário usar um material sensível ao mesmo para se poder observar a imagem. 2.2.1 Radiografia convencional A radiografia convencional é aquela que resulta directamente da aplicação do raio X sobre a região cujo interior se pretende visualizar, sendo a imagem captada directamente por uma película fotossensível, ou filme radiográfico, o qual, após ser revelado, dá origem à imagem. A figura 2.1 dá uma ideia do princípio básico de funcionamento desta técnica. Em equipamentos mais modernos, em vez de uma película fotográfica é usada uma tecnologia semelhante à das máquinas de fotográficas digitais (foto-sensores electrónicos). Deste modo, a imagem é directamente convertida para o formato digital, facilitando assim o seu tratamento e manipulação. Nas imagens de raio X, os diversos órgãos ou tecidos ficam representados sobrepostos, não sendo possível separá-los. No entanto, o conhecimento anatómico da estrutura sobre a qual incidem os raios X ajuda os médicos e radiologistas a fazerem essa separação mentalmente. 5 CAPÍTULO II − TECNOLOGIAS/EQUIPAMENTOS DE AQUISIÇÃO DE IMAGENS MÉDICAS _____________________________________________________________________________________ Figura 2.1: Esquema básico de obtenção de imagens de raio X (adaptado de [Jan, 2006]). Nos equipamentos convencionais de raio X, a imagem obtida sofre uma distorção geométrica, pois o ângulo de incidência dos raios X não é igual em toda a película ou placa sensora. Nos equipamentos analógicos a imagem não pode ser corrigida, mas nos equipamentos digitais tal operação pode ser facilmente efectuada, desde que conhecidos alguns parâmetros. 2.2.2 Angiografia A angiografia é uma tecnologia baseada nos raios X. A principal diferença consiste na injecção de produtos no paciente que façam aumentar o contraste das imagens. Usualmente, estes produtos são conhecidos simplesmente por contrastes. Esta técnica é usada para obter imagens de vasos sanguíneos. Sem a aplicação do contraste, as diferenças entre os tons de cinzento dos vasos sanguíneos e os restantes tecidos registados nas imagens são muito ténues. Ao injectar o contraste nos vasos sanguíneos que se pretendem visualizar, o contraste vai absorver mais radiação do que o sangue sem aditivos, pelo que na imagem obtida surge uma maior diferenciação entre os respectivos vasos sanguíneos e os restantes tecidos. Para melhor analisar as imagens obtidas, pode ser realizada uma subtracção entre a imagem obtida com o contraste e a imagem da mesma região sem o contraste. Assim 6 CAPÍTULO II − TECNOLOGIAS/EQUIPAMENTOS DE AQUISIÇÃO DE IMAGENS MÉDICAS _____________________________________________________________________________________ obtém-se uma imagem só com a diferença das duas, ou seja, os vasos sanguíneos. Esta técnica é chamada de angiografia subtractiva [Jan, 2006]. Naturalmente, para que a operação de subtracção possa ser realizada, é necessário que ambas as imagens estejam alinhadas, o que pode ser conseguido mais ou menos facilmente se o paciente ficar imóvel. Caso haja movimento do paciente, as imagens têm de ser previamente alinhadas por um qualquer processo, manual, automático ou semi-automático. O alinhamento puramente manual pode não permitir a obtenção de bons resultados, basta pensar na possibilidade de rotação do paciente. Assim, os sistemas automáticos ou semi-automáticos podem ser muito úteis para melhorar os resultados desta técnica. 2.2.3 Tomografia computorizada A tomografia computorizada de raios X foi a primeira modalidade tomográfica inteiramente baseada na reconstrução digital da imagem. O seu aparecimento veio modificar significativamente a imagiologia médica, [Jan, 2006]. É amplamente usada, pois apresenta boa resolução espacial e o processo de aquisição é rápido. Além disso, é muito versátil, adaptando-se à generalidade das situações. A sua principal desvantagem advém da utilização de radiação ionizante (raios X), a qual pode contribuir para um posterior aparecimento de lesões ou tumores nos pacientes. A Figura 2.2 apresenta o princípio de funcionamento dos equipamentos de tomografia de terceira geração, os actualmente mais utilizados, [Jan, 2006]. O foco dos raios X e os sensores rodam simultaneamente em função do ângulo θ. Deste modo, a distância entre o foco e os detectores é mantida e os raios incidem sempre perpendicularmente nos detectores. Para impedir que radiação dispersa possa incidir nos detectores, usam-se os collimators. Estes funcionam como filtros pois só permitem que os detectores sejam atingidos por radiação que lhes é perpendicular. Assim, consegue-se uma diminuição significativa do ruído da imagem. Usualmente, a fila de detectores é constituída por várias centenas ou milhares de detectores, [Jan, 2006]. O ângulo de abertura do foco tem que ser tal que permita que o feixe “varra” a região com a forma de uma fatia −slice− do corpo do paciente que se pretende observar. A rotação do equipamento em torno do paciente vai permitir a obtenção de um conjunto de dados diferentes da mesma slice em função do ângulo θ. Assim, combinando esta 7 CAPÍTULO II − TECNOLOGIAS/EQUIPAMENTOS DE AQUISIÇÃO DE IMAGENS MÉDICAS _____________________________________________________________________________________ informação com o ângulo correspondente, é possível reconstruir uma slice na totalidade. Para a obtenção de uma imagem tridimensional, é provocado um deslocamento do corpo em relação ao sistema foco-detectores. Deste modo, obtém-se uma série de slices espaçadas umas das outras segundo o valor pretendido. Usando um algoritmo computacional adequado, as slices são colocadas nas respectivas posições e renderizadas segundo um modelo 3D. Figura 2.2: Esquema simplificado da projecção dos raios X sobre o corpo dos pacientes nos equipamentos de tomografia computorizada de terceira geração (adaptado de [Jan, 2006]). Nos scanners helicoidais, em vez de se obter uma slice de cada vez, o processo de aquisição é contínuo. O foco emissor de raios X e os receptores estão continuamente em rotação em torno do paciente enquanto que este se desloca continuamente ao longo do eixo de rotação. Deste modo, o movimento relativo do sistema foco-detectores em relação ao paciente é helicoidal. Como resultado, a imagem 3D obtida tem essa forma, ao contrário dos outros sistemas em que a imagem 3D era definida por uma série de slices paralelas. Para obter slices paralelas e perpendiculares ao corpo do paciente, pode ser usada interpolação, [Jan, 2006]. A Figura 2.3 ilustra o funcionamento deste tipo de scanner. 8 CAPÍTULO II − TECNOLOGIAS/EQUIPAMENTOS DE AQUISIÇÃO DE IMAGENS MÉDICAS _____________________________________________________________________________________ Figura 2.3: Esquema de funcionamento de um scanner de CT helicoidal (obtida de [Jan, 2006]). 2.3 Ressonância magnética nuclear As imagens de ressonância magnética nuclear (NMR) resultam do fenómeno de ressonância magnética nuclear descoberto na década de 40 do século passado, [Jan, 2006], [Block, 2006]. De um modo simplificado, este fenómeno consiste na troca de energia entre partículas quando sujeitas a um campo magnético forte e uma irradiação por ondas, geralmente de radiofrequência (RF). Este fenómeno permite a identificação de alguns constituintes da matéria em análise e a sua localização, [Jan, 2006], [Block, 2006]. A designação de ressonância magnética nuclear (NMR) foi posteriormente substituída por imagiologia de ressonância magnética (MRI) para evitar a associação que o público em geral fazia com a radiação ionizante, [Block, 2006]. Nesta secção, apresentam-se os princípios básicos deste fenómeno que são considerados na imagiologia médica. Os núcleos dos átomos, além da sua carga positiva, têm também uma propriedade conhecida por spin, por analogia com a física clássica, [Block, 2006]. Para facilitar a compreensão desta propriedade, é comum interpretar-se a mesma como o movimento de rotação da partícula sobre ela mesma. Esta carga eléctrica em movimento cria um campo magnético. Este campo magnético vai ter um sentido, pelo que pode ser entendido como um dipolo. Na ausência de um campo magnético externo a orientação do spin é aleatória. Mas quando os núcleos com spin diferente de zero estão sujeitos a um campo magnético externo, estes tendem a alinhar-se na direcção desse campo. Podendo alinhar-se de 9 CAPÍTULO II − TECNOLOGIAS/EQUIPAMENTOS DE AQUISIÇÃO DE IMAGENS MÉDICAS _____________________________________________________________________________________ modo anti-paralelo, o que corresponde a um nível de energia mais alto, ou de modo paralelo, o que corresponde a um nível de energia mais baixo. A razão entre o número de núcleos que ficam orientados de modo paralelo ao campo magnético externo e os núcleos que ficam orientados de modo anti-paralelo com o campo magnético externo pode ser dado pela equação de probabilidade de Boltzman, [Jan, 2006],[Block, 2006]. Em MRI é possível usar qualquer núcleo com spin diferente de zero, o que possibilita fazer espectroscopia com base no fenómeno de ressonância magnética, mas por questões de abundância e distribuição em todo o corpo, em geral usa-se o hidrogénio. Os núcleos dos átomos de hidrogénio, constituídos por um só protão, têm spin diferente de zero, portanto têm tendência a alinhar-se pelo campo magnético externo. O conjunto dos núcleos de hidrogénio que se alinha paralelamente ao campo magnético externo, B0, por corresponder a uma energia mais baixa, é ligeiramente maior do que o conjunto dos que se alinham anti-paralelamente, obtendo-se assim uma magnetização resultante, M, diferente de zero e alinhada com o campo magnético externo, [Block, 2006]. A Figura 2.4 é uma representação simbólica da orientação dos núcleos de hidrogénio quando sujeitos a um campo magnético externo. Figura 2.4: À esquerda, uma representação do spin com momento magnético μ quando sujeito a um campo magnético externo B0. À direita, esquema da magnetização resultante, M. A razão entre o número de spins com orientação paralela e anti-paralela é dada pela equação de Boltzman (adaptado de [Block, 2006]). Assim, quando um ser humano é sujeito a um campo magnético forte, os núcleos dos átomos de hidrogénio tendem a ficar alinhados pelo campo magnético. A magnetização 10 CAPÍTULO II − TECNOLOGIAS/EQUIPAMENTOS DE AQUISIÇÃO DE IMAGENS MÉDICAS _____________________________________________________________________________________ resultante é proporcional ao número de protões existentes. Ao sujeitar o corpo a uma radiação electromagnética, podem acontecer duas situações, em função da frequência da radiação e da constituição dos núcleos da matéria: o corpo não absorve radiação ou absorve radiação. Um factor que condiciona a frequência da radiação que é absorvida pelos núcleos dos átomos é a intensidade do campo magnético a que estão sujeitos. Esta relação é dada pela equação de Larmor: ω =γ B, onde ω representa a frequência de Larmor, γ é a constante giromagnética que depende do tipo de núcleo e B é a magnitude do campo magnético. Assim, se um impulso electromagnético com a frequência de Larmor for aplicado aos núcleos, eles tendem a alterar o seu alinhamento, colocando-se em fase com a onda electromagnética. Quando tentam regressar ao estado de energia mais baixo, isto é, alinhados paralelamente com o campo magnético externo, libertam energia na frequência de Larmor. Assim, ao sujeitar o corpo a impulsos de 90º (ou outros) de uma onda electromagnética na frequência de Larmor, alguns núcleos absorvem essa energia pelo que mudam a direcção de rotação criando uma componente perpendicular, sendo esta medida por bobines transversais. Logo que o campo electromagnético é desligado verifica-se um decaimento do campo magnético transversal à medida que os núcleos tendem a libertar a energia absorvida na forma de radiação. Assim, após algum tempo, os núcleos voltam a estar alinhados pelo campo magnético externo. Situação análoga acontece com a aplicação de impulsos de 180º, que tem o efeito de inverter a direcção da magnetização resultante. Atendendo que a magnetização resultante é proporcional ao número de átomos de hidrogénio presentes, é possível fazer a discriminação entre vários tipos de tecido. Outro facto importante é que embora alguns tecidos doentes, por exemplo devido a tumores, e tecidos sãos tenham idêntica composição em termos de quantidade de núcleos de hidrogénio, e portanto idêntica magnetização resultante, estes tipos de tecidos têm tempos de decaimento diferentes, isto é, diferentes velocidades de regresso ao estado de equilíbrio. Assim, ajustando o scanner e medindo as velocidades de decaimento para os diversos impulsos de RF é possível diferenciar esses tecidos, [Block, 2006]. 11 CAPÍTULO II − TECNOLOGIAS/EQUIPAMENTOS DE AQUISIÇÃO DE IMAGENS MÉDICAS _____________________________________________________________________________________ Existem vários métodos para obter a localização espacial dos tecidos e assim permitir a criação de uma imagem. Nos equipamentos de MRI mais comuns, para seleccionar uma dada região, slice, ao mesmo tempo que é aplicado o impulso de RF, são ligadas bobines que são percorridas por corrente em sentido contrário à que origina o campo magnético base, [Jan, 2006]. Assim, a soma do campo magnético base com os campos magnéticos criados por estas bobines originam uma variação (gradiente) da intensidade do campo magnético resultante ao longo do corpo do paciente. A pequena variação conseguida na intensidade do campo magnético ao longo do corpo vai permitir que as diferentes regiões do corpo respondam de forma diferente aos impulsos de RF emitidos, pois como já referido, a frequência de Larmor depende da intensidade do campo magnético. Deste modo, através da frequência do sinal excitar apenas as regiões do corpo que se pretende. Provocando um gradiente no campo magnético ao longo das três direcções, x-y-z, é possível obter slices perpendiculares a qualquer um dos eixos. Este processo permite obter uma a uma a resposta individual de cada pequena região. Geralmente, este método não é usado por ser muito moroso. Na Figura 2.5 está ilustrado um esquema de um equipamento de MRI, no que diz respeito à colocação das bobines responsáveis pelo processo de controlo do campo magnético. Figura 2.5: Esquema do princípio de funcionamento de um equipamento de MRI: a bobine principal orientada segundo um dos eixos e as outras duas bobines laterais orientadas segundo os outros dois eixos (obtida de [Jan, 2006]). 12 CAPÍTULO II − TECNOLOGIAS/EQUIPAMENTOS DE AQUISIÇÃO DE IMAGENS MÉDICAS _____________________________________________________________________________________ Nos equipamentos de MRI actuais a imagem pode ser obtida slice a slice (2D) ou de uma só vez (3D), [Prince, 2006]. Com base na frequência de Larmor e usando a transformada de Fourier, é possível determinar localização individual de cada píxel através da frequência e da fase dos coeficientes de Fourier, [Block, 2006]. Uma característica importante dos equipamentos de MRI é o facto de usarem apenas campos magnéticos e ondas electromagnéticas na gama da frequência de Larmor (ondas de RF), sendo estas ondas não ionizantes. Deste modo, estes equipamentos são inócuos para o paciente. No entanto, podem causar danos ou provocar o mau funcionamento de equipamentos electrónicos, pelo que pacientes com pace-makers, por exemplo, não devem recorrer a este tipo de equipamento. 2.4 Imagiologia nuclear A imagiologia nuclear distingue-se das outras modalidades de imagiologia pelo facto de as imagens só poderem ser obtidas quando substâncias radioactivas apropriadas são administradas no corpo do paciente. Estas substâncias, que podem ser injectadas, ingeridas ou inaladas, são marcadores, tracers, e são compostas por radio-nuclídeos que emitem raios gama. A radiação emitida é então utilizada para a obtenção das imagens do corpo do paciente. Este processo começa com a administração ao paciente de substâncias radioactivas com curtos tempos de meia-vida. À medida que estas substâncias atingem a região que se pretende analisar e se alojam nela, vão libertando energia devido ao decaimento radioactivo. Os fotões de alta energia libertados devido ao decaimento radioactivo das substâncias administradas, como os raios gama, são capazes de atravessar os tecidos. Assim, usando equipamento adequado colocado no exterior do corpo do paciente, esta radiação é captada. Este processo permite a obtenção de dados em função do tempo. Deste modo, obtém-se informação da distribuição temporal das substâncias administradas e dos órgãos onde elas circulam ou se depositam. Os raios gama têm uma energia equivalente à dos raios X. Contudo, como nos equipamentos de imagiologia de raios gama a radioactividade das substâncias usadas é muito baixa, a intensidade dos raios gama produzidos é muito inferior à intensidade dos raios X utilizados nos equipamentos de radiologia convencional. 13 CAPÍTULO II − TECNOLOGIAS/EQUIPAMENTOS DE AQUISIÇÃO DE IMAGENS MÉDICAS _____________________________________________________________________________________ Nos equipamentos de raio X convencionais, o fluxo de fotões é contínuo, direccionado e de elevada intensidade, enquanto na imagiologia de raios gama a emissão de fotões é discreta e de baixa intensidade. Além disso, os fotões são emitidos em qualquer direcção, o que provoca uma grande dispersão dos mesmos. Estes factos contribuem para que a qualidade das imagens na imagiologia nuclear seja inferior à da radiografia convencional. No entanto, como a radiação ionizante a que o paciente é submetido na imagiologia nuclear é muito menor do que na radiografia convencional, as consequências negativas da exposição à radiação são portanto muito menores. A Figura 2.6 apresenta um esquema simplificado do processo de obtenção de imagens médicas em imagiologia nuclear convencional. Tal como através da projecção de raios X se criou a tomografia computorizada de raios X, também baseada nesta técnica de emissão de raios gama se desenvolveu tomografia computorizada de raios gama. Há dois tipos de tomografia baseados na emissão de raios gama: tomografia computorizada baseada apenas na emissão de fotões −single-photon emission computed tomography− (SPECT) e a tomografia de emissão de positrões −positron emission tomography− (PET). Figura 2.6: Esquema simplificado da obtenção de imagens em imagiologia nuclear convencional (adaptado de [Jan, 2006]). O princípio da SPECT é idêntico ao da CT de raios X, residindo a diferença essencialmente na fonte da radiação. O princípio da PET é diferente, pois as substâncias radioactivas administradas ao paciente ao decaírem radioactivamente provocam, entre outros elementos radioactivos, a emissão de positrões com uma certa energia cinética. 14 CAPÍTULO II − TECNOLOGIAS/EQUIPAMENTOS DE AQUISIÇÃO DE IMAGENS MÉDICAS _____________________________________________________________________________________ Este positrão ao embater com a matéria circundante é rapidamente anulado por um electrão próximo. Este processo origina a emissão de dois raios gama em sentidos opostos. O scanner do equipamento PET, em forma de anel, procura por detecções temporalmente coincidentes de raios gama em detectores opostos. Assim, quando tal acontecer, é possível determinar a linha que passa pela região onde a anulação do positrão pelo electrão ocorreu, [Pince, 2006], [Jan, 2006]. Combinando estes dados, é possível construir uma imagem da região onde estão as substâncias radioactivas que foram administradas. A Figura 2.7 é um exemplo de uma imagem obtida usando um equipamento PET. Figura 2.7: Imagem de um paciente obtida usando um equipamento de PET (obtida de [Gonzalez, 2008]). 2.5 Ultra-sonografia O princípio da ultra-sonografia baseia-se na emissão de impulsos sonoros (ondas mecânicas) à superfície da região do corpo que se pretende estudar e consequente medição do respectivo eco por um transdutor. O tempo que passa entre a emissão da onda e a recepção do eco permite determinar a profundidade do tecido reflector e a intensidade dá informação acerca da força do tecido reflector. Movendo rapidamente o transdutor ou fazendo um varrimento do mesmo pode-se construir uma imagem em tempo real da região em estudo. Alguns dos equipamentos de ultra-sonografia usam o efeito de Doppler para medir a 15 CAPÍTULO II − TECNOLOGIAS/EQUIPAMENTOS DE AQUISIÇÃO DE IMAGENS MÉDICAS _____________________________________________________________________________________ velocidade de movimento, por exemplo do sangue e do movimento do coração. O efeito Doppler caracteriza-se pela diferença entre a frequência do sinal reflectido em relação à frequência do sinal emitido. Este facto verifica-se quando o sinal é reflectido por objectos que estão em movimento relativamente à fonte emissora/receptora. Os equipamentos de ultra-sonografia usados para obtenção de imagens médicas são relativamente de baixo custo e totalmente inofensivos nas suas aplicações típicas, [Prince, 2006]; no entanto, a qualidade das imagens é inferior às obtidas em tomografia computorizada ou ressonância magnética. A Figura 2.8 é um exemplo de uma imagem de ultra-sonografia numa das suas aplicações mais comuns, a visualização de um feto no útero materno. Figura 2.8: Imagem de ultra-sonografia de um feto (obtida de [Gonzalez, 2008]). 2.6 Outros equipamentos Embora usualmente não incluídos no grupo dos equipamentos de imagiologia, há outros equipamentos com relevância para a aquisição de imagens com finalidades médicas. Como exemplos, pode-se referir a microscopia electrónica −electron microscopy−, as câmaras de infravermelhos e sensores de pressão. A microscopia óptica atinge o seu limite de resolução espacial para valores na ordem da fracção do micro milímetro devido ao comprimento de onda da luz visível. Assim, a 16 CAPÍTULO II − TECNOLOGIAS/EQUIPAMENTOS DE AQUISIÇÃO DE IMAGENS MÉDICAS _____________________________________________________________________________________ microscopia electrónica é uma extensão da microscopia óptica para permitir a visualização de estruturas muito pequenas, podendo ir até valores inferiores ao nano metro. A microscopia electrónica baseia-se na emissão de um feixe de electrões e na sua interacção com a matéria que se pretende visualizar. As câmaras de infravermelhos baseiam-se na detecção das ondas electromagnéticas do espectro do infravermelho que os corpos emitem. As imagens obtidas podem ser muito importantes pois permitem uma análise à distância da distribuição da temperatura no corpo do paciente. Deste modo, facilitam o diagnóstico de doenças e a detecção de regiões anómalas/doentes. Os sensores de pressão medem a força exercida por unidade de área e são frequentemente usados em pedobarografia. O paciente ao caminhar sobre um tapete onde estão incorporados sensores de pressão vai permitir a leitura de um conjunto de dados sobre a distribuição do seu peso ao longo do pé e a forma como coloca o mesmo. Usualmente, esta informação é convertida numa imagem sendo depois analisada pelos especialistas. Os dados obtidos podem depois ser um auxílio no diagnóstico do pé de diabético, na análise de postura, na análise de marcha e na elaboração de calçado com fins terapêuticos. Também há equipamentos sensores de pressão ópticos. Um sistema básico consiste numa placa de vidro ou acrílico polida de forma que a luz que lhe é aplicada seja reflectida internamente. A placa é coberta por uma ou duas camadas finas de plástico poroso nas regiões onde a pressão é exercida (Figura 2.9). O sistema, quando observado de baixo, na ausência de pressão é negro, mas quando é exercida pressão na parte de cima da camada de plástico, este adquire brilho nas áreas correspondentes, [Tavares, 2000]. Figura 2.9: Esquema de um equipamento óptico de aquisição de imagens de pedobarografia (adaptado de [Tavares, 2000]). 17 CAPÍTULO III Alinhamento de imagens médicas Neste capítulo é realizado um estudo sobre algumas das metodologias frequentemente usadas no alinhamento de imagem, especialmente as de origem médica. Embora sejam apresentados diversos critérios de classificação dos algoritmos de alinhamento, neste capítulo, a divisão é realizada em metodologias baseadas essencialmente na localização de características geométricas e metodologia baseadas essencialmente na intensidade. São apresentadas várias metodologias de cada tipo, abordados os princípios básicos das mesmas. As transformações geométricas permitidas no alinhamento e as medidas de similaridade utilizadas são também abordadas. 3.1 Introdução Alinhamento de imagens (normalmente referido como registration) é o processo de determinar a transformação geométrica que melhor sobrepõe duas imagens que têm uma região comum. Por outras palavras, é um processo de transformação do sistema de coordenadas de pelo menos uma das imagens de modo que estruturas homólogas das imagens a alinhar passem a ter as mesmas coordenadas relativamente ao sistema de coordenadas considerado. Deste modo, a correspondência entre os píxeis ou vóxeis (para imagens 3D) de uma imagem modelo ou referência ficam indexados aos píxeis da imagem que se pretende alinhar. Assim, o alinhamento é muitas vezes necessário para integrar informação obtida de diferentes equipamentos; detectar variações em imagens obtidas em diferentes intervalos de tempo ou sob diferentes condições; inferir 18 CAPÍTULO III − ALINHAMENTO DE IMAGENS MÉDICAS _____________________________________________________________________________________ informação de imagens 2D ou 3D em que a câmara ou o objecto se moveram; comparar as imagens com uma base de dados; reconhecimento automático de estruturas; etc. Em [Brown, 1992] e [Zitová, 2003] são apresentados dois dos primeiros estudos exaustivos sobre as técnicas de alinhamento de imagem. No alinhamento de imagens médicas, as imagens a alinhar são obtidas de pacientes através de equipamentos de imagiologia como o raio X, a tomografia computorizada (CT), a imagiologia de ressonância magnética (MRI), a tomografia de emissão de positrões (PET), a ultra-sonografia (US), etc. Este processo de alinhamento de imagens médicas apresenta vários desafios devido às diferentes realidades físicas dos equipamento utilizados, diferenças de posicionamento dos pacientes, variação dos parâmetros de aquisição, alterações sofridas pelas estruturas a analisar devido a doenças ou variações naturais ao longo do tempo, ou ainda devido a diferenças anatómicas entre diferentes indivíduos. Nos últimos anos a publicação de trabalhos relacionados com o alinhamento de imagem médica tem crescido de forma considerável, ocupando agora uma grande parte da investigação realizada em processamento e análise de imagem médica, como mostra o estudo apresentado em [Pluim, 2003a]. Conforme os equipamentos de imagiologia, as imagens obtidas podem ser 2D ou 3D (as imagens 3D são frequentemente referidas como volumes) o que levou ao desenvolvimento de técnicas de alinhamento específicas para cada tipo de imagem. O alinhamento de imagens é uma componente importante num largo número de aplicações, tais como, [Hajnal, 2001]: − Auxílio ao diagnóstico de patologias (por exemplo, comparando a imagens obtidas com as de base de dados, comparando imagens obtidas em diferentes instantes de tempo); − Integração de informação de diferentes modalidades (por exemplo, relacionando informação funcional obtida de um scanner PET com imagens de alta resolução obtidas com CT ou MRI); − Monitorização de alterações de tamanho, forma ou constituição de tecidos/órgãos ao longo do tempo; − Preparação de intervenções cirúrgicas e procedimentos radio-terapêuticos (por exemplo, determinando a localização de um tumor que poderá posteriormente ser 19 CAPÍTULO III − ALINHAMENTO DE IMAGENS MÉDICAS _____________________________________________________________________________________ eliminado com terapêutica adequada); − Relacionar as imagens de pré-operatório com os planos da cirurgia, realidade física do paciente, estruturas anatómicas, posição dos instrumentos cirúrgicos e a sala de operações durante uma cirurgia guiada por computador, [Livyatan, 2003]. Na secção seguinte é feita uma classificação das técnicas de alinhamento de imagem médica. Nas secções 3.3 e 3.4 são apresentadas algumas metodologias de alinhamento baseadas em características geométricas e na intensidade dos píxeis, respectivamente. O objectivo principal destas duas secções não é fazer um estudo exaustivo das técnicas de alinhamento existentes, mas sim apresentar algumas metodologias comuns, explicar como funcionam e apresentar algumas vantagens e desvantagens das mesmas. 3.2 Classificação dos algoritmos Na literatura, uma grande variedade de metodologias de alinhamento de imagens médicas tem sido apresentada. Podem ser utilizados diversos critérios para classificar essas metodologias, dependendo das características consideradas. Seguindo a classificação feita em [Elsen, 1993], as técnicas de alinhamento podem ser divididas pela dimensionalidade (1D, 2D, 3D), origem das propriedades da imagem (marcadores intrínsecos ou extrínsecos ao paciente), domínio da transformação geométrica (local ou global); elasticidade da transformação geométrica (rígida, projectiva, curvada, etc.); rigidez do emparelhamento (interpolação ou aproximação); determinação dos parâmetros (directo ou baseado em procura orientada) e interacção (interactivos, semiautomáticos ou automáticos). Em [Maintz, 1998] a classificação realizada em [Elsen, 1993] foi consideravelmente estendida e detalhada. Maintz usou nove critérios básicos sendo que cada um deles foi ainda subdividido em um ou mais níveis. Os nove critérios considerados são: dimensionalidade, base do alinhamento, natureza da transformação, domínio da transformação, interacção, procedimento de optimização, modalidades envolvidas, sujeitos, e objectos. Na Tabela 1 é apresentada informação mais pormenorizada sobre estes critérios. Uma transformação do sistema de coordenadas de uma imagem diz-se projectiva quando transforma rectas em rectas e curvada ou elástica quando transforma rectas em 20 CAPÍTULO III − ALINHAMENTO DE IMAGENS MÉDICAS _____________________________________________________________________________________ curvas ou vice-versa. As transformações projectivas que transformam rectas paralelas em rectas paralelas dizem-se afim, as que preservam os ângulos e a proporcionalidade entre as dimensões dos objectos dizem-se de semelhança ou de similaridade e finalmente aquelas que preservam os ângulos e dimensões dos objectos dizem-se rígidas. Tabela 3.1: Critérios de classificação para o alinhamento de imagens médicas baseados nos apresentados em [Maintz, 1998]. Critério de classificação Dimensionalidade Base do alinhamento Natureza da transformação Domínio da transformação Subdivisão Dimensão espacial: 2D/2D, 2D/3D, 3D/3D Séries temporais de dimensão espacial: 2D/2D, 2D/3D, 3D/3D Stereotactic frame (muito usada Extrínseca em neurocirurgia) (baseia-se Invasiva Marcas fiduciais (parafusos) em objectos Modelos, molduras, dentes colocados adaptadores, etc. Não-invasiva no Marcas fiduciais (marcas na paciente) pele) Baseada em pontos Anatómicos de referência Geométricos Modelos rígidos (pontos, Baseada em curvas, superfícies) segmentação Intrínseca Modelos deformáveis Redução para escalares ou Baseada em vectores propriedades dos Usando todo o conteúdo da píxeis ou vóxeis imagem Não baseada nas imagens adquiridas (calibração dos sistemas de aquisição) Rígida (rotação e translação) Similaridade Não-rígida (rotação, Afim translação e escalamento) Projectiva Não-similaridade Não-afim Curvada Local (diferentes transformações para diferentes regiões da imagem) Global (a mesma transformação em toda a imagem) 21 CAPÍTULO III − ALINHAMENTO DE IMAGENS MÉDICAS _____________________________________________________________________________________ Tabela 3.1: (continuação) Interactiva Interacção Semi-automática Inicialização fornecida pelo utilizador Inicialização automática Inicialização fornecida pelo utilizador Orientada/corrigida pelo utilizador Ambos Automática Determinação dos parâmetros (determinados de um modo explícito) Procura dos parâmetros que optimizam uma função Monomodal (CT/CT, MRI/MRI, PET/PET, etc.) Multimodal (CT/MRI, CT/PET, CT/SPECT, PET/MRI, etc.) Modalidade para um modelo Paciente para modalidade Intra-sujeito Inter-sujeitos Atlas Cabeça: cérebro ou crânio, olhos, maxilares Tórax: tórax na totalidade, coração, peitos Abdómen: abdómen em geral, rins, fígado Membros: membros em geral, fémur, úmero, mão, pé Pélvis e perineu Coluna vertebral Procedimento de optimização Modalidades envolvidas Sujeitos Objectos Matematicamente, uma função, aplicação ou transformação L de um espaço vectorial V para um espaço vectorial W sobre um corpo K diz-se linear se: ∀u , v ∈ V e ∀α , β ∈ K ⇒ L(αu + βv ) = αL(u ) + βL(v ) . Em particular, uma função L do espaço vectorial IR n para espaço vectorial IR m sobre IR é linear se L(u ) = Au , onde u ∈ IR n e A é uma matriz real de dimensão m × n . Uma função afim T de IR n em IR n é dada por: T (u ) = L(u ) + t = Au + t , onde A é uma matriz real de dimensão n × n e t ∈ IR n . O vector t ∈ IR n representa a translação e a matriz A representa a deformação da forma: rotação, escalamento e outras deformações que preservam a colinearidade. Pelas definições apresentadas, uma transformação afim pode ser vista como uma composição de uma transformação linear e de uma translação. 22 CAPÍTULO III − ALINHAMENTO DE IMAGENS MÉDICAS _____________________________________________________________________________________ Usualmente, as metodologias de alinhamento de imagens podem também ser classificadas com base no espaço de características utilizadas −feature-space used− e medidas de similaridade usadas −similarity metric used− para comparar as imagens. Os espaços de características mais comuns incluem intensidade, pontos de referência, gradientes, regiões limites, cantos, regiões, contornos; bifurcações [Laliberté, 2003], [Matsopoulos, 2004]; e superfícies, [Wong, 2006a]. Outra classificação comum para as metodologias de alinhamento é: baseadas na geometria das estruturas presentes nas imagens e baseadas na intensidade. As metodologias baseadas na geometria usam a localização das características extraídas das imagens. As metodologias baseadas na intensidade usam a totalidade ou uma parte significativa da informação de intensidade presente na imagem. As metodologias podem ainda ser divididas com base no espaço de trabalho considerado: domínio espacial, domínio das frequências (usando transformadas de Fourier ou onduleta) ou ambos. Nas duas secções seguintes são apresentadas e analisadas algumas das técnicas de alinhamento usadas. São também apresentados alguns exemplos de aplicação exemplos de aplicação e citados vários trabalhos relacionados com esta área. As metodologias apresentadas são divididas em baseadas na geometria e baseadas na intensidade. 3.2 Metodologias baseadas na geometria 3.2.1 Alinhamento baseado na correspondência entre pontos Para realizar o alinhamento baseado na correspondência entre pontos, obviamente o primeiro passo é a identificação dos pontos a considerar ou qual se segue a definição das correspondências. Os pontos usados podem ser marcas naturais, tais como ossos, ou marcas artificiais colocadas no corpo do paciente com o intuito de ajudar ao alinhamento. As correspondências podem ser determinadas manualmente ou automaticamente, dependendo do algoritmo de alinhamento considerado, [Maintz,1998]. 3.2.1.1 Emparelhamento Antes do processo de emparelhamento é necessário extrair características dos objectos 23 CAPÍTULO III − ALINHAMENTO DE IMAGENS MÉDICAS _____________________________________________________________________________________ representados nas imagens, tais como, pontos, linhas, fronteiras, contornos, superfícies ou esqueletos. Em Visão Computacional, esta tarefa é usualmente referida com segmentação. Há muitas técnicas para fazer a segmentação dos objectos representados em imagens. Frequentemente, estas técnicas são classificadas em baseadas em regiões e baseadas em fronteiras, seguindo-se uma série de subdivisões. No entanto, outras classificações existem, como por exemplo, técnicas baseadas em características e técnicas baseadas na imagem, [Monteiro, 2007]. Como exemplos de trabalhos na área das técnicas baseadas em fronteiras pode-se considerar: [Marr, 1980], onde a passagem por zero da segunda derivada é usada para definir a fronteira, usando a composição de um filtro gaussiano com o laplaciano da imagem; [Canny, 1986], onde o gradiente da imagem em conjunto com duplo limiar são usados para definir as fronteiras; [Kass, 1988], [Cootes, 1992], [Xu, 1998], [Tavares, 2007], [Vasconcelos, 2008], [Gonçalves, 2008], onde conjuntos de pontos são modelados, frequentemente por curvas, usando, por exemplo, princípios físicos ou estatísticos; [Wang, 2006], [Wang, 2007], onde a forma é tratada como uma estrutura topológica, sendo estes métodos conhecidos por level set methods. Exemplos de segmentação baseada nas regiões, temos os métodos de thresholding, [Otsu, 1979], [Wellner, 1993]; watershed, [Beucher, 1992], [Grau, 2004], baseia-se na analogia com o enchimento de albufeiras/barragens; region growing, [Adams, 1994], baseia-se no crescimento de uma semente dentro de uma região que apresenta determinada afinidade. Estudos aprofundados e revisões sobre segmentação de imagem podem ser consultadas, por exemplo, em [Zhang, 2001], [Zhang, 2004], [Monteiro, 2007], [Gonzalez, 2008], [Ma, 2009]. Após a segmentação das imagens, o passo seguinte é o emparelhamento entre as estruturas extraídas das imagens a emparelhar. O processo de determinação do emparelhamento tem levado ao surgimento de várias metodologias no sentido de ser obtido o melhor emparelhamento possível para a aplicação em concreto. Algumas das técnicas usadas são: informação espacial da intensidade do vector gradiente, [Lucas, 1981]; emparelhamento modal, [Scott, 1991], [Shapiro, 1992], [Sclaroff, 1995], [Carcassoni, 2003], [Bastos, 2006]; shape context, [Belongie, 2002]; shape signature, 24 CAPÍTULO III − ALINHAMENTO DE IMAGENS MÉDICAS _____________________________________________________________________________________ [Otterloo, 1991], [Cohen, 1997], [Oliveira, 2009a], [Oliveira, 2009b], [Oliveira, 2009c]; critérios estocásticos, [Moisan, 2004], [Keren, 2009]; eixos médios e shock graphs, [Zhu, 1996], [Chung, 2000], [Sebastian, 2004]. Frequentemente, a similaridade entre as características extraídas das duas imagens é quantificada numa matriz de afinidade ou de custos de emparelhamentos. Nestas situações, é comum o problema do emparelhamento ser tratado como um problema de optimização. Assim, os algoritmos de afectação são frequentemente usados no sentido de ser encontrado o emparelhamento de custo mínimo. Há dois tipos fundamentais de algoritmos de optimização usados nestes casos, os optimais e não-optimais. Como exemplos de trabalhos onde são usados algoritmos optimais temos: programação linear, [Bastos, 2006]; baseados em grafos, [Roy, 1998], [Fielding, 2000]; optimização concava, [Maciel, 2003]; programação dinâmica, [Scott 2006], [Oliveira, 2008], [Oliveira, 2009a], [Oliveira, 2009b], [Oliveira, 2009c]. Como exemplos de aplicação de algoritmos não optimais tem-se: greedy algorithms, [Wu, 1995]; simulated annealing, [Starink, 1995]. Muitos algoritmos de alinhamento baseiam-se na localização de marcas fiduciais nas imagens consideradas e na sua correspondência, manual ou automática. No entanto, há sempre algum erro relativamente à sua posição exacta e, portanto, um erro no alinhamento que é consequência do erro de localização. O erro de localização é conhecido por fiducial localization error (FLE) e o resíduo, segundo os mínimos quadrados, entre as marcas após alinhamento é conhecido por fiducial registration error (FRE). Contudo, em [Fitzpatrick, 1998] é referido que o que realmente importa não é o valor de FRE mas aquilo a que chamaram target registration error (TRE). Um estudo pormenorizado sobre a teoria de erros relacionada com o alinhamento de imagens pode ser consultado em [Fitzpatrick, 1998] e [Wiles, 2008]. 3.2.1.2 Determinação da transformação geométrica Para determinar a transformação geométrica que melhor alinha dois conjuntos de pontos há várias soluções. Algumas das soluções mais frequentes têm por base o seguinte procedimento: 1 − Determinar os centróides; 2 − Usar a diferença entre as coordenadas dos centróides como o vector 25 CAPÍTULO III − ALINHAMENTO DE IMAGENS MÉDICAS _____________________________________________________________________________________ translação e deslocar um dos objectos no sentido do outro, ou centrar os dois objectos na origem subtraindo às coordenadas de cada ponto as coordenadas do respectivo centróide; 3 − Rodar um dos conjuntos de pontos até que a soma dos desvios quadráticos entre cada para de pontos correspondidos seja mínima. Simultaneamente poderá ser aplicado um escalamento. 3.2.1.2.1 Transformação de similaridade baseada na correspondência entre dois segmentos de recta Para uma estrutura rígida (apenas translações e rotações), a identificação de dois pontos de referência numa imagem e os correspondentes pontos na outra imagem é suficiente para determinar a transformação, tanto em 2D como em 3D, como se vê na situação seguinte: Suponhamos que temos dois pontos, p1 e p2 , na imagem modelo e os correspondentes pontos, q1 e q2 , na imagem a alinhar. Os centróides são dados por: p = 0.5 × ( p1 + p2 ) e q = 0.5 × (q1 + q2 ) . O passo seguinte consiste em centrar ambos os pares de pontos na origem: pi ← pi − p , qi ← qi − q , para i = 1,2 . Para determinar a rotação, o produto vectorial p1 p2 × q1q2 dá o eixo de rotação, sendo que a amplitude do ângulo de rotação pode ser dada por: p p ⋅q q θ = arccos 1 2 1 2 p1 p2 q1q2 , onde (⋅) representa o produto escalar. Se for permitido escalamento homogéneo, as mesmas duas correspondências são suficientes. A escala pode ser dada pelo quociente das distâncias entre os dois pontos de cada imagem. 26 CAPÍTULO III − ALINHAMENTO DE IMAGENS MÉDICAS _____________________________________________________________________________________ 3.2.1.2.2 Transformação rígida ou afim usando decomposição em valores singulares e mínimos quadrados Na prática é usual utilizar mais do que dois pontos em cada imagem. Geralmente, quanto maior for o número de pontos utilizados, menor será o erro médio de localização dos mesmos e consequentemente menor será a influência dos erros de localização no alinhamento final, [Hajnal, 2001]. O valor da raiz quadrada da média das distâncias quadradas é usualmente guardado pelo algoritmo e é o já referido anteriormente FRE, embora também seja comum esse erro ser referido como root mean squared error (RMS). Uma solução matemática muito usada para calcular a transformação rígida quando há várias correspondências definidas é conhecida por orthogonal Procrustes problem, [Hajnal, 2001]. A sua formulação é a seguinte: Suponha-se que se tem dois conjuntos, P e Q, cada um constituído por n pontos e devidamente correspondidos. Sejam p e q os seus centróides. O primeiro passo é centrar os dois conjuntos de pontos na origem: pi ← pi − p qi ← qi − q . Agora o problema resume-se a determinar a rotação. Para tal, calcula-se a matriz de correlação C: [ C = p1 T p2 T ... pn T ] q1 q 2. ... q n Considerando a decomposição em valores singulares de C, tem-se: C = UDV T . A matriz de rotação R é dada por R = VDU T , onde: 0 1 0 0 1 0 ou D = 0 1 D= T 0 det UV 0 0 det UV T ( ) ( , ) para pontos 2D ou 3D, respectivamente, [Hajnal, 2001]. Consequentemente, tem-se que Rpi = qi , ou seja, rodando os pontos do conjunto P segundo a rotação definida pela 27 CAPÍTULO III − ALINHAMENTO DE IMAGENS MÉDICAS _____________________________________________________________________________________ matriz R, esses pontos irão sobrepor-se aos pontos correspondentes do conjunto Q. Se o número de pontos em cada conjunto é dois, então R representa a rotação exacta. Se o número de pontos for maior do que dois, então R representa a rotação óptima no sentido dos mínimos quadrados. Em [Dorst, 2005] é realizada uma análise dos erros de primeira ordem do método referido. Suponha-se agora que se quer determinar a transformação afim que melhor alinha os dois conjuntos de pontos P e Q anteriormente definidos e que estes já estão centrados na origem. Assim, deseja-se uma transformação linear que aplique P em Q (ou o oposto). Seja A uma matriz de dimensão 2 × 2 ou 3× 3 , conforme os pontos sejam 2D ou 3D. Considerando as coordenadas dos pontos de P e Q dispostos em coluna e ordenados, [ T P = p1 p2 T ... pn T ] e Q = [q T 1 q2 T T ] ... qn , pretende-se resolver o problema linear XP = Q . Se P é invertível, então a solução exacta é dada por X = Q P −1 . Contudo, os conjuntos de pontos P e Q são definidos por vários pontos para que o erro médio de localização dos pontos seja pequeno. Deste modo, normalmente a matriz P não é quadrada e portanto não é invertível. Neste caso, considera-se a solução do sistema de equações XP = Q obtida no sentido dos mínimos quadrados. 3.2.1.2.4 Transformação de similaridade no plano complexo Em [Oliveira, 2009a] é usado um procedimento distinto do anterior para determinar a transformação rígida ou de similaridade que melhor alinha dois conjuntos de pontos 2D previamente correspondidos. De um modo simplificado, a metodologia implementada considera os pontos definidos no plano complexo, C, onde uma transformação de similaridade T pode ser representada simplesmente por: T :C → C , z z ' = wz + u onde w e u são números complexos. A transformação T pode ser vista como uma função que aplica uma rotação e um escalamento em torno da origem seguindo-se uma translação. Se o ponto p1 corresponde ao ponto q1 e o ponto p 2 corresponde ao ponto q 2 , então, 28 CAPÍTULO III − ALINHAMENTO DE IMAGENS MÉDICAS _____________________________________________________________________________________ através da definição de T, tem-se: T ( p1 ) = q1 wp + u = q1 ⇔ 1 . T ( p 2 ) = q 2 wp 2 + u = q 2 Resolvendo este sistema de equações lineares, em ordem a u e w obtém-se os parâmetros da transformação T. O valor absoluto de w representa o escalamento, o argumento de w representa o ângulo de rotação e a translação em x e y é definida, respectivamente, por Re(u ) e Im(u ) . Pelas razões já enunciadas, geralmente são usados mais do que dois pontos. A solução proposta em [Oliveira, 2009a] consiste em calcular a transformação geométrica que alinha cada par de pontos de um conjunto com o respectivo par de pontos do outro conjunto. Seguidamente, é realizado o tratamento estatístico das soluções obtidas, eliminando-se assim a influência dos outliers. Repare-se que n correspondências implicam n pontos em cada conjunto e com n pontos é possível definir n(n − 1) / 2 pares. A título de exemplo, repare-se que com 10 correspondências é possível obter 45 estimativas para a transformação geométrica. Uma vantagem deste método relativamente aos anteriores é o facto de não basear todas as transformações nos mesmos centróides, aliás, os centróides nunca são considerados. Note-se que as deformações que as imagens possam ter sofrido geralmente originam um movimento dos centróides relativamente aos restantes pontos do respectivo conjunto. Assim, nos métodos que usam o centróide, como a rotação é calculada após centrar os conjuntos de pontos, tendo por base os seus centróides, o erro de determinação dos centróides vai influenciar a rotação, aumentando assim o erro final. Tal situação não se verifica no algoritmo apresentado em [Oliveira, 2009a]. 3.2.1.2.5 Método de eliminação de outliers: algoritmo RANSAC Os métodos que optimizam a transformação geométrica no sentido dos mínimos quadrados, isto é, minimizando a soma dos erros quadráticos, são muito sensíveis à presença de outliers. Como o erro é quadrático, um ponto outlier muito afastado tem um enorme efeito no erro e consequentemente na transformação geométrica determinada. Uma solução para este problema é eliminar os outliers do conjunto das correspondências. Para tal, em [Fischler, 1981] é proposto um algoritmo de eliminação de outliers conhecido por Random Sample Consensus (RANSAC). Este algoritmo pode 29 CAPÍTULO III − ALINHAMENTO DE IMAGENS MÉDICAS _____________________________________________________________________________________ ser dividido nos seguintes passos: 1 − Escolher aleatoriamente um subconjunto de pontos em função do modelo de transformação geométrica pretendida e calcular a transformação com base nesses pontos (note-se que a escolha de um subconjunto de pontos, na prática corresponde à escolha de um subconjunto de correspondências de entre todas as conhecidas); 2 − Aplicar a transformação determinada a todos os pontos de um dos conjuntos; 3 − Determinar o conjunto de pontos, S, que estão a uma distância inferior a uma determinada tolerância dos seus correspondentes no outro conjunto (mais uma vez, a escolha dos pontos do conjunto S corresponde à escolha de correspondências); 4 − Se o número de pontos de S é maior ou igual a um valor pré-estabelecido, então S é usado para calcular transformação geométrica final pretendida, usando por exemplo os mínimos quadrados. Se o número de pontos de S é menor do que o valor pré-estabelecido, então regressa-se ao ponto 1 ignorando a transformação previamente determinada. 3.2.1.3 Transformação usando coordenadas homogéneas Na Secção 3.2 foi referido que uma transformação afim pode ser definida como uma aplicação linear seguida de uma translação, sendo que se a translação não for nula, a transformação afim não é uma aplicação linear. No entanto, elevando a dimensão do espaço é possível tratar as transformações projectivas, e por consequência as transformações afim, como transformações lineares. A título de exemplo, tem-se que uma transformação rígida T em 2D pode ser definida por: a cosθ T = b sin θ − sin θ a t x a cosθ − b sin θ + t x + = , cosθ b t y a sin θ + b cosθ + t y onde θ representa o ângulo de rotação e t x e t y a translação segundo os eixos das abcissas e das ordenadas, respectivamente. Considerando os pontos do plano R2 definidos em coordenadas homogéneas, tem-se que o vector: 30 CAPÍTULO III − ALINHAMENTO DE IMAGENS MÉDICAS _____________________________________________________________________________________ a b , ficará representado pelo vector: a b . 1 A transformação T anteriormente definida ficará definida por: a cos θ T ' b = sin θ 1 0 − sin θ cos θ 0 t x a a cos θ − b sin θ + t x t y b = a sin θ + b cos θ + t y , 1 1 1 o que mostra que a transformação não linear T pode ser substituída pela transformação linear T '. A consideração das transformações geométricas usando coordenadas homogéneas tem a vantagem de definir todas as transformações como o produto de uma matriz, que representa a transformação, pelas coordenadas dos pontos as transformar. A Tabela 3.2 sintetiza a forma das matrizes que representam as transformações geométricas 2D quando definidas usando coordenadas homogéneas. A determinação dos elementos da matriz de transformação pode ser alcançada resolvendo os sistemas de equações originados. Por exemplo, para a transformação afim, com o conhecimento de três correspondências definem-se seis equações linearmente independentes nas mesmas seis incógnitas. Assim, o sistema de equações resultante poderá ser facilmente resolvido usando o método de eliminação de Gauss, [Press, 2002], por exemplo. No caso de transformações projectivas, para determinar a matriz da transformação conhecendo quatro correspondências, faz-se h33 = 1 (ver Tabela 3.2), obtendo-se assim um sistema linear de oito equações com oito incógnitas que pode ser resolvido facilmente. No caso de serem conhecidas mais de que quatro correspondências, é normal não existir uma solução exacta, determinando-se uma solução aproximada usando, por exemplo, mínimos quadrados. Outra técnica frequentemente usada para determinar a transformação geométrica pretendida consiste no algoritmo DLT −direct 31 CAPÍTULO III − ALINHAMENTO DE IMAGENS MÉDICAS _____________________________________________________________________________________ linear transform. Informação sobre este algoritmo e teoria subjacente poderá ser consultada, por exemplo, em [Hartley, 2003]. Tabela 3.2: Relação entre o tipo de transformação geométrica, definida usando coordenadas homogéneas, com a forma da matriz que a representa e os graus de liberdade, em transformações geométricas 2D. Transformação Matriz Graus de liberdade Projectiva h11 h12 h 21 h22 h31 h32 h13 h23 h33 8 (necessário quatro correspondências, [Hartley, 2003]) Afim h11 h12 h 21 h22 0 0 tx t y 1 6 (necessário três correspondências) Similaridade Rígida s cosθ s sin θ 0 − s sin θ s cosθ cosθ sin θ 0 − sin θ cosθ 0 0 tx t y 1 tx t y 1 4 (necessário duas correspondências) 3 (necessário duas correspondências) 3.2.2 Eixos principais Os eixos principais são muito usados para realizar o alinhamento de duas imagens 2D ou 3D. A sua aplicação é muito simples e não necessita da determinação de correspondências. Pode ser usado apenas um conjunto de pontos característicos, como por exemplo, pontos de contornos, pontos de bifurcação ou vértices, etc. Pode também ser usada a imagem na totalidade e características globais extraídas da mesma, como o nível de cinzento e o gradiente, por exemplo. Na formulação seguinte considera-se todos os píxeis de cada imagem 2D sendo atribuído um peso, f ( x, y ) e g ( x, y ) , a cada píxel das mesmas. Para o caso de imagens 32 CAPÍTULO III − ALINHAMENTO DE IMAGENS MÉDICAS _____________________________________________________________________________________ 3D, o procedimento é equivalente. Por simplicidade, suponha-se que f ( x, y ) e g ( x, y ) representam a intensidade das respectivas imagens f e g; no entanto, podem representar outra característica da imagem. O centróide da imagem f, (x f , y f ) , é dado por: n −1 m −1 (x f , yf )= ∑∑ f (x, y ) × (x, y ) x =0 y =0 n −1 m −1 ∑∑ f (x, y ) . x =0 y =0 De modo análogo, calcula-se o centróide da imagem g, (x g , y g ) . O passo seguinte consiste em calcular a matriz de correlação das coordenadas de cada imagem, C f e C g . Para a imagem f tem-se: n −1 m −1 ∑∑ Cf = x =0 y =0 x − x f f ( x, y ) × × x − xf y − y f [ y − yf ] n −1 m −1 ∑∑ f (x, y ) x =0 y =0 Os vectores próprios de C f são os eixos principais da imagem f. De mesmo modo, determinam-se os eixos principais da imagem g. Para alinhar as imagens, tem-se que a diferença das coordenadas dos centróides indica a translação. O alinhamento rotacional das imagens é obtido alinhando os eixos principais das mesmas. Na Figura 3.1 é apresentado um exemplo de duas imagens de pedobarografia, os respectivos centróides, os eixos principais e o alinhamento final obtido considerando o nível de intensidade de todos os píxeis das imagens originais. 3.2.3 Aproximação pontual iterativa O algoritmo iterative closest point algorithm (ICP) foi proposto em [Besl, 1992] para o alinhamento de formas 3D. No artigo original é realizado o alinhamento de um conjunto de dados com um modelo. A ideia principal é iterativamente aproximar o conjunto de pontos do modelo. Os dados poderão ser oriundos de diversas fontes, nomeadamente sensores que forneçam a localização 3D da estrutura a alinhar pelo modelo. Seja qual for o tipo de estrutura a alinhar, esta tem que ser convertida para um conjunto de pontos. 33 CAPÍTULO III − ALINHAMENTO DE IMAGENS MÉDICAS _____________________________________________________________________________________ Figura 3.1: Na linha superior, duas imagens de pedobarografia, os respectivos centróides e eixos principais. Na linha inferior, do lado esquerdo as duas mesmas imagens sobrepostas antes do alinhamento e do lado direito as duas imagens após o alinhamento usando e metodologia baseada nos eixos principais. (As cores das imagens foram modificadas para facilitar a sua visualização.) O algoritmo adoptado pode ser descrito nos seguintes passos: 1 − Para cada ponto do conjunto de dados a alinhar, identificar o ponto do modelo que lhe está mais próximo; 2 − Determinar a transformação rígida que melhor alinha o conjunto de pontos com o modelo, com base correspondência estabelecidas no ponto anterior; 3 − Aplicar a transformação rígida ao conjunto de pontos; 4 − Se a distância entre o conjunto de pontos e o modelo (poderá ser calculada usando mínimos quadrados) for superior a uma dada tolerância, regressa-se ao ponto 1. Caso contrário, considera-se que o alinhamento está concluído. Este algoritmo vai iterativamente aproximando o conjunto de pontos a alinhar da região do modelo que lhe está mais próxima. Assim, é natural que a solução encontrada seja a 34 CAPÍTULO III − ALINHAMENTO DE IMAGENS MÉDICAS _____________________________________________________________________________________ melhor local, no entanto não há garantia alguma que é a melhor solução global. A solução proposta em [Besl, 1992] para aumentar a probabilidade do algoritmo convergir para a melhor solução global é inicializar o algoritmo várias vezes com diferentes estimativas para a rotação e depois escolher para transformação final a que originou menor distância entre o conjunto de pontos a alinhar e o modelo, de entre todas as transformações determinadas. Em [McLaughlin, 2005] é realizada uma comparação entre os métodos baseados em características que usam ICP e os métodos baseados em intensidade para o alinhamento 2D−3D em neuro-intervenções. 3.3 Metodologias baseadas em intensidade Os métodos de alinhamento baseados em intensidade podem ser classificados segundo dois critérios fundamentais: a estratégia seguida para procurar a melhor solução de alinhamento e a medida de similaridade (qualidade do alinhamento) considerada. Nesta secção optou-se por dividir esses métodos em: domínio espacial (trabalham com a localização dos píxeis) e domínio das frequências (trabalham com o espectro e a fase das imagens). 3.3.1 Domínio espacial 3.3.1.1 Estratégias dos algoritmos de optimização Uma ideia muito simples para alinhar duas imagens consiste em aplicar a uma delas um conjunto de deformações/transformações geométricas e posteriormente escolher a transformação que originou melhores resultados em termos da medida de similaridade considerada. A estratégia de alinhamento mais simples é talvez a estratégia da força “bruta”, isto é, testam-se todas as deformações possíveis e escolhe-se aquela que originar melhores resultados em termos da medida de similaridade utilizada. Naturalmente, não é possível testar todas as hipóteses de deformação no domínio contínuo. Assim, os parâmetros da transformação a aplicar tem que ser discretizados. Obviamente, quanto maior for o conjunto discreto de valores testados maior é o tempo dispendido para calcular as transformações correspondentes. Geralmente, este tipo de estratégia de alinhamento não é utilizada. No entanto, em algumas situações particulares, nomeadamente, em situações 35 CAPÍTULO III − ALINHAMENTO DE IMAGENS MÉDICAS _____________________________________________________________________________________ em que a faixa de variação dos parâmetros da transformação é muito estreita, esta estratégia poderá ser uma escolha adequada. Para transformações rígidas ou de similaridade, uma solução que diminui os graus de liberdade do algoritmo de procura da solução óptima consiste em transformar o sistema de coordenadas rectangulares para o sistema de coordenadas log-polar, [Wolberg, 2000]. Se o centro de rotação escolhido para cada imagem for o mesmo em ambas, então a rotação e o escalamento podem ser facilmente determinadas pois manifestam-se como deslocações no espaço log-polar. Um dos problemas desta metodologia é a dificuldade em encontrar o centro de rotação correcto. Em [Wolberg, 2000] é adoptada uma metodologia de multi-resolução com uma procura exaustiva pela melhor localização para o centro de uma das imagens tendo como referência o centro geométrico da outra imagem. Outra possível solução para o centro de rotação poderia ser o centróide pesado em função da intensidade ou gradiente. No entanto esta solução, tal como a apresentada [Wolberg, 2000] é bastante sensível a condições de iluminação e à janela de visualização, pois podem estar representados objectos numa imagem e não estarem representados na outra imagem. Outro ponto fraco deste tipo de métodos é o facto de geralmente não funcionarem com alinhamento de imagens obtidas em diferentes modalidades (multimodal registration). Algumas das estratégias/técnicas de optimização frequentemente usadas nos métodos baseados em intensidade são: método de Powell, gradiente descendente/ascendente, gradiente descendente/ascendente conjugado e simulated annealing, combinadas com uma estratégia de multi-resolução, [Hellier, 2004]. A juntar a estas técnicas ainda se tem a possibilidade de utilizar toda a imagem ou apenas uma região de interesse (ROI). A ideia principal do método de Powell, [Press, 2002], é simples, contudo eficiente em muitas situações. Pode-se resumi-la do seguinte modo. Seja F uma função real que se pretende minimizar (ou maximizar) e X 0 = ( x1 , x2 ,..., xn ) , a estimativa inicial. Para inicializar, sejam: u i = e i , com i = 1,..., n , 36 CAPÍTULO III − ALINHAMENTO DE IMAGENS MÉDICAS _____________________________________________________________________________________ onde e i representa o vector i da base canónica do espaço de procura considerado. Temse assim que a solução inicial dada em relação às direcções u i é: X 0 = ( x1 , x2 ,..., xn ) = x1u1 + x2u 2 + ... + xn u n . Terminada agora a fase de inicialização, o algoritmo prossegue fazendo variar sucessivamente cada uma das variáveis xi até que seja atingido o mínimo, obtendo sucessivamente uma nova estimativa X i em relação à base definida pelos u i ' s . Após ajustar as n variáveis, faz-se: u i −1 ← u i , com i = 2,..., n , u n = X n − X 0 e procura-se o mínimo ao longo desta nova direcção u n , pois foi esta que originou melhores resultados. A nova estimativa passa a ser o ponto de partida, X 0 , para a nova iteração, considerando agora as novas direcções. Este processo é repetido sucessivamente até que o critério de paragem seja satisfeito. Dependendo da aplicação, a ordem pela qual se colocam ou fazem variar as variáveis xi no sentido de procurar o valor óptimo da função F deve ser adaptada para aumentar a velocidade de convergência e diminuir a inter-dependência entre as variáveis. Por exemplo, nas aplicações de alinhamento de imagens, é de esperar que a procura do valor óptimo seja mais eficiente se se começar pelo ajuste das variáveis que representam a translação e só depois a(s) que representa(m) a rotação. Em [Press, 2002], por exemplo, são apresentadas algumas soluções para melhorar este método. O método gradiente descendentte usa informação do gradiente para estimar a nova aproximação em cada passo do processo iterativo de optimização. Seja F uma função real que se pretende minimizar. Suponhamos que F está definida, é monótona e diferenciável numa vizinhança do ponto A. Tem-se assim que F decresce quando se vai de A no sentido contrário ao dado pelo vector gradiente de F em A, − ∇F ( A) . Assim, se: B = A − α ∇F ( A ) , e α > 0 é um número suficientemente pequeno, então: 37 CAPÍTULO III − ALINHAMENTO DE IMAGENS MÉDICAS _____________________________________________________________________________________ F ( A) ≥ F ( B ) . Baseado no que se acabou de descrever, para o alinhamento de imagens, começa-se com um valor inicial X 0 para o alinhamento e depois iterativamente constrói-se a sequência de estimativas para a transformação, X 0 , X 1 ,..., X n , até que o critério de paragem seja satisfeito, onde: X n+1 = X n − α n ∇F ( X n ), n ≥ 0 , tendo-se assim, consequentemente: F ( X 0 ) ≥ F ( X 1 ) ≥ F ( X 2 ) ≥ ... ≥ F ( X n ) . Assim, é de esperar que a sequência F ( X 0 ), F ( X 1 ), F ( X 2 ),..., F ( X n ) convirja para um mínimo. Para melhorar o processo, o valor de α i pode ser ajustado em cada iteração. Na exposição deste método considerou-se que a função F é diferenciável, mas se F representa a similaridade entre duas imagens discretas, é de esperar que não seja diferenciável. No entanto, esta situação não constitui problema pois pode-se usar a derivada discreta para estimar a derivada. O método baseado no gradiente ascendente é baseado na mesma ideia do gradiente descendente. Neste caso, o objectivo é maximizar a medida de similaridade. Consequentemente, constrói-se a sequência de valores: X n+1 = X n + α n ∇F ( X n ), n ≥ 0 , obtendo-se: F ( X 0 ) ≤ F ( X 1 ) ≤ F ( X 2 ) ≤ ... ≤ F ( X n ) . O método baseado no gradiente descendente/ascendente é um algoritmo de optimização de primeira ordem e portanto não é adequado para optimizar funções de graus mais elevados. Por exemplo, para uma função quadrática, o método do gradiente ascendente/descendente realiza muitos pequenos passos na direcção da solução óptima, não usando as propriedades deste tipo de função. Assim, para este tipo de situações, os métodos do gradiente conjugado são uma melhor alternativa. Uma apresentação deste método pode ser consultada em [Press, 2002]. 38 CAPÍTULO III − ALINHAMENTO DE IMAGENS MÉDICAS _____________________________________________________________________________________ Os algoritmos de optimização frequentemente convergem para mínimos (ou máximos) locais, dificultando assim que o mínimo global seja alcançado. A optimização baseada em simulated annealing é uma técnica cuja principal característica é permitir encontrar o mínimo (ou máximo) global de funções que têm muitos mínimos (máximos) locais. Precisamente devido a esta faceta, esta técnica tem atraído a atenção da comunidade científica. Na base deste algoritmo de optimização está a distribuição de probabilidade de Boltzmann, [Press, 2002]: P (E ) ≈ e − E kT . Nas aplicações cujo objectivo é minimizar o valor de uma medida similaridade (ou dessimilaridade) de duas imagens representado por uma função F, tem-se que: E = ∆F = F ( X i +1 ) − F ( X i ) , onde F é a função a minimizar. O parâmetro k ( k > 0 ) é uma constante que depende do sistema e da implementação e o parâmetro T ( T > 0 ) controla a velocidade do sistema. Em termodinâmica, T representa a temperatura do sistema, sendo que este valor vai diminuindo lentamente ao longo do tempo para obrigar o sistema a lentamente a perder energia e convergir para um estado de energia mínima. Pela fórmula da distribuição de probabilidade de Botlzmann, pode-se concluir que quando E ≤ 0 , isto é, a estimativa X i +1 origina um valor menor ou igual para a função F do que a estimativa X i , a probabilidade é igual a 1 (um). Assim, a nova estimativa X i +1 é aceite. Quando E > 0 , a nova estimativa X i +1 é aceite com a probabilidade dada pela fórmula de Boltzmann. Esta situação pode originar que o algoritmo aceite uma nova estimativa pior do que a anterior, o que parece fazer pouco sentido. No entanto, este facto é a chave do sucesso deste algoritmo, pois assim permite que o algoritmo possa sair de um mínimo local. A fórmula de probabilidade de Boltzmann apenas decide se a nova estimativa é ou não aceite. Assim, é necessário incluir uma estratégia de cálculo das sucessivas novas estimativas para o valor óptimo. Na implementação base da técnica simulated annealing, o processo de determinação das novas estimativas é aleatório. No entanto, dependendo da aplicação, podem ser usados outros mecanismos mais eficientes de determinação das sucessivas estimativas. Um exemplo de aplicação na área do 39 CAPÍTULO III − ALINHAMENTO DE IMAGENS MÉDICAS _____________________________________________________________________________________ alinhamento de imagens médicas pode ser visto em [Loeckx, 2003]. A ideia principal dos métodos de multi-resolução é a seguinte: Inicialmente é realizado um alinhamento considerando as imagens definidas em baixa resolução, estimando-se assim um alinhamento grosseiro. Seguidamente, consideram-se as imagens com uma resolução maior e alinhadas segundo a transformação determinada no passo anterior. Este processo é repetido até que finalmente se faz o alinhamento das imagens originais. A título de exemplo, na primeira iteração pode-se usar uma amostra das imagens onde cada píxel representa uma região de 8 × 8 píxeis da imagem original. Na segunda iteração, cada píxel representa uma região de 4 × 4 píxeis da imagem original, e assim sucessivamente. Frequentemente, os algoritmos de alinhamento de imagem baseados em intensidade usam uma estratégia de multi-resolução devido a dois factores principais: − A probabilidade do algoritmo multi-resolução convergir para um mínimo local é menor do que nos métodos que operam sempre sobre a imagem original; − Geralmente a velocidade de convergência é maior, pois o algoritmo dá passos maiores na direcção da convergência aquando da utilização das imagens de baixa resolução comparativamente aos dados pelos algoritmos que trabalham sempre com a imagem de alta resolução. Além disso, como o algoritmo de multi-resolução na fase final já está a trabalhar com as imagens originais de elevada resolução e estas já estão relativamente bem alinhadas, a solução óptima é facilmente encontrada. Frequentemente, a procura pelo melhor alinhamento possível não é realizada tendo em conta toda a imagem mas apenas uma região de interesse (ROI). Este tipo de estratégia tem algumas vantagens relativamente às técnicas que consideram toda a imagem, nomeadamente: − Ao utilizarem uma imagem constituída por menor número de píxeis (ou vóxeis) diminui o esforço computacional e consequentemente aumenta a velocidade de execução do algoritmo; 40 CAPÍTULO III − ALINHAMENTO DE IMAGENS MÉDICAS _____________________________________________________________________________________ − Quando uma imagem tem objectos adicionais que não estão presentes na outra imagem que se pretende alinhar, a escolha de uma ROI que não considere esses objectos vai permitir obter melhores resultados no alinhamento; − A presença de um tumor apenas em uma das imagens pode fazer com que o algoritmo de alinhamento das imagens fracasse no caso de considerar a totalidade das imagens. Assim, a escolha de uma ROI que não tenha o tumor conduzirá a melhores resultados no alinhamento; − O campo de visão representado nas duas imagens a alinhar pode ser significativamente diferente. Assim, é fundamental que seja escolhida uma ROI representada em ambas as imagens; − Se as imagens são obtidas de diferentes modalidades, poderá ser escolhida uma ROI em que a similaridade das intensidades entre as imagens das diferentes modalidades esteja mais relacionada. 3.3.1.2 Medidas de similaridade O alinhamento de imagens usando a similaridade entre píxeis envolve o cálculo da transformação geométrica através da optimização de uma medida de similaridade calculada directamente sobre a intensidade dos píxeis. Em algumas situações, em vez da intensidade dos píxeis originais, são usadas outras características extraídas da própria intensidade, como por exemplo, imagens suavizadas ou imagens relacionadas com o gradiente. No alinhamento multimodal, são por vezes realizadas operações sobre a intensidade de modo a tornar as duas imagens mais compatíveis. Nesta secção não será feita distinção entre imagem original e imagem obtida da original através de uma qualquer operação de transformação de intensidade. Ao longo dos anos têm sido propostas diferentes medidas para quantificar a similaridade entre imagens com base na comparação das intensidades dos píxeis correspondentes de ambas as imagens. Algumas das medidas mais usadas são: soma dos quadrados das diferenças (SSD); correlação cruzada (CC); entropia conjunta ; informação mútua (MI). Esta medidas podem ser obtidas usando as duas imagens na totalidade ou apenas utilizado uma ROI. Em [Penney, 1998] pode ser consultado um estudo aprofundado relacionado com este tema. 41 CAPÍTULO III − ALINHAMENTO DE IMAGENS MÉDICAS _____________________________________________________________________________________ 3.3.1.2.1 Soma dos quadrados das diferenças A função de custo soma dos quadrados das diferenças (SSD), por vezes referida apenas como “least squares,” tem sido largamente usada em alinhamento de imagem, [Woods, 1998], [Hajnal, 1995], [Friston, 1995], [Orchard, 2005], [Fitch, 2005], [Orchard, 2007b], [Lucas, 1981]. A fórmula é: N SSD = ∑ ( f i − g i ) , 2 i =1 onde N representa o número total de píxeis no domínio considerado, f i representa a intensidade do píxel da imagem f indexado por i, g i a intensidade do píxel correspondente da imagem g. Geralmente é utilizada a SSD normalizada e referida apenas como SSD. A sua fórmula é a seguinte: SSD = 1 N N ∑( f i =1 − gi ) . 2 i Também é comum considerar-se a soma pesada do quadrado das diferenças. Nestes casos é usada a fórmula: N SSD = ∑ ( f i − g i ) wi , 2 i =1 onde wi é o peso atribuído. A medida SSD é muito sensível a píxeis cuja diferença entre as intensidades correspondentes seja muito elevada, por exemplo devido a ruído. Para reduzir esses efeitos pode ser usada a soma das diferenças absolutas (SAD) em vez da SSD. As imagens são consideradas optimamente alinhadas quando estas medidas, SSD ou SAD, atingem o seu valor mínimo. A medida SSD tem por base o pressuposto que os píxeis correspondentes às mesmas regiões do corpo devem ter idênticas intensidades na imagem que representa essas regiões. Assim, esta medida é mais adequada para o alinhamento monomodal do que multimodal. No entanto, têm sido realizados alguns trabalhos na área do alinhamento multimodal usando a SSD, [Guimond, 2001], [Periaswamy, 2003]. 42 CAPÍTULO III − ALINHAMENTO DE IMAGENS MÉDICAS _____________________________________________________________________________________ 3.3.1.2.2 Correlação cruzada A correlação cruzada não é mais do que o coeficiente de correlação linear de Pearson, [Press, 2002]. O coeficiente de correlação é uma medida de dependência linear entre duas variáveis. Para o caso concreto das aplicações de alinhamento de imagens, mede a relação de dependência linear da intensidade dos píxeis correspondentes. A fórmula considerada é: ∑( f N CC = i =1 ∑( f N i =1 i − f )( g i − g ) − f) × 2 i N ∑ (g i =1 − g) , 2 i onde f i , g i e N são os mesmos parâmetros que foram definidos para a SSD e f e g são as médias das intensidades das imagens f e g nos domínios considerados. Como é bem conhecido, o CC varia entre − 1 e 1. Um valor próximo de − 1 significa que há uma correlação linear forte mas negativa, isto é, há uma forte dependência linear entre as intensidades das duas imagens mas quando a intensidade de um píxel aumenta numa das imagens, a intensidade do píxel correspondente da outra imagem diminui. Um valor próximo de 1 (um) significa que há uma correlação linear forte positiva, isto é, há uma forte dependência linear entre as intensidades das duas imagens e quando a intensidade de um píxel aumenta numa das imagens, a intensidade do píxel correspondente da outra imagem também aumenta. Já um valor próximo de 0 (zero) significa que não há dependência linear entre as intensidades das imagens. Como exemplos de trabalhos onde é usado a CC podem ser considerados: [Cideciyan, 1995], [Solaiyappan, 2000] e [Maintz, 1996]. 3.3.1.2.3 Entropia conjunta Talvez a maior parte das medidas de similaridade actualmente usadas seja baseadas na medida de entropia Shannon-Wiener, H, originalmente desenvolvida como no âmbito da teoria de comunicação na década de 40 do século passado, [Hajnal, 2001]. No entanto, há outras medidas de entropia que em alguns casos são consideradas por alguns autores como mais adequadas para as aplicações de alinhamento de imagem médica, nomeadamente, Rényi entropy, [Hamza, 2003], [Wachowiak, 2003] e Tsallis entropy, [Tsallis, 1988], [Martin, 2004], [Cvejic, 2006], [Sun, 2007]. 43 CAPÍTULO III − ALINHAMENTO DE IMAGENS MÉDICAS _____________________________________________________________________________________ Nas aplicações de alinhamento de imagem, a entropia Shannon-Wiener é dada por: E ( f ) = −∑ p f (i ) log( p f (i )) , N i =0 onde p f (i ) é a probabilidade de existir um píxel com intensidade i na imagem f (ou ROI considerada na imagem f), isto é: p f (i ) = número de píxeis com intensidade i em f . número total de píxeis em f A entropia atinge o máximo se todos os píxeis tiveram diferentes níveis de intensidade e atinge o mínimo se todos os píxeis tiverem a mesma intensidade. Considere-se agora duas imagens, f e g, e o histograma conjunto das intensidades das mesmas. A probabilidade conjunta p f , g (i, j ) representa a probabilidade de um píxel na imagem f ter intensidade i e o seu correspondente na imagem g ter intensidade j, isto é: p f , g (i, j ) = número de pares de píxeis com intensidade (i, j ) no histograma conjunto . (número de níveis de intensidade considerados )2 A entropia conjunta de duas imagens f e g é calculada em função do seu histograma conjunto e é dada por: H ( f , g ) = −∑∑ p f , g (i, j ) log( p f , g (i, j )) . N N i =0 j =0 Para duas imagens optimamente alinhadas, os píxeis no histograma conjunto das duas imagens tendem a concentrar-se sobre uma linha recta e portanto a entropia conjunta atinge o mínimo. Se as duas imagens não estão alinhadas, os píxeis no histograma conjunto tendem a dispersar-se e consequentemente a entropia conjunta é maior do que seria se as imagens estivessem alinhadas. Na Figura 3.2 é apresentado um exemplo de duas imagens e os respectivos histogramas conjuntos para as situações em que as imagens estão alinhadas e não alinhadas. Geralmente, a entropia conjunta não é usada individualmente nas aplicações de alinhamento de imagem, mas sim combinada com a entropia individual de cada imagem, originando assim a uma nova medida de similaridade chamada informação mútua. 44 CAPÍTULO III − ALINHAMENTO DE IMAGENS MÉDICAS _____________________________________________________________________________________ (a) (b) (c) (d) (e) Figura 3.2: Duas imagens e os seus histogramas conjuntos: (a) imagem de raio X do peito; (b) a mesma imagem de raio X após uma pequena translação vertical; (d) representação plana do histograma conjunto da imagem (a) com ela própria; (c) representação plana do histograma conjunto da imagem (a) com a imagem (b); (e) representação 3D do histograma conjunto das imagens (a) e (b). 3.3.1.2.4 Informação mútua A entropia conjunta pode ser usada directamente como medida de similaridade, no entanto tal é pouco comum porque esta é muito dependente da região de interesse considerada. Por exemplo, se a região de interesse considerada na imagem modelo f engloba uma grande porção do fundo da imagem e a região correspondente da imagem a alinhar g também, então a probabilidade conjunta correspondente à intensidade do fundo das imagens será elevada e consequentemente a entropia conjunta H ( f , g ) será baixa. Obviamente, se a área de fundo diminuir, a entropia conjunta tem tendência a aumentar. Assim, um algoritmo de alinhamento que procure minimizar a entropia conjunta terá tendência para maximizar a quantidade de área de fundo das imagens presente nas regiões de interesse e portanto pode originar soluções de alinhamento 45 CAPÍTULO III − ALINHAMENTO DE IMAGENS MÉDICAS _____________________________________________________________________________________ incorrectas. A informação mútua é uma solução para este ponto fraco da entropia conjunta. A informação mútua foi introduzida como taxa de transmissão de informação por Shannon em 1948, [Shannon, 1948], tornando-se conhecida posteriormente por informação mútua. Esta medida foi simultaneamente proposta para o alinhamento multimodal de imagens médicas por Viola e colaboradores, [Viola, 1995a], [Viola, 1995b], [Wells, 1995], [Viola, 1997]; e por Collignon e colaboradores, [Collignon, 1995], [Maes, 1997], [Collignon, 1998]. De um modo simplificado, a informação mútua quantifica a qualidade com que uma imagem pode explicar a outra, atingindo o seu máximo quando as imagens estão correctamente alinhadas. Na literatura, a informação mútua é geralmente representada de três formas distintas, mas todas equivalentes quando usada e medida de entropia de Shannon-Wiener: MI ( f , g ) = H ( f ) + H ( g ) − H ( f , g ) ; MI ( f , g ) = H ( g ) − H ( g | f ) ; N N p f , g (i, j ) . MI ( f , g ) = ∑∑ p f , g (i, j ) log p (i ) p ( j ) i =0 j =0 f g O termo H (g | f ) representa a entropia condicional, a qual é baseada na probabilidade condicional p g , f ( j | i ) , ou seja, a probabilidade de um valor de intensidade j existir na imagem g sabendo que o píxel correspondente da imagem f tem intensidade i. Os restantes termos são os mesmos que foram definidos na entropia conjunta. É importante relembrar que, regra geral, f e g representam a região de interesse e que esta não é fixa. Assim, as entropias H ( f ) e H ( g ) não são constantes durante o processo de alinhamento, embora a informação contida nas imagens o seja, obviamente. A dimensão da região de interesse considerada influencia o valor da medida de similaridade informação mútua. Assim, em [Studholme, 1999] é proposta um medida de informação mútua normalizada (NMI) a qual é menos sensível à variação da dimensão das regiões consideradas: NMI ( f , g ) = H ( f ) + H (g ) . H( f , g) 46 CAPÍTULO III − ALINHAMENTO DE IMAGENS MÉDICAS _____________________________________________________________________________________ Em [Pluim, 2003b] é realizado um estudo sobre a utilização da informação mútua no alinhamento de imagens médicas. Esse estudo considera trabalhos até 2002. Como exemplos de trabalhos mais recentes onde é usada a informação mútua, pode-se referir, [Shekhar, 2002] e [Hellier, 2004]. A informação mútua é talvez a medida de similaridade mais usada no alinhamento de imagens médicas. No entanto, a teoria de informação dispõe de outras medidas adequadas para o alinhamento de imagens médicas baseadas na divergência da distribuição conjunta da intensidade das imagens a alinhar. Em [Pluim, 2004] é realizado um estudo comparativo entre a informação mútua e outras medidas baseadas em informação, relativamente ao alinhamento de imagens médicas. 3.3.2 Domínio das frequências Um sinal periódico pode ser representado por uma soma de funções periódicas. A transformada de Fourier e as várias transformadas de onduleta são exemplos disso. Nesta secção vai ser abordada apenas a transformação de uma imagem do domínio espacial para o domínio das frequências usando transformadas de Fourier e de que modo essa transformação pode ser uma ferramenta para o alinhamento de imagens. A transformada de Fourier é uma transformação do sinal representado no domínio temporal ou espacial para o domínio das frequências. Uma imagem bidimensional f no domínio espacial pode ser vista como uma função que a cada par de coordenadas representando uma localização espacial faz corresponder uma intensidade: f : D ⊂ IR 2 → IR . ( x, y ) f ( x, y ) Para imagens discretas, D é um subconjunto de Z e usualmente é rectangular. No domínio das frequências, a mesma imagem f pode ser representada por: F : Γ ⊂ IR 2 → C , (u, v ) F (u, v ) onde cada valor de F (u , v ) é um número complexo z = a + ib para o qual o seu valor absoluto representa a amplitude ou espectro e a expressão arctan(b / a ) representa a fase do sinal. A conversão entre as duas formas é simples e rápida usando a transformada rápida de Fourier (FFT) sem que informação seja perdida. As fórmulas seguintes 47 CAPÍTULO III − ALINHAMENTO DE IMAGENS MÉDICAS _____________________________________________________________________________________ representam a relação entre as duas formas de definir uma imagem, considerando que a imagens f é discreta e está definida num rectângulo de dimensões, M × N , [Gonzalez, 2008]: F (u , v ) = M −1 N −1 ∑∑ f (x, y )e ux vy − i 2π + M N , x =0 y =0 1 f ( x, y ) = MN M −1 N −1 ∑∑ F (u, v )e ux . vy + i 2π M N . u =0 v =0 A Figura 3.3 mostra três imagens exemplo, e os respectivos espectros e fases. Nas imagens representando os espectros, a frequência aumenta do centro da imagem para a periferia e quanto mais branco é um píxel, maior é a magnitude do espectro correspondente, F (u , v ) . Optou-se por centrar as frequências representadas nas imagens obtidas por ser esta a forma mais comum de as representar e também porque facilita a compreensão das propriedades a seguir indicadas. Nas imagens da fase, o ângulo varia linearmente de − π rad (preto) até + π rad (branco). Como pode ser visto na Figura 3.3, uma rotação no domínio espacial corresponde à mesma rotação do espectro no domínio das frequências. Assim, a rotação pode ser determinada também no domínio das frequências. Outro facto que se pode observar é que os espectros de duas imagens cuja diferença entre elas é apenas uma translação é exactamente o mesmo. Esta propriedade é importante em aplicações de alinhamento de imagens porque permite determinar a rotação que melhor alinha as imagens independentemente da translação que as imagens possam ter sofrido. Se as coordenadas rectangulares ( x, y ) da imagem do espectro forem transformadas para coordenadas polares (rho, theta ) , a rotação em coordenadas cartesianas converte-se numa translação em coordenadas polares ao longo do eixo do theta. Assim, usando SSD, correlação cruzada ou correlação de fase, por exemplo, facilmente se pode encontrar o ângulo de rotação óptimo. Observado as imagens da fase, parece que não há informação relevante que possa auxiliar no alinhamento. No entanto, estando duas imagens alinhadas em termos de rotação, a translação pode ser pode ser determinada usando a correlação entre as fases, [Kuglin, 1975], [Foroosh, 2002], [Reddy, 1996], [Orchard, 2007a]. 48 CAPÍTULO III − ALINHAMENTO DE IMAGENS MÉDICAS _____________________________________________________________________________________ Figura 3.3: Por linha, três sequências de imagens exemplo: Da esquerda para a direita: imagens originais no domínio espacial, espectro das imagens no domínio das frequências e finalmente a fase das imagens no domínio das frequências. Usualmente, os métodos baseados na correlação da fase são directos, isto é, determinam o melhor alinhamento de uma só vez em vez de irem aos poucos aproximando-se da melhor solução como muitos outros métodos. Este método é simples, basta considerar a transformada de Fourier de ambas as imagens, dividir um a um os coeficientes correspondentes das respectivas imagens e depois calcular a inversa da transformada de Fourier. Se as duas imagens diferirem apenas de uma translação, a imagem final obtida deverá apresentar um píxel ou um conjunto de píxeis, normalmente adjacentes, com uma intensidade muito maior do que os restantes. Com base na localização desses píxeis pode-se determinar translação, [Kuglin, 1975], [Foroosh, 2002], [Reddy, 1996], [Orchard, 2007a]. Para ilustrar a propriedade acabada de descrever, observe-se a Figura 3.4. Esta imagem foi obtida usando as duas imagens de rectângulos paralelos aos eixos coordenados representados na Figura 3.3. 49 CAPÍTULO III − ALINHAMENTO DE IMAGENS MÉDICAS _____________________________________________________________________________________ Figura 3.4: Exemplo de uma imagem obtida determinando a correlação de fases directamente. A posição do ponto mais claro indica a translação da imagem a alinhar relativamente à imagem modelo. Repare-se que na base da propriedade acabada de descrever está o facto de que o quociente de dois números complexo é um número complexo cuja fase é igual à diferença entre as fases de ambos. Em termos matemáticos, sejam z = r e iθ e w = ρ e iα dois números complexos quaisquer. Aplicando-se propriedades básicas das operações com potências, tem-se que: z / w = (r / ρ )e i (θ −α ) . A Figura 3.5 mostra o alinhamento de duas imagens de CT da cabeça e o alinhamento obtido usando a metodologia acabada de descrever. Nos exemplos apresentados foi utilizada a intensidade dos píxeis para realizar o alinhamento usando a transformada de Fourier. No entanto, mesmo usando a transformada de Fourier, podem ser usadas características extraída da imagem, como por exemplo contornos, [Orchard, 2007a]. A metodologia apresentada é adequada para alinhar imagens onde há apenas uma deformação rígida de uma imagem para a outra. Alguns autores apresentam soluções usando directamente ou indirectamente a transformada de Fourier para realizarem alinhamento não necessariamente rígido. Uma solução, não necessariamente usando transformadas de Fourier, consiste em determinar a correspondência (neste caso alinhamento) de cada uma das pequenas regiões características em que se divide a imagem modelo (considerando essas pequenas regiões como se fossem uma ROI) com a imagem a alinhar. Note-se que neste tipo de alinhamento é necessário optimizar uma medida de similaridade. Depois, considerando as coordenadas dos centróides das pequenas regiões, é possível obter um conjunto de correspondências que serão usadas para determinar a transformação. O problema deste 50 CAPÍTULO III − ALINHAMENTO DE IMAGENS MÉDICAS _____________________________________________________________________________________ método é o elevado esforço computacional requerido. Em [Wong, 2006b] é apresentada uma solução deste género. A principal diferença consiste no método de determinação da translação óptima. Nesse trabalho, Wong e Orchard transformam o cálculo da SSD numa convulsão, a qual é avaliada eficientemente no domínio das frequências, pois uma convulsão no domínio espacial corresponde a uma multiplicação no domínio das frequências. Note-se que se as regiões forem muito pequenas relativamente à imagem, estas podem ser consideradas como pontos numa imagem de menor resolução e portanto as rotações não são consideradas. Além dos trabalhos já referidos, existem muitos outros trabalhos nesta área como, por exemplo, os propostos em [Apicella, 1989], [Kassan, 1996]. Figura 3.5: Alinhamento de duas imagens de CT da cabeça: Na linha superior, duas imagens originais; na linha à inferior, à esquerda as duas imagens sobrepostas antes do alinhamento e à direita as mesmas após o alinhamento. (A imagem modelo foi representada em tons de azul e a imagem a alinhar em tons de vermelho para facilitar a visualização.) 51 CAPÍTULO III − ALINHAMENTO DE IMAGENS MÉDICAS _____________________________________________________________________________________ 3.4 Conclusões Existem várias técnicas de alinhamento de imagens. As apresentadas nesta monografia foram divididas em baseadas em características geométricas e as baseadas na intensidade. No entanto, existem muitas metodologias de alinhamento onde ambas as técnicas trabalham em conjunto e outras em que a classificação se torna algo ambígua. Como paradigmas das técnicas onde ambos os tipos de metodologia trabalham em conjunto, vai-se indicar dois trabalhos. No primeiro, [Auer, 2005], é apresentada uma metodologia de alinhamento hierárquica não rígida. A metodologia proposta pode ser dividida em dois passos principais. No primeiro é realizado um rápido alinhamento rígido grosseiro e no segundo um alinhamento mais lento mas mais fino. No primeiro passo, o alinhamento é realizado com base na maximização da informação mútua modificada e normalizada entre as duas imagens, [Likar, 2000], adoptando um esquema de multi-resolução. Neste mesmo passo é usado o algoritmo de optimização de Powell, [Press, 2002]. No segundo passo, é feita a combinação entre um alinhamento baseado na correspondência pontual com uma interpolação thin-plate spline. No segundo trabalho, [Andreetto, 2004], é apresentado outro exemplo de integração de várias metodologias. O método proposto inicia com a extracção (segmentação) de uma superfície seguida da transformada de Fourier 3D para estimar de forma grosseira a transformação rígida. Seguidamente, é realizado o alinhamento fino das iso-superfícies que descrevem os ossos usando o algoritmo ICP. As várias técnicas/metodologias de alinhamento apresentadas têm pontos fortes e fracos. A decisão de usar uma delas numa determinada aplicação em desfavor das outras depende de características particulares da aplicação, tais como, velocidade de execução pretendida, facilidade/dificuldade de realizar a segmentação das imagens, deformações geométricas admitidas, existência ou não de oclusão de objectos numa imagem relativamente à outra, existência de artefactos numa das imagens, modalidades envolvidas, etc. 52 CAPÍTULO IV Conclusões finais e perspectivas de trabalho futuro 4.1 Conclusões A realização do estudo de investigação que está na base desta monografia, assim como as soluções de alinhamento de imagem entretanto desenvolvidas e implementadas, permitiram ter uma ideia bastante clara desta área de investigação. Foram estudadas técnicas cujo desenvolvimento já se processou há alguns anos, assim como técnicas cujo desenvolvimento é muito mais recente. Esta opção teve como principal objectivo promover um desenvolvimento equilibrado de competências na área do alinhamento de imagens, em especial as de origem médica. 4.2 Perspectivas de trabalho para a Tese de Doutoramento A primeira fase do presente trabalho de Doutoramento, correspondente ao estudo bibliográfico detalhado sobre as várias técnicas, metodologias e modelizações computacionais, existentes em Visão Computacional, para o emparelhamento e alinhamento de imagens/estruturas, está praticamente concluído, como se comprova pelos capítulos anteriores. No entanto, um estudo mais aprofundado será realizado relativamente às técnicas que venham a ser implementadas. Na etapa seguinte deste projecto será construída a base da plataforma computacional a utilizar no desenvolvimento, ensaio, comparação e validação das técnicas, modelações e metodologias a considerar. Assim, serão identificadas e seleccionadas as bibliotecas 53 CAPÍTULO IV − CONCLUSÕES FINAIS E PERSPECTIVAS DE TRABALHO FUTURO _____________________________________________________________________________________ computacionais que a mesma poderá integrar. Caso a plataforma seja construída em C++, poderão ser consideradas a bibliotecas Newmat (para cálculo matricial), OpenCV (de processamento e análise de imagem), VTK (para a visualização e o processamento de objectos gráficos 2D/3D), Free DICOM (para a importação e exportação de ficheiros de imagem em formato DICOM) e ezDICOM (para importação e exportação de ficheiros de imagens médicas de ressonância magnética, tomografia computorizada e ultra-sons). Após o desenvolvimento da base da plataforma computacional de desenvolvimento, serão definidos vários casos reais de aplicação existentes na área médica. Assim, serão identificados vários casos de aplicação de emparelhamento e alinhamento de estruturas em imagens médicas 2D, 3D e 4D (3D mais tempo), considerando vários pacientes e diferentes técnicas de aquisição de imagem. Exemplos de estruturas a considerar são: coração, cérebro, pulmões, órgãos da cavidade pélvica, artérias e pés. Na fase seguinte deste projecto, serão desenvolvidas, integradas na plataforma de desenvolvimento, ensaiadas e validadas, técnicas, metodologias e modelizações computacionais que permitam o emparelhamento e o alinhamento de estruturas representadas em imagens médicas 2D/3D/4D. Assim, serão consideradas as seguintes etapas, objectivos, técnicas e métodos: − Emparelhamento de estruturas representadas em imagens médicas 2D, considerando-se para tal características chave das mesmas, como pontos de elevada curvatura, contornos e regiões. Com este fim, poderão ser consideradas, entre outras possibilidades, modelizações estatísticas, geométricas e físicas, complementadas com técnicas de optimização; − Alinhamento de estruturas representadas em imagens médicas 2D; após o emparelhamento de estruturas representadas em imagens médicas 2D, a transformação espacial que melhor mapeia os dados envolvidos deverá ser obtida, obtendo-se a sua componente rígida e as deformações não rígidas locais; descritores canónicos robustos poderão também ser desenvolvidos e obtidos, quer para as estruturas em causa quer para a transformação espacial obtida; nesta etapa, serão consideradas técnicas de optimização; − As técnicas, metodologias e modelizações desenvolvidas nas etapas anteriores 54 CAPÍTULO IV − CONCLUSÕES FINAIS E PERSPECTIVAS DE TRABALHO FUTURO _____________________________________________________________________________________ para emparelhar e alinhar estruturas representadas em imagens 2D deverão ser agora adequadas, se possível, para imagens 3D; poderão ser implementadas técnicas específicas para imagens 3D; − Após os desenvolvimentos anteriores para emparelhar e alinhar estruturas representadas em imagens 2D e 3D, nesta etapa serão desenvolvidas técnicas, metodologias e modelizações para realizar o emparelhamento e alinhamento de estruturas ao longo do tempo; isto é, ao longo de sequências de imagens médicas; para tal, os desenvolvimentos anteriores poderão ser complementados com a utilização de métodos estocásticos, como filtragem de Kalman e suas variantes, para prever em cada instante o comportamento dos modelos construídos para as estruturas, e modelizações de movimento. Ao longo de todos os desenvolvimentos e implementações efectuadas, as técnicas, metodologias e modelizações consideradas serão cuidadosamente ensaiadas e validadas recorrendo-se a casos sintéticos adequados e aos casos reais da área da imagem médica previamente identificados e seleccionados. 55 Referências [Adams, 1994] − R. Adams, L. Bischof. Seeded region growing. IEEE Transactions on Pattern Analysis and Machine Intelligence, vol. 16, no. 6, pp. 641-647, June 1994. [Andreetto, 2004] − Marco Andreetto, Guido M. Cortelazzo. Frequency domain registration of computer tomography data. Proceedings of the 2nd International Symposium on 3D Data Processing, Visualization, and Transmission (3DPVT’04). [Apicella, 1989] − A. Apicella, J. S. Kippenhan, J. H. Nagel. Fast multi-modality image matching. Med. Imaging III: Image Process., vol. Proc. SPIE 1092, pp. 252263, 1989. [Auer, 2005] − Martin Auer, Peter Regitnig, Gerhard A. Holzapfel. An automatic nonrigid registration for stained histological sections. IEEE Transactions on Image Processing, vol. 14, no. 4, pp. 475-486, April 2005. [Bastos, 2006] − L. Bastos, J. M. R. S. Tavares. Matching of objects nodal points improvement using optimization. Inverse Problems in Science and Engineering, vol. 14, no. 5, pp. 529-541, 2006. [Belongie, 2002] − S. Belongie, J. Malik, J. Puzicha. Shape matching and object recognition using shape contexts. IEEE Transactions on Pattern Analysis and Machine Intelligence, vol. 24, no. 24, pp. 509-522, 2002. 56 REFERÊNCIAS _____________________________________________________________________________________ [Besl, 1992] − P. J. Besl, N. D. McKay. A method for registration of 3-D shapes. IEEE Transactions on Pattern Analysis and Machine Intelligence, vol. 14, pp. 239256, 1992. [Beucher, 1992] − S. Beucher. The watershed transformation applied to image segmentation. 10th Pfefferkorn Conference on Signal and Image Processing in Microscopy and Microanalysis, 16-19 sept. 1991, Cambridge, UK, Scanning Microscopy International, suppl. 6, pp. 299-314, 1992. [Block, 2006] − W. F. Block, A. L. Alexander, S. B. Fain, M. E. Meyerend, C. J. Moran, S. B. Reeder, K. K. Vigen, O. Wieben, J. H. Brittain. Magnetic Resonance Imaging. Enclyclopedia of Medical Devices and Instrumentation, Second Edition, Volume 4. Wiley-Interscience, A John Wiley & Sons Inc. Publication, 2006. [Brown, 1992] − Lisa Gottesfeld Brown. A survey of image registration techniques. ACM Computing Surveys, vol. 24, no. 4, pp. 325-376, 1992. [Canny, 1986] − J. F. Canny. A computational approach to edge detection. IEEE Transactions on Pattern Analysis and Machine Intelligence, vol. 8, no. 6, pp. 679-698, November 1986. [Carcassoni, 2003] − M. Carcassoni, E. Hancock. Correspondence matching with modal clusters. IEEE Transactions on Pattern Analysis and Machine Intelligence, vol. 25, no. 12, pp. 1609-1615, 2003. [Chung, 2000] – Jae-Moon Chung, Noboru Ohnishi. Matching and recognition of planar shapes using medial axis properties. Bio-Mimetic Control Research Center, The Institute of Physical and Chemical Research (Riken), 2000. [Cideciyan, 1995] − A. Cideciyan. Registration of ocular fundus images: an algorithm using cross-correlation of triple invariant image descriptors. IEEE Engineering in Medicine and Biology Magazine, vol. 14, no. 1, pp. 52-58, 1995. 57 REFERÊNCIAS _____________________________________________________________________________________ [Cohen, 1997] − S. Cohen, L. Guibas. Partial matching of planar polylines under similarity transformations. Proceeding of the 8th Annual Symposium on Discrete Algorithms, pp. 777-786, 1997. [Collignon, 1995] − A. Collignon, F. Maes, D. Delaere, D. Vandermeulen, P. Suetens, G. Marchal. Automated multi-modality image registration based on information theory. Information Processing in Medical Imaging, Y. Bizais, C. Barillot, and R. Di Paola, Eds., pp. 263-274, Kluwer Academic Publishers, Dordrecht, Netherlands, 1995. [Collignon, 1998] − A. Collignon. Multi-modality medical image registration by maximization of mutual information. PhD. Thesis, Catholic University of Leuven, Leuven, Belgium, 1998. [Cootes, 1992] − T. Cootes, C. Taylor. Active shape models – smart snakes. Proceedings of the British Machine Vision Conference, Leeds, 1992. [Cvejic, 2006] − N. Cvejic, C N. Cangarajah, D. R. Bull. Image fusion metric based on mutual information and Tsallis entropy. Electronics Letters, vol. 42, no. 11, pp. 626-627, 2006. [Dorst, 2005] − Leo Dorst. First order error propagation of the Procrustes method for 3D attitude estimation. IEEE Transactions on Pattern Analysis and Machine Intelligence, vol. 27, no. 2, pp. 221-229, February 2005. [Elsen, 1993] − Petra A. van Elsen, Evert-Jan D. Pol, Max A. Viergever. Medical image matching − a review with classification. IEEE Engineering in Medicine and Biology, vol. 12, no. 1, pp. 26-39, March 1993. [Fielding, 2000] − G. Fielding, M. Kam. Weighted matching for dense stereo correspondence. Pattern Recognition, vol. 33, no. 9, pp. 1511-1524, 2000. [Fischler, 1981] − M. Fischler, R. Bolles. Random sample consensus: a paradigm for model fitting with applications to image analysis and automated cartography. Comm. of the ACM, 1981, vol. 24, pp. 381-395, 1981. 58 REFERÊNCIAS _____________________________________________________________________________________ [Fitch, 2005] − A. Fitch, A. Kadyrov, W. Christmas, J. Kittler. Fast robust correlation. IEEE Transactions on Image Processing, vol. 14, no. 8, pp. 1063-1073, 2005. [Fitzpatrick, 1998] − J. Fitzpatrick, J. West, C. Maurer. Predicting error in rigid-body, point-based registration. IEEE Transactions on Medical Imaging, vol. 17, pp. 694-702, 1998. [Foroosh, 2002] − H. Foroosh, J. B. Zerubia, M. Berthod. Extension of phase correlation to subpixel registration. IEEE Transactions on Image Processing, vol. 11, no. 3, pp. 188-200, March 2002. [Friston, 1995] − K. J. Friston, J. Ashburner, J. B. Poline, C. D. Frith, J. D. Heather, R. S. J. Frackowiak. Spatial registration and normalization of images. Human Brain Mapping, vol. 2, pp. 165-189, 1995. [Gonçalves, 2008] − P. Gonçalves, J. Tavares, R Jorge. Segmentation and simulation of objects represented in images using physical principles. CMES: Computer Modeling in Engineering & Sciences, vol. 32, no. 1, pp. 45-55, 2008. [Gonzalez, 2008] − R. Gonzalez, R. Woods. Digital image processing, Third Edition, Prentice Hall, 2008. [Grau, 2004] − V. Grau, A.U. J. Mewes, M. Alcaniz, R. Kikinis, S. K. Warfield. Improved watershed transform for medical image segmentation using prior information. IEEE Transactions on Medical Imaging, vol. 23, no. 4, pp. 447458, April 2004. [Guimond, 2001] − A. Guimond, A. Roche, N. Ayache, J. Meunier. Three-dimensional multimodal brain warping using the demons algorithm and adaptive intensity corrections. IEEE Transactions on Medical Imaging, vol. 20, no. 1, pp. 58-69, January 2001. [Hajnal, 1995] − Joseph. V. Hajnal, N. Saeed, A. Oatridge, E. J. Williams, I. R. Young, G. M. Bydder. Detection of subtle brain changes using subvoxel registration and subtraction of serial MR images. Journal of Computer Assisted Tomography, vol. 19, pp. 677-691, 1995. 59 REFERÊNCIAS _____________________________________________________________________________________ [Hajnal, 2001] − Joseph V. Hajnal, Derek Hill, David J. Hawkes. Medical Image Registration. CRC Press, 2001. [Hamza, 2003] − Y. He, A. B. Hamza, H. Krim. A generalized divergence measure for robust image registration. IEEE Transactions on Signal Processing, vol. 51, no. 5, pp. 1211-1220, 2003. [Hartley, 2003] − Richard Hartley, Andrew Zisserman. Multiple view geometry in computer vision, Second Edition. Cambridge, 2003 [Hellier, 2004] − Pierre Hellier, Christian Barillot. A hierarchical parametric algorithm for deformable multimodal image registration. Computer Methods and Programs in Biomedicine vol. 75, no. 2, pp. 107-115, 2004. [Jan, 2006] − Jiří Jan. Medical image processing, reconstruction and restoration: concepts and methods. CRC Press - Taylor & Francis Group, 2006. [Kass, 1988] − M. Kass, A. Witkin, D. Terzopoulos. Snakes: active contour models. International Journal of Computer Vision, vol. 1, pp. 321-331, 1988. [Kassan, 1996] − A. Kassam, M. L. Wood. Fourier registration of three-dimensional brain MR images: exploiting the axis of rotation. Journal of Magnetic Resonance Imaging, vol. 6, pp. 894-902, 1996. [Keren, 2009] − D. Keren. A probabilistic method for point matching in the presence of noise and degeneracy. Journal of Mathematical Imaging and Vision, vol. 33, pp. 338-346, 2009. [Kuglin, 1975] − C. D. Kuglin, D. C. Hines. The phase correlation image alignment method. Proceedings International. Conference. Cybernetics and Society, pp. 163-165, 1975. [Laliberté, 2003] − France Laliberté, Langis Gagnon, Yunlong Sheng. Registration and fusion of retinal images − an evaluation study. IEEE Transactions on Medical Imaging, vol. 22, no. 5, pp. 661-673, May 2003. 60 REFERÊNCIAS _____________________________________________________________________________________ [Likar, 2000] − B. Likar, F. Pernus. A hierarchical approach to elastic registration based on mutual information. Image and Vision Computing, vol. 19, pp. 33-44, 2000. [Livyatan, 2003] − H. Livyatan, Z. Yaniv. Gradient-based 2-D/3-D rigid registration of fluoroscopic X-ray to CT. IEEE Transactions on Medical Imaging, vol. 22, no. 11, pp. 1395-1406, November 2003. [Loeckx, 2003] − D. Loeckx, F. Maes, D. Vandermeulen, P. Suetens. Temporal subtraction of thorax CR images Uusing a statistical deformation model. IEEE Transactions on Medical Imaging, vol. 22, no. 11, November 2003. [Lucas, 1981] − B. Lucas, T. Kanade. An interative image registration technique with an application to stereo vision. Proceedings Imaging Understanding Workshop, 1988, pp. 121-130. [Ma, 2009] − Zhen Ma, J. Tavares, R. Jorge, T. Mascarenhas. A review of algorithms for medical image segmentation and their applications to the female pelvic cavity. Computer Methods in Biomechanics and Biomedical Engineering, DOI: 10.1080/10255840903131878, 2009 (in press). [Maciel, 2003] − J. Maciel, J. Costeira. A global solution to sparse correspondence problems. IEEE Transactions on Pattern Analysis and Machine Intelligence, vol. 25, no. 2, pp. 187-199, 2003. [Maes, 1997] − F. Maes, A. Collignon, D. Vandermeulen, G. Marchal, P. Suetens. Multi-modality medical image registration by maximization of mutual information. IEEE Transactions on Medical Imaging, vol. 16, no. 2, pp. 187198, 1997. [Maintz, 1996] − J. B. A. Maintz, P. A. van Elsen, M. A. Viergever. Evaluation of ridge seeking operators for multimodality medical image matching. IEEE Transactions on Pattern Analysis and Machine Intelligence, vol. 18, no. 4, 353365, 1996. 61 REFERÊNCIAS _____________________________________________________________________________________ [Maintz, 1998] − J. B. A. Maintz, M. A. Viergever. A survey of medical image registration. Medical Image Analysis, Oxford, vol. 2, no. 1, pp. 1-36, 1998. [Marr, 1980] − D. Marr, E. Hildreth. Theory of edge detection. Proceedings of the Royal Society of London. Series B, Biological Sciences, vol. 207, no. 1167, pp. 187217, February, 1980. [Martin, 2004] − S. Martin, G. Morison, W. Nailon, T. Durrani. Fast and accurate image registration using Tsallis entropy and simultaneous perturbation stochastic approximation. Electronics Letters, vol. 40, no. 10, pp. 595-597, 2004. [Matsopoulos, 2004] − George K. Matsopoulos, Pantelis A. Asvestas, Nikolaos A. Mouravliansky, Konstantinos K. Delibasis. Multimodal registration of retinal images using self organizing maps. IEEE Transactions on Medical Imaging, vol. 23, no. 12, December 2004. [McLaughlin, 2005] − Robert A. McLaughlin, John Hipwell, David J. Hawkes, J. Alison Noble, James V. Byrne, Tim C. Cox. A Comparison of a similaritybased and a feature-Based 2-D–3-D registration method for neurointerventional use. IEEE Transactions on Medical Imaging, vol. 24, no. 8, August 2005. [Moisan, 2004] − L. Moisan, S. Bérenger. A probabilistic criterion to detect rigid point matches between two images and estimate the fundamental matrix. International Journal of Computer Vision, vol. 57, no. 3, pp. 201-218, 2004. [Monteiro, 2007] − Fernando J. C. Monteiro. Region-based spatial and temporal image segmentation. PhD Thesis, Faculdade de Engenharia da Universidade do Porto, 2007. [Oliveira, 2008] − Francisco P. M. Oliveira, João Manuel R. S. Tavares. Algorithm of dynamic programming for optimization of the global matching between two contours defined by ordered points. CMES: Computer Modeling in Engineering & Sciences, vol. 31, no. 1, pp. 1-11, 2008. 62 REFERÊNCIAS _____________________________________________________________________________________ [Oliveira, 2009a] − Francisco P. M. Oliveira, João Manuel R. S. Tavares. Matching contours in images through the use of curvature, distance to centroid and global optimization with order-preserving constraint. CMES: Computer Modeling in Engineering & Sciences, vol. 43, no. 1, pp. 91-110, 2009. [Oliveira, 2009b] − Francisco P. M. Oliveira, João Manuel R. S. Tavares, Todd C. Paraky. Rapid pedobarographic image registration based on contour curvature and optimization. Journal of Biomechanics (aceite). [Oliveira, 2009c] − Francisco P. M. Oliveira, João Manuel R. S. Tavares, Todd C. Pataky. A versatile matching algorithm based on dynamic programming with circular order preserving. VIPimage 2009 – II ECCOMAS Thematic Conference on Computational Vision and Medical Image Processing, Porto, Portugal, 14-16 October, 2009 (aceite). [Orchard, 2005] − Jeff Orchard. Efficient global weighted least-squares translation registration in the frequency domain. Proceedings of International Conference Image Analysis and Recognition ICIAR, 2005, Toronto, Canada, vol. 3656, pp. 116-124. [Orchard, 2007a] − Jeff Orchard. Globally optimal multimodal rigid registration: an analytic solution using edge information. Proceedings of IEEE International Conference on Image Processing, 2007, vol. 1, pp. I – 485-488. [Orchard, 2007b] − Jeff Orchard. Efficient least squares multimodal registration with a globally exhaustive alignment search. IEEE Transactions on Image Processing, vol. 16, no. 10, October 2007. [Otsu, 1979] − Nobuyuki Otsu. A threshold selection method from gray-level histogram. IEEE Transactions on Systems Man Cybernetics, vol. 9, pp. 62-66, 1979. [Otterloo, 1991] − P. Otterloo. A contour-oriented approach to shape analysis, Prentice Hall International (UK) Ltd, Englewood Cliffs, NJ, pp. 90-108, 1991. 63 REFERÊNCIAS _____________________________________________________________________________________ [Penney, 1998] − G. P. Penney, J. Weese, J. A. Little, P. Desmedt, D. L. G. Hill, D. J. Hawkes. A comparison of similarity measures for use in 2-D-3-D medical image registration. IEEE Transactions on Medical Imaging, vol. 17, no. 4, pp. 586–595, August 1998. [Periaswamy, 2003] − S. Periaswamy, H. Farid. Elastic registration in the presence of intensity variations. IEEE Transactions on Medical Imaging, vol. 22, no. 7, pp. 865-874, July 2003. [Pluim, 2003a] − Josien P. W. Pluim, J. Michael Fitzpatrick. Image registration. IEEE Transactions on Medical Imaging, vol. 22, no. 11, pp. 1341-1343, 2003. [Pluim, 2003b] − Josien P. W. Pluim, J. B. Antoine Maintz, Max A. Viergever. Mutual information based registration of medical images: a survey. IEEE Transactions on Medical Imaging, vol. 22, no. 8, pp. 986-1004, 2003. [Pluim, 2004] − Josien P. W. Pluim, J. B. Antoine Maintz, Max A. Viergever. fInformation measures in medical image registration. IEEE Transactions on Medical Imaging, vol. 23, no. 12, pp. 1508-1516, December 2004 [Press, 2002] − William H. Press, Saul A. Teukolsky, William T. Vetterling, Brian P. Flannery. Numerical recipes in C: the art of scientific computing. Cambridge University Press, 2002. [Prince, 2006] − Jerry L. Prince, Jonathan M. Links. Medical imaging signals and systems. Pearson Prentice Hall Bioengineering, 2006. [Reddy, 1996] − B. Reddy, B. Chatterji. An FFT-based technique for translation, rotation, and scale-invariant image registration. IEEE Transactions on Image Processing, vol. 5, no. 8, pp. 1266-1271, August 1996. [Roy, 1998] − S. Roy, I. Cox. A maximum-flow formulation of the n-camera stereo correspondence problem. IEEE Proceedings of International Conference on Computer Vision, Bombai, January, 1998. 64 REFERÊNCIAS _____________________________________________________________________________________ [Sclaroff, 1995] − S. Sclaroff, A. Pentland. Modal matching for correspondence and recognition. IEEE Transactions on Pattern Analysis and Machine Intelligence, vol. 17, no. 6, pp. 545-561, 1995. [Scott, 1991] − G. Scott, H. Longuet-Higgins. An algorithm for associating the features of two patterns. Proc Roy Soc Lond, vol. B244, pp. 21-26, 1991. [Scott, 2006] − C. Scott, R. Nowak. Robust contour matching via the order-preserving assignment problem. IEEE Transactions on Image Processing, vol. 15, no. 7, pp. 1831-1838, 2006. [Sebastian, 2004] – Thomas B. Sebastian, Philip N. Klein, Benjamin B. Kimia. Recognition of shape by editing their shock graphs. IEEE Transactions on Pattern Analysis and Machine Intelligence, vol. 26, no. 5, May 2004. [Shannon, 1948] − C. E. Shannon. The mathematical theory of communication (parts 1 and 2), Bell Syst. Tech. J., vol. 27, pp. 379-423&623-656, 1948. [Shapiro, 1992] − L. Shapiro, M. Brady. Feature-based correspondence: an eigenvector approach. Image and Vision Computing, vol. 10, no. 5, pp. 283-288, 1992. [Shekhar, 2002] − R. Shekhar, V. Zagrodsky. Mutual information-based rigid and nonrigid registration of ultrasound volumes. IEEE Transactions on Medical Imaging, vol. 21, no. 1, pp. 9-22, 2002. [Solaiyappan, 2000] − M. Solaiyappan, S. Gupta. Predictive registration of cardiac MR perfusion images using geometric invariants. Proceedings of ISMRM 2000, Denver, Colorado, USA, vol. 1, pp. 37, 2000. [Starink, 1995] − J. Starink, E. Backer. Finding point correspondences using simulated annealing. Pattern Recognition, vol. 8, no. 2, pp. 231-240, 1995. [Studholme, 1999] − C Studholme, D. G. Hill, D. J. Hawkes. An overlap invariant entropy measure of 3D medical image alignment. Pattern Recognition, vol. 32, no. 1, pp. 71-86, January 1999. 65 REFERÊNCIAS _____________________________________________________________________________________ [Sun, 2007] − Shaoyan Sun, Liwei Zhang, Chonghui Guo. Medical image registration by minimizing divergence measure based on Tsallis entropy. International Journal of Biological and Medical Sciences vol. 2, no. 2, pp. 75-80, 2007. [Tavares, 2000] − J. Tavares, J. Barbosa, A. Padilha, Matching image objects in dynamic pedobarography, RecPad 2000, 11th Portuguese Conference on Pattern Recognition, Porto, Portugal, 2000. [Tavares, 2007] − J. Tavares, F. Carvalho, F. Oliveira, M. Vasconcelos, P. Gonçalves, R. Pinho. Computer analysis of objects’ movement in image sequences: methods and applications. DSM 2007 – Conferência Nacional de Dinâmica de Sistemas Multicorpo, ISBN: 978-989-20-0968-1, pp. 33-40, Guimarães, Portugal, 6-7 Dezembro 2007. [Tsallis, 1988] − C. Tsallis. Possible generalization of Boltzmann-Gibbs statistics. J. Stat. Phys., vol. 52, pp. 479-487, 1988. [Vasconcelos, 2008] − M. Vasconcelos, J. Tavares. Methods to automatically built point distribution models for objects like hand palms and faces represented in images. CMES: Computer Modeling in Engineering & Sciences, vol. 36, no. 3, pp. 213-241, 2008. [Viola, 1995a] − Paul Viola. Alignment by maximization of mutual information. PhD Thesis, Massachusetts Institute of Technology, 1995. [Viola, 1995b] − Paul Viola, William M. Wells III. Alignment by maximization of mutual information. International Conference on Computer Vision, E. Grimson, S. Shafer, A. Blake, and K. Sugihara, Eds., pp. 16-23, IEEE Computer Society Press, Los Alamitos, CA, 1995. [Viola, 1997] − Paul Viola and William M. Wells III. Alignment by maximization of mutual information. International Journal of Computer Vision, vol. 24, no. 2 pp. 137-154, 1997. 66 REFERÊNCIAS _____________________________________________________________________________________ [Wachowiak, 2003] − M. P. Wachowiak, R. Smolikova, T. M. Peters. Multiresolution biomedical image registration using generalized information measures. Proceedings of Medical Image Computing and Computer Assisted Intervention (MICCAI), pp. 846-853, Montréal, 2003. [Wang, 2006] − S. Wang, M. Wang: Structural shape and topology optimization using an implicit free boundary parametrization method. CMES: Computer Modeling in Engineering & Sciences, vol. 13, no. 2, pp. 119-147, 2006. [Wang, 2007] − S. Wang, K. Lim, B. Khoo, M. Wang. A geometric deformation constrained level set method for structural shape and topology optimization. CMES: Computer Modeling in Engineering & Sciences, vol. 18, no. 3, pp. 155-181, 2007. [Wellner, 1993] − Pierre Wellner. Adaptive thresholding for the digital desk. Rank Xerox Technical Report EPC-1993-110, 1993. [Wells, 1995] − William M. Wells III, Paul Viola, R. Kikinis. Multi-modal volume registration by maximization of mutual information. Medical Robotics and Computer Assisted Surgery, pp. 55-62, John Wiley & Sons, New York, 1995. [Wiles, 2008] − Andrew D. Wiles, Alexander Likholyot, Donald D. Frantz, Terry M. Peters. A statistical model for point-based target registration error with anisotropic fiducial localizer error. IEEE Transactions on Medical Imaging, vol. 27, no. 3, March 2008. [Wolberg, 2000] − G. Wolberg, S. Zokai. Robust image registration using log-polar transform. Proceedings of International Conference on Image Processing, 2000, vol. 1, pp. 493-496, 2000. [Wong, 2006a] − Alexander Wong, William Bishop, Jeff Orchard. Efficient multi-modal least-squares alignment of medical images using quasi-orientation maps. Proceedings of the 2006 International Conference on Image Processing, Computer Vision, & Pattern Recognition, Las Vegas, Nevada, USA, June 2629, 2006. 67 REFERÊNCIAS _____________________________________________________________________________________ [Wong, 2006b] − Alexander Wong, Jeff Orchard. Efficient and robust non-rigid leastsquares rectification of medical images. Proceedings of the 2006 International Conference on Image Processing, Computer Vision, & Pattern Recognition, Las Vegas, Nevada, USA, June 26-29, 2006 [Woods, 1998] − R. P. Woods, S. T. Grafton, C. J. Holmes, S. R. Cherry, J. C. Mazziotta. Automated image registration: I. general methods and intrasubject, intramodality validation. Journal of Computer Assisted Tomography, vol. 22, pp. 139-152, 1998. [Wu, 1995] − M. Wu, J. Leou. A bipartite matching approach to feature correspondence in stereo vision. Pattern Recognition Letters, vol. 16, pp. 2331, 1995. [Xu, 1998] − C. Xu, J. Prince. Snakes, shapes, and gradient vector flow. IEEE Transactions on Image Processing, vol. 7, no. 3, pp. 359-369, 1998. [Zhang, 2001] − Y. Zhang. A review of recent evaluation methods for image segmentation. Sixth International Symposium on Signal Processing and its Applications, Kuala Lumpur, Malaysia: IEEE, 2001. [Zhang, 2004] − D. Zhang, G. Lu. Review of shape representation and description techniques. Pattern Recognition, vol. 37, pp. 1-19, 2004. [Zhu, 1996] – Song Chun Zhu, A. L. Yuille. FORMS: Flexible object recognition and modeling system. International Journal of Computer Vision, vol. 20, n. 3, December 1996. [Zitová, 2003] − Barbara Zitová, Jan Flusser. Image registration methods: a survey. Image and Vision Computing, vol. 21, pp. 977-1000, 2003. 68