segmentação de imagens de intensidade gerada por

Propaganda
Apresentação
Panorama
Programa
Relação de Títulos
Relação de Autores
Busca de Palavras
SEGMENTAÇÃO DE IMAGENS DE INTENSIDADE GERADA POR
PERFILAMENTO A LASER USANDO TÉCNICAS DE DIVISÃO E FUSÃO
DE REGIÕES
Edinéia Aparecida dos Santos Galvanin1
Aluir Porfírio Dal Poz2
Antonio Juliano Fazan1
Aparecida Doniseti Pires de Souza3
Universidade Estadual Paulista - Faculdade de Ciências e Tecnologia
1
Programa de Pós-Graduação em Ciências Cartográficas
2
Departamento de Cartografia
3
Departamento de Matemática, Estatística e Computação
Rua Roberto Simonsen, 305 - Campus de Presidente Prudente – SP
{edineia, aluir, juliano, adps}@prudente.unesp.br
RESUMO
Este artigo propõe uma metodologia para a segmentação de regiões em imagens de intensidade de retorno de
pulso laser. Esta metodologia baseia-se na utilização conjunta de duas técnicas seqüenciais, sendo uma de divisão
recursiva e outra de fusão de regiões. A etapa inicial de divisão recursiva consiste no particionamento da imagem em
um conjunto de regiões arbitrárias. Essa estratégia consiste então em dividir a imagem em regiões, utilizando um limiar
pré-estabelecido com base em conhecimentos a priori dos objetos presentes na cena. Ao final desse processo de
segmentação é obtida uma imagem dividida em regiões contíguas, mas que pode estar fragmentada devido à
possibilidade de ligeiras diferenças radiométricas na imagem de retorno de pulso laser. Já a etapa fusão de regiões tem
por objetivo unir regiões adjacentes, com características similares, tendo por base critérios estatísticos. Neste caso
verifica-se através de um teste de razão de verossimilhanças se as regiões adjacentes pertencem ou não a um mesmo
objeto. A utilização de critérios estatísticos para a discriminação de regiões de interesse é de suma importância, visto
que estes procedimentos podem fazer com que os objetos existentes na cena sejam segmentados com maior eficiência.
Assim, a solução proposta consiste em aplicar a técnica de divisão recursiva na imagem de intensidade e então aplicar o
processo de fusão de regiões utilizando critérios estatísticos na imagem particionada. Os resultados obtidos permitiram
verificar que a metodologia proposta é apropriada para aplicações envolvendo análise de imagem, pois possibilitou a
obtenção de regiões geralmente relacionadas com objetos urbanos, tais como ruas e edifícios. Especialmente a etapa de
fusão estatística mostrou-se eficiente para a diminuição da fragmentação observada nos resultados gerados pela etapa
inicial de divisão recursiva.
Palavras chaves: Divisão recursiva, Fusão de regiões, Análise de imagem, Perfilamento a laser, Imagem de intensidade.
ABSTRACT
This paper proposes a methodology for region segmentation in laser beam intensity images. This
methodology is based on the use of two sequential techniques, i.e. a recursive splitting and region merging techniques.
The initial stage of recursive splitting consists in partitioning the image in a set of arbitrary regions. This strategy aims
at splitting the image into a set of regions using a pre-defined threshold based on prior knowledge of objects presented
on the scene. At the end of this segmentation process, it is obtained an image subdivided in contiguous regions, but it
might be fragmented due to the possibility of slight radiometric differences on the laser beam intensity image. The stage
of region merging aims at jointing adjacent regions with similar characteristics, using statistical rules. In this case it is
verified through a likelihood ratio test whether adjacent regions belong or not to the same object. The use of statistical
criteria for discrimination of interest regions is very important, because these procedures can allow the segmentation of
the objects in the scene to be more efficient. Thus, the proposed solution consists in applying the recursive splitting
technique to the intensity image and then applying the region merging process using statistical rules to the partitioned
image. The obtained results have showed that the proposed methodology is appropriate for application involving image
analysis, because it has made possible the extraction of regions usually related to urban objects, such as streets and
buildings. Especially the stage of statistical merging has proved to be efficient in the decrease of the fragmentation
observed in the results generated by the initial stage of recursive splitting.
Apresentação
Panorama
Programa
Relação de Títulos
Relação de Autores
Busca de Palavras
Keywords: Recursive splitting, Region merging, Image analysis, Laser scanning, Intensity image
1 INTRODUÇÃO
2 SISTEMA DE PERFILAMENTO A LASER
A segmentação de imagens é o termo usado
em visão computacional para o agrupamento de partes
de uma imagem genérica em unidades que são
homogêneas com respeito a uma ou várias
características (ou atributos), resultando em uma
imagem segmentada (Ballard e Brown, 1982).
A segmentação por regiões é utilizada para
separar os objetos de interesse. Neste caso, a imagem é
particionada em diferentes regiões, ficando cada uma
relacionada a certas características e conjuntos de
pixels conectados. Assim, a partir do particionamento
da imagem, em regiões, podem ser realizadas medidas
sobre cada região e as relações entre as regiões
adjacentes podem ser estabelecidas (Gonzales e
Woods, 2000).
No âmbito de reconhecimento de padrões a
segmentação de imagens é um passo preliminar e
essencial para passos subseqüentes de análise de
imagem. Neste caso, o reconhecimento pode ser
realizado a partir do relacionamento espacial entre os
objetos de interesse presentes na cena.
A estratégia proposta neste trabalho consiste
no particionamento da imagem em um conjunto de
regiões arbitrárias. Ao final desse processo de
segmentação é obtida uma imagem dividida em regiões
contíguas, mas que pode estar fragmentada devido à
possibilidade de ligeiras diferenças radiométricas na
imagem de retorno de pulso laser. Já a etapa de fusão
de regiões tem por objetivo unir regiões adjacentes
com características similares, tendo por base critérios
estatísticos. Neste caso, verifica-se através da razão de
verossimilhanças (Jain et al., 1995) e através de um
teste de razão de verossimilhanças (Larson, 1982) se as
regiões adjacentes pertencem ou não a um mesmo
objeto. A utilização de critérios estatísticos a respeito
das regiões de interesse é de suma importância, visto
que estas informações podem fazer com que os objetos
existentes na cena sejam segmentados com maior
eficiência.
Este artigo está organizado em 6 seções
principais. A seção 2 apresenta algumas características
do sistema de perfilamento a laser. A seção 3 apresenta
os aspectos teóricos da divisão recursiva de regiões. Já
os aspectos teóricos do processo de fusão de regiões
são apresentados na seção 4. Os resultados e análise
são descritos na seção 5 e a seção 6 traz as
considerações finais sobre o trabalho.
Nos últimos anos o uso da tecnologia de
perfilamento a laser tem se tornado foco crescente de
pesquisas. A necessidade de aquisição rápida e eficaz
de dados digitais de elevação do terreno (Modelo
Digital de Elevação - MDE) tem motivado o uso desta
tecnologia.
O sistema de perfilamento a laser é
composto por três componentes principais, sendo eles o
Global Positioning System (GPS), o Inertial
Measurement Unit (IMU) e o sensor LASER. Este
sistema tem como função principal, através da emissão
e recepção de pulsos de LASER, medir a distância
entre o sensor e a superfície do objeto. Com a
integração GPS/IMU, o sistema fornece uma nuvem de
pontos adquirida através das medidas de distância.
Uma característica marcante dos sistemas de
perfilamento a laser é a medição da primeira e da
última reflexão de um mesmo pulso. Alguns sistemas
podem medir diferentes ecos do sinal emitido, refletido
por diferentes objetos dentro da projeção do feixe no
terreno (footprint). É possível medir o primeiro e o
último eco do pulso, ou até medir toda a variação do
eco, se for necessário (Wehr e Lohr, 1999).
Além da informação de altura, as
informações relacionadas com a capacidade de
reflectância
de
determinados
objetos
são
disponibilizadas pelo sistema de perfilamento a laser.
A intensidade de retorno dos pulsos ao sistema pode
ser medida variando de acordo com a superfície
perfilada, isto é, a superfície pode absorver ou refletir
pulsos de forma diferente. Esta característica pode
auxiliar em um processo de segmentação da imagem,
pois os objetos presentes na cena, dependendo de suas
características, possuem respostas diferentes.
A imagem mostrada na figura 1 é um
exemplo de uma imagem de intensidade obtida usando
a informação de retorno do primeiro pulso do sistema
de perfilamento a laser realizado pelo Instituto de
Tecnologia para o Desenvolvimento (LACTEC).
Apresentação
Panorama
Programa
Relação de Títulos
1
3
Relação de Autores
2
4
(a)
1
2
Busca de Palavras
3
4
(b)
Fig. 1 – Imagem de intensidade obtida a partir do
perfilamento a laser (Fonte: LACTEC).
3 DIVISÃO DE REGIÕES
Uma região em uma imagem é um
agrupamento de pixels conexos com propriedades
similares. Em análise de imagem as regiões são de
suma importância, pois elas correspondem aos objetos
presentes na cena. Uma imagem, por sua vez pode
conter vários objetos e cada objeto pode conter várias
regiões correspondendo a diferentes partes do objeto.
Ao subdividir uma imagem em regiões,
várias decisões devem ser tomadas. No entanto, o
problema está em decidir qual propriedade utilizar na
subdivisão. Essa questão geralmente requer um
conhecimento sobre as características dos objetos
presentes na cena. Em algumas aplicações, a variância
dos valores de intensidade é usada como medida de
dispersão dos valores de cinza de uma determinada
região. Uma abordagem utilizada para subdividir
regiões é a divisão recursiva de regiões, ou métodos de
decomposição regular, neste caso, a representação
quad tree.
Um quad tree é uma estrutura que permite
dividir recursivamente uma imagem original em subregiões, tendo por base uma propriedade e um limiar
pré-estabelecido. Se a variação dos níveis de cinza de
uma região em análise for maior que o limiar
especificado, essa região é subdividida em outras
quatro regiões e, cada uma das regiões resultantes, são
divididas em outras quatro, seguindo-se recursivamente
até que não seja possível dividir nenhuma região. A
figura 2 mostra a construção de um quad tree a partir
de um exemplo genérico.
(c)
(d)
Fig. 2 – (a) Imagem original. (b) Imagem dividida em
quatro sub-regiões e o quad tree correspondente. (c)
Subdivisão das regiões 1 e 4 em quatro sub-regiões
respectivamente e o quad tree correspondente. (d)
Subdivisão da sub-região 2 em quatro sub-regiões e o
quad tree correspondente (Fonte: Adaptado de Jain et
al., 1995).
A segmentação baseada na divisão recursiva
de regiões é apresentada em Jain et al. (1995). Nesta
abordagem, considera-se R a imagem completa e P
uma propriedade (por exemplo, a variância dos níveis
de cinza). Esta divisão é baseada em um teste de
hipóteses do tipo H 0 : P( Ri ) ≤ σ 02 = λ (onde λ é um
valor pré-estabelecido de acordo com os valores de
intensidade dos objetos presentes na cena) contra a
hipótese H 1 : P( Ri ) > σ 02 . Se H 1 : P ( Ri ) > σ 02
rejeita-se H 0 em favor de H 1 . A segmentação de R
é realizada a partir de sucessivas subdivisões. Assim,
se a hipótese H 1 for verificada, então a imagem é
subdividida em quadrantes cada vez menores. Essa
técnica, em particular, possui uma representação
conveniente denominada quad tree, isto é, uma árvore
em que cada nó possui exatamente quatro
descendentes.
Essa abordagem pode ser sumariada nas
seguintes etapas:
1) Dividi-se a imagem R em quatro quadrantes
distintos;
2) Para cada quadrante calcula-se a variância dos
níveis de cinza;
Apresentação
Panorama
Programa
Relação de Títulos
3) Se P( Ri ) > λ , subdivide-se o referido quadrante em
quatro outros quadrantes.
A segunda e a terceira etapa devem ser
aplicadas recursivamente a todos os quadrantes da
imagem, enquanto P ( R i ) > λ . O processo é finalizado e
o critério de parada ocorre quando P ( Ri ) < λ , ∀ i . Cabe
ressaltar que esse procedimento deve ser aplicado
recursivamente até que não haja mais quadrantes para
serem subdivididos. Assim, o algoritmo é finalizado e
uma estrutura é gerada. Essa estrutura corresponde a
uma imagem segmentada, onde cada Ri é rotulada
com o nível médio de cinza da região correspondente.
3 FUSÃO DE REGIÕES
As regiões obtidas após a aplicação do
algoritmo de divisão recursiva apresentam como
resultado uma imagem com regiões contíguas, mas que
pode estar fragmentada. A principal razão para este
problema é devido à possibilidade de ocorrência, para
um mesmo objeto, de ligeiras diferenças radiométricas
na imagem de retorno de pulso laser. Com o objetivo
de apresentar uma metodologia que forneça regiões
similares geralmente relacionadas com objetos
urbanos, tais como ruas e edifícios, este artigo propõe a
integração entre as técnicas de divisão recursiva e
fusão de regiões.
A técnica de fusão de regiões utilizando
critérios estatísticos proposta por Jain et al. (1995)
considera a utilização de características estatísticas de
duas regiões adjacentes. Essas características são
utilizadas para decidir se as regiões devem ou não ser
fundidas.
O julgamento inicial para a fusão de duas
regiões é realizado considerando duas regiões
adjacentes R1 e R2, com m1 e m2 pixels,
respectivamente. Assim, existem duas hipóteses
possíveis:
ƒ
H0: Ambas as regiões pertencem ao mesmo
objeto. Neste caso, as intensidades são todas
obtidas a partir de uma única distribuição
gaussiana com parâmetros (µ0 , σ 0 ) ;
ƒ
H1: As regiões pertencem a objetos diferentes.
Neste caso, as intensidades de cada região são
obtidas a partir de distribuições gaussianas
separadas com parâmetros (µ1, σ1) e (µ2 ,σ 2 ) .
Em geral, esses parâmetros não são
conhecidos, mas são estimados usando amostras. Por
exemplo, quando uma região contém n pixels com
níveis de cinza gi, i = 1,..., n, provenientes de uma
distribuição normal, pode-se escrever:
Relação de Autores
−
1
p ( gi ) =
( gi − µ )2
2σ 2
e
2πσ
Busca de Palavras
(1)
Os estimadores de máxima verossimilhança
( µ̂ , σˆ 2 ) são dados por:
µ̂ =
1
n
n
∑g
(2)
i
i =1
1
n
σˆ 2 =
n
∑ (g
i
− uˆ ) 2
(3)
i =1
Assumindo-se a hipótese H0 e que todas as
intensidades gi são independentemente obtidas de uma
população normal com parâmetros ( µ 0 , σ 0 ) , a função
densidade de probabilidade conjunta sob H0 é dada por
(Jain et al., 1995):
m1 + m 2
p( g1, g 2 ,..., g m1 + m 2 | H 0 ) =
∏ p( g | H
i
0
i =1
=
m1 + m2
∏(
i =1
−
1
2πσ 0
)
( gi − µ0 )2
∑i =11
m + m2
=
−
1
( 2πσ )
( gi − µ0 ) 2
2σ 02
e
m1 + m2
(4)
2σ 02
e
0
A equação 4 avaliada nos estimadores de
máxima verossimilhança, dados pelas equações 2 e 3,
resulta em:
p( g1 , g 2 ,..., g m1+ m 2 | H 0 ) =
(
1
2πσ 0
−
)
m1 + m2
e
( m1 + m2 )
2
(5)
Assumindo agora a hipótese H1 e que m1
pixels pertencentes à região 1 são tomados
independentemente e uma população com parâmetros
( µ1 , σ 1 ) e que outros m2 pixels pertencentes à região 2
são tomados independentemente de uma outra
população normal com parâmetros ( µ 2 , σ 2 ) . Neste
caso, a função densidade de probabilidade conjunta
avaliada nos estimadores de máxima verossimilhança
dados pelas equações 2 e 3, resulta em (Jain et al.,
1995):
p( g1 , g 2 ,..., g m1 , g m1 + 1 ,..., g m1 + m 2 | H 1 ) =
(
1
2πσ 1
)
m1
−
e
m1
2
×
(
1
2πσ 2
)
m2
−
e
m2
2
(6)
.
A razão de verossimilhanças (L) é definida
na equação 7 como a razão entre a densidade conjunta
sob H1 e a densidade conjunta sob H0.
Apresentação
Panorama
Programa
Relação de Títulos
Relação de Autores
Busca de Palavras
m1 + m 2
L=
Os
p( g 1 , g 2 ,... | H 1 ) σ 0
=
p( g 1 , g 2 ,... | H 0 ) σ 1m1 ⋅ σ 2m 2
valores
dos
(7)
parâmetros
σ 0 , σ 1 e σ 2 na equação acima são estimados
utilizando as equações 2 e 3, considerando todos os
pixels (m1 + m2) , sendo m1 pixels da região 1 e m2
pixels da região 2. Neste caso, segundo Jain et al.
(1995), se a razão L é menor que um limiar préestabelecido (k), existe forte evidência de que as duas
regiões que estão sendo analisadas sejam similares e
possam ser fundidas. Segundo Larson (1982), a razão
de verossimilhanças L−1 ≤ k equivale a T ≥ d , onde
t representa o quantil de uma distribuição t-Student
com (m + n – 2) graus de liberdade, onde
t = ( µˆ 1 − µˆ 2 )
m1 m 2
m1 + m 2
∑ (g
i
− µˆ 1 ) 2 +
∑ (g
j
− µˆ 2 ) 2
m1 + m 2 − 2
e
(8)
d = t1−α / 2, m + n − 2 representa o quantil da distribuição t-
Fig. 4 – Imagem dividida em regiões utilizando a
divisão recursiva via quad tree.
A figura 5 apresenta o resultado obtido com
a aplicação da técnica de fusão de regiões utilizando a
razão de verossimilhança apresentada na equação 7,
com um limiar pré-estabelecido (k = 0,0009).
Student onde a probabilidade de T ≤ d é dada por
1−α .
2
4 RESULTADOS E ANÁLISE
Nesta seção são apresentados alguns
resultados do processo seqüencial de divisão e fusão de
regiões. Foi utilizada uma imagem de intensidade
obtida por perfilamento a laser (figura 3).
Fig. 5 – Resultado da fusão de regiões adjacentes com
características similares, utilizando um limiar fixo.
Fig. 3 – Imagem de intensidade gerada por
perfilamento a laser (Fonte: LACTEC).
A figura 4 mostra o resultado obtido pela
aplicação da técnica de divisão recursiva via quad tree.
O limiar utilizado nesse processo foi mantido fixo
( λ = 25 ).
A figura 6 ilustra o resultado obtido
utilizando o teste de razão de verossimilhanças através
da estatística T ilustrada na equação 8, com (m + n – 2)
graus de liberdade e α = 0,05 .
Apresentação
Panorama
Programa
Relação de Títulos
Relação de Autores
Busca de Palavras
Galvanin e ao mestrando Antonio Juliano Fazan. Este
trabalho é também resultado de um projeto financiado
pela FAPESP, na categoria de Auxílio à Pesquisa,
coordenado pelo segundo autor. Este artigo conta
também com apoio do CNPQ, através de bolsa de
produtividade em Pesquisa (PQ) do segundo autor. Os
autores também agradecem ao Instituto de Tecnologia
para o Desenvolvimento (LACTEC) de Curitiba - Pr
pela concessão da imagem de intensidade gerada por
perfilamento a laser utilizada no experimento.
7 REFERÊNCIAS BIBLIOGRÁFICAS
Ballard, D. H.; C.M. Brown, 1982, Computer Vision,
Prentice-Hall, Englewwod Cliffs, New Jersey.
Gonzales, R. C.; R.E. Woods, 2000, Digital Image
Processing, Addison-Weslly publiching company, 716
páginas.
Fig. 6 – Resultado da fusão de regiões adjacentes com
características similares, utilizando um limiar obtido a
partir da distribuição t-Student.
Devido à possibilidade de ligeiras diferenças
radiométricas na imagem de retorno de pulso laser, o
resultado apresentado na figura 4 apresenta regiões
contíguas, frequentemente fragmentadas. A figura 5
mostra uma pequena redução da fragmentação das
regiões obtidas com a técnica de fusão de regiões,
utilizando um limiar pré-estabelecido. Já a figura 6
ilustra uma fusão significativa das regiões com
características similares, utilizando o teste de razão de
verossimilhanças conforme Larson (1982). Neste caso
o limiar é obtido a partir da distribuição t-Student.
5 CONSIDERAÇÕES FINAIS
Neste trabalho foram apresentados os
fundamentos teóricos, algorítmicos e a análise
referente aos processos de divisão recursiva via quad
tree e a fusão de regiões estatisticamente similares
obtidas na etapa de divisão recursiva. Foram descritos
os passos integrantes do processo e apresentado um
experimento efetuado com uma imagem de intensidade
gerada por perfilamento a laser. Dessa forma, as
expectativas teóricas puderam ser verificadas
experimentalmente.
A fusão de regiões estatisticamente similares
mostrou-se capaz de fornecer regiões geralmente
relacionadas com objetos urbanos. Cabe ressaltar que
uma característica desejável do método é a utilização
de limiares fixos, o que viabiliza sua utilização em
etapas posteriores de análise de imagem.
6 AGRADECIMENTOS
Os autores agradecem a CAPES e CNPQ,
pelo suporte, sob a forma de bolsa de Demanda Social,
concedida a doutoranda Edinéia Aparecida dos Santos
Jain, R.; R. Kasturi e B. G. Schunck, 1995, Machine
Vision, MIT Press and McGraw-Hill, Inc New York,
549 páginas.
Larson, H. J., 1982, Introduction to Probability Theory
and Statistical Inference, Publications, Canadá, 637
páginas.
Wehr, A.; U. Lohr, 1999. Airborne Laserscanning-an
Introduction and Overview, ISPRS Journal of
Photogrammetry and Remote Sensing, Vol. 54, p. 6882.
Download