lsita1-4 - Computação UFCG

Propaganda
1) Apresente e comente sobre a arquitetura de um sistema típico de PDI.
Um sistema típico consiste em módulos para: aquisição da imagem de entrada,
processamento e geração da imagem de saída. O processamento pode envolver
operações de baixo ou médio nível. Operações típicas de baixo nível: realce de
imagens, filtragem de ruídos, correção de histograma. Operações típicas de
nível intermediário: detecção de bordas em diferentes orientações,
segmentação de imagens em regiões etc.
2) Explique o que você entende pela área de Computação Visual.
Trata-se de uma área abrangente que inclui todas as disciplinas que tratam de
informação visual, a saber: PDI, visão computacional, reconhecimento de
padrões, computação gráfica, visualização, entre outras.
3) Apresente exemplos de processamento de alto nível associados a PDI.
Reconhecimento de objetos, interpretação de cenas, aprendizagem de objetos
visuais a partir de características extraídas, agrupamento de imagens etc
4) O que você entende por um espaço de cores? Quais as diferenças entre os
espaços HSV e RGB? É sempre possível mapear de um espaço de cor para
outro?
Um espaço de cor é uma representação que quantifica/registra/armazena a luz
refletida na superfície dos objetos. O espaço HSV representa a informação de
cor a partir de componentes de Matiz (a cor pura), Saturação (da cor) e Valor
(brilho), já o espaço RGB representa a cor como quantizações das frequências
de radiação eletromagnética associadas às cores vermelho, verde e azul. O
espaço HSV pode ser representado como um Cone em que o canal H
representa ângulos na seção circular do cone, o canal S representa um raio na
seção circular, e, finalmente, o canal V representa uma medição na altura do
cone. No espaço RBG, os componentes representam um sistema de
coordenadas Cartesiano de 3 dimensões, cada qual associada a um dos canais
de cores.
5) Explique a equação que descreve o processo de formação de imagens: F(x,y) =
R(x,y) . I(x,y)
A imagem capturada pelo sensor, F(x,y), é o resultado da composição
(produto) da iluminação sobre a superfície observada, I(x,y) e a índice de
reflectância da soperfície. I(x,y) é aproximadamente constante para toda a
superfície (a fonte de iluminação normalmente não muda de intensidade nem
de posição). A reflectância da superfície caracteriza a capacidade da superfície
refletir e absorver determinados componentes de frequência da radiação (luz)
incidente. Normalmente o sinal F(x,y) é capturado utilizando 3 tipos de
sensores, sensíveis às frequências das cores vermelho, azul e verde.
6) Explique os conceitos de Amostragem Espacial e Quantização Radiométrica.
Ambos são processos de discretização de informações contínuas do mundo
visual, a saber, a amostragem tona discretas as coordenadas espaciais de uma
imagem enquanto que a quantização torna discretas as intensidades de
iluminação percebida num determinado canal da imagem.
7) Um scanner possui 1200 fotoreceptores por polegada dispostos numa barra
com iluminação que percorre a superfície de digitalização e captura na outra
direção (vertical) também 1200 pontos em uma polegada. Cada fotorreceptor
registra cores em 3 bytes. Quantos pixels uma imagem de um cartão postal
colorido ocupando uma área de 5 x 3 polegadas capturado por este scanner
deve ocupar na memória?
R = 5x1200 x 3x1200 x 3
8) Os conceitos de resolução espacial de câmeras digitais e de scanners são os
mesmos? Discuta.
Scanner R=pixels por undade de espaço
Câmera R=total de pixels
9) Explique matematicamente a operação de Convolução Espacial.
A convolução espacial é uma operação local sobre uma imagem, na qual uma
máscara de pesos é transladada sobre a imagem e a operação de soma
ponderada é realizada sobre os pixels da imagem. Matematicamente, tem-se
que a Imagem de saída Is na coordenada (x,y) (essas coordenadas são
percorridas sistematicamente para que toda a imagem de entrada seja
processada) é computada como um somatório duplo envolvendo os pesos da
máscara m nas coordenadas locais (i,j) e a imagem de entrada Ie nas
coordenadas originais (x,y) transladadas pelas coordenadas locais (i,j), M e N
representam as dimensões da máscara nas direções horizontal e vertical.,
respectivamente.
10)
Nos limites da imagem de entrada, por exemplo, na coordenada (0,0),
como é possível calcular o valor da convolução utilizando uma máscada 3x3?
É possível por meio de uma operação de preenchimento (padding), a qual, por
exemplo, replica pixels de regiões próximas nas regiões inválidas (fora dos
limites da imagem de entrada).
11)
Projete uma máscara de convolução 3x3 para detectar: (a) ruído formado
por pontos unitários escuros em background claro; (b) segmentos de linhas
escuras a 90 graus e background claro. Restrição: as máscaras não devem
produzir respostas quando operadas sobre regiões homogêneas.
(a)
0 1 0
1 -4 1
0 1 0
(b)
1 -2 1
1 -2 1
1 -2 1
12)
Defina histograma de uma imagem digital. Defina o conceito de bin do
histograma. Exemplifique uma transformação típica utilizando histogramas.
Um histograma é uma estrutura que registra as frequências de ocorrência das
diferentes intensidades presentes numa imagem digital. O bin representa o
intervalo de contagem de ocorrência dos pixels. Exemplo: suponha que uma
imagem digital foi capturada em condições de baixa iluminação. Seu
histograma, portanto, não terá bins preenchidos nos valores altos de níveis de
cinza (o histograma fica condensado apenas na região de baixas intensidades).
Uma forma de melhorar a qualidade de visualização da imagem é fazer uma
transformação no histograma (equalização) que permitirá distribuir as
intensidades em todos os bins do histograma.
13)
Explique um das duas operações a seguir: (a) dilatação morfológica; (b)
erosão morfológica.
Considerando um elemento estruturante local (e.g. no formato de uma cruz ou
quadrado 3x3), a dilatação morfológica faz o preenchimento da imagem sendo
processada utilizando como modelo (como um carimbo) o elemento
estruturante centrado nos pixels não nulos da imagem de entrada.
14)
Explique matematicamente segmentação por limiarização .
Is(x,y) = 1 se Is(x,y) > \theta
0 caso contrário
Em que \theta é o limiar de segmentação.
Download