Análise de Classificadores Orientados a Objeto e Mineração de

Propaganda
La Geoinformación
al Servicio de la Sociedad
Memorias
Sociedad Latinoamericana en
Percepción Remota y Sistemas
de Información Espacial
Capítulo Colombia
Medellín, Colombia
29 de Septiembre al 3 de Octubre de 2014
ANÁLISE DE CLASSIFICADORES ORIENTADOS A OBJETO E
MINERAÇÃO DE DADOS, COMO SUPORTE AO MONITORAMENTO
DE ALTERAÇÕES URBANAS EM PEQUENAS CIDADES.
ANALYSES OF CLASSIFIERS OBJECT-ORIENTED AND DATA
MINING, SUCH AS SUPPORT FOR MONITORING OF URBAN
CHANGE IN SMALL TOWNS
Edilson de Souza Bias
Professor do Instituto de Geociências , Universidade de Brasilia , Campus Darcy Ribeiro –
Asa Norte Brasília-DF CEP 70910-900, [email protected]
Rodrigo Rodrigues Antunes
Doutorando em Geociências aplicadas – Instituto de Geociências , Universidade de Brasília ,
Campus Darcy Ribeiro – Asa Norte Brasília-DF CE 70910-900,
[email protected]
Ricardo Seixas Brites
Professor do Instituto de Geociências , Universidade de Brasilia , Campus Darcy Ribeiro –
Asa Norte Brasília-DF CEP 70910-900, [email protected]
Gilson O. A. P. Costa
Departamento de Engenharia Elétrica – PUC-RJ, Brasil, [email protected]
Resumo
Este estudo teve como objetivo testar a viabilidade da utilização de classificadores orientados
a objeto e mineração de dados, como suporte para o monitoramento de mudanças urbanas em
pequenas cidades que desejam ou já implementaram um cadastro multifinalitário. A
aplicação deste estudo foi realizado na cidade de Goianésia, localizada na porção norte do
estado de Goiás, com uma população de aproximadamente 70.000 habitantes. Em 2003,
através da administração pública local, teve iniciou a implementação de um SIG (Sistema de
Informação Geográfica), concebido para alcançar um CTM urbano (Cadastro Multifinalitário)
para garantir a modernização administrativa e fiscal da cidade. No entanto, ao longo dos anos,
a dificuldade de acompanhar as expansões e mudanças intra- urbana deixaram o sistema
instável, principalmente porque não existir elementos reais que permitem obter indicadores
das mudanças intra-urbanas. Com a aplicação da análise baseada em objetos (OBIA) e
mineração de dados, foi possível identificar, de forma semi-automática, as mudanças em
edificações e no uso do solo, a aumentando a eficiência do processo de atualização dos
registros prediais. O processo de classificação usou imagens GeoEye 1, o sistema
InterIMAGE e o software WEKA. A segmentação de imagem e o processo de amostragem foi
efetuado usando o InterIMAGE. A fim de agilizar e eliminar a subjetividade na aplicação das
regras de decisões geradas pelo analista no sistema InterIMAGE, foi aplicada a mineração de
dados no processo de preparação da classificação. Para o processo de extração de dados foi
usado algoritmo J48 do sistema de WEKA. Dessa forma, foi possível processar e montar a
árvore de decisão a partir de atributos extraídos do InterIMAGE. O J48 é a implementação do
algoritmo ID3 (Interactive Dichotomiser 3). A avaliação dos resultados foi realizada através
do modelo de amostragem proposto por Congalton & Green (1999) e da aplicação da análise
de exatidão global e coeficiente Tau. Para 2011, foram selecionadas 597 pixels, obtenção de
uma precisão geral de 83,2% e 81,3% para o coeficiente Tau. Para 2013, foram selecionadas
628 pixels, demonstrando uma exatidão de 84,6% e 82,6% para o coeficiente Tau. Ambos os
resultados foram considerados bons, provando a eficiência da do processo de classificação.
Palavras-Chave: Cadastro Urbano, Geoeye-1, InterIMAGE, Mineração de Dados, OBIA.
Abstract
This study aimed to test the feasibility of using classifiers and object-oriented data mining,
such as support for monitoring of urban change in small towns who want or already
implemented a multipurpose cadastre. The application of this study was conducted in the city
of Goianésia, located in the northern portion of the state of Goiás , with a population of
approximately 70,000 inhabitants . In 2003, through the local public administration, began the
implementation of a GIS ( Geographic Information System) designed to achieve an urban
MTC (Multipurpose Technical Cadastre) assuring the administrative and fiscal modernization
of the city. However, over the years, the difficulty to follow the expansions and changes in
intra - urban cadastral update process left the system unstable, mainly because there are no
elements that allow to obtain real indicators of intra - urban changes. With the application of
object-based analysis (OBIA) and data mining, it was possible to identify, in a semi automatic way, the changes in buildings and land use, increasing the efficiency of the process
of updating the city’s land register. The classification process used GeoEye 1 imagery, the
InterIMAGE system and the WEKA software. The image segmentation and the sampling
process for each defined class were conducted using the InterIMAGE. In order to streamline
and eliminate subjectivity in implementing the rules of decisions generated by the analyst in
the InterIMAGE system, data mining in the preparatory process of classification was applied.
For the data mining process the J48 algorithm was used in the WEKA system. This way, it
was possible to process and deliver the decision tree from the InterIMAGE’s extracted
attributes. The J48 is the implementation of the ID3 algorithm (Interactive Dichotomiser 3).
The evaluation of results was performed using the sampling model proposed by Congalton &
Green (1999) and the application of the analysis of overall accuracy and coefficient Tau. For
2011, were selected 597 pixels, obtaining an overall accuracy of 83.2 % and 81.3% for the
coefficient Tau. For 2013, were selected 628 pixels, demonstrating an overall accuracy of
84.6% and 82.6% for the coefficient Tau. Both results were quite acceptable, proving the
efficiency of the use of data mining in the classification process.
Key-Word - Urban cadastre, Geoeye-1, InterIMAGE, Data mining, OBIA.
Introdução
A transformação do território urbano acontece de forma acelerada, principalmente em cidades
populosas e com característica sócio-econômica elevada. Todos os dias ocorrem alterações no
uso e na ocupação do solo. Fazendo parte de um sistema cadastral, as alterações intra-urbanas
precisam de rotinas de atualização, de forma a garantir um processo contínuo e eficiente,
evitando um cadastro com informações defasadas.
É importante estabelecer a necessidade da coleta sistemática, da atualização, do
processamento e da distribuição dos dados espaciais para o apoio à tomada de decisão
administrativa, econômica e legal. É necessário estabelecer estratégia de levantamentos
massivos periódicos, que permitam atualizar a cartografia municipal e as bases de dados de
forma conjunta.
Diversos estudos têm demonstrado que o acelerado processo de crescimento das cidades é um
fenômeno constante na realidade hodierna, criando situações específicas que devem ser
avaliadas por meio de monitoração permanente dos cenários em constante alteração. Neste
particular, as técnicas de sensoriamento remoto são ferramentas que desempenham importante
papel no processo de planejamento e reestruturação do ambiente urbano, pois as imagens
permitem identificar as características dos objetos e correlacioná-los às origens dos agentes
modificadores do espaço. Além disso, permitem verificar a extensão e a intensidade das
alterações provocadas pelas ações antrópicas (BIAS; BRITES; ROSA, 2012). A melhoria das
resoluções espacial e espectral e o aprimoramento das técnicas de processamento de imagens
têm possibilitado a análise e o mapeamento da cobertura do solo em um nível nunca realizado
anteriormente com imagens orbitais (RIBEIRO; FONSECA; KUX,2011).
A classificação de imagens baseada em objeto e em conhecimento é, no momento, o enfoque
mais vantajoso para a análise de imagens de alta resolução espacial para aplicações em
planejamento urbano (KUX, 2011).
Desta forma, esta pesquisa propõe testar a viabilidade da utilização de classificadores
orientados a objeto e mineração de dados, como suporte para o monitoramento de mudanças
urbanas em pequenas cidades que desejam ou já implementaram um cadastro multifinalitário
como é o caso do município de Goianésia-GO, onde a avaliação das alterações das
edificações é feita de maneira visual, por meio das imagens de sensoriamento remoto
disponíveis.
Goianésia está localizada a 168 km da capital estadual Goiânia, na porção norte do estado,
figura 1, e é considerada um polo agroindustrial do país, onde são cultivadas e instaladas
várias indústrias, principalmente da cana de açúcar. O município teve um acréscimo na renda
média de salário e de emprego de 180 % e 214% respectivamente, entre 2002 e 2012.
Figure 1 – Localização do município
Material e Métodos
Foram utilizados para essa pesquisa: Imagens dos anos de 2011 e 2013, do sensor GeoEye-1
da área urbana do município; software InterIMAGE 1.40 para classificação orientada a
objetos; ENVI 5.1 – Fusão de imagens; WEKA 3.7.8 para mineração de dados; QuantumGIS
1.8.0 para confecção de mapas, recortes, plotagem de pontos aleatórios de checagem e
elaboração de indicadores de alteração intra-urbana e para atingir os objetivos propostos
foram aplicados os passos metodológicos apresentados na figura 2.
Figure 2 – Métodos aplicados
Na figura 3 (b) é apresentada a rede semântica criada no InterIMAGE. No nó vegetação foi
utilizado o operador TA_NDVI_Segmenter, no nó n_vegetação foi criado um nó filho quadras
que recebeu o operador TA_Shape_File_Import e nas classes interessadas foi utilizado o
operador TA_Baatz_Segmenter.
a.
b.
Figure 3. (a) localização da área de teste e recorte. (b) Rede semântica criada no InterIMAGE
As regras aplicadas para as classes da rede semântica foram disponibilizadas pela árvore de
decisão J48 (WEKA), que é uma implementação do algoritmo ID3 (Iterative Dichotomiser).
A acurácia temática foi analisada com aplicação dos seguintes procedimentos:
a. quantificação do número de amostras;
b. distribuição aleatória de pontos de checagem;
c. investigação por interpretação visual;
d. composição da matriz de confusão; e
e. cálculo de concordância global e coeficiente de concordância Tau.
Por meio de uma distribuição multinominal, foi calculado o número de amostras, tendo por
unidade amostral o pixel. O cálculo do tamanho da amostra (Equação I) foi baseado em
Congalton; Green (1999).
(I)
Onde:
N = número de amostras
= no mapa, a classe com maior proporção
1- = grau de confiança
B = obtido de tabela de distribuição quiquadrado com Grau de liberdade 1 /k
K = número de classes
b = erro admissível
Com o resultado da quantificação do número de amostras (587 – 2011 / 627 2013), foram
plotados pontos aleatórios pelo sistema QuantumGIS.
Resultados
O operador utilizado para as classes de interesse (cerâmica, metálica, etc) foi o
TA_Baatz_Segmenter, desenvolvido por Baatz & Schäpe (2000), onde cada segmento gerado
representa uma hipótese a ser analisada pelo próximo nó da rede semântica.
Após realizar a segmentação foram coletadas amostras de cada classe. A ferramenta sample
editor, do sistema InterIMAGE, permitiu selecionar e exportar cada atributo escolhido: Os
atributos selecionados foram: compacity, angle, squareness, circleness, brightness, entropy,
maxpixelvalue, mean, minpixelvalue, ratio e bandmeandiv.
Com os resultados das exportações dos atributos de cada classe foi possível juntar todos os
dados em um único arquivo para leitura do minerador WEKA.
Os dados provenientes do WEKA foram inseridos manualmente no InterIMAGE por meio do
operador Decision Rule for TopDown. Posteriormente foi feita a classificação. A figura 4
apresenta um exemplo no processo de integração WEKA e InterIMAGE.
Figure 4. Exemplo de um procedimento de integração de dados WEKA e InterIMAGE.
Com o resultado da classificação foram gerados mapas temáticos comparativos das alterações
figuras 5 (a) (b).
a. Mapa - Imagem de 2011.
b. Mapa - Imagem de 2013.
Figure 5. Mapas temáticos feitos por meio dos resultados da classificação.
A partir de uma matriz de confusão foi analisada a exatidão de cada classificação por meio da
aplicação do índice Global e TAU, os valores obtidos foram 83.2 % e 81.3% (2011) e 84.6%
e 82.6% (2013).
Conclusão
A classificação orientada a objetos mostrou-se uma excelente solução para acompanhamento
de expansão e alteração intra-urbana, permitindo gerar importantes indicadores.
A segmentação multirresolução por meio do operador de Baatz e Shape (2000) possibilitou
utilizar diferentes valores para os parâmetros como: escala, tonalidade e forma, permitindo
agrupamento de pixel por relacionamento entre os objetos.
Quanto à integração dos dois sistemas (WEKA e InterIMAGE), é possível concluir que ela
apresentou grande eficiência ao processo, contudo, o tratamento manual dos dados da
mineração e a forma de inserção manual dos mesmo no InterIMAGE, retarda o processo e
expõe os dados a operações errôneas.
Referências Bibliográficas
BAATZ, Martin; SCHAPE, Arno. Multiresolution segmentation: an optimization
approach for high quality multi-scale image segmentation. Disponível em:
<http://www.ecognition.cc/download/baatz_schaepe.pdf> Acesso em: 15 jan. 2014.
BIAS, Edilson de Souza; BRITES, Ricado Seixas; ROSA, Antônio Nuno de Castro: Imagens
de alta resolução especial. In: Introdução ao processamento de imagens de sensoriamento
remote. Org. MENESES, Paulo Roberto; ALMEIDA, Tati. 1a Ed., v. 1. Brasília: CNPq, 2012.
CONGALTON, Russell G.; GREEN, K. Assessing the accuracy of remotely sensed data:
principles and practices. Boca Raton-USA: Lewis Publisher, 1999.
KUX, Hermann: Classificação da cobertura do solo urbano usando imagens ópticas de
altíssima resolução e o sistema InterIMAGE, baseado em conhecimento. Anais XV
Simpósio Brasileiro de Sensoriamento Remoto – SBSR, Curitiba, PR, Brasil, 2011, p. 822.
RIBEIRO, Bárbara Maria Giaccom; FONSECA, Leila Maria Garcia; KUX, Hermann Johann
Heinrich: Mapeamento da cobertura do solo urbano utilizando imagens WORLDVIEW
II e o sistema InterIMAGE. Revista Brasileira de Cartografia, n. 63, Edição Espcial 40 anos,
2011.
Download