La Geoinformación al Servicio de la Sociedad Memorias Sociedad Latinoamericana en Percepción Remota y Sistemas de Información Espacial Capítulo Colombia Medellín, Colombia 29 de Septiembre al 3 de Octubre de 2014 ANÁLISE DE CLASSIFICADORES ORIENTADOS A OBJETO E MINERAÇÃO DE DADOS, COMO SUPORTE AO MONITORAMENTO DE ALTERAÇÕES URBANAS EM PEQUENAS CIDADES. ANALYSES OF CLASSIFIERS OBJECT-ORIENTED AND DATA MINING, SUCH AS SUPPORT FOR MONITORING OF URBAN CHANGE IN SMALL TOWNS Edilson de Souza Bias Professor do Instituto de Geociências , Universidade de Brasilia , Campus Darcy Ribeiro – Asa Norte Brasília-DF CEP 70910-900, [email protected] Rodrigo Rodrigues Antunes Doutorando em Geociências aplicadas – Instituto de Geociências , Universidade de Brasília , Campus Darcy Ribeiro – Asa Norte Brasília-DF CE 70910-900, [email protected] Ricardo Seixas Brites Professor do Instituto de Geociências , Universidade de Brasilia , Campus Darcy Ribeiro – Asa Norte Brasília-DF CEP 70910-900, [email protected] Gilson O. A. P. Costa Departamento de Engenharia Elétrica – PUC-RJ, Brasil, [email protected] Resumo Este estudo teve como objetivo testar a viabilidade da utilização de classificadores orientados a objeto e mineração de dados, como suporte para o monitoramento de mudanças urbanas em pequenas cidades que desejam ou já implementaram um cadastro multifinalitário. A aplicação deste estudo foi realizado na cidade de Goianésia, localizada na porção norte do estado de Goiás, com uma população de aproximadamente 70.000 habitantes. Em 2003, através da administração pública local, teve iniciou a implementação de um SIG (Sistema de Informação Geográfica), concebido para alcançar um CTM urbano (Cadastro Multifinalitário) para garantir a modernização administrativa e fiscal da cidade. No entanto, ao longo dos anos, a dificuldade de acompanhar as expansões e mudanças intra- urbana deixaram o sistema instável, principalmente porque não existir elementos reais que permitem obter indicadores das mudanças intra-urbanas. Com a aplicação da análise baseada em objetos (OBIA) e mineração de dados, foi possível identificar, de forma semi-automática, as mudanças em edificações e no uso do solo, a aumentando a eficiência do processo de atualização dos registros prediais. O processo de classificação usou imagens GeoEye 1, o sistema InterIMAGE e o software WEKA. A segmentação de imagem e o processo de amostragem foi efetuado usando o InterIMAGE. A fim de agilizar e eliminar a subjetividade na aplicação das regras de decisões geradas pelo analista no sistema InterIMAGE, foi aplicada a mineração de dados no processo de preparação da classificação. Para o processo de extração de dados foi usado algoritmo J48 do sistema de WEKA. Dessa forma, foi possível processar e montar a árvore de decisão a partir de atributos extraídos do InterIMAGE. O J48 é a implementação do algoritmo ID3 (Interactive Dichotomiser 3). A avaliação dos resultados foi realizada através do modelo de amostragem proposto por Congalton & Green (1999) e da aplicação da análise de exatidão global e coeficiente Tau. Para 2011, foram selecionadas 597 pixels, obtenção de uma precisão geral de 83,2% e 81,3% para o coeficiente Tau. Para 2013, foram selecionadas 628 pixels, demonstrando uma exatidão de 84,6% e 82,6% para o coeficiente Tau. Ambos os resultados foram considerados bons, provando a eficiência da do processo de classificação. Palavras-Chave: Cadastro Urbano, Geoeye-1, InterIMAGE, Mineração de Dados, OBIA. Abstract This study aimed to test the feasibility of using classifiers and object-oriented data mining, such as support for monitoring of urban change in small towns who want or already implemented a multipurpose cadastre. The application of this study was conducted in the city of Goianésia, located in the northern portion of the state of Goiás , with a population of approximately 70,000 inhabitants . In 2003, through the local public administration, began the implementation of a GIS ( Geographic Information System) designed to achieve an urban MTC (Multipurpose Technical Cadastre) assuring the administrative and fiscal modernization of the city. However, over the years, the difficulty to follow the expansions and changes in intra - urban cadastral update process left the system unstable, mainly because there are no elements that allow to obtain real indicators of intra - urban changes. With the application of object-based analysis (OBIA) and data mining, it was possible to identify, in a semi automatic way, the changes in buildings and land use, increasing the efficiency of the process of updating the city’s land register. The classification process used GeoEye 1 imagery, the InterIMAGE system and the WEKA software. The image segmentation and the sampling process for each defined class were conducted using the InterIMAGE. In order to streamline and eliminate subjectivity in implementing the rules of decisions generated by the analyst in the InterIMAGE system, data mining in the preparatory process of classification was applied. For the data mining process the J48 algorithm was used in the WEKA system. This way, it was possible to process and deliver the decision tree from the InterIMAGE’s extracted attributes. The J48 is the implementation of the ID3 algorithm (Interactive Dichotomiser 3). The evaluation of results was performed using the sampling model proposed by Congalton & Green (1999) and the application of the analysis of overall accuracy and coefficient Tau. For 2011, were selected 597 pixels, obtaining an overall accuracy of 83.2 % and 81.3% for the coefficient Tau. For 2013, were selected 628 pixels, demonstrating an overall accuracy of 84.6% and 82.6% for the coefficient Tau. Both results were quite acceptable, proving the efficiency of the use of data mining in the classification process. Key-Word - Urban cadastre, Geoeye-1, InterIMAGE, Data mining, OBIA. Introdução A transformação do território urbano acontece de forma acelerada, principalmente em cidades populosas e com característica sócio-econômica elevada. Todos os dias ocorrem alterações no uso e na ocupação do solo. Fazendo parte de um sistema cadastral, as alterações intra-urbanas precisam de rotinas de atualização, de forma a garantir um processo contínuo e eficiente, evitando um cadastro com informações defasadas. É importante estabelecer a necessidade da coleta sistemática, da atualização, do processamento e da distribuição dos dados espaciais para o apoio à tomada de decisão administrativa, econômica e legal. É necessário estabelecer estratégia de levantamentos massivos periódicos, que permitam atualizar a cartografia municipal e as bases de dados de forma conjunta. Diversos estudos têm demonstrado que o acelerado processo de crescimento das cidades é um fenômeno constante na realidade hodierna, criando situações específicas que devem ser avaliadas por meio de monitoração permanente dos cenários em constante alteração. Neste particular, as técnicas de sensoriamento remoto são ferramentas que desempenham importante papel no processo de planejamento e reestruturação do ambiente urbano, pois as imagens permitem identificar as características dos objetos e correlacioná-los às origens dos agentes modificadores do espaço. Além disso, permitem verificar a extensão e a intensidade das alterações provocadas pelas ações antrópicas (BIAS; BRITES; ROSA, 2012). A melhoria das resoluções espacial e espectral e o aprimoramento das técnicas de processamento de imagens têm possibilitado a análise e o mapeamento da cobertura do solo em um nível nunca realizado anteriormente com imagens orbitais (RIBEIRO; FONSECA; KUX,2011). A classificação de imagens baseada em objeto e em conhecimento é, no momento, o enfoque mais vantajoso para a análise de imagens de alta resolução espacial para aplicações em planejamento urbano (KUX, 2011). Desta forma, esta pesquisa propõe testar a viabilidade da utilização de classificadores orientados a objeto e mineração de dados, como suporte para o monitoramento de mudanças urbanas em pequenas cidades que desejam ou já implementaram um cadastro multifinalitário como é o caso do município de Goianésia-GO, onde a avaliação das alterações das edificações é feita de maneira visual, por meio das imagens de sensoriamento remoto disponíveis. Goianésia está localizada a 168 km da capital estadual Goiânia, na porção norte do estado, figura 1, e é considerada um polo agroindustrial do país, onde são cultivadas e instaladas várias indústrias, principalmente da cana de açúcar. O município teve um acréscimo na renda média de salário e de emprego de 180 % e 214% respectivamente, entre 2002 e 2012. Figure 1 – Localização do município Material e Métodos Foram utilizados para essa pesquisa: Imagens dos anos de 2011 e 2013, do sensor GeoEye-1 da área urbana do município; software InterIMAGE 1.40 para classificação orientada a objetos; ENVI 5.1 – Fusão de imagens; WEKA 3.7.8 para mineração de dados; QuantumGIS 1.8.0 para confecção de mapas, recortes, plotagem de pontos aleatórios de checagem e elaboração de indicadores de alteração intra-urbana e para atingir os objetivos propostos foram aplicados os passos metodológicos apresentados na figura 2. Figure 2 – Métodos aplicados Na figura 3 (b) é apresentada a rede semântica criada no InterIMAGE. No nó vegetação foi utilizado o operador TA_NDVI_Segmenter, no nó n_vegetação foi criado um nó filho quadras que recebeu o operador TA_Shape_File_Import e nas classes interessadas foi utilizado o operador TA_Baatz_Segmenter. a. b. Figure 3. (a) localização da área de teste e recorte. (b) Rede semântica criada no InterIMAGE As regras aplicadas para as classes da rede semântica foram disponibilizadas pela árvore de decisão J48 (WEKA), que é uma implementação do algoritmo ID3 (Iterative Dichotomiser). A acurácia temática foi analisada com aplicação dos seguintes procedimentos: a. quantificação do número de amostras; b. distribuição aleatória de pontos de checagem; c. investigação por interpretação visual; d. composição da matriz de confusão; e e. cálculo de concordância global e coeficiente de concordância Tau. Por meio de uma distribuição multinominal, foi calculado o número de amostras, tendo por unidade amostral o pixel. O cálculo do tamanho da amostra (Equação I) foi baseado em Congalton; Green (1999). (I) Onde: N = número de amostras = no mapa, a classe com maior proporção 1- = grau de confiança B = obtido de tabela de distribuição quiquadrado com Grau de liberdade 1 /k K = número de classes b = erro admissível Com o resultado da quantificação do número de amostras (587 – 2011 / 627 2013), foram plotados pontos aleatórios pelo sistema QuantumGIS. Resultados O operador utilizado para as classes de interesse (cerâmica, metálica, etc) foi o TA_Baatz_Segmenter, desenvolvido por Baatz & Schäpe (2000), onde cada segmento gerado representa uma hipótese a ser analisada pelo próximo nó da rede semântica. Após realizar a segmentação foram coletadas amostras de cada classe. A ferramenta sample editor, do sistema InterIMAGE, permitiu selecionar e exportar cada atributo escolhido: Os atributos selecionados foram: compacity, angle, squareness, circleness, brightness, entropy, maxpixelvalue, mean, minpixelvalue, ratio e bandmeandiv. Com os resultados das exportações dos atributos de cada classe foi possível juntar todos os dados em um único arquivo para leitura do minerador WEKA. Os dados provenientes do WEKA foram inseridos manualmente no InterIMAGE por meio do operador Decision Rule for TopDown. Posteriormente foi feita a classificação. A figura 4 apresenta um exemplo no processo de integração WEKA e InterIMAGE. Figure 4. Exemplo de um procedimento de integração de dados WEKA e InterIMAGE. Com o resultado da classificação foram gerados mapas temáticos comparativos das alterações figuras 5 (a) (b). a. Mapa - Imagem de 2011. b. Mapa - Imagem de 2013. Figure 5. Mapas temáticos feitos por meio dos resultados da classificação. A partir de uma matriz de confusão foi analisada a exatidão de cada classificação por meio da aplicação do índice Global e TAU, os valores obtidos foram 83.2 % e 81.3% (2011) e 84.6% e 82.6% (2013). Conclusão A classificação orientada a objetos mostrou-se uma excelente solução para acompanhamento de expansão e alteração intra-urbana, permitindo gerar importantes indicadores. A segmentação multirresolução por meio do operador de Baatz e Shape (2000) possibilitou utilizar diferentes valores para os parâmetros como: escala, tonalidade e forma, permitindo agrupamento de pixel por relacionamento entre os objetos. Quanto à integração dos dois sistemas (WEKA e InterIMAGE), é possível concluir que ela apresentou grande eficiência ao processo, contudo, o tratamento manual dos dados da mineração e a forma de inserção manual dos mesmo no InterIMAGE, retarda o processo e expõe os dados a operações errôneas. Referências Bibliográficas BAATZ, Martin; SCHAPE, Arno. Multiresolution segmentation: an optimization approach for high quality multi-scale image segmentation. Disponível em: <http://www.ecognition.cc/download/baatz_schaepe.pdf> Acesso em: 15 jan. 2014. BIAS, Edilson de Souza; BRITES, Ricado Seixas; ROSA, Antônio Nuno de Castro: Imagens de alta resolução especial. In: Introdução ao processamento de imagens de sensoriamento remote. Org. MENESES, Paulo Roberto; ALMEIDA, Tati. 1a Ed., v. 1. Brasília: CNPq, 2012. CONGALTON, Russell G.; GREEN, K. Assessing the accuracy of remotely sensed data: principles and practices. Boca Raton-USA: Lewis Publisher, 1999. KUX, Hermann: Classificação da cobertura do solo urbano usando imagens ópticas de altíssima resolução e o sistema InterIMAGE, baseado em conhecimento. Anais XV Simpósio Brasileiro de Sensoriamento Remoto – SBSR, Curitiba, PR, Brasil, 2011, p. 822. RIBEIRO, Bárbara Maria Giaccom; FONSECA, Leila Maria Garcia; KUX, Hermann Johann Heinrich: Mapeamento da cobertura do solo urbano utilizando imagens WORLDVIEW II e o sistema InterIMAGE. Revista Brasileira de Cartografia, n. 63, Edição Espcial 40 anos, 2011.