Modelagem Conceitual de Banco de Dados Geográficos Donilson Lopes da Rosa, Sérgio Muinhos Barroso Lima Bacharelado em Sistemas de Informação – Faculdade Metodista Granbery Rua Batista de Oliveira, 1145 – 36010-532 – Juiz de Fora – MG {donilsonlr, smblima}@gmail.com Abstract. The objective of this work is to present a study about Conceptual Modeling of Geographic Databases, using the concepts of GeoFrame framework applied in the UMLGeoframe conceptual model, specific for Geographic Information Systems.It will be developed a study case of a Climate System. The diagrams of this model will be elaborated with the use of the tool ArgoCASEGEO, an extension of the Argo-UML. Resumo. O objetivo deste trabalho é apresentar um estudo sobre modelagem conceitual de Banco de Dados Geográficos, utilizando os conceitos do framework GeoFrame aplicados no modelo conceitual UML-Geoframe, específico para Sistemas de Informação Geográfica. Será desenvolvido um estudo de caso de um Sistema de Condições Climáticas. Os diagramas desse modelo serão elaborados com o uso da ferramenta de modelagem conceitual de aplicações geográficas, ArgoCASEGEO, uma extensão da Argo-UML.. Palavras-chaves. Modelagem conceitual; Banco de Dados Geográficos; Sistema de Informação Geográfica. INTRODUÇÃO As diversas maneiras de interpretação dos conceitos de espaço podem trazer grandes dificuldades para quem pretende desenvolver alguma aplicação computacional que envolva dados espaciais, já que, por tratar-se de conceitos abstratos, as suas representações têm que passar por processos elaborados de entendimento e modelagem, para que possam fornecer informações mais palpáveis. Tais diferenciações dos conceitos espaciais podem ser Revista Eletrônica da Faculdade Metodista Granbery - http://re.granbery.edu.br ISSN 1981 0377 Faculdade de Sistemas de Informação - N. 3, JUL/DEZ 2007 estabelecidas de acordo com os padrões culturais e as possibilidades técnicas, fornecendo significados distintos à natureza e à organização espacial. A palavra espaço é utilizada para as mais diversas finalidades; pode representar o espaço sideral, espaço topológico, espaço econômico ou espaço pessoal, sendo associada a diferentes escalas, seja mundial, ou até de um cômodo em nossa casa. Entre as diversas correntes de pensamento da Geografia, alguns conceitos foram explorados, cada qual com suas idéias e de acordo com o momento social, político e econômico. As análises espaciais puderam, no decorrer da história, acompanhar o desenvolvimento das práticas de pesquisa e das tecnologias, proporcionando aos cientistas atuais um extenso rol de informações e mecanismos de obtenção de dados espaciais. No início as pesquisas se limitavam a órgãos do governo e tinham o subsídio de multinacionais, eram limitadas pelo baixo nível de equipamentos e softwares, mesmo assim foram apresentadas grandes teorias e conceitos fundamentais para que hoje fossem transformados num turbilhão de possibilidades no mundo do geoprocessamento. As técnicas de captação de imagens, de processamento dos dados geográficos e seus relacionamentos, os métodos de acesso e o crescimento da Internet, que possibilitou maior disponibilidade de informações e disseminação de conhecimentos, seguidos dos avanços dos Sistemas de Gerenciamento de Bancos de Dados, favoreceram ao grande interesse pelos diversos setores de atuação nos quais os SIGs - Sistemas de Informação Geográfica - estão presentes na atualidade. Este artigo foi desenvolvido com base na apresentação do Trabalho de Conclusão de Curso: SIG - Sistemas de Informação Geográfica - Modelagem de Banco de Dados Geográficos (ROSA, 2007) e teve estímulo pela interdisciplinaridade dessa área de conhecimento, ratificada pelo aprendizado de disciplinas como Banco de Dados e Análise de Sistemas, no curso de Sistema de Informação da Faculdade Metodista Granbery; e Introdução ao Geoprocessamento no curso de Geografia da Universidade Federal de Juiz de Fora. O artigo está organizado da seguinte maneira: a seção 1 apresenta os conceitos básicos utilizados para a representação espacial de dados geográficos, com uma descrição de SIG. A seção 2 apresenta a modelagem conceitual de dados geográficos por meio do framework1 GeoFrame, demonstrando como é feita a modelagem de dados espaciais utilizando a linguagem UML-GeoFrame. A seguir, a seção 3 apresenta a ferramenta 1 Framework: é uma estrutura de suporte definida, em que outro projeto de software pode ser organizado e desenvolvido. Pode incluir programas de suporte, bibliotecas de código, linguagens de script e outros softwares para ajudar a desenvolver e juntar diferentes componentes de um projeto de software. É projetado com a intenção de facilitar o desenvolvimento de software, habilitando designers e programadores a gastarem mais tempo determinando nas exigências do software do que com detalhes tediosos de baixo nível do sistema. ArgoCASEGEO, suas principais características e funcionalidades. Finalizando, na seção 4, teremos um estudo de caso com a modelagem de um Sistema de Condições Climáticas. REPRESENTAÇÃO ESPACIAL DE DADOS GEOGRÁFICOS Para tentarmos estabelecer uma maneira mais perceptível e compreensiva dos conceitos abstratos de espaço, e transformá-los em representações espaciais nos computadores, devemos considerar aspectos capazes de possibilitar melhor entendimento dos mesmos, ou seja, os conceitos que descrevem o mundo real, os modelos lógico-matemáticos, as estruturas de dados geométricas e alfanuméricas, os algoritmos que serão utilizados nos SIGs e opções de arquitetura, linguagens de programação e desempenho de hardware. Dados geográficos são as representações de fenômenos, como: solo, vegetação, clima, dados censitários, dados cadastrais urbanos, exclusão social, ocorrências de crimes, declividade de um terreno, rede de abastecimento de água e coleta de esgoto, ou seja, tudo que se relaciona à natureza e aos homens e às relações estabelecidas entre ambos. O Geoprocesamento é uma ciência que é composta por práticas de trabalho de pesquisa de campo, técnicas de procesamento de dados, métodos de aplicação, equipamentos e conhecimento humano, com o intuito de processar informações advindas de coletas de dados e percepções do universo com finalidades específicas nas quais cada sistema atua. Um SIG é um software que tem a capacidade de capturar, modelar, manipular, recuperar, cunsultar, analisar e apresentar informações com dados geográficos. Os componentes de um SIG e as suas integrações podem ser observados na figura 1. A Interface é utilizada pelo usuário para operar e controlar o sistema; Entrada e Integração de Dados são os mecanismos de conversão de dados para a forma digital; Consulta e Análise Espacial são os métodos de processamento de imagens; Visualização e Plotagem são as representações dos dados por meio de mapas, imagens e tabelas; e Gerência de Dados na qual são armazenados, organizados e recuperados os dados espaciais. Figura 1 – Arquitetura de sistemas de informação geográfica. Fonte: Câmara, G. 2005. MODELAGEM CONCEITUAL DE DADOS GEOGRÁFICOS Os modelos de dados são criados para representar os objetos e fenômenos da natureza e possibilitar ao desenvolvedor e ao usuário de um SIG entender melhor os conceitos relacionados com a aplicação que estiver em questão. A abstração do mundo real serve para que sejam representadas todas as entidades e os relacionamentos nos quais um sistema é proposto, dentro das funcionalidades necessárias para atender os requisitos pré-estabelecidos. A modelagem conceitual está inserida no domínio do problema, ou seja, será descrita em linguagem de alto nível e ficará independente do software. A representação de dados geográficos apresenta algumas particularidades devido a aspectos que envolvem a localização espacial dos objetos, o tempo de observação, o registro de fatores externos e a precisão na obtenção dos dados, sejam eles: −A limitação da representação do mundo real por meio de conceitos geométricos, sendo necessário o maior número possível de formalização de conceitos abstratos; −Maneiras diferentes de interpretação espacial pelos usuários; −Os dados geográficos possuem diferentes formas geométricas; −Relações espaciais de difícil entendimento e execução. Para obtermos melhores resultados na modelagem de dados geográficos, devemos conhecer os níveis de abstração que podem ser representados: o mundo real e seus fenômenos (ruas, rios ou cobertura vegetal), a representação conceitual das entidades, a representação com aspectos visuais e implementação nas quais são definidas as estruturas de dados. O modelo UML-Geoframe, adaptação do framework GeoFrame (FILHO e IOCHPE, 1999) à linguagem de modelagem UML (BOOCH, JACOBSON E RUMBAUGH, 1998), atende aos aspectos de modelagem de dados geográficos, possibilitando que os conceitos de abstração de espaço sejam transformados em aplicações de melhor entendimento. Utilizando conceitos da orientação a objetos, permite que a modelagem seja criada de modo adequado às modernas práticas de desenvolvimento e às linguagens de programação mais propagadas e utilizadas na atualidade. As classes que compõem esta modelagem são apresentadas na figura 2 e seguem padrões e conceitos semelhantes aos que foram propostos no padrão OMT-Geo (BORGES, 1997), nos quais são explorados os conceitos de espaço absoluto2, geo-campo (classe CAMPOGEOGRÁFICO) e geo-objetos (classe OBJETOGEOGRÁFICO), que representam classes georreferenciadas, ou seja, classes com características geométricas e que possuem localização espacial (latitude e longitude). A classe TEMA permite ao desenvolvedor dividir o esquema de acordo com pacotes que representam os aspectos que serão abordados pelo sistema, sendo que a classe REGIAOGEOGRÁFICA pode englobar vários temas. Esse modelo possibilita a representação de objetos convencionais (classe OBJETONAOGEOGRÁFICO); nos níveis inferiores da representação encontram-se as classes REPRESENTAÇAOCAMPO nas quais podemos representar as classes como ISOLINHAS (curvas de nível de cartas topográficas), GRADEPONTOS (elevação de terrenos), GRADECELULAS PONTOSIRREGULARES (dados (imagens de meteorológicos satélite), de POLADJACENTES estações climatológicas); e e OBJETOESPACIAL com as classes PONTO, LINHA, POLÍGONO E OBJESPCOMPLEXO. 2 Espaço absoluto: também chamado cartesiano, é um container de coisas e eventos, uma estrutura para localizar pontos, trajetórias e objetos. Figura 2 – Diagrama de Classes GeoFrame. Fonte: Filho, J. L. 2004. Outra característica desse modelo é a representação dessas classes com estereótipos apresentados na figura 3 com uma observação a ser feita na qual temos os objetos espaciais complexos que são compostos por dois ou mais (2..n) objetos espaciais, por exemplo, um arquipélago; e o estereótipo <<função>> que serve para representação de campos categóricos, ou o relacionamento entre esse tipo de classe, como por exemplo Solo e Tipo de solo. Figura 3 – Estereótipos das classes GeoFrame. Fonte: Filho, J. L. 2004. O processo de modelagem na UML-GeoFrame segue os seguintes passos: 1 - Identificar temas e subtemas por região: escolhida a área a ser representada devemos identificar os temas e subtemas que serão abordados na modelagem, utilizando o construtor Pacote da UML, como podemos observar na figura 4; Figura 4 – Diagrama de temas GeoFrame. Fonte: Filho, J. L. 2004. 2 - Construir diagramas de classes por tema: nesta fase é que devemos utilizar os estereótipos para representação das classes; 3 - Modelar o componente espacial dos fenômenos geográficos: aqui devemos estabelecer a especificação dos fenômenos geográficos por meio das associações entre as classes. Os passos 2 e 3 devem ser realizados juntos e podem ser observados pelo diagrama da figura 5. Figura 5 – Diagrama de classes Gestão Urbana. Fonte: Filho, J. L. 2001. FERRAMENTA ARGOCASEGEO A ferramenta free3 ArgoCASEGEO, uma extensão da Argo-UML, está sendo desenvolvida desde 2004 pelo corpo docente do Departamento de Informática da Universidade Federal de Viçosa, por funcionários e por discentes envolvidos em projetos de iniciação científica do curso de Ciência da Computação da UFV. Ela oferece mecanismos de adaptação à linguagem de modelagem UML-Geoframe sendo desenvolvida em linguagem de programação Java, de código aberto, e a sua versão 2.0 está disponível para download por meio do link http://www.dpi.ufv.br/projetos/argocasegeo/ArgoCASEGEO2.exe. 3 Ferramenta free: programa utilizado para desenvolvimento ou programação de um sistema computacional disponibilizado gratuitamente na Internet. O seu ambiente de trabalho apresenta três painéis: o de navegação, no qual temos acesso aos diagramas do projeto; o gráfico, no qual são construídos os diagramas; o de propriedades, que fornece modos de edição dos itens dos diagramas. Conforme pode ser observado na figura 6, a ferramenta tem uma interface simples e fácil de ser utilizada. Figura 6 – Interface da ArgoCASEGEO. A ferramenta possui quatro módulos já disponíveis para utilização e um módulo que está sendo desenvolvido pelos projetistas, além de projetos de módulos que farão a integração destes: O Módulo Gráfico, no qual temos os estereótipos e construtores que são utilizados na modelagem conceitual de banco de dados geográficos; o Módulo de Dicionário de Dados com as descrições dos elementos dos modelos; o Módulo de Catálogo de Padrões de Análise que cuida da reutilização de esquemas já existentes; o Módulo de Geração Automática no qual ocorre a transformação do esquema conceitual para o lógico; e o Módulo de Engenharia Reversa que possibilitará obter esquemas conceituais por meio de aplicações feitas em diversos SIGs. Entre as principais funcionalidades destacam-se a criação de diagramas da UML e o diagrama UML-GeoFrame; opções para escolher as representações dos objetos ou campos geográficos, ou seja, a sua representação geométrica; inclusão das classes do nosso modelo, utilizando as opções de adicionar atributos e operações, e escolha da multiplicidade dos relacionamentos, agregação-composição e navegabilidade entre as classes. SISTEMA DE CONDIÇÕES CLIMATOLÓGICAS O sistema que serviu de base para essa modelagem foi projetado pelo graduando Rodrigo Terror Giesbrecht, e trata-se do estudo de caso que está desenvolvido em sua monografia. O objetivo desse sistema é apresentar informações sobre o clima de uma determinada região, utilizando a captação de imagens de satélites e a obtenção de dados meteorológicos, como temperatura, pressão atmosférica e umidade relativa do ar nos aparelhos instalados em estações climatológicas em uma cidade. Esse tipo de coleta facilitará a caracterização do clima da região escolhida pelo usuário e possibilitará a visualização de mapas, inclusive com a possibilidade de geração de gráficos desses dados coletados, e as conexões entre as cidades, pelas rodovias que ligam as mesmas. A modelagem segue os passos expostos anteriormente, com a construção do diagrama de casos de uso no qual temos as interações do usuário com o sistema, ou seja, as funcionalidades do sistema, e pode ser verificado na figura 7 abaixo. Figura 7 - Diagrama de Casos de Uso. Em seguida passamos à construção do diagrama de temas, na qual utilizamos o diagrama de pacotes da UML. O tema infra-estrutura possui os sub-temas Sistema Viário e Divisão Administrativa, em que serão estabelecidas as fronteiras entre cidades e estados, ou seja, a localização dos mesmos por meio das coordenadas geográficas da região, e quais as rodovias interligam essas cidades, inclusive a sua classificação, se estadual ou federal. O tema Cartografia possui um sub-tema, Projeção Cartográfica (Mapa). O tema Coleta de Dados apresenta as formas de captação de dados seja pela Estação Climatológica (Coleta) seja por Sensoriamento Remoto (Satélite), com a possibilidade de geração de gráficos das condições climáticas da região monitorada. Observamos na figura 8 uma visão macro do sistema, utilizando um diagrama para cada uma das regiões que forem pesquisadas pelos usuários. CondicoesClimatologicas:RegiaoGeografica Figura 8 - Diagrama de Temas. No diagrama de classes estabelecemos quais são as classes que se enquadram como FENOMENOGEOGRÁFICO que serão subdivididas entre as classes OBJETOGEOGRÁFICO (Estado, Cidade e Rodovia) e CAMPOGEOGRÁFICO (Mapa, Coleta e Satélite). A classe Estado mantém uma composição com a classe Cidade, pois esta faz parte daquela e dentro do sistema não existem isoladamente. Uma cidade pode ser ligada por uma ou várias rodovias, que podem passar por várias cidades. Uma cidade, uma rodovia e um estado podem ser desenhados em um ou mais mapas, que podem conter várias cidades, estados ou rodovias. Uma coleta, obrigatoriamente, deve pertencer a uma cidade, que pode ter várias coletas ou nenhuma. Um mapa é construído por uma ou várias imagens de satélites, que, por sua vez, podem fornecer imagens para construção de vários mapas. Como destaques da figura 9, temos: os atributos coordXY da classe cidade, que servem para localizar as cidades; na classe Mapa temos os atributos tema, escala e região em que podemos definir o tipo de mapa, qual região da cidade e a proporção em que visualizamos a imagem do satélite. O atributo gráfico dessa classe é responsável direto pelo método desenhar, por meio do qual se estabelecem os contornos do mapa que está sendo produzido. Na classe Coleta, são retirados os dados referentes às condições climáticas e à geração de gráficos das observações feitas pelos equipamentos instalados em uma estação climatológica. A captura de imagens pelos satélites é uma das opções existentes e utilizadas para construção de mapas que servem como base para as operações realizadas pelos SIG. LEGENDA: Objeto Geográfico Campo Geográfico Objeto não-Geográfico Figura 9 - Diagrama de classes. CONSIDERAÇÕES FINAIS Neste artigo foram apresentados conceitos básicos utilizados para a modelagem conceitual de banco de dados geográficos, por intermédio da linguagem de modelagem UMLGeoFrame, na qual podemos observar suas aplicações no campo do geoprocessamento e de SIG. Foram descritos os elementos de um SIG, os conceitos nos quais eles se enquadram, as principais estruturas e os tipos de dados encontrados nessa modelagem. Também foram abordados os níveis de abstração dos dados geográficos e as dificuldades de representação dos mesmos. Foi escolhida a linguagem UML-GeoFrame com suas principais características, tipos de classes, diagramas e relacionamentos, e processos de modelagem para ser desenvolvido um caso de uso utilizando a ferramenta de modelagem ArgoCASEGEO. Considerando a grande gama de informações pertinentes ao tema deste trabalho, e sua interdisciplinaridade, pode-se estabelecer parâmetros de como é complexo e desafiador o estudo e a pesquisa neste campo, porém trata-se de um grande e amplo universo de análise e com possibilidades de crescimento profissional e pessoal, já que não se remete somente a aplicações estritamente técnicas: Esse tipo de pesquisa tem como premissa o conhecimento das capacidades humanas de interpretação do espaço, a aplicação de conceitos matemáticos e o desenvolvimento de técnicas computacionais. AGRADECIMENTOS Os autores deste artigo agradecem o apoio da direção da Faculdade Metodista Granbery e da coordenação do curso de Sistema de Informação pelo incentivo à prática de pesquisa e ao estímulo transferido aos alunos, encorajando-os a desenvolver trabalhos acadêmicos que aprimoram os ensinamentos transmitidos pelos professores da Instituição. REFERÊNCIAS BIBLIOGRÁFICAS BOOCH, G.; JACOBSON, I.; RUMBAUGH, J. The Unified Modeling Language User Guide. Reading: Addison-Wesley, 1998. BORGES, K. A. V. Modelagem de Dados Geográficos: Uma extensão do modelo OMT para aplicações geográficas. Belo Horizonte: Escola de Governo, Fundação João Pinheiro, 1997. Dissertação Mestrado. CASANOVA, M. A.; CÂMARA, G.; DAVIS JR., C. A.; VINHAS, L.; QUEIROZ, G. R. Banco de Dados Geográficos. Curitiba: Editora MundoGEO, 2005. FILHO, J. L. Estruturação e Modelagem de Bancos de Dados para GIS. Gis Brasil – 10º Show Internacional de Geotecnologias, CD Curso n. 6. São Paulo: COMDEX, 2004. FILHO, J. L. Projeto de Banco de Dados para Sistemas de Informação Geográfica. Viçosa: Departamento de Informática, UFV, 2001. Tutorial. FILHO, J. L.; IOCHPE, C. Specifying analysis patterns for geographic databases on the basis of a conceptual framework. In: ACM SYMPOSIUM ON ADVANCES IN GEOGRAPHIC INFORMATION SYSTEMS, 7., Kansas City - USA, 1999. GIESBRECHT, R. T. Sistemas de Informações Geográficas: Teoria e Implementação. Juiz de Fora: Bacharelado em Sistemas de Informação, Faculdade Metodista Granbery, Instituto Metodista Granbery, 2008. Monografia de Graduação. QUEIROZ, R. G.; FERREIRA, K. R. Tutorial sobre Banco de Dados Geográficos. Ministério da Ciência e Tecnologia – Inpe – Instituto Nacional de Pesquisas Espaciais. São José dos Campos. 2006. ROSA, D. L. SIG - Sistemas de Informação Geográfica - Modelagem de Banco de Dados Geográficos. Juiz de Fora: Bacharelado em Sistemas de Informação, Faculdade Metodista Granbery, 2007. Monografia de Graduação. SALES R., MAEDA V.; SIMONATO T. Modelagem de dados espaciais. SQL Magazine. Rio de Janeiro. n. 21, p. 32-39. jul. 2005. SAMPAIO, G. B.; GAZOLA, A.; FILHO, J. L. Modelagem e projeto de banco de dados geográficos com características temporais. Viçosa: Departamento de Informática, UFV, 2005. Artigo. SILVA E.; FILHO, J. L. Modelagem de banco de dados geográficos usando o modelo UML-GeoFrame. SQL Magazine. Rio de Janeiro. n. 28, p. 44-47. fev. 2006. UFV. ArgoCASEGEO tutorial. Disponível <http://www.dpi.ufv.br/projetos/argocasegeo/tutorial >. Acesso em: novembro de 2007. em: