UNIVERSIDADE FEDERAL DE SANTA CATARINA DEPARTAMENTO DE INFORMÁTICA E ESTATÍSTICA DISCIPLINA DE PLANO PROJETOS 1 RESUMO DA DISSERTAÇÃO DE MESTRADO DO MESTRE ANDRÉ VINÍCIUS CASTOLDI – UMA ONTOLOGIA PARA ENLACES DE UNIDADES DE INFORMAÇÃO EM PLATAFORMAS DE GOVERNO ELETRÔNICO Dissertação apresentada ao Programa de Pós-Graduação em Engenharia de Produção da Universidade Federal de Santa Catarina em Julho de 2003 Julho 2006 Aluno: André Vieira de Aguiar 1 - Introdução A partir da década de 90, o volume e a demanda de informações circulando de maneira digital têm crescido muito, especialmente utilizando a internet para tal fim. No setor de serviços públicos não têm sido diferente, tanto é verdade que os governos têm investido mais na construção de portais públicos e infra-estrutura para tornar mais eficiente a troca de informações. Estados Unidos e Europa possuem milhares de iniciativas de governo eletrônico (PACHECO,2003). O Brasil destaca-se por ser um país com grande dinamismo na área de E-Gov entre as nações em desenvolvimento e projetos brasileiros são referências internacionais como, por exemplo, cobrança de impostos(SHAW, 2002). Uma das principais demandas do governo é justamente a geração de informações sobre diversas áreas de ação do Estado. Nesse contexto, todas as entidades geradoras de informações são partes fundamentais pois representam os subdomínios dessa rede de informações que juntas formam uma plataforma de E-Gov. Esta plataforma possui, em suas entidades formadoras, diferentes repositórios de informações, por isso há a necessidade de conhecer todos os repositórios, assim como seus esquemas de dados para permitir a integração dos mesmos. Todavia, E-Gov possui um dinamismo muito agressivo, pois todos os dias surgem novas bases de dados, formatos e esquemas. Neste contexto, verifica-se a necessidade de usar um repositório de metadados que intermediaria as diversas fontes de dados e possibilitaria a integração das mesmas. Uma das áreas de pesquisa que tem crescido muito é a de Ontologias, que tem sua importância, entre outras, no que diz respeito à integração de dados e modelagem de conhecimento. Ontologias permitem, por exemplo, que conceitos e visões de um mesmo domínio sejam compartilhados, atuando como facilitadores na integração de diferentes unidades de informação do E-Gov. Tal integração seria feita, a priori, por seres humanos, mas com o advento das ontologias, essa tarefa poderá ser delegada à agentes de software, que utilizarão esta ontologia para manipulação dos dados das diferentes fontes. Este trabalho objetiva a construção de uma ontologia para representar unidades e fontes de informação visando facilitar a intercomunicação entre as diferentes entidades relacionadas com o E-Gov, assim como apresentar aspectos teóricos relacionados a plataformas de governo, levantamento teórico sobre web semântica, ontologias e serviços web que viabilizem a concepção de um modelo para aplicações. Entre outros objetivos estão a definição da linguagem de representação de ontologias e descrever como essa ontologia pode ser aplicada na prática. 2 – Plataformas de Governo Eletrônico e Gestão de Unidades de Informação Um dos objetivos deste documento é permitir que diferentes sistemas possam utilizar das informações disponíveis em plataformas de governo, independente da infraestrutura e tecnologia utilizada, tendo em comum o uso de ontologias para a comunicação entre as diferentes fontes e unidades de informação de E-Gov. 2.1 – Plataformas de Governo Eletrônico Governo Eletrônico é um conceito recente, e utilizando a definição de Zweers e Planqué (2001), pode-se afirmar que Governo Eletrônico objetiva fornecer ou disponibilizar informações, produtos ou serviços, através de meio eletrônico a qualquer momento e a todos os envolvidos, de alguma forma com a esfera pública. Segundo Lenk e Traunmüllerv (apud JOIA, 2002), o Governo Eletrônico pode ser analisado sob quatro perspectivas: 1. A Perspectiva do Cidadão – visando oferecer serviços de utilidade pública ao cidadão; 2. A Perspectiva de Processos – visando repensar o modo de operação dos processos existentes no Governo, como por exemplo, processos de licitação para compras (e-procurement); 3. A Perspectiva da Cooperação – visando integrar os vários órgãos governamentais e outras organizações envolvidas. 4. A perspectiva da Gestão do Conhecimento – visando permitir ao Governo, gerenciar e disponibilizar o conhecimento gerado e acumulado por seus vários órgãos. 2.2 As quatro fases do Governo Eletrônico Vários fatores foram de suma importância não só para o Governo, mas para toda a sociedade utilizar do novo ambiente (a Web) para estabelecer novas formas de interação. Keller (2000) identificou quatro fases no processo de transição dos Governos em direção ao Governo Eletrônico: 1. Presença. A primeira fase caracteriza-se pela presença do Governo na Internet. Mas essa presença se dá de maneira descentralizada, ou seja, cada departamento possui um referenciado URL diferente para oferecer informações e serviços produzidos por aquele departamento. Mas para os usuários terem acesso às páginas, estes devem conhecer os endereços eletrônicos ou utilizar de ferramentas de busca para tal fim, e considerando a grande quantidade de departamentos de um governo, pode-se ter uma idéia da dificuldade de interagir eletronicamente com o governo. 2. Interação. Nesta fase, governos criam um site central, a partir do qual cidadãos podem se conectar a qualquer outro departamento de maneira prática e rápida. Porém, o cidadão ainda precisa de um prévio conhecimento sobre qual departamento deve reportar-se sobre determinado serviço ou assunto. 3. Transação. Inovações significativas são inseridas nessa fase, onde, ao invés de organizar suas páginas por departamento, os serviços são agregados em um único portal na Web. 4. Transformação. Nesta fase, as organizações usarão a Internet, as telecomunicações e outras tecnologias para melhorar a prestação de serviços e a troca de informações entre todas as entidades envolvidas na esfera de E-Gov( Governo, cidadãos, setor privado, organizações, etc.). 2.3 Fontes de Informação Segundo Pacheco (2003), as fontes de informação são repositórios de dados referentes a cada unidade da plataforma de governo. As fontes de informação podem incluir todos os tipos de repositórios, desde bases estruturadas, bases digitais textuais, bases documentais, repositórios de imagens e demais meios de informações do governo. 2.4 Unidades de informação Em uma plataforma de governo eletrônico, as unidades de informação são partes fundamentais, pois elas descrevem os subdomínios da área-fim a qual a plataforma está sendo desenvolvida. Uma unidade de informação é composta de diversos elementos (módulos e campos) e tem relação direta com outras unidades de informação do domínio da plataforma. Os principais elementos da camada de unidades de informação estão relacionados à padronização do conteúdo de cada unidade. Aos responsáveis do projeto caberá a identificação das unidades, especificação do seu conteúdo inicial, propor um padrão inicial para essas unidades e promover a sua contínua revisão. Para estabelecer esses padrões, é necessário definir a ontologia das unidades de informação e a sua padronização em XML (Extensible Markup Language). 2.5 O uso de padrões para Unidades de Informação A tarefa de criar ontologias para estabelecer padrões deve produzir resultados que possibilitem o compartilhamento e intercâmbio entre os envolvidos no processo. Para tal, é fundamental que a definição das unidades de informação seja a base para a especificação desses padrões. Estes são descritos em forma de estruturas e regras de informações que permitam ser interpretados tanto por pessoas quanto por computadores. Todo este material deve ser colocado à disposição da comunidade usuária, garantindo o conhecimento compartilhado e a futura interoperabilidade entre todos envolvidos na plataforma. Na Plataforma E-Gov, para cada unidade de informação são definidos metadados específicos em uma linguagem de marcação para promover a interoperabilidade dos sistemas e das informações. Com o surgimento do XML, houve uma grande evolução no que diz respeito ao intercâmbio de informações, a ponto de ser considerado a linguagempadrão para intercâmbio de informações na Web (MELLO et al., 2000). Porém, o XML descreve apenas a gramática dos documentos (DENKER et al., 2001) e não impõe regras para a definição e o uso das tags e demais primitivas da linguagem. Assim sendo, para garantir a interoperabilidade semântica de informações será necessária uma linguagem mais elaborada como, por exemplo, RDF (MARINO, 2002) e DAML+OIL (BONIFÁCIO, 2002), e, com o advento da Web Semântica, OWL (SMITH et al., 2003). 2.6 Os padrões de Unidades de Informação e a integração com outros sistemas Devido ao fato da integração ocorrer em um ambiente essencialmente semântico, a Web, será delimitado que todas as fontes de informação, incluindo esquemas serão conhecidas a priori. A integração será feita sob duas ópticas distintas, do ponto de vista lógico e semântico. A diferença entre esses dois será apresentada a seguir. A integração lógica está ligada ao fato de que é necessário que informações de várias fontes de informação possam ser vistas como uma única fonte de informação integrada sobre um esquema global (GUPTA et al, 2002). Este tipo de integração faz necessário o uso de um mediador, software que permite que se defina um esquema integrador baseado em esquemas de dados individuais, escondendo ao usuário a heterogeneidade das fontes de dados. A integração semântica é baseada no significado da informação. No modelo de integração sintática, está se implementando interoperabilidade entre sistemas de busca. Na Web semântica, o que se procura é a interoperabilidade com base no significado da informação. É nesse contexto, que a integração semântica visa à publicação de modelos conceituais (ontologias), que descreve os conceitos, papeis, hierarquias de classificação, etc. na integração semântica, o mediador expõe ao usuário um modelo conceitual. A mediação semântica permite que fontes de informação exportem seus esquemas a um nível apropriado de abstração ao mediador. 3 WEB SEMÂNTICA, ONTOLOGIAS E SERVIÇOS WEB 3.1 Web Semântica Idealizada por Tim Benners-Lee (o criador da internet atual), a Web Semântica engloba tópicos de Inteligência Artificial e outras tecnologias Web para a construção de novas formas de representação do conhecimento, de forma a facilitar a localização, comparação e integração de recursos através da Web (BENNERS-LEE et al.2001). A Web Semântica é uma forma mais eficiente de representar dados na World Wide Web. A maioria das páginas Web atuais são destinadas à leitura por humanos e não para a compreensão de computadores, exceto no que se refere às rotinas de formatação, mas são incapazes de inferir o conteúdo semântico da página, pois os dados encontram-se dentro de arquivos HTML, em meio à códigos específicos para a formatação da página. Segundo Berners-Lee (2001, p.1), a internet atual foi desenvolvida como um meio de entrega de documentos para humanos e não para o processamento automático por computadores. Com a Web semântica esse problema é resolvido da seguinte forma: primeiro, a Web semântica permitirá que comunidades publiquem seus dados de maneira independente da formatação dos mesmos. Em segundo, através do uso de ontologias será possível que uma máquina entenda quais relacionamentos estão ligados a determinadas informações. Dessa forma, com a Web Semântica, um agente de software, ao ler a página de uma clínica médica, por exemplo, não saberá apenas que aquela página possui um “tratamento, medicina, terapia” como palavra-chave (recurso disponível atualmente), mas também saberá que o Dr. Fulano atende nesta clínica as segundas, quartas e sextas-feiras e que o serviço Web mostra os horários disponíveis para consultas como parâmetro de entrada no formato dd-mm-aaaa. E o agente “saberá” disso sem precisar dos recursos de inteligência artificial dos personagens Hal de “2001 – Uma Odisséia no Espaço”ou C-3PO, de “Star Wars”. (BENNERS-LEE et al., 2001). A Web Semântica será uma extensão da Web atual, em que será atribuído um sentido bem definido à informação, habilitando computadores e pessoas a trabalharem cooperativamente. Dessa forma, a descoberta, automação, integração e reuso de informações será viabilizado. As tecnologias fundamentais para o estabelecimento da Web semântica são: - URI: Uniform Resource Identifier já é um componente essencial na Web atual, qualquer recurso disponível na Web é identificado por um URI (BERNNERS- LEE et at, 2002). Seu tipo mais conhecido é o URL(Uniform Resource Locator), o localizador de informações. - XML e XML Schema: XML é a base para a representação de dados em um formato que facilite a interoperabilidade entre aplicativos. XML Schema consiste na recomendação da W3C para estruturar documentos XML. - RDF e RDF Schema: RDF define como descrever recursos em termos de propriedades e valores. RDF Schema define propriedades para se definir esquemas. RDFS permite verificar se um documento RDF está coerentemente preenchido. Diferentes aplicações podem usar mesmos esquemas para ter uma estrutura de documentos em comum na troca de informações. - OWL: o próximo nível é o nível lógico. É necessário que haja como escrever lógica dentro de documentos, tais como a checagem de um documento contra um conjunto de regras de autoconsistência. Essa camada necessita de uma linguagem para representação de ontologias, nesse sentido, a W3C tem trabalhado na especificação da linguagem OWL (Web Ontology language). 3.2 Ontologias Pesquisas na área de ontologias têm crescido muito recentemente. Jargão esse “Ontologia” que foi adotado da Filosofia e que atualmente tem alcançado importantes resultados em áreas como Inteligência Artificial, Lingüística Computacional e Teoria de Banco de Dados. Sua importância tem sido reconhecida em várias outras áreas como engenharia e representação do conhecimento, modelagem qualitativa, integração de informação, entre outras. Seu uso em aplicações reais tem sido muito difundido, em áreas como Integração de Informações Corporativas (EIS), tradução de linguagem natural, sistemas de informações geográficas, entre outros (GUARINO, 1998). O projeto de ontologias possui peculiaridades metodológicas e arquiteturais. Na questão metodológica, a principal peculiaridade é o uso de uma abordagem interdisciplinar, em que a filosofia e a lingüística atuam na análise da estrutura de uma dada realidade, com um alto nível de generalidade e na formulação de um vocabulário claro e preciso. No lado arquitetural, o aspecto mais interessante é que uma ontologia pode ocupar o papel central em um sistema de informação, guiando a perspectiva de sistemas de informação baseados em ontologias. O reconhecimento da importância da ontologia para a representação do conhecimento foi resultado de um amadurecimento gradual da área, como é apresentado a seguir: 3.3 O que é ontologia O grande interesse por ontologias acarretou no surgimento de uma série de definições para o termo, algumas até mesmo conflitantes entre si. Ontologia é freqüentemente contrastada com Epistemologia. “É o ramo da filosofia que trata do ser enquanto ser, isto é, do ser concebido como tendo uma natureza comum que é inerente a todos e cada um dos seres” (AURÉLIO, 1994). No sentido filosófico, pode-se classificar uma ontologia como um sistema de categorias explicando uma certa visão do mundo. Esse sistema não depende de uma linguagem em particular. Por outro lado, em IA, uma ontologia refere-se a um artefato de engenharia formado por um vocabulário específico que é usado para descrever uma certa realidade e um conjunto de afirmações explícitas sobre o significado das palavras do vocabulário (GUARINO, WELTY, 1998). Duas ontologias podem ser diferentes quanto ao vocabulário usado (por exemplo, palavras em inglês e português), mas ainda assim podem compartilhar de uma mesma conceituação. Guarino (1998) diz que uma ontologia é na verdade uma especificação parcial e explícita que tenta, da melhor forma possível, aproximar a estrutura de mundo definida por uma conceituação. Um exemplo muito simples de ontologia seria uma hierarquia de tipos, especificando classes e seus relacionamentos. Os esquemas de banco de dados relacional também servem como ontologias, pois atuam nas restrições de integridade entre as entidades. Uma ontologia, assim, atua como um contrato entre parceiros para que os mesmos possam se comunicar com segurança dentro de um mesmo domínio de informação (DAUM; MERTEN, 2002). Por exemplo, agentes de software que utilizem a mesma ontologia podem se comunicar entre si sem comprometer a semântica da informação que está sendo trocada, formando uma comunidade de usuários da internet. 3.4 Por que usar ontologias Como dito anteriormente, uma ontologia facilita a troca de informações sobre um domínio específico. Mas se isso é possível sem o uso de ontologias, qual é, então, a vantagem de se usar ontologias? Noy e McGuinness (2000) apresentam algumas razões do uso de ontologias: a. Compartilhar a mesma estrutura de informação entre pessoas e agentes de software. Trata-se de um dos objetivos mais comuns no desenvolvimento de ontologias (MUSEN, 1992; GRUBER, 1993). Por exemplo, se sites compartilharem e publicarem as informações usando uma mesma ontologia, agentes de software poderão extrair e agregar informações desses sites para diversos fins. b. Permitir o reuso do conhecimento do domínio. Este é um dos principais aspectos responsáveis pelo interesse atual em pesquisa sobre ontologias. Se um grupo de pesquisadores desenvolve uma ontologia para determinado domínio, outros podem simplesmente reutilizá-la em suas aplicações. Além disso, pode-se utilizar uma ontologia ampla que descreve conceitos mais genéricos e estendê-la de modo que descreve um domínio mais detalhadamente. c. Separar o conhecimento do domínio do conhecimento operacional. Pode-se descrever uma tarefa de configurar um produto a partir dos seus componentes, de acordo com uma especificação necessária, e implementar um programa que faz essa configuração (MCGUINNESS; WRIGHT, 1998). Por exemplo, pode-se desenvolver uma ontologia que descreva os componentes de um microcomputador e suas características, e aplicar um algoritmo para configurar a venda de PCs configuráveis pelo cliente. d. Analisar o conhecimento do domínio. Isso é possível pelo fato de que uma especificação declarativa dos termos está disponível. A análise formal dos termos é extremamente importante quando se deseja reusar ontologias existentes e estendelas(MCGUINNES et al., 2000). 3.5 Tipos de ontologias As ontologias podem ser classificadas quanto à sua generalidade. Guarino (1998) identifica quatro tipos de ontologias. a. Ontologias genéricas: São criadas para descrever domínios gerais como espaço, tempo, objeto, evento, etc. Essas ontologias são compartilhadas por uma grande comunidade e não dependem de um problema ou domínio específico. b. Ontologias de domínio (verticais): São específicas de um determinado domínio de conhecimento, como indústria de computadores, farmacêutica. c. Ontologias de tarefas (horizontais): exemplo, análise de requisitos de software. Aplica-se a uma certa tarefa, por d. Ontologias de aplicação: aplicam-se a uma certa aplicação, sendo uma especialização de uma ontologia de domínio e/ou de tarefa. Os itens da ontologia assumem papéis específicos para a aplicação em questão. 3.6 Profundidade Ontológica Quanto à profundidade ontológica, as ontologias podem ser classificadas em quatro níveis segundo Guarino e Welty (1998): a. Vocabulário: em sua forma mais simples, uma ontologia é apenas um vocabulário. Dessa forma, uma DTD ou XML-Schema pode definir uma ontologia. Se as entidades envolvidas compartilham esse mesmo vocabulário, estarão habilitadas a trocar mensagens com um vocabulário em comum. b. Taxonomia: O significado dos termos é estabelecido pela definição de relacionamentos entre eles. Um dos relacionamentos mais naturais é a classificação, relacionamento entre objetos e classes, subclasses e superclasses. Muitas ontologias existentes são definidas usando-se apenas relacionamentos hierárquicos. c. Sistema relacional. As ontologias também podem incluir relacionamentos não hierárquicos. Existem muitos relacionamentos possíveis entre os objetos além dos relacionamentos hierárquicos “é-um”. Os relacionamentos são típicos dos diagramas de relacionamento de entidades dos bancos de dados relacionais. d. Teoria Axiomática. Além dos relacionamentos, as ontologias podem impor restrições. As restrições são definidas como axiomas, que são afirmações lógicas que garantem a integridade de um relacionamento. As ontologias que só implementam o nível 1 (vocabulário) são de uso limitado. Elas podem ajudar a simplificar e a padronizar a troca de dados, mas não permitem que máquinas possam inferir algo sobre um item que diz respeito à determinada informação, pois não há garantia de semântica na operação. O último estágio da definição de ontologias traz o conceito de axiomas, que normalmente é muito difícil serem obtidos em aplicações práticas. Apesar disso, o uso das restrições é importante e aumenta significantemente a integridade e a coerência dos dados. Claramente, a cada nível, o nível de trabalho exigido é maior para se definir ontologias. O desenvolvimento de ontologias é um processo criativo, e uma preocupação que o projetista deve ter em mente é que não existe uma única forma correta. A avaliação das mesmas só será possível através do seu uso em aplicações para as quais foi desenvolvida. 3.7 Serviços Web Um serviço Web pode ser qualquer pacote de funções publicadas e acessadas por outros programas via internet. Baseiam-se em padrões abertos, tornando possível o desenvolvimento desses serviços a partir de qualquer plataforma ou linguagem de programação disponível. Para ser considerado um serviço Web, ele deve possuir uma forma de disponibilizar as informações desse serviço através de alguma espécie de interface, o que chamamos de documento WSDL. Uma especificação WSDL é baseada em XML e descreve todos os detalhes necessários para se interagir com o serviço Web, incluindo os formatos das mensagens e os protocolos de transporte. A interface esconde os detalhes de implementação do serviço e ocasiona baixo acoplamento, visto que é independente de hardware e software. O WSDL (Web Services Definition Language) é uma linguagem de metadados para services Web. Este documento define a interface entre o provedor de serviço e o cliente. WSDL pode ser usado no projeto de especificação que invocam e operam serviços Web na Internet e acessam aplicações remotas e bases de dados. Normalmente, quando se cria uma aplicação que se comunica com um serviço Web particular, tudo o que a aplicação precisa saber para estabelecer a comunicação é o arquivo WSDL. Visando estabelecer um protocolo simples e aberto para a troca de informações entre as entidades envolvidas no fornecimento e consumo de informações em um ambiente distribuído foi criado o SOAP (Simple Object Access Protocol). SOAP é um formato de mensagens baseado em XML independente de plataforma ou linguagem de programação. Sua simplicidade o torna fácil de ser depurado e muito mais claro de ser lido a um arquivo binário. Além disso, o uso de protocolos como SOAP sobre http é compatível com sistemas de firewall e não tem os mesmos problemas de segurança que os sistemas de protocolos proprietários. Para a descoberta desses serviços na Web, foi desenvolvido o UDDI (Universal Description Discovery and Integration) liderado pela IBM, Microsoft e Ariba desde 2000. Seu objetivo é funcionar como um local de registro de serviços, como as páginas amarelas de um catálogo telefônico, assim as companhias registram seus serviços nas categorias em que se encaixam. Além das páginas amarelas, UDDI também contém páginas brancas, que possuem a listagem das entidades de serviços, e as páginas verdes que representam documentos técnicos necessários para invocar um dado serviço. Sendo o UDDI um registro, geralmente é implementado em bases de dados. O modelo de dados do UDDI é composto dos seguintes elementos: - BusinessEntity: representa uma companhia do mundo físico; - BusinessService: representa um serviço oferecido pela companhia; - BindingTemplate: instruções sobre como invocar um serviço; - Tmodel: representa, entre outras coisas, os itens de documentação de um serviço 4 O REPOSITÓRIO DE UNIDADES E FONTES DE INFORMAÇÃO 4.1 A integração dos dados A integração tem sido um dos principais desafios dos projetos de governo eletrônico (PACHECO, 2003), sendo frequentemente resolvida através da troca de arquivos entre as fontes de informação (SANTANA et at., 2001). Esse processo depende da interação dos administradores das bases de dados entre os quais são estabelecidos os enlaces. As partes devem definir um padrão para intercâmbio de dados entre ambas as fontes de informação. Uma vez estabelecida a integração a integração entre as fontes de informação, devese repetir o processo de “troca de arquivos” periodicamente, para que as atualizações das bases também se reflitam nos enlaces de dados. 4.2 O repositório Para auxiliar o trabalho de integração, será usado um repositório para armazenar os metadados dessas fontes. Por reunir informações de várias fontes e unidades de informação, este repositório tornaria mais prático o estabelecimento dos enlaces. Quando um administrador desejar estabelecer enlaces com o administrador de outra fonte, ele não dependerá mais de um sincronismo com o administrador da outra ponta, pois os recursos dos quais ele precisa já estão disponíveis no repositório. O fluxo do processo de enlace ocorre da seguinte maneira: inicialmente, as unidades de informação são cadastradas, seus atributos e interfaces de busca. Em seguida todas as entidades envolvidas publicam no repositório suas fontes de informação, relacionando-as com as unidades, os atributos e as interfaces de busca que foram previamente cadastradas. Uma interface de busca é um conjunto padronizado de atributos usados para a recuperação de URLs de objetos de informação. Todas essas informações podem ser reunidas e compiladas, resultando em uma matriz de distribuição de unidades de informação por fontes de informação. 4.3 Modelo Conceitual A figura abaixo apresenta o modelo de classes da ontologia proposta. Através deste diagrama pode-se compreender o relacionamento entre as principais classes do repositório. · Uma Unidade de Informação é formada por Atributos e possui Interfaces de busca, que por sua vez, usam um subconjunto dos atributos da unidade de informação. · Instituições Consorciadas mantêm Fontes de Informação, que, por sua vez, armazenam instâncias das Unidades de Informação e disponibilizam Serviços de Busca compatíveis com uma ou mais Interfaces de Busca das Unidades de Informação armazenadas. 4.4 Casos de uso do repositório Os principais casos de uso do repositório estão relacionados com a definição das unidades de informação, com o registro das fontes de informação e com a consulta ao repositório. 4.4.1 Definição das Unidades de Informação A definição das unidades de informação é uma das etapas mais importantes de todo o processo envolvido no uso do repositório. Pois, se alguma unidade for definida de maneira inadequada, ela não será utilizada em todo o seu potencial. Por isso, recomenda-se que a definição dessas unidades seja feita com a comunidade como forma de validar a especificação antes da sua publicação. Para que o repositório seja compatível com a arquitetura de Web Semântica, é necessário publicar a ontologia dos serviços prestados no site. Abaixo está um trecho da ontologia representada na linguagem OWL. <owlx:Class owlx:name="unidadeInformacao" owlx:complete="false"> <owlx:Annotation> <owlx:Label xml:lang="pt"> Unidade de Informação </owlx:Label> </owlx:Annotation> <owlx:DataRestriction owlx:property="idUnidadeInformacao"> <owlx:cardinality owlx:value="1"/> <owlx:allValuesFrom owlx:datatype="&xsd;integer"/> 4.4.2 Registro de fontes de informação O registro das fontes de informação será utilizado pelas instituições para publicar suas fontes de informação e interfaces de busca no repositório. Para se associar, a instituição deve informar os seguintes dados cadastrais: subconjunto de atributos da unidade de informação disponíveis em sua base de dados e as interfaces de busca que implementou. 4.4.3 Consulta ao repositório Uma vez que o repositório possua Unidades e Fontes de Informação relacionadas, pode-se então disponibilizá-lo para consultas públicas. O módulo de consultas trabalha cruzando informações sobre Unidades, Fontes de Informação e Interfaces de busca, a fim de disponibilizar quais fontes dispõe de cada unidade de informação e os tipos de interface. Dessa forma, o usuário pode obter informações sobre objetos de informações que estão distribuídos nas diferentes instituições. 4.5 Arquitetura A idéia é que o repositório represente uma visão semântica dos relacionamentos sintáticos estabelecidos entre os Serviços Web das instituições e o UDDI. Dessa forma, o usuário do repositório não precisaria se preocupar com termos técnicos referentes ao domínio do UDDI, pois quando ele fizer uma consulta, por exemplo, o repositório – através de um mecanismo de comunicação com o UDDI – traduziria a semântica da instrução em comandos da API do UDDI, estabelecendo, assim, as tarefas solicitadas pelo usuário. A tecnologia de Serviços Web foi utilizada pela sua flexibilidade de implementação. Afinal, Serviços Web podem ser implementados independentemente da plataforma e linguagem de programação, garantindo que quando uma instituição associar-se ao repositório, esta não precisará alterar nada do que está utilizando atualmente. 5 CONCLUSÕES Apesar de existir uma crescente demanda por informações e serviços na Web, ainda são encontradas muitas dificuldades no desenvolvimento de soluções totalmente integradas. Umas das dificuldades é o dinamismo do setor de E-Gov, pois o surgimento de novas bases de dados é frequente e contínuo, dificultando a integração dos dados e a geração contínua de informação. O resultado são informações distribuídas em “ilhas” e a dificuldade do cidadão em encontrar o que necessita. O ponto chave para alterar essa situação é a interoperabilidade. Para tornar-se possível, um dos recursos necessários é o estabelecimento de padrões comuns de informações e o intercâmbio no serviço de consulta. É nesse contexto que são utilizadas as ontologias. Essa área tem ganhado importância na área de engenharia do conhecimento e integração de dados. Linguagens para representação de ontologias, como OWL, permitem que se desenvolvam modelos semânticos para representar conceitos e relacionamentos. Além disso, outra característica importante é que o conhecimento representado pode ser reutilizado facilmente. Para estabelecer meios para ampliar a interoperabilidade de projetos de informação de governos, foi proposta uma ontologia para representar as fontes e unidades de informação e relacioná-las a plataformas de governo eletrônico. Para tanto, estabeleceramse elementos teóricos relacionados a plataforma de governo e seus componentes, unidades de informação e fontes de informação, que são as entidades responsáveis pela informação pública em diferentes repositórios de informação em que as unidades estão presentes. Com essa visão de arquitetura, é possível estabelecer modelos conceituais nos quais se definem padrões semânticos compatíveis com outros sistemas que buscam informações públicas na Web. Para definir os elementos conceituais da ontologia proposta, foi utilizada a linguagem OWL, visando descrever como unidades de informação podem ser representadas em diferentes repositórios de informação. O modelo proposto foi aplicado à definição de serviços de interoperabilidade de unidades de informação de Ciência e Tecnologia (presentes na Plataforma Lattes do CNPq). Na aplicação emprega-se uma ontologia que permite criar referências entre as fontes e as unidades de informação em C&T, classificadas segundo subdomínios da área e com a possibilidade de cada instituição ampliar a sua visibilidade por meio de desenvolvimento de interfaces de acesso às suas unidades. 6 REFERÊNCIAS BIBLIOGRÁFICAS (FERREIRA, 1994) FERREIRA, Aurélio Buarque de Holanda. Dicionário Aurélio Eletrônico. Rio de Janeiro: Nova Fronteira, dez. 1994. Versão 1.4. CD-ROM. (BERGAMASCHI et al., 1999) BERGAMASCHI, S. et al. Semantic integration of semi structured and structured data sources. SIGMOD Record, 28(1): p. 54-99, 1999. (BERNERS-LEE et al., 2001) BERNERS-LEE, Tim et al. The Semantic Web. Scientifc American, Estados Unidos, 17 maio 2001. Disponível em: <http://www.sciam.com/print_version.cfm?articleID=00048144-0D2C704A9809EC 588EF21>. Acesso em: 13 jun. 2003. (BERNERS-LEE; MILLER, 2002) BERNERS-LEE, Tim; MILLER, Eric. The semantic weblifts-off. ERCIM News, n. 51, out. 2002. Disponível em: <http://www.ercim.org/publication/Ercim_News/enw51/berners-lee.html>. Acesso em: 13 jan. 2003. (BONIFÁCIO, 2002) BONIFÁCIO, Ailton S. Ontologias e consulta semântica: uma aplicação ao caso Lattes. 2002. Dissertação (Mestrado em Ciência da Computação). Programa de Pós-Graduação em Computação, Universidade Federal do Rio Grande do Sul,Porto Alegre, 2002. Disponível em:<http://www.uel.br/pessoal/ailton/ Trabalhos/Dissertaçao%20de%20Mestrado-Ailton-Final.pdf>. Acesso em: 10 jan. 2003. (DAUM; MERTEN, 2002) DAUM, Berthold; MERTEN, Udo. Arquitetura de Sistemas com XML. Rio de Janeiro: Campus, 2002. (DENKER et al., 2001) DECKER, Stefan et al. Accessing Information and Services on the DAML-Enabled Web. In: INTERNATIONAL WORKSHOP ON THE SEMANTIC WEB, SEMWEB. Honkgong. 2 set. 2001. Anais... Honkgong, 2001 Disponível em: <http://www.csl.sri.com/papers/denkeretal01/>. (GRUBER, 1993) GRUBER, T. R. A translation approach to portable ontology specification. Knowledge Acquisition, v. 5, p. 199-220. (GRUBER, 1995) GRUBER, T. R. Toward principles for the design of ontologies used for knowledge sharing. International Journal of Human and Computer Studies, n. 43, p.907-928, 1995. (GRUNINGER; FOX, 1995) GRUNINGER, M.; FOX, M. S. Methodology for the design and evaluation of ontologies. In: IJCAI - WORKSHOP ON BASIC ONTOLOGICAL ISSUES IN KNOWLEDGE SHARING, 1995, Montreal. Proceedings… Montreal, 1995. (GUARINO; GIARETTA, 1995) GUARINO, Nicola; GIARETTA, Perdaniele. Ontologies and knowledge bases – towards a terminological clarification. In: Towards VeryLarge Knowledge Bases: Knowledge Building and Knowledge Sharing. Amsterdam: IOS Press, 1995. p. 2532. (GUARINO; WELTY, 1998) GUARINO, N.; WELTY, C. Conceptual Modeling and ontological analysis. Padova: LADSEB-CNR, 1998. (GUARINO, 1997) GUARINO, Nicola. Semantic Matching: Formal ontológica, distinctions for information organization, extraction and integration. SCIE, 1997. p. 139-170. Disponível em: <http://citeseer.nj.nec.com/guarino97 semantic. html>. Acesso em: 15 jun. 2003. (GUARINO, 1998) GUARINO, Nicola. Formal ontology and information systems. In: FOIS, 1998, Trento, Italia. Proceedings… Trento, Italia, 6-8 jun. 1998. (GUPTA et al., 2002) GUPTA, A. et al. Registering scientific information sources for semantic mediation. (HENDLER et al., 2002) HENDLER, J. et al. Integrating Applications on the Semantic Web. Journal of the Institute of Electrical Engineers of Japan, v. 122(10), out. 2002. p. 676-680. Disponível em: <http://www.w3.org/2002 /07/swint>. Acesso em: 15 jun. 2003. (INFOMESH, 2003) The Semantic Web: an Introduction. Disponível em: <http://infomesh.net/2001/swintro/>. Acesso em: 6 jan. 2003. (KELLER, 2000) KELLER, B. Four phases of e-government: phase 4 – Transformation. [S.l.]:GartnerGroup, 20 dez. 2000. Research Note. (KREGER, 2001) KREGER, H. Web Services Conceptual Architecture (WSCA 1.0), IBM Software Group, maio 2001. Disponível em: http://www3.ibm.com/software/ solutions/webservices/pdf/WSCA.pdf>. Acesso em: 17 jun. 2003. (MARINO, 2002) MARINO, Maria T. Integração de informações em ambientes científicos na web: uma abordagem baseada na arquitetura RDF. 2001. Dissertação (MCGUINNES et al., 2000) McGUINNESS, D. L. et al. An environment for merging and testing large ontologies. Principles of knowledge representation and reasoning: proceedings of the seventh international conference (KR2000). A. G. Cohn, F. Giunchiglia and B. Selman, editors. San Francisco, CA, Morgan Kaufmann Publishers. (MCGUINNES; VAN HARMLELEN, 2002) McGUINNESS, Debora L.; VAN HARMLELEN, Frank. Web Ontology Language (OWL): Overview. W3C Working Draft. 22 jan. 2002. Disponível em: <http://www.ksl.stanford.edu/people/dim/webont/OWLOverview.htm>. Acesso em: jan. 2003. (MCGUINNESS; WRIGHT, 1998) McGUINNESS, D.L.; WRIGHT, J. Conceptual modelingfor configuration: A description logic-based approach. Artificial Intelligence for Engineering Design, Analysis and Manufacturing – special issue on Configuration. (MELLO et al., 2000) MELLO, Ronaldo et al. Dados semi-estruturados. In: SIMPÓSIO BRASILEIRO DE BANCO DE DADOS, 15, 2000, João Pessoa, PB. Anais... João Pessoa, 2000. (MUSEN, 1992) MUSEN, M. A. Dimensions of knowledge sharing and reuse. Computers andBiomedical Research, v. 25, p. 436-467. (NOY; MCGUINNESS, 2000) NOY, Natalya F.; McGUINNESS, Deborah L. Ontology development 101: a guide to creating your first ontology. Stanford University, CA. (PACHECO, 2003) PACHECO, Roberto. Uma metodologia de desenvolvimento de plataformas de governo para geração e divulgação de informações e de conhecimento. Florianópolis, Grupo Stela, 2003. (PERRI, 2001) PERRI. E-governance. Do Digital Aids Make a Difference in Policy Making?In: PRINS, J. E. J. (ed.). Designing E-Government. Kluwer Law International, p. 7-27. (SABBATINI, 2001) SABBATINI, M. Lattes, cómo gestionar la ciência brasileña en la red.divulc@t:ciencia@tecnología. 2001. Disponível em: <http://www.galeon.com /divulcat/articu/141a.htm>. Acesso em: 3 jan. 2003. (SANTANA et al., 2001) SANTANA, P. H. et al. Servidor de enlaces: motivação e metodologia. Ciência da Informação, v. 30, n. 3, p. 48-55, set/dez, 2002. Disponível em: <http://www.ibict.br/ cionline/300301/3030701.pdf>. Acesso em: 16 jun. 2003. (SHAW, 2002) SHAW, R. Creating Trust in Critical Network Infrasctructures: the case of Brazil. In: ITU WORKSHOP ON CREATING TRUST IN CRITICAL NETWORK INFRASCTRUCTURES, 2002, Seoul, Republic of Korea. Anais... Seoul, Republic of Korea, 2202. Disponível em: <http://www.itu.int/osg/spuni/security/docs/cni.06.pdf>. Acesso em: 3 jan. 2003. (SILVA; LIMA, 2002) SILVA, G. C.; LIMA, T. S. RDF e RDFS na Infra-estrutura de suporte à web semântica. Revista Eletrônica de Iniciação Científica, ano II, v. II, n. I, mar. 2002. (SMITH et al., 2003) SMITH, M. K et al. Web Ontology Language (OWL) Guide Version 1.0: W3C Working Draft. 4 nov. 2002. Disponível em: <http://www.w3.org/TR/2002/WD-owl-guide-20021104>. Acesso em: 2 jan. 2003. (TSUI et al., 2000) TSUI, E. et al. The role of artificial intelligence in knowledge management. Knowledge Based Systems, v. 13, n. 5, p. 235-239, 2000. Disponível em: <http://citeseer.nj.nec.com/tsui00ro le.html>. Acesso em: 30 dez. 2002.