Resumo - Projetos

UNIVERSIDADE FEDERAL DE SANTA CATARINA
DEPARTAMENTO DE INFORMÁTICA E ESTATÍSTICA
DISCIPLINA DE PLANO PROJETOS 1
RESUMO DA DISSERTAÇÃO DE MESTRADO DO MESTRE
ANDRÉ VINÍCIUS CASTOLDI – UMA ONTOLOGIA PARA
ENLACES DE UNIDADES DE INFORMAÇÃO EM PLATAFORMAS
DE GOVERNO ELETRÔNICO
Dissertação apresentada ao Programa
de Pós-Graduação em Engenharia de
Produção da Universidade Federal de
Santa Catarina em Julho de 2003
Julho 2006
Aluno: André Vieira de Aguiar
1 - Introdução
A partir da década de 90, o volume e a demanda de informações circulando de
maneira digital têm crescido muito, especialmente utilizando a internet para tal fim. No
setor de serviços públicos não têm sido diferente, tanto é verdade que os governos têm
investido mais na construção de portais públicos e infra-estrutura para tornar mais eficiente
a troca de informações. Estados Unidos e Europa possuem milhares de iniciativas de
governo eletrônico (PACHECO,2003). O Brasil destaca-se por ser um país com grande
dinamismo na área de E-Gov entre as nações em desenvolvimento e projetos brasileiros são
referências internacionais como, por exemplo, cobrança de impostos(SHAW, 2002).
Uma das principais demandas do governo é justamente a geração de informações
sobre diversas áreas de ação do Estado. Nesse contexto, todas as entidades geradoras de
informações são partes fundamentais pois representam os subdomínios dessa rede de
informações que juntas formam uma plataforma de E-Gov. Esta plataforma possui, em suas
entidades formadoras, diferentes repositórios de informações, por isso há a necessidade de
conhecer todos os repositórios, assim como seus esquemas de dados para permitir a
integração dos mesmos.
Todavia, E-Gov possui um dinamismo muito agressivo, pois todos os dias surgem
novas bases de dados, formatos e esquemas. Neste contexto, verifica-se a necessidade de
usar um repositório de metadados que intermediaria as diversas fontes de dados e
possibilitaria a integração das mesmas.
Uma das áreas de pesquisa que tem crescido muito é a de Ontologias, que tem sua
importância, entre outras, no que diz respeito à integração de dados e modelagem de
conhecimento. Ontologias permitem, por exemplo, que conceitos e visões de um mesmo
domínio sejam compartilhados, atuando como facilitadores na integração de diferentes
unidades de informação do E-Gov. Tal integração seria feita, a priori, por seres humanos,
mas com o advento das ontologias, essa tarefa poderá ser delegada à agentes de software,
que utilizarão esta ontologia para manipulação dos dados das diferentes fontes.
Este trabalho objetiva a construção de uma ontologia para representar unidades e
fontes de informação visando facilitar a intercomunicação entre as diferentes entidades
relacionadas com o E-Gov, assim como apresentar aspectos teóricos relacionados a
plataformas de governo, levantamento teórico sobre web semântica, ontologias e serviços
web que viabilizem a concepção de um modelo para aplicações. Entre outros objetivos
estão a definição da linguagem de representação de ontologias e descrever como essa
ontologia pode ser aplicada na prática.
2 – Plataformas de Governo Eletrônico e Gestão de Unidades de Informação
Um dos objetivos deste documento é permitir que diferentes sistemas possam
utilizar das informações disponíveis em plataformas de governo, independente da infraestrutura e tecnologia utilizada, tendo em comum o uso de ontologias para a comunicação
entre as diferentes fontes e unidades de informação de E-Gov.
2.1 – Plataformas de Governo Eletrônico
Governo Eletrônico é um conceito recente, e utilizando a definição de Zweers e
Planqué (2001), pode-se afirmar que Governo Eletrônico objetiva fornecer ou
disponibilizar informações, produtos ou serviços, através de meio eletrônico a qualquer
momento e a todos os envolvidos, de alguma forma com a esfera pública.
Segundo Lenk e Traunmüllerv (apud JOIA, 2002), o Governo Eletrônico pode ser
analisado sob quatro perspectivas:
1. A Perspectiva do Cidadão – visando oferecer serviços de utilidade pública ao
cidadão;
2. A Perspectiva de Processos – visando repensar o modo de operação dos
processos existentes no Governo, como por exemplo, processos de licitação para
compras (e-procurement);
3. A Perspectiva da Cooperação – visando integrar os vários órgãos
governamentais e outras organizações envolvidas.
4. A perspectiva da Gestão do Conhecimento – visando permitir ao Governo,
gerenciar e disponibilizar o conhecimento gerado e acumulado por seus vários
órgãos.
2.2 As quatro fases do Governo Eletrônico
Vários fatores foram de suma importância não só para o Governo, mas para toda a
sociedade utilizar do novo ambiente (a Web) para estabelecer novas formas de interação.
Keller (2000) identificou quatro fases no processo de transição dos Governos em direção ao
Governo Eletrônico:
1. Presença. A primeira fase caracteriza-se pela presença do Governo na Internet.
Mas essa presença se dá de maneira descentralizada, ou seja, cada departamento
possui um referenciado URL diferente para oferecer informações e serviços
produzidos por aquele departamento. Mas para os usuários terem acesso às
páginas, estes devem conhecer os endereços eletrônicos ou utilizar de
ferramentas de busca para tal fim, e considerando a grande quantidade de
departamentos de um governo, pode-se ter uma idéia da dificuldade de interagir
eletronicamente com o governo.
2. Interação. Nesta fase, governos criam um site central, a partir do qual cidadãos
podem se conectar a qualquer outro departamento de maneira prática e rápida.
Porém, o cidadão ainda precisa de um prévio conhecimento sobre qual
departamento deve reportar-se sobre determinado serviço ou assunto.
3. Transação. Inovações significativas são inseridas nessa fase, onde, ao invés de
organizar suas páginas por departamento, os serviços são agregados em um
único portal na Web.
4. Transformação.
Nesta
fase,
as
organizações
usarão
a
Internet,
as
telecomunicações e outras tecnologias para melhorar a prestação de serviços e a
troca de informações entre todas as entidades envolvidas na esfera de E-Gov(
Governo, cidadãos, setor privado, organizações, etc.).
2.3 Fontes de Informação
Segundo Pacheco (2003), as fontes de informação são repositórios de dados
referentes a cada unidade da plataforma de governo. As fontes de informação podem incluir
todos os tipos de repositórios, desde bases estruturadas, bases digitais textuais, bases
documentais, repositórios de imagens e demais meios de informações do governo.
2.4 Unidades de informação
Em uma plataforma de governo eletrônico, as unidades de informação são partes
fundamentais, pois elas descrevem os subdomínios da área-fim a qual a plataforma está
sendo desenvolvida. Uma unidade de informação é composta de diversos elementos
(módulos e campos) e tem relação direta com outras unidades de informação do domínio da
plataforma. Os principais elementos da camada de unidades de informação estão
relacionados à padronização do conteúdo de cada unidade. Aos responsáveis do projeto
caberá a identificação das unidades, especificação do seu conteúdo inicial, propor um
padrão inicial para essas unidades e promover a sua contínua revisão. Para estabelecer esses
padrões, é necessário definir a ontologia das unidades de informação e a sua padronização
em XML (Extensible Markup Language).
2.5 O uso de padrões para Unidades de Informação
A tarefa de criar ontologias para estabelecer padrões deve produzir resultados que
possibilitem o compartilhamento e intercâmbio entre os envolvidos no processo. Para tal, é
fundamental que a definição das unidades de informação seja a base para a especificação
desses padrões. Estes são descritos em forma de estruturas e regras de informações que
permitam ser interpretados tanto por pessoas quanto por computadores. Todo este material
deve ser colocado à disposição da comunidade usuária, garantindo o conhecimento
compartilhado e a futura interoperabilidade entre todos envolvidos na plataforma.
Na Plataforma E-Gov, para cada unidade de informação são definidos metadados
específicos em uma linguagem de marcação para promover a interoperabilidade dos
sistemas e das informações. Com o surgimento do XML, houve uma grande evolução no
que diz respeito ao intercâmbio de informações, a ponto de ser considerado a linguagempadrão para intercâmbio de informações na Web (MELLO et al., 2000). Porém, o XML
descreve apenas a gramática dos documentos (DENKER et al., 2001) e não impõe regras
para a definição e o uso das tags e demais primitivas da linguagem. Assim sendo, para
garantir a interoperabilidade semântica de informações será necessária uma linguagem mais
elaborada como, por exemplo, RDF (MARINO, 2002) e DAML+OIL (BONIFÁCIO,
2002), e, com o advento da Web Semântica, OWL (SMITH et al., 2003).
2.6 Os padrões de Unidades de Informação e a integração com outros sistemas
Devido ao fato da integração ocorrer em um ambiente essencialmente semântico, a
Web, será delimitado que todas as fontes de informação, incluindo esquemas serão
conhecidas a priori. A integração será feita sob duas ópticas distintas, do ponto de vista
lógico e semântico. A diferença entre esses dois será apresentada a seguir.
A integração lógica está ligada ao fato de que é necessário que informações de
várias fontes de informação possam ser vistas como uma única fonte de informação
integrada sobre um esquema global (GUPTA et al, 2002). Este tipo de integração faz
necessário o uso de um mediador, software que permite que se defina um esquema
integrador baseado em esquemas de dados individuais, escondendo ao usuário a
heterogeneidade das fontes de dados.
A integração semântica é baseada no significado da informação. No modelo de
integração sintática, está se implementando interoperabilidade entre sistemas de busca. Na
Web semântica, o que se procura é a interoperabilidade com base no significado da
informação. É nesse contexto, que a integração semântica visa à publicação de modelos
conceituais (ontologias), que descreve os conceitos, papeis, hierarquias de classificação,
etc. na integração semântica, o mediador expõe ao usuário um modelo conceitual. A
mediação semântica permite que fontes de informação exportem seus esquemas a um nível
apropriado de abstração ao mediador.
3 WEB SEMÂNTICA, ONTOLOGIAS E SERVIÇOS WEB
3.1 Web Semântica
Idealizada por Tim Benners-Lee (o criador da internet atual), a Web Semântica
engloba tópicos de Inteligência Artificial e outras tecnologias Web para a construção de
novas formas de representação do conhecimento, de forma a facilitar a localização,
comparação e integração de recursos através da Web (BENNERS-LEE et al.2001). A Web
Semântica é uma forma mais eficiente de representar dados na World Wide Web. A maioria
das páginas Web atuais são destinadas à leitura por humanos e não para a compreensão de
computadores, exceto no que se refere às rotinas de formatação, mas são incapazes de
inferir o conteúdo semântico da página, pois os dados encontram-se dentro de arquivos
HTML, em meio à códigos específicos para a formatação da página. Segundo Berners-Lee
(2001, p.1), a internet atual foi desenvolvida como um meio de entrega de documentos para
humanos e não para o processamento automático por computadores. Com a Web semântica
esse problema é resolvido da seguinte forma: primeiro, a Web semântica permitirá que
comunidades publiquem seus dados de maneira independente da formatação dos mesmos.
Em segundo, através do uso de ontologias será possível que uma máquina entenda quais
relacionamentos estão ligados a determinadas informações.
Dessa forma, com a Web Semântica, um agente de software, ao ler a página de uma
clínica médica, por exemplo, não saberá apenas que aquela página possui um “tratamento,
medicina, terapia” como palavra-chave (recurso disponível atualmente), mas também
saberá que o Dr. Fulano atende nesta clínica as segundas, quartas e sextas-feiras e que o
serviço Web mostra os horários disponíveis para consultas como parâmetro de entrada no
formato dd-mm-aaaa. E o agente “saberá” disso sem precisar dos recursos de inteligência
artificial dos personagens Hal de “2001 – Uma Odisséia no Espaço”ou C-3PO, de “Star
Wars”. (BENNERS-LEE et al., 2001).
A Web Semântica será uma extensão da Web atual, em que será atribuído um
sentido bem definido à informação, habilitando computadores e pessoas a trabalharem
cooperativamente. Dessa forma, a descoberta, automação, integração e reuso de
informações será viabilizado.
As tecnologias fundamentais para o estabelecimento da Web semântica são:
-
URI: Uniform Resource Identifier já é um componente essencial na Web atual,
qualquer recurso disponível na Web é identificado por um URI (BERNNERS-
LEE et at, 2002). Seu tipo mais conhecido é o URL(Uniform Resource Locator),
o localizador de informações.
-
XML e XML Schema: XML é a base para a representação de dados em um
formato que facilite a interoperabilidade entre aplicativos. XML Schema
consiste na recomendação da W3C para estruturar documentos XML.
-
RDF e RDF Schema: RDF define como descrever recursos em termos de
propriedades e valores. RDF Schema define propriedades para se definir
esquemas. RDFS permite verificar se um documento RDF está coerentemente
preenchido. Diferentes aplicações podem usar mesmos esquemas para ter uma
estrutura de documentos em comum na troca de informações.
-
OWL: o próximo nível é o nível lógico. É necessário que haja como escrever
lógica dentro de documentos, tais como a checagem de um documento contra
um conjunto de regras de autoconsistência. Essa camada necessita de uma
linguagem para representação de ontologias, nesse sentido, a W3C tem
trabalhado na especificação da linguagem OWL (Web Ontology language).
3.2 Ontologias
Pesquisas na área de ontologias têm crescido muito recentemente. Jargão esse
“Ontologia” que foi adotado da Filosofia e que atualmente tem alcançado importantes
resultados em áreas como Inteligência Artificial, Lingüística Computacional e Teoria de
Banco de Dados. Sua importância tem sido reconhecida em várias outras áreas como
engenharia e representação do conhecimento, modelagem qualitativa, integração de
informação, entre outras. Seu uso em aplicações reais tem sido muito difundido, em áreas
como Integração de Informações Corporativas (EIS), tradução de linguagem natural,
sistemas de informações geográficas, entre outros (GUARINO, 1998).
O projeto de ontologias possui peculiaridades metodológicas e arquiteturais. Na
questão metodológica, a principal peculiaridade é o uso de uma abordagem interdisciplinar,
em que a filosofia e a lingüística atuam na análise da estrutura de uma dada realidade, com
um alto nível de generalidade e na formulação de um vocabulário claro e preciso. No lado
arquitetural, o aspecto mais interessante é que uma ontologia pode ocupar o papel central
em um sistema de informação, guiando a perspectiva de sistemas de informação baseados
em ontologias. O reconhecimento da importância da ontologia para a representação do
conhecimento foi resultado de um amadurecimento gradual da área, como é apresentado a
seguir:
3.3 O que é ontologia
O grande interesse por ontologias acarretou no surgimento de uma série de
definições para o termo, algumas até mesmo conflitantes entre si. Ontologia é
freqüentemente contrastada com Epistemologia. “É o ramo da filosofia que trata do ser
enquanto ser, isto é, do ser concebido como tendo uma natureza comum que é inerente a
todos e cada um dos seres” (AURÉLIO, 1994). No sentido filosófico, pode-se classificar
uma ontologia como um sistema de categorias explicando uma certa visão do mundo. Esse
sistema não depende de uma linguagem em particular. Por outro lado, em IA, uma
ontologia refere-se a um artefato de engenharia formado por um vocabulário específico que
é usado para descrever uma certa realidade e um conjunto de afirmações explícitas sobre o
significado das palavras do vocabulário (GUARINO, WELTY, 1998). Duas ontologias
podem ser diferentes quanto ao vocabulário usado (por exemplo, palavras em inglês e
português), mas ainda assim podem compartilhar de uma mesma conceituação. Guarino
(1998) diz que uma ontologia é na verdade uma especificação parcial e explícita que tenta,
da melhor forma possível, aproximar a estrutura de mundo definida por uma conceituação.
Um exemplo muito simples de ontologia seria uma hierarquia de tipos,
especificando classes e seus relacionamentos. Os esquemas de banco de dados relacional
também servem como ontologias, pois atuam nas restrições de integridade entre as
entidades. Uma ontologia, assim, atua como um contrato entre parceiros para que os
mesmos possam se comunicar com segurança dentro de um mesmo domínio de informação
(DAUM; MERTEN, 2002). Por exemplo, agentes de software que utilizem a mesma
ontologia podem se comunicar entre si sem comprometer a semântica da informação que
está sendo trocada, formando uma comunidade de usuários da internet.
3.4 Por que usar ontologias
Como dito anteriormente, uma ontologia facilita a troca de informações sobre um
domínio específico. Mas se isso é possível sem o uso de ontologias, qual é, então, a
vantagem de se usar ontologias? Noy e McGuinness (2000) apresentam algumas razões do
uso de ontologias:
a. Compartilhar a mesma estrutura de informação entre pessoas e agentes de
software. Trata-se de um dos objetivos mais comuns no desenvolvimento de ontologias
(MUSEN, 1992; GRUBER, 1993). Por exemplo, se sites compartilharem e publicarem as
informações usando uma mesma ontologia, agentes de software poderão extrair e agregar
informações desses sites para diversos fins.
b. Permitir o reuso do conhecimento do domínio. Este é um dos principais
aspectos responsáveis pelo interesse atual em pesquisa sobre ontologias. Se um grupo de
pesquisadores desenvolve uma ontologia para determinado domínio, outros podem
simplesmente reutilizá-la em suas aplicações. Além disso, pode-se utilizar uma ontologia
ampla que descreve conceitos mais genéricos e estendê-la de modo que descreve um
domínio mais detalhadamente.
c. Separar o conhecimento do domínio do conhecimento operacional. Pode-se
descrever uma tarefa de configurar um produto a partir dos seus componentes, de acordo
com uma especificação necessária, e implementar um programa que faz essa configuração
(MCGUINNESS; WRIGHT, 1998). Por exemplo, pode-se desenvolver uma ontologia que
descreva os componentes de um microcomputador e suas características, e aplicar um
algoritmo para configurar a venda de PCs configuráveis pelo cliente.
d. Analisar o conhecimento do domínio. Isso é possível pelo fato de que uma
especificação declarativa dos termos está disponível. A análise formal dos termos é
extremamente importante quando se deseja reusar ontologias existentes e estendelas(MCGUINNES et al., 2000).
3.5 Tipos de ontologias
As ontologias podem ser classificadas quanto à sua generalidade. Guarino (1998)
identifica quatro tipos de ontologias.
a. Ontologias genéricas: São criadas para descrever domínios gerais como espaço,
tempo, objeto, evento, etc. Essas ontologias são compartilhadas por uma grande
comunidade e não dependem de um problema ou domínio específico.
b.
Ontologias de domínio (verticais):
São específicas de um determinado
domínio de conhecimento, como indústria de computadores, farmacêutica.
c. Ontologias de tarefas (horizontais):
exemplo, análise de requisitos de software.
Aplica-se a uma certa tarefa, por
d. Ontologias de aplicação: aplicam-se a uma certa aplicação, sendo uma
especialização de uma ontologia de domínio e/ou de tarefa. Os itens da
ontologia assumem papéis específicos para a aplicação em questão.
3.6 Profundidade Ontológica
Quanto à profundidade ontológica, as ontologias podem ser classificadas em quatro
níveis segundo Guarino e Welty (1998):
a. Vocabulário: em sua forma mais simples, uma ontologia é apenas um
vocabulário. Dessa forma, uma DTD ou XML-Schema pode definir uma
ontologia. Se as entidades envolvidas compartilham esse mesmo vocabulário,
estarão habilitadas a trocar mensagens com um vocabulário em comum.
b. Taxonomia: O significado dos termos é estabelecido pela definição de
relacionamentos entre eles. Um dos relacionamentos mais naturais é a
classificação, relacionamento entre objetos e classes, subclasses e superclasses.
Muitas ontologias existentes são definidas usando-se apenas relacionamentos
hierárquicos.
c. Sistema relacional. As ontologias também podem incluir relacionamentos não
hierárquicos. Existem muitos relacionamentos possíveis entre os objetos além
dos relacionamentos hierárquicos “é-um”. Os relacionamentos são típicos dos
diagramas de relacionamento de entidades dos bancos de dados relacionais.
d. Teoria Axiomática. Além dos relacionamentos, as ontologias podem impor
restrições. As restrições são definidas como axiomas, que são afirmações lógicas
que garantem a integridade de um relacionamento.
As ontologias que só implementam o nível 1 (vocabulário) são de uso limitado. Elas
podem ajudar a simplificar e a padronizar a troca de dados, mas não permitem que
máquinas possam inferir algo sobre um item que diz respeito à determinada informação,
pois não há garantia de semântica na operação. O último estágio da definição de ontologias
traz o conceito de axiomas, que normalmente é muito difícil serem obtidos em aplicações
práticas. Apesar disso, o uso das restrições é importante e aumenta significantemente a
integridade e a coerência dos dados. Claramente, a cada nível, o nível de trabalho exigido é
maior para se definir ontologias.
O desenvolvimento de ontologias é um processo criativo, e uma preocupação que o
projetista deve ter em mente é que não existe uma única forma correta. A avaliação das
mesmas só será possível através do seu uso em aplicações para as quais foi desenvolvida.
3.7 Serviços Web
Um serviço Web pode ser qualquer pacote de funções publicadas e acessadas por
outros programas via internet. Baseiam-se em padrões abertos, tornando possível o
desenvolvimento desses serviços a partir de qualquer plataforma ou linguagem de
programação disponível. Para ser considerado um serviço Web, ele deve possuir uma forma
de disponibilizar as informações desse serviço através de alguma espécie de interface, o que
chamamos de documento WSDL. Uma especificação WSDL é baseada em XML e
descreve todos os detalhes necessários para se interagir com o serviço Web, incluindo os
formatos das mensagens e os protocolos de transporte. A interface esconde os detalhes de
implementação do serviço e ocasiona baixo acoplamento, visto que é independente de
hardware e software.
O WSDL (Web Services Definition Language) é uma linguagem de metadados para
services Web. Este documento define a interface entre o provedor de serviço e o cliente.
WSDL pode ser usado no projeto de especificação que invocam e operam serviços Web na
Internet e acessam aplicações remotas e bases de dados. Normalmente, quando se cria uma
aplicação que se comunica com um serviço Web particular, tudo o que a aplicação precisa
saber para estabelecer a comunicação é o arquivo WSDL.
Visando estabelecer um protocolo simples e aberto para a troca de informações
entre as entidades envolvidas no fornecimento e consumo de informações em um ambiente
distribuído foi criado o SOAP (Simple Object Access Protocol). SOAP é um formato de
mensagens baseado em XML independente de plataforma ou linguagem de programação.
Sua simplicidade o torna fácil de ser depurado e muito mais claro de ser lido a um arquivo
binário. Além disso, o uso de protocolos como SOAP sobre http é compatível com sistemas
de firewall e não tem os mesmos problemas de segurança que os sistemas de protocolos
proprietários.
Para a descoberta desses serviços na Web, foi desenvolvido o UDDI (Universal
Description Discovery and Integration) liderado pela IBM, Microsoft e Ariba desde 2000.
Seu objetivo é funcionar como um local de registro de serviços, como as páginas amarelas
de um catálogo telefônico, assim as companhias registram seus serviços nas categorias em
que se encaixam. Além das páginas amarelas, UDDI também contém páginas brancas, que
possuem a listagem das entidades de serviços, e as páginas verdes que representam
documentos técnicos necessários para invocar um dado serviço. Sendo o UDDI um registro,
geralmente é implementado em bases de dados. O modelo de dados do UDDI é composto
dos seguintes elementos:
- BusinessEntity: representa uma companhia do mundo físico;
- BusinessService: representa um serviço oferecido pela companhia;
- BindingTemplate: instruções sobre como invocar um serviço;
- Tmodel: representa, entre outras coisas, os itens de documentação de um serviço
4 O REPOSITÓRIO DE UNIDADES E FONTES DE INFORMAÇÃO
4.1 A integração dos dados
A integração tem sido um dos principais desafios dos projetos de governo eletrônico
(PACHECO, 2003), sendo frequentemente resolvida através da troca de arquivos entre as
fontes de informação (SANTANA et at., 2001). Esse processo depende da interação dos
administradores das bases de dados entre os quais são estabelecidos os enlaces. As partes
devem definir um padrão para intercâmbio de dados entre ambas as fontes de informação.
Uma vez estabelecida a integração a integração entre as fontes de informação, devese repetir o processo de “troca de arquivos” periodicamente, para que as atualizações das
bases também se reflitam nos enlaces de dados.
4.2 O repositório
Para auxiliar o trabalho de integração, será usado um repositório para armazenar os
metadados dessas fontes. Por reunir informações de várias fontes e unidades de informação,
este repositório tornaria mais prático o estabelecimento dos enlaces. Quando um
administrador desejar estabelecer enlaces com o administrador de outra fonte, ele não
dependerá mais de um sincronismo com o administrador da outra ponta, pois os recursos
dos quais ele precisa já estão disponíveis no repositório.
O fluxo do processo de enlace ocorre da seguinte maneira: inicialmente, as unidades
de informação são cadastradas, seus atributos e interfaces de busca. Em seguida todas as
entidades envolvidas publicam no repositório suas fontes de informação, relacionando-as
com as unidades, os atributos e as interfaces de busca que foram previamente cadastradas.
Uma interface de busca é um conjunto padronizado de atributos usados para a recuperação
de URLs de objetos de informação. Todas essas informações podem ser reunidas e
compiladas, resultando em uma matriz de distribuição de unidades de informação por
fontes de informação.
4.3 Modelo Conceitual
A figura abaixo apresenta o modelo de classes da ontologia proposta. Através
deste diagrama pode-se compreender o relacionamento entre as principais classes do
repositório.
· Uma Unidade de Informação é formada por Atributos e possui Interfaces de busca,
que por sua vez, usam um subconjunto dos atributos da unidade de informação.
· Instituições Consorciadas mantêm Fontes de Informação, que, por sua vez,
armazenam instâncias das Unidades de Informação e disponibilizam Serviços de Busca
compatíveis com uma ou mais Interfaces de Busca das Unidades de Informação
armazenadas.
4.4 Casos de uso do repositório
Os principais casos de uso do repositório estão relacionados com a definição das
unidades de informação, com o registro das fontes de informação e com a consulta ao
repositório.
4.4.1 Definição das Unidades de Informação
A definição das unidades de informação é uma das etapas mais importantes de todo
o processo envolvido no uso do repositório. Pois, se alguma unidade for definida de
maneira inadequada, ela não será utilizada em todo o seu potencial. Por isso, recomenda-se
que a definição dessas unidades seja feita com a comunidade como forma de validar a
especificação antes da sua publicação.
Para que o repositório seja compatível com a arquitetura de Web Semântica, é
necessário publicar a ontologia dos serviços prestados no site. Abaixo está um trecho da
ontologia representada na linguagem OWL.
<owlx:Class
owlx:name="unidadeInformacao"
owlx:complete="false">
<owlx:Annotation>
<owlx:Label
xml:lang="pt">
Unidade de Informação
</owlx:Label>
</owlx:Annotation>
<owlx:DataRestriction
owlx:property="idUnidadeInformacao">
<owlx:cardinality owlx:value="1"/>
<owlx:allValuesFrom
owlx:datatype="&xsd;integer"/>
4.4.2 Registro de fontes de informação
O registro das fontes de informação será utilizado pelas instituições para publicar
suas fontes de informação e interfaces de busca no repositório. Para se associar, a
instituição deve informar os seguintes dados cadastrais: subconjunto de atributos da
unidade de informação disponíveis em sua base de dados e as interfaces de busca que
implementou.
4.4.3 Consulta ao repositório
Uma vez que o repositório possua Unidades e Fontes de Informação relacionadas,
pode-se então disponibilizá-lo para consultas públicas. O módulo de consultas trabalha
cruzando informações sobre Unidades, Fontes de Informação e Interfaces de busca, a fim
de disponibilizar quais fontes dispõe de cada unidade de informação e os tipos de interface.
Dessa forma, o usuário pode obter informações sobre objetos de informações que estão
distribuídos nas diferentes instituições.
4.5 Arquitetura
A idéia é que o repositório represente uma visão semântica dos relacionamentos
sintáticos estabelecidos entre os Serviços Web das instituições e o UDDI. Dessa forma, o
usuário do repositório não precisaria se preocupar com termos técnicos referentes ao
domínio do UDDI, pois quando ele fizer uma consulta, por exemplo, o repositório – através
de um mecanismo de comunicação com o UDDI – traduziria a semântica da instrução em
comandos da API do UDDI, estabelecendo, assim, as tarefas solicitadas pelo usuário.
A tecnologia de Serviços Web foi utilizada pela sua flexibilidade de implementação.
Afinal, Serviços Web podem ser implementados independentemente da plataforma e
linguagem de programação, garantindo que quando uma instituição associar-se ao
repositório, esta não precisará alterar nada do que está utilizando atualmente.
5 CONCLUSÕES
Apesar de existir uma crescente demanda por informações e serviços na Web, ainda
são encontradas muitas dificuldades no desenvolvimento de soluções totalmente integradas.
Umas das dificuldades é o dinamismo do setor de E-Gov, pois o surgimento de novas bases
de dados é frequente e contínuo, dificultando a integração dos dados e a geração contínua
de informação. O resultado são informações distribuídas em “ilhas” e a dificuldade do
cidadão em encontrar o que necessita.
O ponto chave para alterar essa situação é a interoperabilidade. Para tornar-se possível, um
dos recursos necessários é o estabelecimento de padrões comuns de informações e o
intercâmbio no serviço de consulta. É nesse contexto que são utilizadas as ontologias. Essa
área tem ganhado importância na área de engenharia do conhecimento e integração de
dados. Linguagens para representação de ontologias, como OWL, permitem que se
desenvolvam modelos semânticos para representar conceitos e relacionamentos. Além
disso, outra característica importante é que o conhecimento representado pode ser
reutilizado facilmente.
Para estabelecer meios para ampliar a interoperabilidade de projetos de informação
de governos, foi proposta uma ontologia para representar as fontes e unidades de
informação e relacioná-las a plataformas de governo eletrônico. Para tanto, estabeleceramse elementos teóricos relacionados a plataforma de governo e seus componentes, unidades
de informação e fontes de informação, que são as entidades responsáveis pela informação
pública em diferentes repositórios de informação em que as unidades estão presentes. Com
essa visão de arquitetura, é possível estabelecer modelos conceituais nos quais se definem
padrões semânticos compatíveis com outros sistemas que buscam informações públicas na
Web.
Para definir os elementos conceituais da ontologia proposta, foi utilizada a
linguagem OWL, visando descrever como unidades de informação podem ser representadas
em diferentes repositórios de informação.
O modelo proposto foi aplicado à definição de serviços de interoperabilidade de
unidades de informação de Ciência e Tecnologia (presentes na Plataforma Lattes do
CNPq). Na aplicação emprega-se uma ontologia que permite criar referências entre as
fontes e as unidades de informação em C&T, classificadas segundo subdomínios da área e
com a possibilidade de cada instituição ampliar a sua visibilidade por meio de
desenvolvimento de interfaces de acesso às suas unidades.
6 REFERÊNCIAS BIBLIOGRÁFICAS
(FERREIRA, 1994) FERREIRA, Aurélio Buarque de Holanda. Dicionário Aurélio
Eletrônico. Rio de Janeiro: Nova Fronteira, dez. 1994. Versão 1.4. CD-ROM.
(BERGAMASCHI et al., 1999) BERGAMASCHI, S. et al. Semantic integration of semi
structured and structured data sources. SIGMOD Record, 28(1): p. 54-99, 1999.
(BERNERS-LEE et al., 2001) BERNERS-LEE, Tim et al. The Semantic Web. Scientifc
American, Estados Unidos, 17 maio 2001. Disponível em:
<http://www.sciam.com/print_version.cfm?articleID=00048144-0D2C704A9809EC
588EF21>. Acesso em: 13 jun. 2003.
(BERNERS-LEE; MILLER, 2002) BERNERS-LEE, Tim; MILLER, Eric. The semantic
weblifts-off. ERCIM News, n. 51, out. 2002. Disponível em:
<http://www.ercim.org/publication/Ercim_News/enw51/berners-lee.html>. Acesso
em: 13 jan. 2003.
(BONIFÁCIO, 2002) BONIFÁCIO, Ailton S. Ontologias e consulta semântica: uma
aplicação ao caso Lattes. 2002. Dissertação (Mestrado em Ciência da Computação).
Programa de Pós-Graduação em Computação, Universidade Federal do Rio Grande
do Sul,Porto Alegre, 2002. Disponível em:<http://www.uel.br/pessoal/ailton/
Trabalhos/Dissertaçao%20de%20Mestrado-Ailton-Final.pdf>. Acesso em: 10 jan.
2003.
(DAUM; MERTEN, 2002) DAUM, Berthold; MERTEN, Udo. Arquitetura de Sistemas
com XML. Rio de Janeiro: Campus, 2002.
(DENKER et al., 2001) DECKER, Stefan et al. Accessing Information and Services on the
DAML-Enabled Web. In: INTERNATIONAL WORKSHOP ON THE SEMANTIC
WEB, SEMWEB. Honkgong. 2 set. 2001. Anais... Honkgong, 2001 Disponível em:
<http://www.csl.sri.com/papers/denkeretal01/>. (GRUBER, 1993) GRUBER, T. R.
A translation approach to portable ontology specification. Knowledge Acquisition,
v. 5, p. 199-220.
(GRUBER, 1995) GRUBER, T. R. Toward principles for the design of ontologies used for
knowledge sharing. International Journal of Human and Computer Studies, n.
43, p.907-928, 1995.
(GRUNINGER; FOX, 1995) GRUNINGER, M.; FOX, M. S. Methodology for the design
and evaluation of ontologies. In: IJCAI - WORKSHOP ON BASIC
ONTOLOGICAL ISSUES IN KNOWLEDGE SHARING, 1995, Montreal.
Proceedings… Montreal, 1995. (GUARINO; GIARETTA, 1995) GUARINO,
Nicola; GIARETTA, Perdaniele. Ontologies and knowledge bases – towards a
terminological clarification. In: Towards VeryLarge Knowledge Bases:
Knowledge Building and Knowledge Sharing. Amsterdam: IOS Press, 1995. p. 2532.
(GUARINO; WELTY, 1998) GUARINO, N.; WELTY, C. Conceptual Modeling and
ontological analysis. Padova: LADSEB-CNR, 1998.
(GUARINO, 1997) GUARINO, Nicola. Semantic Matching: Formal ontológica,
distinctions for information organization, extraction and integration. SCIE, 1997. p.
139-170. Disponível em: <http://citeseer.nj.nec.com/guarino97 semantic. html>.
Acesso em: 15 jun. 2003.
(GUARINO, 1998) GUARINO, Nicola. Formal ontology and information systems. In:
FOIS, 1998, Trento, Italia. Proceedings… Trento, Italia, 6-8 jun. 1998.
(GUPTA et al., 2002) GUPTA, A. et al. Registering scientific information sources for
semantic mediation.
(HENDLER et al., 2002) HENDLER, J. et al. Integrating Applications on the Semantic
Web. Journal of the Institute of Electrical Engineers of Japan, v. 122(10), out.
2002. p. 676-680. Disponível em: <http://www.w3.org/2002 /07/swint>. Acesso em:
15 jun. 2003.
(INFOMESH, 2003) The Semantic Web: an Introduction. Disponível em:
<http://infomesh.net/2001/swintro/>. Acesso em: 6 jan. 2003.
(KELLER, 2000) KELLER, B. Four phases of e-government: phase 4 – Transformation.
[S.l.]:GartnerGroup, 20 dez. 2000. Research Note.
(KREGER, 2001) KREGER, H. Web Services Conceptual Architecture (WSCA 1.0), IBM
Software Group, maio 2001. Disponível em: http://www3.ibm.com/software/
solutions/webservices/pdf/WSCA.pdf>. Acesso em: 17 jun. 2003.
(MARINO, 2002) MARINO, Maria T. Integração de informações em ambientes
científicos na web: uma abordagem baseada na arquitetura RDF. 2001. Dissertação
(MCGUINNES et al., 2000) McGUINNESS, D. L. et al. An environment for merging and
testing large ontologies. Principles of knowledge representation and reasoning:
proceedings of the seventh international conference (KR2000). A. G. Cohn, F.
Giunchiglia and B. Selman, editors. San Francisco, CA, Morgan Kaufmann
Publishers.
(MCGUINNES; VAN HARMLELEN, 2002) McGUINNESS, Debora L.; VAN
HARMLELEN, Frank. Web Ontology Language (OWL): Overview. W3C
Working Draft. 22 jan. 2002. Disponível em:
<http://www.ksl.stanford.edu/people/dim/webont/OWLOverview.htm>. Acesso em:
jan. 2003.
(MCGUINNESS; WRIGHT, 1998) McGUINNESS, D.L.; WRIGHT, J. Conceptual
modelingfor configuration: A description logic-based approach. Artificial
Intelligence for Engineering Design, Analysis and Manufacturing – special
issue on Configuration.
(MELLO et al., 2000) MELLO, Ronaldo et al. Dados semi-estruturados. In: SIMPÓSIO
BRASILEIRO DE BANCO DE DADOS, 15, 2000, João Pessoa, PB. Anais... João
Pessoa, 2000.
(MUSEN, 1992) MUSEN, M. A. Dimensions of knowledge sharing and reuse. Computers
andBiomedical Research, v. 25, p. 436-467.
(NOY; MCGUINNESS, 2000) NOY, Natalya F.; McGUINNESS, Deborah L. Ontology
development 101: a guide to creating your first ontology. Stanford University, CA.
(PACHECO, 2003) PACHECO, Roberto. Uma metodologia de desenvolvimento de
plataformas de governo para geração e divulgação de informações e de
conhecimento. Florianópolis, Grupo Stela, 2003.
(PERRI, 2001) PERRI. E-governance. Do Digital Aids Make a Difference in Policy
Making?In: PRINS, J. E. J. (ed.). Designing E-Government. Kluwer Law
International, p. 7-27.
(SABBATINI, 2001) SABBATINI, M. Lattes, cómo gestionar la ciência brasileña en la
red.divulc@t:ciencia@tecnología. 2001. Disponível em: <http://www.galeon.com
/divulcat/articu/141a.htm>. Acesso em: 3 jan. 2003.
(SANTANA et al., 2001) SANTANA, P. H. et al. Servidor de enlaces: motivação e
metodologia. Ciência da Informação, v. 30, n. 3, p. 48-55, set/dez, 2002.
Disponível em: <http://www.ibict.br/ cionline/300301/3030701.pdf>. Acesso em:
16 jun. 2003.
(SHAW, 2002) SHAW, R. Creating Trust in Critical Network Infrasctructures: the case of
Brazil. In: ITU WORKSHOP ON CREATING TRUST IN CRITICAL NETWORK
INFRASCTRUCTURES, 2002, Seoul, Republic of Korea. Anais... Seoul, Republic
of Korea, 2202. Disponível em:
<http://www.itu.int/osg/spuni/security/docs/cni.06.pdf>. Acesso em: 3 jan. 2003.
(SILVA; LIMA, 2002) SILVA, G. C.; LIMA, T. S. RDF e RDFS na Infra-estrutura de
suporte à web semântica. Revista Eletrônica de Iniciação Científica, ano II, v. II,
n. I, mar. 2002.
(SMITH et al., 2003) SMITH, M. K et al. Web Ontology Language (OWL) Guide
Version 1.0: W3C Working Draft. 4 nov. 2002. Disponível em:
<http://www.w3.org/TR/2002/WD-owl-guide-20021104>. Acesso em: 2 jan. 2003.
(TSUI et al., 2000) TSUI, E. et al. The role of artificial intelligence in knowledge
management. Knowledge Based Systems, v. 13, n. 5, p. 235-239, 2000. Disponível
em: <http://citeseer.nj.nec.com/tsui00ro le.html>. Acesso em: 30 dez. 2002.