Usando EAD e NOBRADE para acessar um fundo arquivístico

Propaganda
DI MAMBRO, Galba e RIBEIRO, José Guilherme. Usando EAD e NOBRADE para acessar um
fundo arquivístico digitalizado: o Servidor de Imagens do AHUFJF. Mesa-redonda do dia
08/11/2007. Seminário Internacional do Arquivo Público Mineiro, II. Documentos Eletrônicos: gestão e
preservação. Anais do ... Belo Horizonte, 05 a 08 de novembro de 2007. Publicado em: NEVES, Marta
Eloísa Melgaço e NEGREIROS, Leandro Ribeiro (org.). Documentos eletrônicos; fundamentos
arquivísticos para a pesquisa em gestão e preservação. Belo Horizonte: Secretaria de estado da Cultura
de Minas Gerais, Arquivo Público Mineiro, 2008. 168p.
MESA-REDONDA: PROJETOS DE
DIGITALIZAÇÃO E PRESERVAÇÃO
DIGITAL
Usando EAD e NOBRADE para acessar um fundo arquivístico digitalizado:
o Servidor de Imagens do AHUFJF
Galba Di Mambro*
José Guilherme Ribeiro**
APRESENTAÇÃO
A presente comunicação é fruto do trabalho conjunto de seus dois autores. Nessa
associação, o professor Galba Di Mambro tem se responsabilizado pelo estudo das normas
internacionais (ISAD(G)1 e NOBRADE2), pela elaboração dos instrumentos de pesquisa e pela
execução do trabalho de digitalização, enquanto o professor José Guilherme Ribeiro tem se
responsabilizado pelo estudo do padrão EAD, e pela concepção e desenvolvimento do sistema de
entrega de imagens usando esse padrão.
O trabalho está sendo desenvolvido pelo Arquivo Histórico da UFJF – AHUFJF desde
2006 quando, por meio de projeto apresentado junto à FAPEMIG, os documentos do fundo
Sociedade de Medicina e Cirurgia de Juiz de Fora foram higienizados, arranjados, descritos e
digitalizados. Em 2007, através de projeto apresentado ao ICMS/Cultural de Minas Gerais, está
sendo desenvolvido o sistema para a disponibilização das imagens digitais, por meio de um site
na Web. O desenvolvimento do site deverá estar concluído em fevereiro de 2008.
O site desenvolvido ultrapassa o âmbito dos documentos da Sociedade de Medicina e
Cirurgia de Juiz de Fora. Ele pretende reunir, a partir de um único endereço, o resultado de uma
série de trabalhos de digitalização desenvolvidos pelo Arquivo Histórico da UFJF. O conjunto
desses trabalhos estará disponível no Servidor de Imagens do AHUFJF.
Os estudos para o Servidor de Imagens começaram a ser desenvolvidos em 2006. Como
* Professor da Universidade Federal de Juiz de Fora. Diretor do Arquivo Histórico da UFJF.
<[email protected]>
** Consultor do Arquivo Histórico da UFJF. <[email protected]>
1 CONSELHO INTERNACIONAL DE ARQUIVOS. ISAD(G) 2001; Norma Geral Internacional de Descrição
Arquivística. 2, ed, adotada pelo Comitê de Normas de Descrição, Estocolmo: 1999. Versão final aprovada pelo
CIA. Rio de Janeiro: Arquivo Nacional, 2001. 119 p. O padrão ISAD(G) é comentado no texto, mais à frente.
2 CONSELHO NACIONAL DE ARQUIVOS - CONARQ. Câmara Técnica de Descrição Arquivística.
NOBRADE. Norma Brasileira de Descrição Arquivística. Rio de Janeiro: CONARQ, 2006. 123 p. O padrão
NOBRADE é comentado no texto, mais à frente.
parte desses estudos, no início de 2007 foi feito um modelo – um protótipo – que sistematiza de
forma concreta “aquilo que queremos” com o servidor. Em outras palavras, esse modelo
correspondeu à explicitação da maioria dos requisitos funcionais do sistema, tal como os
entendemos na época.3 Nessa comunicação, exploraremos esse modelo, procurando demonstrar
como será o funcionamento do sistema, quando concluído. O leitor deve estar avisado de que
trata-se de um estudo preliminar, e que, embora a maior parte dos requisitos deva permanecer
estável, a aparência geral do site, ou mesmo uma ou outra funcionalidade, podem ser alteradas.
1. O SERVIDOR DE IMAGENS DO AHUFJF
A Ilustração 1 mostra a tela de abertura do Servidor de Imagens. Nela haverá um texto
inicial, que explicará o âmbito do sistema. A seguir, logo abaixo, estarão disponíveis alguns
links, que apontarão para os projetos de digitalização do AHUFJF. Inicialmente, apenas o site da
Sociedade de Medicina e Cirurgia de Juiz de Fora estará disponível. A partir de 2008, novos sites
serão acrescentados ao Servidor. Para prosseguir, vamos selecionar o link da Sociedade de
Medicina e Cirurgia de Juiz de Fora.
3 Requisitos funcionais correspondem à especificação das funções de um software, ou o conjunto de “coisas” que
ele fará. Para mais detalhes, cf. LARMAN, Craig. Utilizando UML e padrões: uma introdução à análise e ao
projeto orientados a objetos e ao desenvolvimento iterativo. 3. ed. Porto Alegre: Bookman, 2007.
Ilustração 1: Tela de abertura do Servidor de Imagens do AHUFJF
A Ilustração 2 mostra a tela inicial da Sociedade de Medicina e Cirurgia. O leitor deve ter
em mente que, a partir desse ponto, estamos lidando com um instrumento de pesquisa em
formato digital. Isso será explicado mais tarde, mas o leitor deve pensar como se tudo, a partir
desse ponto, correspondesse a um único arquivo de computador, uma descrição arquivística em
formato digital.
A tela mostrada na Ilustração 2 contém uma pequena síntese, um resumo para avaliação
do usuário. A intenção é que, lendo o resumo, o internauta possa escolher entre prosseguir ou
não na análise do fundo. Abaixo do resumo, em área não mostrada na ilustração, o usuário
encontrará uma série de links para seguir.
Ilustração 2: Tela de abertura da Sociedade de Medicina e Cirurgia de Juiz de Fora
Seguindo o item descrição arquivística, o internauta encontrará a descrição do fundo
como um todo, feita conforme a Norma Brasileira de Descrição Arquivística – NOBRADE. A
descrição ocupa várias telas, das quais destacamos uma, mostrada na Ilustração 3. Nela vêem-se
alguns campos, como o código identificador, o título, as datas-limite, história administrativa,
história arquivística, e outros, relativos ao fundo como um todo. O nome dos campos, bem como
orientações gerais sobre o seu preenchimento, são dados pela NOBRADE. O layout não é fixado
pela norma, e corresponde a uma adaptação do AHUFJF. O usuário pode ter, lendo a descrição
em primeiro nível, uma visão abrangente do fundo como um todo, encontrando, ao final, uma
série de links que permitem a ele prosseguir (Ilustração 4).
A Ilustração 4 mostra as opções de prosseguimento para o internauta. Ele tem ali uma
visão geral das grandes divisões do fundo, podendo escolher qual delas quer consultar em
detalhe. Se o usuário escolher a opção “Grupo D. Correspondência operacional”, encontrará a
figura mostrada na Ilustração 5. Nessa tela, o usuário poderá ver a descrição de todas as séries do
grupo D, de forma seqüencial.
Ilustração 3: Descrição em primeiro nível - Fundo Sociedade de Medicina e Cirurgia
de Juiz de Fora
Ilustração 4: Acesso aos níveis subordinados
Na Ilustração 5, cada descrição de série está mostrada em uma tabela, uma espécie de
ficha, com os dados relativos à mesma. Os campos da ficha são essencialmente os mesmos da
descrição em primeiro nível, apenas preenchidos de forma mais curta, e com um número maior
de campos sendo omitidos. Novamente, a estrutura dos campos é dada pela NOBRADE, e o
layout é uma adaptação do AHUFJF. Caso haja subníveis a serem consultados (subséries,
dossiês, processos ou itens), haverá um link na última linha da tabela, que levará ao próximo
nível. Caso contrário, naquele lugar haverá um link para as imagens dos documentos daquela
unidade. Seguindo esse link (“Ver imagens dos documentos dessa série”), temos a tela mostrada
na Ilustração 6.
Ilustração 5: Descrição das séries do Grupo D - Correspondência Operacional
A Ilustração 6 mostra o que chamamos de “visualizador” das imagens. É uma ferramenta
para a visualização das imagens de uma série, subsérie, ou nível inferior. Ele inicia mostrando a
primeira imagem do conjunto solicitado, e contém opções para mostrar a próxima, a anterior, a
primeira e a última do conjunto. Possui também uma opção de zoom, que permite ampliar ou
reduzir a imagem, dentro de certos limites.
Isso encerra a primeira forma de acesso, considerada a principal, aos fundos do Servidor
de Imagens do AHUFJF. O usuário que faz esse caminho parte do geral para o particular – de
uma informação mais ou menos genérica do conteúdo da documentação a uma descrição do
fundo, e daí aos níveis inferiores, até chegar à imagens digitais dos documentos. Isso reproduz,
na Internet, o modo de consulta dos arquivos reais.
Voltando ao site do Servidor de Imagens, podemos ter outras formas de acesso. A
primeira delas é através de uma série de índices – índice alfabético geral, índice das obras e
folhetos, índice das fotografias, dos periódicos, etc. Se voltarmos algumas telas, selecionando o
índice alfabético geral, iremos nos deparar com um imagem como a mostrada na Ilustração 7. A
imagem mostra uma série de descritores, com entradas que remetem às séries, ao lado de
entradas do tipo “ver” e “ver também”. Cada uma dessas entradas tem ao seu lado um link, ou
uma série de links, que levam a trechos da descrição arquivística. Por exemplo, a entrada
“ANESTESIOLOGISTAS” tem ao seu lado a referência à série “2E05”. Clicando nesse link, o
usuário será levado à descrição da série 2E05, numa tela semelhante à mostrada anteriormente,
na Ilustração 5. A partir daí, o internauta pode acessar os níveis inferiores, se houver, ou a
imagem dos documentos, como já foi mostrado.
Ilustração 6: Visualização de um documento - Sociedade de Medicina e Cirurgia
A última forma de acesso disponível é um mecanismo de busca, que permite a pesquisa
por palavras ou por datas, no interior das fichas descritivas do fundo, das séries e dos demais
níveis. A tela do mecanismo de busca é mostrada na Ilustração 8. Inicialmente, os campos de
texto e de datas estarão vazios, e a tela não mostrará nenhum resultado da busca. Quando o
usuário digitar um critério de pesquisa – texto ou datas, ou ambos – e pressionar o botão
“Pesquisar”, a busca será realizada. O resultado da busca mostra a ocorrência do resultado
encontrado, bem como toda a hierarquia do documento (fundo, série, subsérie, etc.) em que ele
se encontra. Clicando no link do resultado, o usuário será levado à descrição da unidade
correspondente, numa tela semelhante à da Ilustração 5, de onde poderá prosseguir para os níveis
inferiores ou para as imagens dos documentos.
Ilustração 7: Índice Alfabético Geral das Séries
2. DESDOBRAMENTOS
A especificidade do Servidor de Imagens do AHUFJF está em ser baseado em dois
padrões de descrição arquivística – a NOBRADE e a EAD, cuja difusão no Brasil está em
estágio inicial. A NOBRADE é a Norma Brasileira de Descrição Arquivística, aprovada pelo
Conselho Nacional de Arquivos, e corresponde à adaptação da Norma Internacional de
Descrição Arquivística – ISAD(G) para o caso brasileiro. A EAD refere-se à Encoded Archival
Description (Descrição Arquivística Codificada) e corresponde a um padrão mantido pela
Associação dos Arquivistas Americanos e pela Biblioteca do Congresso dos EUA 4, e que tem
sido introduzido recentemente no Brasil.5
4 No site oficial da EAD podem-se encontrar textos de referência sobre a mesma, bem como links para outros sites
que usam a EAD e/ou que contém mais material sobre ela. Cf. http://www.loc.gov/ead/ (acesso em 23 de abril de
2007). Muito material de referência pode ser encontrado no site Cover Pages sobre a EAD
(http://xml.coverpages.org/ead.html - acesso em 12 de julho de 2007).
5 Entre os eventos recentes que envolveram a EAD, pode-se citar a oficina “Uma introdução à EAD”, promovida
pelo AHUFJF e ministrada pelo prof. José Guilherme Ribeiro, de 04 a 06 de maio de 2005, o curso “Registro e
transferência de dados – o uso da XML”, promovido pela Associação dos Arquivistas Brasileiros e ministrado
por Adrissa Dominitini e Ana Pavani nos dias 12 e 13 de fevereiro de 2007, a “Oficina sobre EAD e EAC”,
Ilustração 8: Mecanismo de busca - Sociedade de Medicina e Cirurgia
No Servidor de Imagens do AHUFJF, a NOBRADE é usada como estrutura de dados, e a
EAD é usada como padrão de armazenamento e de comunicação.6 Isso quer dizer que o nome
dos elementos descritivos de um fundo, série ou item documental é dado pela NOBRADE, assim
como a estrutura geral da descrição (estrutura multinível). Por seu lado, a EAD fornece o meio
de dar a essa descrição um formato legível por computador.
A EAD usa a linguagem XML para armazenar uma descrição arquivística.7 Se
promovida pelo Arquivo Nacional e ministrada pelo prof. Michael Fox nos dias 12 e 13 de março de 2007, e o II
Encontro de Bases de Dados sobre Informações Arquivísticas, promovido pela Associação dos Arquivistas
Brasileiros nos dias 15 e 16 de março de 2007, no Rio de Janeiro. Artigo recente da revista Arquivística.net faz
referência ao padrão EAD. Cf. SOUSA, Ana Paula de Moura e outros. Princípios da Descrição Arquivística: do
suporte convencional ao eletrônico. Arquivistica.net. Rio de Janeiro, v. 2, n.2, p. 38-51, ago./dez. 2006.
Disponível em http://www.arquivistica.net – acesso em 04 de outubro de 2007.
6 A classificação foi proposta por Michael Fox. Segundo ele, os padrões internacionais usados na Arquivologia e
na Biblioteconomia podem ser divididos em 4 categorias: padrões de estrutura de dados, de conteúdo, de valores
de dados e de comunicação. A função de armazenamento (“data storage”) é mencionada, junto com a de
comunicação e intercâmbio de dados, em passagens referentes ao Marc e em outras referentes à EAD. O uso dos
padrões NOBRADE e EAD, no trabalho desenvolvido no AHUFJF, é coerente com a análise de Fox. O leitor
interessado pode consultar FOX, Michael J. Stargazing: locating EAD in the descriptive firmament. In: PITTI,
Daniel V., DUFF, Wendy M.(Ed.) Encoded archival description on the Internet. New York: The Haworth
Press, 2001. p. 61-74. (Volume publicado simultaneamente no Journal of Internet Cataloging, v. 4, n. 3-4,
2001. Cópias do artigo podem ser compradas em http://www.HaworthPress.com – acesso em 15 de setembro de
2007).
7 A XML é uma linguagem de computador, aprovada pelo consórcio W3C em 1998. Há muito material sobre a
anteriormente pedimos ao leitor para pensar que tudo, de certo ponto em diante, correspondia a
um único documento, é porque todas as informações mostradas daquele ponto em diante
estavam contidas em um único arquivo de computador. A EAD armazena os dados, mas não as
instruções de formatação. O conteúdo dos campos, a ordem em que eles aparecem, e as relações
hierárquicas entre eles, são informações registradas pelo documento EAD. Fontes, cores, e a
fragmentação dos arquivos são informações adicionais, registradas num outro tipo de documento
chamado “folha de estilos”.
A interação entre um documento EAD e uma folha de estilos pode ser vista num exemplo
simples. O documento EAD registra as informações fundamentais (o conteúdo, digamos assim)
de uma descrição arquivística. A folha de estilos registra as informações necessárias à
apresentação desse conteúdo. É possível então que o mesmo conteúdo tenha duas ou mais
apresentações diferentes. Ou seja: a mesma descrição multinível vista aqui, num modelo de site
para a Web, poderia gerar (com o mesmo conteúdo, voltamos a enfatizar) um documento de
texto, num arquivo do editor de textos Word, por exemplo. O Arquivo Histórico da UFJF
pretende tirar partido dessa maleabilidade gerando descrições multinível adaptadas, para
acompanhar as cópias em CD e DVD das imagens, em formato JPEG e TIFF, geradas pelo
processo de digitalização. Isso permite que as diversas versões da descrição sejam mais
facilmente sincronizadas, depois de passar por uma revisão, por exemplo.
Existe outra característica importante no uso da EAD – uma característica que surge
como uma possibilidade a ser explorada. É muito comum usar-se, como veículo para o
armazenamento da descrição arquivística, bancos de dados relacionais. Quem já usou um banco
de dados relacional sabe que, para isso, é necessário definir uma ou mais tabelas e campos, no
que seria chamado de “estrutura” dos dados. Normalmente, em projetos isolados, essa estrutura é
definida de modo ad-hoc pelo programador, projetista ou analista de sistemas. O resultado é que
esses projetos, desenvolvidos isoladamente, possuem estruturas de dados que se comunicam com
dificuldade. O uso da NOBRADE pode melhorar um pouco esse caos, porque ela oferece uma
estrutura básica de onde partir. Mas, mesmo assim, a dificuldade permanece, pois o grau de
liberdade no mapeamento dos elementos NOBRADE para tabelas e campos relacionais é muito
amplo.
XML, para consulta on-line ou publicado. Uma pesquisa no Google ou Yahoo! sempre retornará uma grande
quantidade de tutoriais sobre o assunto, que podem servir como uma referência inicial. Uma página que contém
uma grande relação de recursos (livros, bibliografias, material on-line, etc.) é a página XML do W3C
(http://www.w3.org/XML/ - acesso em 10 de julho de 2007). A página do site Cover Pages sobre a XML
(http://xml.coverpages.org/xml.html - acesso em 10 de julho de 2007) também fornece uma grande quantidade
de referências sobre o tema. Outra fonte é o site XML.com (http://www.xml.com/ - acesso em 10 de julho de
2007). Quanto a publicações em papel, o leitor pode recorrer ao livro de Harold & Means sobre o tema HAROLD, Elliotte Rusty, MEANS, W. Scott. XML in a nutshell: a desktop quick reference. 2.ed. Sebastopol
(USA): O'Reilly, 2002. 613 p.
Nesse ponto, entra a EAD. A EAD não é mais do que a sistematização da estrutura de
uma descrição arquivística compatível com ISAD(G) e NOBRADE. As informações que a EAD
traz são os nomes que se deve usar para cada elemento (por exemplo, que o campo “Âmbito e
conteúdo” usado pela ISAD(G) e pela NOBRADE deve ser chamado “scopecontent”), e o modo
como eles se relacionam (por exemplo, que uma série pode conter subséries, dossiês, processos,
itens, e etc.). Mesmo sendo aparentemente mínimas, essas informações são cruciais. Elas
permitem que dois projetos, que usem bancos de dados relacionais (ou outra forma de
armazenamento) possam trocar dados entre si, usando a EAD como base para um protocolo de
comunicação.
Isso permite desdobramentos interessantes, ainda inexplorados no Brasil. O principal
deles é que esses projetos, até então isolados, se integrem de alguma forma. Uma possibilidade
seria a formação de bases de dados centralizadas, que funcionassem como portal de acesso e
mecanismo de busca unificado para projetos antes isolados. Isso ampliaria a visibilidade dessas
iniciativas, na medida em que o internauta recorreria a um portal unificado para acessar um
conjunto amplo de sites que, de outra forma, não seriam tão facilmente localizados. Outra
possibilidade, relacionada à anterior, é que esses sites usem a Internet para se integrar,
delineando alguma forma de rede de computadores. Um site centralizado com mecanismo de
busca unificado poderia usar a Internet para se abastecer de dados, por exemplo, ou poderia usar
a estrutura do documento EAD – que é padronizada – para se comunicar com sites distribuídos.
Essas possibilidades, que apenas começam a se delinear, deverão ser exploradas, proximamente,
pelo Servidor de Imagens do AHUFJF.8
CONCLUSÕES
O uso conjunto da NOBRADE e da EAD abre uma ampla gama de oportunidades para os
trabalhos de descrição arquivística. O Servidor de Imagens do AHUFJF explora algumas dessas
possibilidades, aplicando os dois padrões num modelo de site para disponibilização de cópias
digitais de documentos de arquivos. Além de uma grande flexibilidade, materializada na
capacidade de ter um mesmo documento em vários formatos de apresentação, a difusão desses
8 Existem exemplos de bancos de dados unificados que usam EAD como padrão de metadados, dos quais um dos
primeiros foi o Online Archive of California (http://www.oac.cdlib.org/ - acesso em 04 de outubro de 2007).
Relatos de experiências desse tipo podem ser encontrados em PITTI, Daniel V., DUFF, Wendy (Ed). Encoded
Archival Description on the Internet. New York: Haworth Press, 2001. (Co-publicado simultaneamente no
Journal of Internet Cataloging. v. 4, n. 3/4, 2001); e em STOCKTING, Bill, QUEYROUX, Fabiennne (Ed.).
Encoding Across Frontiers: proceedings of the European Conference on Encoded Archival Description and
Context (EAD and EAC), Paris, France, 7-8 October 2004. New York: Haworth Press, 2005. (Co-publicado
simultaneamente no Journal of Archival Organization, v. 3, n. 2/3, 2005). As possibilidades em torno de uma
rede de arquivos foram exploradas em RIBEIRO, José Guilherme. Implantação da Rede de Arquivos
Municipais de Minas Gerais – RAM-MG. Governador Valadares, 2004. (mimeo.)
padrões também permitirá uma maior integração entre projetos até então dispersos. A formação
de bancos de dados unificados e de sistemas de redes são apenas algumas dessas possibilidades,
e podem contribuir para ampliar a visibilidade e o acesso a iniciativas até então dispersas.
Juiz de Fora / Governador Valadares, 04 de outubro de 2007
Download