DI MAMBRO, Galba e RIBEIRO, José Guilherme. Usando EAD e NOBRADE para acessar um fundo arquivístico digitalizado: o Servidor de Imagens do AHUFJF. Mesa-redonda do dia 08/11/2007. Seminário Internacional do Arquivo Público Mineiro, II. Documentos Eletrônicos: gestão e preservação. Anais do ... Belo Horizonte, 05 a 08 de novembro de 2007. Publicado em: NEVES, Marta Eloísa Melgaço e NEGREIROS, Leandro Ribeiro (org.). Documentos eletrônicos; fundamentos arquivísticos para a pesquisa em gestão e preservação. Belo Horizonte: Secretaria de estado da Cultura de Minas Gerais, Arquivo Público Mineiro, 2008. 168p. MESA-REDONDA: PROJETOS DE DIGITALIZAÇÃO E PRESERVAÇÃO DIGITAL Usando EAD e NOBRADE para acessar um fundo arquivístico digitalizado: o Servidor de Imagens do AHUFJF Galba Di Mambro* José Guilherme Ribeiro** APRESENTAÇÃO A presente comunicação é fruto do trabalho conjunto de seus dois autores. Nessa associação, o professor Galba Di Mambro tem se responsabilizado pelo estudo das normas internacionais (ISAD(G)1 e NOBRADE2), pela elaboração dos instrumentos de pesquisa e pela execução do trabalho de digitalização, enquanto o professor José Guilherme Ribeiro tem se responsabilizado pelo estudo do padrão EAD, e pela concepção e desenvolvimento do sistema de entrega de imagens usando esse padrão. O trabalho está sendo desenvolvido pelo Arquivo Histórico da UFJF – AHUFJF desde 2006 quando, por meio de projeto apresentado junto à FAPEMIG, os documentos do fundo Sociedade de Medicina e Cirurgia de Juiz de Fora foram higienizados, arranjados, descritos e digitalizados. Em 2007, através de projeto apresentado ao ICMS/Cultural de Minas Gerais, está sendo desenvolvido o sistema para a disponibilização das imagens digitais, por meio de um site na Web. O desenvolvimento do site deverá estar concluído em fevereiro de 2008. O site desenvolvido ultrapassa o âmbito dos documentos da Sociedade de Medicina e Cirurgia de Juiz de Fora. Ele pretende reunir, a partir de um único endereço, o resultado de uma série de trabalhos de digitalização desenvolvidos pelo Arquivo Histórico da UFJF. O conjunto desses trabalhos estará disponível no Servidor de Imagens do AHUFJF. Os estudos para o Servidor de Imagens começaram a ser desenvolvidos em 2006. Como * Professor da Universidade Federal de Juiz de Fora. Diretor do Arquivo Histórico da UFJF. <[email protected]> ** Consultor do Arquivo Histórico da UFJF. <[email protected]> 1 CONSELHO INTERNACIONAL DE ARQUIVOS. ISAD(G) 2001; Norma Geral Internacional de Descrição Arquivística. 2, ed, adotada pelo Comitê de Normas de Descrição, Estocolmo: 1999. Versão final aprovada pelo CIA. Rio de Janeiro: Arquivo Nacional, 2001. 119 p. O padrão ISAD(G) é comentado no texto, mais à frente. 2 CONSELHO NACIONAL DE ARQUIVOS - CONARQ. Câmara Técnica de Descrição Arquivística. NOBRADE. Norma Brasileira de Descrição Arquivística. Rio de Janeiro: CONARQ, 2006. 123 p. O padrão NOBRADE é comentado no texto, mais à frente. parte desses estudos, no início de 2007 foi feito um modelo – um protótipo – que sistematiza de forma concreta “aquilo que queremos” com o servidor. Em outras palavras, esse modelo correspondeu à explicitação da maioria dos requisitos funcionais do sistema, tal como os entendemos na época.3 Nessa comunicação, exploraremos esse modelo, procurando demonstrar como será o funcionamento do sistema, quando concluído. O leitor deve estar avisado de que trata-se de um estudo preliminar, e que, embora a maior parte dos requisitos deva permanecer estável, a aparência geral do site, ou mesmo uma ou outra funcionalidade, podem ser alteradas. 1. O SERVIDOR DE IMAGENS DO AHUFJF A Ilustração 1 mostra a tela de abertura do Servidor de Imagens. Nela haverá um texto inicial, que explicará o âmbito do sistema. A seguir, logo abaixo, estarão disponíveis alguns links, que apontarão para os projetos de digitalização do AHUFJF. Inicialmente, apenas o site da Sociedade de Medicina e Cirurgia de Juiz de Fora estará disponível. A partir de 2008, novos sites serão acrescentados ao Servidor. Para prosseguir, vamos selecionar o link da Sociedade de Medicina e Cirurgia de Juiz de Fora. 3 Requisitos funcionais correspondem à especificação das funções de um software, ou o conjunto de “coisas” que ele fará. Para mais detalhes, cf. LARMAN, Craig. Utilizando UML e padrões: uma introdução à análise e ao projeto orientados a objetos e ao desenvolvimento iterativo. 3. ed. Porto Alegre: Bookman, 2007. Ilustração 1: Tela de abertura do Servidor de Imagens do AHUFJF A Ilustração 2 mostra a tela inicial da Sociedade de Medicina e Cirurgia. O leitor deve ter em mente que, a partir desse ponto, estamos lidando com um instrumento de pesquisa em formato digital. Isso será explicado mais tarde, mas o leitor deve pensar como se tudo, a partir desse ponto, correspondesse a um único arquivo de computador, uma descrição arquivística em formato digital. A tela mostrada na Ilustração 2 contém uma pequena síntese, um resumo para avaliação do usuário. A intenção é que, lendo o resumo, o internauta possa escolher entre prosseguir ou não na análise do fundo. Abaixo do resumo, em área não mostrada na ilustração, o usuário encontrará uma série de links para seguir. Ilustração 2: Tela de abertura da Sociedade de Medicina e Cirurgia de Juiz de Fora Seguindo o item descrição arquivística, o internauta encontrará a descrição do fundo como um todo, feita conforme a Norma Brasileira de Descrição Arquivística – NOBRADE. A descrição ocupa várias telas, das quais destacamos uma, mostrada na Ilustração 3. Nela vêem-se alguns campos, como o código identificador, o título, as datas-limite, história administrativa, história arquivística, e outros, relativos ao fundo como um todo. O nome dos campos, bem como orientações gerais sobre o seu preenchimento, são dados pela NOBRADE. O layout não é fixado pela norma, e corresponde a uma adaptação do AHUFJF. O usuário pode ter, lendo a descrição em primeiro nível, uma visão abrangente do fundo como um todo, encontrando, ao final, uma série de links que permitem a ele prosseguir (Ilustração 4). A Ilustração 4 mostra as opções de prosseguimento para o internauta. Ele tem ali uma visão geral das grandes divisões do fundo, podendo escolher qual delas quer consultar em detalhe. Se o usuário escolher a opção “Grupo D. Correspondência operacional”, encontrará a figura mostrada na Ilustração 5. Nessa tela, o usuário poderá ver a descrição de todas as séries do grupo D, de forma seqüencial. Ilustração 3: Descrição em primeiro nível - Fundo Sociedade de Medicina e Cirurgia de Juiz de Fora Ilustração 4: Acesso aos níveis subordinados Na Ilustração 5, cada descrição de série está mostrada em uma tabela, uma espécie de ficha, com os dados relativos à mesma. Os campos da ficha são essencialmente os mesmos da descrição em primeiro nível, apenas preenchidos de forma mais curta, e com um número maior de campos sendo omitidos. Novamente, a estrutura dos campos é dada pela NOBRADE, e o layout é uma adaptação do AHUFJF. Caso haja subníveis a serem consultados (subséries, dossiês, processos ou itens), haverá um link na última linha da tabela, que levará ao próximo nível. Caso contrário, naquele lugar haverá um link para as imagens dos documentos daquela unidade. Seguindo esse link (“Ver imagens dos documentos dessa série”), temos a tela mostrada na Ilustração 6. Ilustração 5: Descrição das séries do Grupo D - Correspondência Operacional A Ilustração 6 mostra o que chamamos de “visualizador” das imagens. É uma ferramenta para a visualização das imagens de uma série, subsérie, ou nível inferior. Ele inicia mostrando a primeira imagem do conjunto solicitado, e contém opções para mostrar a próxima, a anterior, a primeira e a última do conjunto. Possui também uma opção de zoom, que permite ampliar ou reduzir a imagem, dentro de certos limites. Isso encerra a primeira forma de acesso, considerada a principal, aos fundos do Servidor de Imagens do AHUFJF. O usuário que faz esse caminho parte do geral para o particular – de uma informação mais ou menos genérica do conteúdo da documentação a uma descrição do fundo, e daí aos níveis inferiores, até chegar à imagens digitais dos documentos. Isso reproduz, na Internet, o modo de consulta dos arquivos reais. Voltando ao site do Servidor de Imagens, podemos ter outras formas de acesso. A primeira delas é através de uma série de índices – índice alfabético geral, índice das obras e folhetos, índice das fotografias, dos periódicos, etc. Se voltarmos algumas telas, selecionando o índice alfabético geral, iremos nos deparar com um imagem como a mostrada na Ilustração 7. A imagem mostra uma série de descritores, com entradas que remetem às séries, ao lado de entradas do tipo “ver” e “ver também”. Cada uma dessas entradas tem ao seu lado um link, ou uma série de links, que levam a trechos da descrição arquivística. Por exemplo, a entrada “ANESTESIOLOGISTAS” tem ao seu lado a referência à série “2E05”. Clicando nesse link, o usuário será levado à descrição da série 2E05, numa tela semelhante à mostrada anteriormente, na Ilustração 5. A partir daí, o internauta pode acessar os níveis inferiores, se houver, ou a imagem dos documentos, como já foi mostrado. Ilustração 6: Visualização de um documento - Sociedade de Medicina e Cirurgia A última forma de acesso disponível é um mecanismo de busca, que permite a pesquisa por palavras ou por datas, no interior das fichas descritivas do fundo, das séries e dos demais níveis. A tela do mecanismo de busca é mostrada na Ilustração 8. Inicialmente, os campos de texto e de datas estarão vazios, e a tela não mostrará nenhum resultado da busca. Quando o usuário digitar um critério de pesquisa – texto ou datas, ou ambos – e pressionar o botão “Pesquisar”, a busca será realizada. O resultado da busca mostra a ocorrência do resultado encontrado, bem como toda a hierarquia do documento (fundo, série, subsérie, etc.) em que ele se encontra. Clicando no link do resultado, o usuário será levado à descrição da unidade correspondente, numa tela semelhante à da Ilustração 5, de onde poderá prosseguir para os níveis inferiores ou para as imagens dos documentos. Ilustração 7: Índice Alfabético Geral das Séries 2. DESDOBRAMENTOS A especificidade do Servidor de Imagens do AHUFJF está em ser baseado em dois padrões de descrição arquivística – a NOBRADE e a EAD, cuja difusão no Brasil está em estágio inicial. A NOBRADE é a Norma Brasileira de Descrição Arquivística, aprovada pelo Conselho Nacional de Arquivos, e corresponde à adaptação da Norma Internacional de Descrição Arquivística – ISAD(G) para o caso brasileiro. A EAD refere-se à Encoded Archival Description (Descrição Arquivística Codificada) e corresponde a um padrão mantido pela Associação dos Arquivistas Americanos e pela Biblioteca do Congresso dos EUA 4, e que tem sido introduzido recentemente no Brasil.5 4 No site oficial da EAD podem-se encontrar textos de referência sobre a mesma, bem como links para outros sites que usam a EAD e/ou que contém mais material sobre ela. Cf. http://www.loc.gov/ead/ (acesso em 23 de abril de 2007). Muito material de referência pode ser encontrado no site Cover Pages sobre a EAD (http://xml.coverpages.org/ead.html - acesso em 12 de julho de 2007). 5 Entre os eventos recentes que envolveram a EAD, pode-se citar a oficina “Uma introdução à EAD”, promovida pelo AHUFJF e ministrada pelo prof. José Guilherme Ribeiro, de 04 a 06 de maio de 2005, o curso “Registro e transferência de dados – o uso da XML”, promovido pela Associação dos Arquivistas Brasileiros e ministrado por Adrissa Dominitini e Ana Pavani nos dias 12 e 13 de fevereiro de 2007, a “Oficina sobre EAD e EAC”, Ilustração 8: Mecanismo de busca - Sociedade de Medicina e Cirurgia No Servidor de Imagens do AHUFJF, a NOBRADE é usada como estrutura de dados, e a EAD é usada como padrão de armazenamento e de comunicação.6 Isso quer dizer que o nome dos elementos descritivos de um fundo, série ou item documental é dado pela NOBRADE, assim como a estrutura geral da descrição (estrutura multinível). Por seu lado, a EAD fornece o meio de dar a essa descrição um formato legível por computador. A EAD usa a linguagem XML para armazenar uma descrição arquivística.7 Se promovida pelo Arquivo Nacional e ministrada pelo prof. Michael Fox nos dias 12 e 13 de março de 2007, e o II Encontro de Bases de Dados sobre Informações Arquivísticas, promovido pela Associação dos Arquivistas Brasileiros nos dias 15 e 16 de março de 2007, no Rio de Janeiro. Artigo recente da revista Arquivística.net faz referência ao padrão EAD. Cf. SOUSA, Ana Paula de Moura e outros. Princípios da Descrição Arquivística: do suporte convencional ao eletrônico. Arquivistica.net. Rio de Janeiro, v. 2, n.2, p. 38-51, ago./dez. 2006. Disponível em http://www.arquivistica.net – acesso em 04 de outubro de 2007. 6 A classificação foi proposta por Michael Fox. Segundo ele, os padrões internacionais usados na Arquivologia e na Biblioteconomia podem ser divididos em 4 categorias: padrões de estrutura de dados, de conteúdo, de valores de dados e de comunicação. A função de armazenamento (“data storage”) é mencionada, junto com a de comunicação e intercâmbio de dados, em passagens referentes ao Marc e em outras referentes à EAD. O uso dos padrões NOBRADE e EAD, no trabalho desenvolvido no AHUFJF, é coerente com a análise de Fox. O leitor interessado pode consultar FOX, Michael J. Stargazing: locating EAD in the descriptive firmament. In: PITTI, Daniel V., DUFF, Wendy M.(Ed.) Encoded archival description on the Internet. New York: The Haworth Press, 2001. p. 61-74. (Volume publicado simultaneamente no Journal of Internet Cataloging, v. 4, n. 3-4, 2001. Cópias do artigo podem ser compradas em http://www.HaworthPress.com – acesso em 15 de setembro de 2007). 7 A XML é uma linguagem de computador, aprovada pelo consórcio W3C em 1998. Há muito material sobre a anteriormente pedimos ao leitor para pensar que tudo, de certo ponto em diante, correspondia a um único documento, é porque todas as informações mostradas daquele ponto em diante estavam contidas em um único arquivo de computador. A EAD armazena os dados, mas não as instruções de formatação. O conteúdo dos campos, a ordem em que eles aparecem, e as relações hierárquicas entre eles, são informações registradas pelo documento EAD. Fontes, cores, e a fragmentação dos arquivos são informações adicionais, registradas num outro tipo de documento chamado “folha de estilos”. A interação entre um documento EAD e uma folha de estilos pode ser vista num exemplo simples. O documento EAD registra as informações fundamentais (o conteúdo, digamos assim) de uma descrição arquivística. A folha de estilos registra as informações necessárias à apresentação desse conteúdo. É possível então que o mesmo conteúdo tenha duas ou mais apresentações diferentes. Ou seja: a mesma descrição multinível vista aqui, num modelo de site para a Web, poderia gerar (com o mesmo conteúdo, voltamos a enfatizar) um documento de texto, num arquivo do editor de textos Word, por exemplo. O Arquivo Histórico da UFJF pretende tirar partido dessa maleabilidade gerando descrições multinível adaptadas, para acompanhar as cópias em CD e DVD das imagens, em formato JPEG e TIFF, geradas pelo processo de digitalização. Isso permite que as diversas versões da descrição sejam mais facilmente sincronizadas, depois de passar por uma revisão, por exemplo. Existe outra característica importante no uso da EAD – uma característica que surge como uma possibilidade a ser explorada. É muito comum usar-se, como veículo para o armazenamento da descrição arquivística, bancos de dados relacionais. Quem já usou um banco de dados relacional sabe que, para isso, é necessário definir uma ou mais tabelas e campos, no que seria chamado de “estrutura” dos dados. Normalmente, em projetos isolados, essa estrutura é definida de modo ad-hoc pelo programador, projetista ou analista de sistemas. O resultado é que esses projetos, desenvolvidos isoladamente, possuem estruturas de dados que se comunicam com dificuldade. O uso da NOBRADE pode melhorar um pouco esse caos, porque ela oferece uma estrutura básica de onde partir. Mas, mesmo assim, a dificuldade permanece, pois o grau de liberdade no mapeamento dos elementos NOBRADE para tabelas e campos relacionais é muito amplo. XML, para consulta on-line ou publicado. Uma pesquisa no Google ou Yahoo! sempre retornará uma grande quantidade de tutoriais sobre o assunto, que podem servir como uma referência inicial. Uma página que contém uma grande relação de recursos (livros, bibliografias, material on-line, etc.) é a página XML do W3C (http://www.w3.org/XML/ - acesso em 10 de julho de 2007). A página do site Cover Pages sobre a XML (http://xml.coverpages.org/xml.html - acesso em 10 de julho de 2007) também fornece uma grande quantidade de referências sobre o tema. Outra fonte é o site XML.com (http://www.xml.com/ - acesso em 10 de julho de 2007). Quanto a publicações em papel, o leitor pode recorrer ao livro de Harold & Means sobre o tema HAROLD, Elliotte Rusty, MEANS, W. Scott. XML in a nutshell: a desktop quick reference. 2.ed. Sebastopol (USA): O'Reilly, 2002. 613 p. Nesse ponto, entra a EAD. A EAD não é mais do que a sistematização da estrutura de uma descrição arquivística compatível com ISAD(G) e NOBRADE. As informações que a EAD traz são os nomes que se deve usar para cada elemento (por exemplo, que o campo “Âmbito e conteúdo” usado pela ISAD(G) e pela NOBRADE deve ser chamado “scopecontent”), e o modo como eles se relacionam (por exemplo, que uma série pode conter subséries, dossiês, processos, itens, e etc.). Mesmo sendo aparentemente mínimas, essas informações são cruciais. Elas permitem que dois projetos, que usem bancos de dados relacionais (ou outra forma de armazenamento) possam trocar dados entre si, usando a EAD como base para um protocolo de comunicação. Isso permite desdobramentos interessantes, ainda inexplorados no Brasil. O principal deles é que esses projetos, até então isolados, se integrem de alguma forma. Uma possibilidade seria a formação de bases de dados centralizadas, que funcionassem como portal de acesso e mecanismo de busca unificado para projetos antes isolados. Isso ampliaria a visibilidade dessas iniciativas, na medida em que o internauta recorreria a um portal unificado para acessar um conjunto amplo de sites que, de outra forma, não seriam tão facilmente localizados. Outra possibilidade, relacionada à anterior, é que esses sites usem a Internet para se integrar, delineando alguma forma de rede de computadores. Um site centralizado com mecanismo de busca unificado poderia usar a Internet para se abastecer de dados, por exemplo, ou poderia usar a estrutura do documento EAD – que é padronizada – para se comunicar com sites distribuídos. Essas possibilidades, que apenas começam a se delinear, deverão ser exploradas, proximamente, pelo Servidor de Imagens do AHUFJF.8 CONCLUSÕES O uso conjunto da NOBRADE e da EAD abre uma ampla gama de oportunidades para os trabalhos de descrição arquivística. O Servidor de Imagens do AHUFJF explora algumas dessas possibilidades, aplicando os dois padrões num modelo de site para disponibilização de cópias digitais de documentos de arquivos. Além de uma grande flexibilidade, materializada na capacidade de ter um mesmo documento em vários formatos de apresentação, a difusão desses 8 Existem exemplos de bancos de dados unificados que usam EAD como padrão de metadados, dos quais um dos primeiros foi o Online Archive of California (http://www.oac.cdlib.org/ - acesso em 04 de outubro de 2007). Relatos de experiências desse tipo podem ser encontrados em PITTI, Daniel V., DUFF, Wendy (Ed). Encoded Archival Description on the Internet. New York: Haworth Press, 2001. (Co-publicado simultaneamente no Journal of Internet Cataloging. v. 4, n. 3/4, 2001); e em STOCKTING, Bill, QUEYROUX, Fabiennne (Ed.). Encoding Across Frontiers: proceedings of the European Conference on Encoded Archival Description and Context (EAD and EAC), Paris, France, 7-8 October 2004. New York: Haworth Press, 2005. (Co-publicado simultaneamente no Journal of Archival Organization, v. 3, n. 2/3, 2005). As possibilidades em torno de uma rede de arquivos foram exploradas em RIBEIRO, José Guilherme. Implantação da Rede de Arquivos Municipais de Minas Gerais – RAM-MG. Governador Valadares, 2004. (mimeo.) padrões também permitirá uma maior integração entre projetos até então dispersos. A formação de bancos de dados unificados e de sistemas de redes são apenas algumas dessas possibilidades, e podem contribuir para ampliar a visibilidade e o acesso a iniciativas até então dispersas. Juiz de Fora / Governador Valadares, 04 de outubro de 2007