2006-11-11 Seminário MICEI2007 Universidade do Minho DBPreserve: Preservação de Bases de Dados José Carlos Ramalho [email protected] História Seminário MICEI2007 Universidade do Minho 2 1990 1998 2000 1999 2003 2006 2007 Projectos em curso Seminário MICEI2007 Universidade do Minho 3 Projectos em curso Seminário MICEI2007 Universidade do Minho 4 • DigitArq 2.0: criação e manutenção de arquivos digitais • CRAV: criação dum balcão electrónico para arquivos • RODA: repositório de objectos digitais autênticos Enquadramento dos projectos Universidade do Minho Seminário MICEI2007 Arqbase ISIS Access Arquivista Excel Word Filemaker XML 10010010110 10100100101 Inventários Índices Listagens Catálogos Guias de transferência Utente 5 Objectivos dos projectos Seminário MICEI2007 Universidade do Minho 6 • Eliminação do papel • Centralização da informação • Utilização de normas internacionais – International Standard Archival Description - ISAD(g) – Encoded Archival Description - EAD/XML • Gestão de descrições arquivísticas • Gestão de objectos digitais • Permitir o acesso via Web ao acervo do arquivo • Preservação Digital Open Archival Information System Seminário MICEI2007 Universidade do Minho 7 Disseminação: • Motor de pesquisa • Balcão electrónico • Visualizador de ODs Ingestão: • Descrição • Aquisição • Construtor de SIPs Repositório Central Gestão: • GOD: gestão de ODs • POD: publicação de ODs • “Everyone Information System” • Controlo de acessos Preservação Digital: RODA DigitArq2 Seminário MICEI2007 Universidade do Minho QuickTime™ and a TIFF (LZW) decompressor are needed to see this picture. Normas envolvidas: • EAD - descriçaõ arquivística • METS - descrição estrutural • NISO MIX - descrição técnica • PREMIS - descrição de intervenções de preservação 8 Organização da metainformação - EAD Seminário MICEI2007 Universidade do Minho 9 • Estrutura hierárquica • Descrição do mais geral para o mais específico • Diferentes níveis descritivos • Elementos descritivos: – – – – – – Referência título datas extremas condições de acesso âmbito e conteúdo … Fundo Secção Série Documento Secção Série Documento 2006-11-11 Seminário MICEI2007 Universidade do Minho RODA Seminário MICEI2007 Universidade do Minho 11 • Preservação de objectos digitais: – – – – Documentos simples Documentos com tabelas e imagens Imagens Bases de Dados Relacionais • Requisitos de Autenticidade Preservação de Bases de Dados Seminário MICEI2007 Universidade do Minho 12 Gestão AIP SIP Ingestão AIP Repositório Central Políticas Preservação Disseminação DIP Construtor de SIPs Universidade do Minho Seminário MICEI2007 XML METS 13 XML Base de Dados Access SQL Server Oracle Construtor de SIPs binários XML NISO Z39.87 Ficheiro ZIP Extracção das BDs para XML Universidade do Minho Seminário MICEI2007 • Uma BD tem duas partes: 14 – Estrutura – Dados • É necessário preservar as duas • Para os dados há várias linguagens • Para a estrutura muito poucas DBML - Database Markup Language Seminário MICEI2007 Universidade do Minho 15 <?xml version="1.0" encoding="ISO -8859-1"?> <DB name="XXX" date="today"> <STRUCTURE> ... <TABLE NAME="PRODUTOS"> </STRUCTURE> <DATA> ... ... </TABLE> </DATA> </DB> <COLUMNS> <COLUMN NAME="CīDIGO" TYPE="int" NULL="no"/> ... </COLUMNS> Exemplo: Produtos e Fornecedores Universidade do Minho Seminário MICEI2007 Produtos 16 Fornecedores Código Descrição Quantidade Preço Código Nome Morada ... 1:N 1:N P2F Código-P Código-F Resultado: DBML Seminário MICEI2007 Universidade do Minho 17 <?xml version="1.0" ?> <DB> <STRUCTURE> <TABLE NAME="PRODUTOS"> <COLUMNS> <COLUMN NAME="CīDIGO" TYPE="nvarchar" SIZE="10" NULL="no"/> <COLUMN NAME="DESCRI‚ĢO" TYPE="nvarchar" SIZE="50" NULL="no"/> ... </COLUMNS> <KEYS> <PKEY TYPE="simple"> <FIELD NAME=" CīDIGO "/> </PKEY> </KEYS> </TABLE> <TABLE NAME="P2F"> <COLUMNS> <COLUMN NAME="COD -P" TYPE="nvarchar" SIZE="10" NULL="no"/> <COLUMN NAME="COD -F" TYPE="nvarchar" SIZE="10" NULL="no"/> </COLUMNS> <KEYS> <PKEY TYPE="composite"> <FIELD NAME="COD-P"/> <FIELD NAME="COD -F"/> </PKEY> <FKEY NAME="COD -P" IN="PRODUTOS" REF="CīDIGO"/> <FKEY NAME="COD -F" IN="FORNECEDORES" REF="CīDIGO"/> </KEYS> </TABLE> <TABLE NAME="FORNECEDORES"> <COLUMNS> <COLUMN NAME="CīDIGO" TYPE="nvarchar" SIZE="10" NULL="no"/> <COLUMN NAME="NOME" TYPE="nvarchar" SIZE="60" NULL="no"/> ... </COLUMNS> <KEYS> <PKEY TYPE="simple"> <FIELD NAME="CīDIGO"/> </PKEY> </KEYS> </TABLE> </STRUCTURE> <DATA> Dados: DBML Seminário MICEI2007 Universidade do Minho 18 ... <DATA> <PRODUTOS> <PRODUTOS-REG> <CīDIGO> a122 </CīDIGO> <DESCRI‚ĢO> leite </DESCRI‚ĢO> ... </PRODUTOS-REG> <PRODUTOS-REG> ... </PRODUTOS-REG> </PRODUTOS> ... </DATA> ... Construtor de SIPs Universidade do Minho Seminário MICEI2007 XML METS 19 XML Base de Dados Access SQL Server Oracle Construtor de SIPs binários XML NISO Z39.87 Ficheiro ZIP Modelo relacional do Repositório Universidade do Minho Seminário MICEI2007 DB 20 TABLES IdDB nameDB dateInit nTables 1:N IdTable IdDB nameTable nFields FIELDS 1:N SGBD IdDB IdTable IdField nameField IsPKey IsFKey Type 1:N 1:N 1:N RELATIONS REGISTERS IdRelation IdDB SourceTable TargetTable SourceField TargetField IdDB IdTable IdField IdReg Data 1:N Preservação de Bases de Dados Seminário MICEI2007 Universidade do Minho Gestão AIP SIP Ingestão AIP Repositório Central Disseminação DIP Políticas Preservação Browser 21 2006-11-11 Universidade do Minho Seminário MICEI2007 QuickTime™ and a MPEG-4 Video decompressor are needed to see this picture. Questões? Demonstração de um arquivo em exploração: www.adporto.org Desenvolvimento, manutenção e suporte: [email protected] ; [email protected]