Construtor de SIPs - Universidade do Minho

Propaganda
2006-11-11
Seminário MICEI2007
Universidade
do Minho
DBPreserve:
Preservação de Bases de Dados
José Carlos Ramalho
[email protected]
História
Seminário MICEI2007
Universidade
do Minho
2
1990
1998
2000
1999
2003
2006
2007
Projectos em curso
Seminário MICEI2007
Universidade
do Minho
3
Projectos em curso
Seminário MICEI2007
Universidade
do Minho
4
• DigitArq 2.0: criação e
manutenção de arquivos
digitais
• CRAV: criação dum balcão
electrónico para arquivos
• RODA: repositório de objectos
digitais autênticos
Enquadramento dos projectos
Universidade
do Minho
Seminário MICEI2007
Arqbase
ISIS
Access
Arquivista
Excel
Word
Filemaker
XML
10010010110
10100100101
Inventários
Índices
Listagens
Catálogos
Guias de
transferência
Utente
5
Objectivos dos projectos
Seminário MICEI2007
Universidade
do Minho
6
• Eliminação do papel
• Centralização da informação
• Utilização de normas internacionais
– International Standard Archival Description - ISAD(g)
– Encoded Archival Description - EAD/XML
• Gestão de descrições arquivísticas
• Gestão de objectos digitais
• Permitir o acesso via Web ao acervo do
arquivo
• Preservação Digital
Open Archival Information System
Seminário MICEI2007
Universidade
do Minho
7
Disseminação:
• Motor de pesquisa
• Balcão electrónico
• Visualizador de ODs
Ingestão:
• Descrição
• Aquisição
• Construtor de SIPs
Repositório
Central
Gestão:
• GOD: gestão de ODs
• POD: publicação de ODs
• “Everyone Information
System”
• Controlo de acessos
Preservação Digital: RODA
DigitArq2
Seminário MICEI2007
Universidade
do Minho
QuickTime™ and a
TIFF (LZW) decompressor
are needed to see this picture.
Normas envolvidas:
• EAD - descriçaõ arquivística
• METS - descrição estrutural
• NISO MIX - descrição técnica
• PREMIS - descrição de intervenções de preservação
8
Organização da metainformação - EAD
Seminário MICEI2007
Universidade
do Minho
9
• Estrutura hierárquica
• Descrição do mais geral
para o mais específico
• Diferentes níveis descritivos
• Elementos descritivos:
–
–
–
–
–
–
Referência
título
datas extremas
condições de acesso
âmbito e conteúdo
…
Fundo
Secção
Série
Documento
Secção
Série
Documento
2006-11-11
Seminário MICEI2007
Universidade
do Minho
RODA
Seminário MICEI2007
Universidade
do Minho
11
• Preservação de objectos
digitais:
–
–
–
–
Documentos simples
Documentos com tabelas e imagens
Imagens
Bases de Dados Relacionais
• Requisitos de Autenticidade
Preservação de Bases de Dados
Seminário MICEI2007
Universidade
do Minho
12
Gestão
AIP
SIP
Ingestão
AIP
Repositório
Central
Políticas
Preservação
Disseminação
DIP
Construtor de SIPs
Universidade
do Minho
Seminário MICEI2007
XML
METS
13
XML
Base de Dados
Access
SQL Server
Oracle
Construtor
de
SIPs
binários
XML
NISO
Z39.87
Ficheiro ZIP
Extracção das BDs para XML
Universidade
do Minho
Seminário MICEI2007
• Uma BD tem duas partes:
14
– Estrutura
– Dados
• É necessário preservar as duas
• Para os dados há várias
linguagens
• Para a estrutura muito poucas
DBML - Database Markup Language
Seminário MICEI2007
Universidade
do Minho
15
<?xml version="1.0" encoding="ISO
-8859-1"?>
<DB name="XXX" date="today">
<STRUCTURE>
...
<TABLE NAME="PRODUTOS">
</STRUCTURE>
<DATA>
...
...
</TABLE>
</DATA>
</DB>
<COLUMNS>
<COLUMN NAME="CīDIGO" TYPE="int" NULL="no"/>
...
</COLUMNS>
Exemplo: Produtos e Fornecedores
Universidade
do Minho
Seminário MICEI2007
Produtos
16
Fornecedores
Código
Descrição
Quantidade
Preço
Código
Nome
Morada
...
1:N
1:N
P2F
Código-P
Código-F
Resultado: DBML
Seminário MICEI2007
Universidade
do Minho
17
<?xml version="1.0" ?>
<DB>
<STRUCTURE>
<TABLE NAME="PRODUTOS">
<COLUMNS>
<COLUMN NAME="CīDIGO" TYPE="nvarchar" SIZE="10"
NULL="no"/>
<COLUMN NAME="DESCRI‚ĢO"
TYPE="nvarchar" SIZE="50" NULL="no"/>
...
</COLUMNS>
<KEYS>
<PKEY TYPE="simple">
<FIELD NAME=" CīDIGO "/>
</PKEY>
</KEYS>
</TABLE>
<TABLE NAME="P2F">
<COLUMNS>
<COLUMN NAME="COD
-P" TYPE="nvarchar" SIZE="10"
NULL="no"/>
<COLUMN NAME="COD
-F" TYPE="nvarchar" SIZE="10"
NULL="no"/>
</COLUMNS>
<KEYS>
<PKEY TYPE="composite">
<FIELD NAME="COD-P"/>
<FIELD NAME="COD
-F"/>
</PKEY>
<FKEY NAME="COD
-P" IN="PRODUTOS" REF="CīDIGO"/>
<FKEY NAME="COD
-F" IN="FORNECEDORES" REF="CīDIGO"/>
</KEYS>
</TABLE>
<TABLE NAME="FORNECEDORES">
<COLUMNS>
<COLUMN NAME="CīDIGO" TYPE="nvarchar" SIZE="10"
NULL="no"/>
<COLUMN NAME="NOME" TYPE="nvarchar" SIZE="60"
NULL="no"/>
...
</COLUMNS>
<KEYS>
<PKEY TYPE="simple">
<FIELD NAME="CīDIGO"/>
</PKEY>
</KEYS>
</TABLE>
</STRUCTURE>
<DATA>
Dados: DBML
Seminário MICEI2007
Universidade
do Minho
18
...
<DATA>
<PRODUTOS>
<PRODUTOS-REG>
<CīDIGO> a122 </CīDIGO>
<DESCRI‚ĢO> leite </DESCRI‚ĢO>
...
</PRODUTOS-REG>
<PRODUTOS-REG>
...
</PRODUTOS-REG>
</PRODUTOS>
...
</DATA>
...
Construtor de SIPs
Universidade
do Minho
Seminário MICEI2007
XML
METS
19
XML
Base de Dados
Access
SQL Server
Oracle
Construtor
de
SIPs
binários
XML
NISO
Z39.87
Ficheiro ZIP
Modelo relacional do Repositório
Universidade
do Minho
Seminário MICEI2007
DB
20
TABLES
IdDB
nameDB
dateInit
nTables
1:N
IdTable
IdDB
nameTable
nFields
FIELDS
1:N
SGBD
IdDB
IdTable
IdField
nameField
IsPKey
IsFKey
Type
1:N
1:N
1:N
RELATIONS
REGISTERS
IdRelation
IdDB
SourceTable
TargetTable
SourceField
TargetField
IdDB
IdTable
IdField
IdReg
Data
1:N
Preservação de Bases de Dados
Seminário MICEI2007
Universidade
do Minho
Gestão
AIP
SIP
Ingestão
AIP
Repositório
Central
Disseminação
DIP
Políticas
Preservação
Browser
21
2006-11-11
Universidade
do Minho
Seminário MICEI2007
QuickTime™ and a
MPEG-4 Video decompressor
are needed to see this picture.
Questões?
Demonstração de um arquivo em exploração: www.adporto.org
Desenvolvimento, manutenção e suporte:
[email protected] ; [email protected]
Download