o padrão de metadados dublin core: a representação

Propaganda
1
Eixo Temático: Organização e Representação da Informação e do
Conhecimento
O PADRÃO DE METADADOS DUBLIN CORE: A REPRESENTAÇÃO
DESCRITIVA EM HTML1
Bill Alexander Santos da Silva2
Juliana Marques do Amaral3
Nayara Ghiovana Stanganelli4
RESUMO
Em razão de solucionar as formas de recuperação e acesso aos recursos
armazenados na Web foi criado o padrão de metadados Dublin Core, apresentando
uma estrutura simples, flexível, padronizada e com consenso internacional para sua
utilização. Por meio de uma análise exploratória e descritiva da literatura disponível,
o objetivo desse trabalho é apresentar o Dublin Core e verificar a representação do
recurso informacional, inserido ao Hyper Text Markup Language (HTML).
Considerando as características de sua estrutura, os resultados mostram que o
Dublin Core possui um grande potencial de substituir os métodos anteriores de
representação para o ambiente Web.
Palavras-chave: Dublin Core. HTML. Padrão de metadados. Descrição de recursos
informacionais digitais.
1 INTRODUÇÃO E OBJETIVOS
A tecnologia tem o papel de potencializar a inteligência humana, fornece
condições para que a pessoas criem e disseminem seus conhecimentos em
ambientes colaborativos. Além disso, possibilita diversos tipos de interação e
dinâmica. Atualmente os meios de comunicação estão inseridos dentro de uma
macromídia, denominada plataforma Web.
O surgimento de ferramentas que permitem a construção rápida de páginas e
websites culminou em uma aceleração constante, exponencial e descontrolada de
1
Trabalho desenvolvido durante a disciplina optativa “2BIB996 - Metadados e interoperabilidade” da
graduação de Biblioteconomia e ministrada pela Profa. Ana Carolina Simionato, durante o período de
março a julho de 2014, na Universidade Estadual de Londrina (UEL).
2
Graduando do Curso de Biblioteconomia – UEL. Email: [email protected]
3
Graduando do Curso de Biblioteconomia – UEL. Email: [email protected]
4
Graduando do Curso de Biblioteconomia – UEL. Email: [email protected]
2
diferentes tipos de recursos informacionais na Web, incluindo os recursos como os
websites. Essa produção gera um caos informacional e consequentemente, tarefas
como a identificação, organização e busca de informações se tornam importantes
para que possa recuperar e acessar o que se deseja. E além disso, otimiza as
formas de navegação dentro dos sistemas informacionais.
Nesse sentido, várias iniciativas estão sendo conduzidas e assim, tendo em
vista as formas descritivas para garantir o acesso aos documentos, esse estudo
procura refletir sobre como: a representação descritiva auxilia nas formas de
recuperação e acesso na plataforma Web? Para tanto, os padrões mais flexíveis e
eficientes para descrição de recursos, como o Dublin Core, apresentam uma
estrutura capaz de garantir o acesso do recurso e facilitar a interoperabilidade entre
os metadados.
Dessa forma, a partir de uma revisão bibliográfica da literatura realizada sobre
o padrão de metadados Dublin Core e sobre a linguagem de marcação Hyper Text
Markup Language (HTML), o objetivo do estudo é verificar que o uso do padrão
Dublin Core em websites construídos com base na linguagem HTML possibilitam a
otimização do acesso e recuperação dos recursos. Logo, esse estudo contribui com
a literatura sobre o tema, além de esclarecer sobre a representação descritiva na
plataforma Web.
2 PRESSUPOSTOS TEÓRICOS
As tecnologias modificam a relação dos profissionais da informação com a
forma de tratar a informação gerada e corporificada em recursos, entre essa relação
ocasionam as principais mudanças relacionadas à informação e à tecnologia, como
exemplo a produção acentuada de recursos informacionais. E consequentemente,
na mesma proporção, a relação dos usuários no processo de localização, uso e
reuso desses recursos informacionais.
Os recursos informacionais
[...] refere-se a informação objetivada no contexto de um campo do
conhecimento podendo ser apresentado em uma estrutura analógica
e/ou digital, com valor informacional que caracteriza a sua concepção
intelectual expressa na corporificação de manifestações estruturadas
na forma de itens. O recurso informacional também é nominado de:
3
‘item informacional’, ‘informação registrada’, ‘coisa física, ou uma
coisa não-física’ e ‘artefato’. (SANTOS; SIMIONATO; ARAKAKI,
2014, p. 148).
Para tanto, o volume informacional causa um aspecto problemático: a
dificuldade entre os processos de identificação, organização, busca, recuperação,
acesso e uso das informações em ambientes digitais. (ALVES, 2010). Nesse
sentido, para que o acesso às informações estocadas possa atender ao usuário na
realização de suas pesquisas, a informação e os recursos devem ser corretamente e
adequadamente descritas.
Dessa forma, a Ciência da Informação e a Biblioteconomia têm buscado
soluções em melhorar as formas de representação e recuperação da informação,
tanto em ambientes físicos como as bibliotecas e centros de informação, e também
ambientes digitais, como exemplo os websites da plataforma Web.
A catalogação como disciplina contida na Ciência da Informação e a
Biblioteconomia é definido como um processo que
[...] descreve formalmente um documento do recurso e se estabelece
um variado e variável número de pontos de acesso, objetivando
proporcionar, ao usuário final, a condição de encontrar, identificar,
selecionar e obter o documento ou descrito, ou a informação nele
contida. (CATARINO; SOUZA, 2012, p. 84)
E para que possa estabelecer pontos de acesso adequados a descrição
necessita de padronização da informação na Web por meio de metadados e seus
padrões. Os metadados definem-se pela forma mais conhecida: ‘dados sobre
dados’.
Conforme explica Grácio (2002) os metadados são elementos que descrevem
as informações contidas em um recurso, com o objetivo de possibilitar sua busca e
recuperação.
Este
conceito
explica
como
toda
informação
armazenada
eletronicamente pode ser acessada e recuperada com precisão independente do
seu formato, como texto, imagem, som, vídeo, e outros tipos de recurso.
Os metadados estão presentes na maioria dos sistemas de informação em
uma variedade de tipos e níveis, e a sua aplicação e efetivação corresponde ao tipo
de ambiente informacional.
4
E nesse sentido, os metadados precisam ser padronizados, ou seja, devem
utilizar um formato padrão e terminologia própria e também um número de
elementos descritivos que pode ser variável de acordo com o padrão. Esses
elementos devem seguir esquemas de codificação que sejam usuais e comuns,
como o uso de vocabulário controlado, esquemas de classificação e formatos de
descrição formais, permitindo dessa forma o compartilhamento desses metadados
entre diferentes instituições.
Segundo Buckland (2006) a utilização dos formatos padronizados para
armazenamento e exibição torna mais fácil o acesso aos documentos. E portanto, os
metadados sejam eles padrões nacionais ou internacionais, precisam ser
cuidadosamente elaborados, permitindo o tratamento adequado e acessibilidade às
informações de um recurso.
Assim, surgem iniciativas importantes para solucionar o problema de
descrição de recursos na Web, como o padrão de metadados Dublin Core que tem
aplicação internacional para descrição de documentos eletrônicos.
Seu desenvolvimento teve sua origem na 2ª Conferência Internacional sobre a
World Wide Web (WWW) em 1994 na cidade de Chicago, onde Yuri Rubinsky,
Stuart Weibel e Eric Miller, ambos da Online Computer Library Center (OCLC) e Joe
Hardin da National Center for Supercomputing Applications (NCSA), promoveram
uma discussão sobre semântica e Web (GRÁCIO, 2002).
Em 1995 foi criado o Dublin Core e, no ano seguinte, a sua instituição base a
Dublin Core Metadata Initiative (DCMI). O Dublin Core foi nomeado dessa forma,
pois o primeiro evento se dava em Dublin, Ohio nos Estados Unidos e Core, por
conter os metadados essenciais para qualquer descrição. (GRÁCIO, 2002). E podese predispor que o Dublin Core contemporiza a uma iniciativa criada para
catalogação de recursos eletrônicos na Web, com uma proposta de expandir a
representação e aperfeiçoando a recuperação de documentos em outros domínios,
que não os bibliográficos.
A Dublin Core Metadata Initiative tem reunido profissionais de diversas áreas
e países para trabalharem juntos nas discussões sobre como os metadados podem
ajudar a resolver a falta de descrição das informações no meio eletrônico. E a partir
dessas discussões também levou o DCMI a organizar, no ano seguinte (1996) e se
5
repetindo até hoje, um evento chamado OCLC/NCSA Metadada Workshop
(GRÁCIO, 2002).
E durante os primeiros OCLC/NCSA Metadada Workshop principal discussão
era o conjunto mínimo de elementos descritivos que representariam os recursos da
Web. Segundo Grácio (2002) durante este primeiro evento, muitos participantes
reconheceram a dificuldade de trabalhar com padrões que possuíssem muitos
elementos e procuraram determinar uma relação de elementos não exaustiva e
tediosa para descrever os recursos de rede.
O Dublin Core possui um conjunto de 15 elementos para descrição. E esses
elementos designam aos objetivos propostos e são suficientemente amplos e
flexíveis para ser utilizados nas mais diversas situações (BAPTISTA; MACHADO,
1999). E segundo Souza; Vendrusculo e Melo (2000, p. 93) “O conjunto de
metadados descrito pelo DC é composto de quinze elementos, os quais poderiam
ser descritos como o mais baixo denominador comum para descrição de recurso
(equivalente a uma ficha catalográfica)”.
A seguir, no quadro 1, é representado cada um dos quinze elementos
componentes do Dublin Core.
Quadro 1 – Os quinze elementos do padrão Dublin Core e a definição de valores
Elementos do
Dublin Core
1. Título
2. Autor
3. Assunto/palavraschave
4. Descrição
Definição do valor
Identificador: Title
Definição: Um nome dado para o recurso
Comentário: Tipicamente, um título será o nome pelo qual o recurso é
formalmente conhecido, podendo ser o próprio título.
Identificador: Creator
Definição: Uma entidade primeiramente responsável pelo conteúdo dos
recursos.
Comentário: Em autor incluem uma pessoa, uma organização ou um serviço.
Identificador: Subject
Definição: O tema (objeto ou ponto principal) do conteúdo do recurso.
Comentário: Tipicamente, um Assunto será expresso com palavras-chave,
descritores ou códigos de classificação que descrevem o tema do recurso
(indica o conteúdo informativo).
Identificador: Description
Definição: Um relato do conteúdo do recurso.
Comentário: Descrição pode incluir (mas não é limitado) a um “abstract”,
tabelas de conteúdo, referências para uma representação de conteúdo ou um
texto livre de relato do conteúdo.
6
5. Editor
6. Colaborador
7. Data
8. Tipo do recurso
9. Formato
10. Identificador do
recurso
11. Fonte
12. Língua
13. Relação
Identificador: Publisher
Definição: Uma entidade responsável por tornar o recursodisponível.
Comentário: No editor incluem uma pessoa, uma organização ou um serviço.
Tipicamente, o nome de um editor deve ser usado para indicar a entidade.
Identificador: Contributor
Definição: Uma entidade responsável por fazer contribuiçõespara o conteúdo
do recurso.
Comentário: Exemplos de um Colaborador incluem uma pessoa, uma
organização ou um serviço. Tipicamente, o nome do colaborador deve ser
usado para indicar a entidade.
Identificador: Date
Definição: Uma data associada com um evento no ciclo de vida do recurso.
Comentário: Tipicamente, data seráassociada com a criação ou a
disponibilização do recurso. Recomendação para melhor uso de codificação
dos valores de data é definido na norma ISO 8601 e segue o formato YYYYMM-DD, onde YYYY é o ano, MM é o mês e DD o dia.
Identificador: Type
Definição: A natureza ou a espécie do conteúdo do recurso.
Comentário: Tipo inclui termos descrevendo categorias gerais, funções,
espécies ou níveis de agregação para conteúdo. Recomendação para melhor
uso é selecionar valores de vocabulário controlado. Para descrever
manifestação física ou digital dos recursos, deve-se usar o elemento Formato.
Identificador: Format
Definição: A manifestação física ou digital do recurso.
Comentário: Tipicamente, formato pode incluir o tipo da mídia ou as
dimensões do recurso. O Formato pode ser usado para determinar o software,
hardware ou outro equipamento necessário para mostrar ou operar o recurso.
Exemplos de dimensões incluem tamanho e duração.
Identificador: Identifier
Definição: Uma referência não ambígua para o recurso dentro de um dado
contexto.
Comentário: A recomendação para melhor uso é identificar o recurso pelo
significado de uma string ou número conforme um sistema de identificação
formal. Exemplo de sistemas de identificação formal inclui o Identificador de
Uniforme de Recursos (Uniform Resource Identificador – URI) e outros.
Identificador: Source
Definição: Uma referência para o recurso do qual o presente recurso é
derivado.
Comentário: O presente recurso pode ser derivado de uma fonte de recurso
inteira ou em parte. A recomendação para melhor uso é identificar o recurso
pelo significado da string ou do número conforme o sistema de identificação
formal.
Identificador: Language
Definição: Uma língua do conteúdo intelectual do recurso.
Comentário: A recomendação para melhor uso dos valores do elemento
língua é definida pela RFC 1766 que inclui um código de língua em 2 letras
(do padrão ISO 639), seguido opcionalmente pelo código de país em 2 letras
também (do padrão ISO 3166).
Identificador: Relation
Definição: Uma referência para o recurso relacionado, como versão de um
7
14. Cobertura
15. Gerenciamento
de Direitos autorais
trabalho, tradução de um trabalho ou parte de um trabalho.
Comentário: A recomendação para melhor uso é referenciar o recurso pelo
significado da string ou do número conforme um sistema de identificação
formal.
Identificador: Coverage
Definição: O âmbito do conteúdo do recurso.
Comentário: Cobertura tipicamente inclui localização espacial (o nome de um
lugar ou suas coordenadas geográficas), período temporal (um rótulo, uma
data ou intervalo de datas do período) ou jurisdição (como o nome de uma
entidade administrativa). A recomendação para melhor uso é selecionar
valores de vocabulário controlado, como do Thesaurus de Nomes Geográficos
(TGN) e, quando for apropriado, nomes de lugares ou períodos de tempo são
usados em preferência a identificadores numéricos como conjunto de
coordenadas ou intervalo de tempo.
Identificador: Rights
Definição: Informações sobre direitos do recurso.
Comentário: Tipicamente, um elemento Direitos conterá uma declaração de
gerenciamento de direitos para o recurso. Informações de Direitos
frequentemente abrangem Direitos de Propriedade Intelectual (Intellectual
Property Rights - IPR), Copyright, e várias propriedades de Direitos.
Fonte: DCMI (2014, não paginado, tradução nossa).
Portanto, o Dublin Core possui como características: a simplicidade significa
que o Dublin Core pode ser facilmente gerado pelo responsável do documento; a
interoperabilidade semântica apresenta a caraterística que o Dublin Core é um
modelo unívoco que realiza uma interoperabilidade entre as áreas, ter o consenso
internacional, é que o padrão tem a participação de mais de vinte países na busca
por um escopo internacional na Web, a extensibilidade condiz que parte de uma
modelo simplificado de descrição, a flexibilidade sob a elaboração de modelos
permitindo que novos elementos possam ser acrescentados. (DCMI, 2014, não
paginado, tradução nossa).
3 PROCEDIMENTOS METODOLÓGICOS
Esse trabalho insere-se em uma pesquisa exploratória de caráter qualitativo
de cunho teórico e prático. A análise exploratória e descritiva da literatura disponível
sobre o tema proposto permite melhor aprofundamento teórico na área da Ciência
da Informação, em especial no campo da Representação Descritiva.
Dessa forma, o universo da pesquisa está pautado nos fundamentos da
catalogação,
no
estudo
do
tratamento
descritivo
da
informação
e
no
8
desenvolvimento da catalogação dos recursos informacionais, tendo como
instrumento de análise a estrutura do padrão de metadados Dublin Core e a
linguagem de marcação HyperText Markup Language (HTML).
4 ANÁLISE E DISCUSSÃO DOS RESULTADOS
Os metadados quando aplicados fora do seu contexto original, adquirem um
âmbito ainda mais expansivo. Na internet, os metadados podem ser incorporados à
linguagem HTML como “tags meta” e o uso dos metadados do padrão Dublin Core
facilita os usuários buscarem informações de uma maneira mais rápida e eficiente.
O HTML consiste em uma linguagem de marcação utilizada para produção de
páginas na Web e permite a criação de documentos que podem ser lidos em
praticamente qualquer tipo de computador e transmitidos pela internet.
Para escrever documentos HTML não é necessário mais do que um editor de
texto simples e conhecimento dos códigos que compõem a linguagem, também
denominados como tags. As tags servem para indicar a função de cada elemento da
página Web e funcionam como comandos de formatação de textos, formulários, links
(ligações), imagens, tabelas, entre outros. E os browsers (navegadores) são as
ferramentas que identificam as tags e apresentam a página conforme está
especificada e descrita. A linguagem HTML que atualmente se encontra na sua
quinta versão (HTML5) com novos recursos e principalmente a manipulação de
conteúdo gráfico e multimídia, suas variáveis ou evoluções, e permite basicamente,
a elaboração de três tarefas.
 A diagramação ou formatação do texto na forma deseja, que costa no
cabeçalho, títulos, parágrafos, ou lista de itens;
 A interligação (link) com outras páginas através de clique do mouse;
 A inserção de outros arquivos, contendo imagens, animação, som ou texto
no corpo do documento a ser exibido.
Os metadados em si, são encontrados em toda a expressão de uma página
em HTML, podem ser inseridos na maioria das vezes no cabeçalho do código fonte
dos documentos produzidos em tais recursos. E os padrões metadados
9
estabelecidos são similares aos elementos e estruturas de etiquetas meta
padronizadas em HTML.
A linguagem é precedida de comandos, e este comando devem estar
precedidos por um início e fim, como exemplo: <HTML>...</HTML>. Embora, não
seja de uso obrigatório alguns comandos possuem como função declarar que o
documento está nesta linguagem, sendo inserido no começo do documento e no
final. Logo, os metadados devem ser inseridos logo depois do título do documento,
que é a primeira fonte para a indexação de uma página e para a elaboração da lista
de endereço.
O comando <TITLE> é uma etiqueta que deve ser incluída quando o
documento necessita de um título. Recomenda-se o uso de um título curto e
informativo, este dado será apresentado na barra de título ou no canto superior à
direita da tela, dependendo do programa de visualização utilizado pelo usuário.
Dessa forma, cada campo do Dublin Core compreende em uma maneira
diferente das outras, como pode ser exemplificado pela descrição com base no
Dublin Core apresentada na figura1.
Figura 1 – Descrição utilizando o Dublin Core
Fonte: Código fonte do FRBR Blog. Disponível em: <http://www.frbr.org/>.
Logo, o HTML é uma linguagem de marcação simples para sua utilização e
que fornece recursos necessários para descrever, identificar, processar, localizar,
recuperar, e filtrar um objeto/ documento digital. Sendo assim, observa-se que
Dublin Core e HTML estão inteiramente relacionados, ou seja, HTML é uma
linguagem intrínseca à descrição na estrutura Dublin Core em páginas Web.
10
5 CONSIDERAÇÕES FINAIS
Como considerações finais, observa-se que o padrão Dublin Core apresenta
uma forma simples e composta por quinze elementos de identificação, que também
podem ser qualificados no acréscimo de outros elementos.
Os elementos qualificados do Dublin Core constituem-se em uma melhor
descrição e precisão semântica do recurso, que está sendo inseridos nos campos.
Contudo essa descrição mais aprofundada fica a critério do profissional da
informação, e da mesma forma, nos elementos de baixo denominador onde existe a
possibilidade de não utilizar todos os elementos apresentados pelo Dublin Core.
O HTML conjunto ao Dublin Core permite verificar que o padrão de
metadados aprimora a localização, representação e recuperação das informações
em ambiente Web assim permitindo maior aproveitamento de seus recursos. Da
mesma forma, essa interoperabilidade das fontes de informação na internet
demonstra a contribuição do trabalho do bibliotecário para que o conhecimento não
fique disperso ao que se constitui o meio digital.
Com este estudo, o uso do Dublin Core torna a representação descritiva dos
documentos mais ágil, flexível ao ambiente digital, buscando garantir o controle e o
acesso aos recursos nele descrito.
REFERÊNCIAS
ALVES, R. C. V. Metadados como elementos do processo de catalogação. 2010.
134 f. Tese (Doutorado em Ciência da Informação)– Faculdade de Filosofia e
Ciências, Universidade Estadual Paulista, Marília, 2010. Disponível em:
<http://www.marilia.unesp.br/Home/PosGraduacao/CienciadaInformacao/Dissertacoes/alves_rachel.pdf>. Acesso em: 01 jul.
2014.
BAPTISTA, A. A.; MACHADO, A. B. A utilização do Dublin Core qualificado na
descrição semântica de uma revista científica em linha. Departamento de
Sistema de Informação, Universidade do Minho, Guimarães, Portugal. 2014.
Disponível em: <http://repositorium.sdum.uminho.pt/handle/1822/381>. Acesso em:
15 mai. 2014.
CATARINO, M. E.; SOUZA, T. B. A representação descritiva no contexto da web
semântica. TransInformação, v. 24, n. 2, 2012. Disponível em:
<http://www.scielo.br/pdf/tinf/v24n2/a01v24n2.pdf>. Acesso em: 18 jul. 2014.
11
BUCKLAND, M. K. Descrição e pesquisa: metadados como infra-estrutura.
Brazillian Journal of Information Science, Marília, v. 0, n. 0, jul./dez. 2006.
Disponível em: <http://dialnet.unirioja.es/servlet/articulo?codigo=4366507>.Acesso
em: 14 mai. 2014.
DUBLIN CORE METADATA INICIATIVE (DCMI). Metadata Innovation. 2014.
Disponível em: <http://dublincore.org/>. Acesso em: 16 mai. 2014.
GRÁCIO, J. C. A. Metadados para a descrição de recursos da Internet: o padrão
Dublin Core, aplicações e a questão da interoperabilidade. 2002. 127 f. Dissertação
(Mestrado em Ciência da Informação)– Faculdade de Filosofia e Ciências,
Universidade Estadual Paulista, Marília, 2002. Disponível em:
<http://www.marilia.unesp.br/Home/PosGraduacao/CienciadaInformacao/Dissertacoes/gracio_jca_dr_mar.pdf>. Acesso em:
13 mai. 2014.
SANTOS, P. L. V. A. C.; SIMIONATO, A. C.; ARAKAKI, F. A. Definição de
metadados para recursos informacionais: apresentação da metodologia BEAM.
Informação & Informação, Londrina, v. 19, n. 146, 2014. Disponível em:
<http://www.uel.br/revistas/uel/index.php/informacao/article/view/15251>. Acesso
em: 13 mai. 2014.
SOUZA, M. I. F.; VENDRUSCULO, L. G.; MELO G. C. Metadados para descrição de
recursos de informação eletrônica: utilização do padrão Dublin Core. Ciência da
Informação, Brasília, v. 29, n. 1, p. 93-102, jan./abr. 2000. Disponível em:
<http://www.scielo.br/pdf/ci/v29n1/v29n1a10.pdf>. Acesso em: 13 mai. 2014.
Download