1 Eixo Temático: Organização e Representação da Informação e do Conhecimento O PADRÃO DE METADADOS DUBLIN CORE: A REPRESENTAÇÃO DESCRITIVA EM HTML1 Bill Alexander Santos da Silva2 Juliana Marques do Amaral3 Nayara Ghiovana Stanganelli4 RESUMO Em razão de solucionar as formas de recuperação e acesso aos recursos armazenados na Web foi criado o padrão de metadados Dublin Core, apresentando uma estrutura simples, flexível, padronizada e com consenso internacional para sua utilização. Por meio de uma análise exploratória e descritiva da literatura disponível, o objetivo desse trabalho é apresentar o Dublin Core e verificar a representação do recurso informacional, inserido ao Hyper Text Markup Language (HTML). Considerando as características de sua estrutura, os resultados mostram que o Dublin Core possui um grande potencial de substituir os métodos anteriores de representação para o ambiente Web. Palavras-chave: Dublin Core. HTML. Padrão de metadados. Descrição de recursos informacionais digitais. 1 INTRODUÇÃO E OBJETIVOS A tecnologia tem o papel de potencializar a inteligência humana, fornece condições para que a pessoas criem e disseminem seus conhecimentos em ambientes colaborativos. Além disso, possibilita diversos tipos de interação e dinâmica. Atualmente os meios de comunicação estão inseridos dentro de uma macromídia, denominada plataforma Web. O surgimento de ferramentas que permitem a construção rápida de páginas e websites culminou em uma aceleração constante, exponencial e descontrolada de 1 Trabalho desenvolvido durante a disciplina optativa “2BIB996 - Metadados e interoperabilidade” da graduação de Biblioteconomia e ministrada pela Profa. Ana Carolina Simionato, durante o período de março a julho de 2014, na Universidade Estadual de Londrina (UEL). 2 Graduando do Curso de Biblioteconomia – UEL. Email: [email protected] 3 Graduando do Curso de Biblioteconomia – UEL. Email: [email protected] 4 Graduando do Curso de Biblioteconomia – UEL. Email: [email protected] 2 diferentes tipos de recursos informacionais na Web, incluindo os recursos como os websites. Essa produção gera um caos informacional e consequentemente, tarefas como a identificação, organização e busca de informações se tornam importantes para que possa recuperar e acessar o que se deseja. E além disso, otimiza as formas de navegação dentro dos sistemas informacionais. Nesse sentido, várias iniciativas estão sendo conduzidas e assim, tendo em vista as formas descritivas para garantir o acesso aos documentos, esse estudo procura refletir sobre como: a representação descritiva auxilia nas formas de recuperação e acesso na plataforma Web? Para tanto, os padrões mais flexíveis e eficientes para descrição de recursos, como o Dublin Core, apresentam uma estrutura capaz de garantir o acesso do recurso e facilitar a interoperabilidade entre os metadados. Dessa forma, a partir de uma revisão bibliográfica da literatura realizada sobre o padrão de metadados Dublin Core e sobre a linguagem de marcação Hyper Text Markup Language (HTML), o objetivo do estudo é verificar que o uso do padrão Dublin Core em websites construídos com base na linguagem HTML possibilitam a otimização do acesso e recuperação dos recursos. Logo, esse estudo contribui com a literatura sobre o tema, além de esclarecer sobre a representação descritiva na plataforma Web. 2 PRESSUPOSTOS TEÓRICOS As tecnologias modificam a relação dos profissionais da informação com a forma de tratar a informação gerada e corporificada em recursos, entre essa relação ocasionam as principais mudanças relacionadas à informação e à tecnologia, como exemplo a produção acentuada de recursos informacionais. E consequentemente, na mesma proporção, a relação dos usuários no processo de localização, uso e reuso desses recursos informacionais. Os recursos informacionais [...] refere-se a informação objetivada no contexto de um campo do conhecimento podendo ser apresentado em uma estrutura analógica e/ou digital, com valor informacional que caracteriza a sua concepção intelectual expressa na corporificação de manifestações estruturadas na forma de itens. O recurso informacional também é nominado de: 3 ‘item informacional’, ‘informação registrada’, ‘coisa física, ou uma coisa não-física’ e ‘artefato’. (SANTOS; SIMIONATO; ARAKAKI, 2014, p. 148). Para tanto, o volume informacional causa um aspecto problemático: a dificuldade entre os processos de identificação, organização, busca, recuperação, acesso e uso das informações em ambientes digitais. (ALVES, 2010). Nesse sentido, para que o acesso às informações estocadas possa atender ao usuário na realização de suas pesquisas, a informação e os recursos devem ser corretamente e adequadamente descritas. Dessa forma, a Ciência da Informação e a Biblioteconomia têm buscado soluções em melhorar as formas de representação e recuperação da informação, tanto em ambientes físicos como as bibliotecas e centros de informação, e também ambientes digitais, como exemplo os websites da plataforma Web. A catalogação como disciplina contida na Ciência da Informação e a Biblioteconomia é definido como um processo que [...] descreve formalmente um documento do recurso e se estabelece um variado e variável número de pontos de acesso, objetivando proporcionar, ao usuário final, a condição de encontrar, identificar, selecionar e obter o documento ou descrito, ou a informação nele contida. (CATARINO; SOUZA, 2012, p. 84) E para que possa estabelecer pontos de acesso adequados a descrição necessita de padronização da informação na Web por meio de metadados e seus padrões. Os metadados definem-se pela forma mais conhecida: ‘dados sobre dados’. Conforme explica Grácio (2002) os metadados são elementos que descrevem as informações contidas em um recurso, com o objetivo de possibilitar sua busca e recuperação. Este conceito explica como toda informação armazenada eletronicamente pode ser acessada e recuperada com precisão independente do seu formato, como texto, imagem, som, vídeo, e outros tipos de recurso. Os metadados estão presentes na maioria dos sistemas de informação em uma variedade de tipos e níveis, e a sua aplicação e efetivação corresponde ao tipo de ambiente informacional. 4 E nesse sentido, os metadados precisam ser padronizados, ou seja, devem utilizar um formato padrão e terminologia própria e também um número de elementos descritivos que pode ser variável de acordo com o padrão. Esses elementos devem seguir esquemas de codificação que sejam usuais e comuns, como o uso de vocabulário controlado, esquemas de classificação e formatos de descrição formais, permitindo dessa forma o compartilhamento desses metadados entre diferentes instituições. Segundo Buckland (2006) a utilização dos formatos padronizados para armazenamento e exibição torna mais fácil o acesso aos documentos. E portanto, os metadados sejam eles padrões nacionais ou internacionais, precisam ser cuidadosamente elaborados, permitindo o tratamento adequado e acessibilidade às informações de um recurso. Assim, surgem iniciativas importantes para solucionar o problema de descrição de recursos na Web, como o padrão de metadados Dublin Core que tem aplicação internacional para descrição de documentos eletrônicos. Seu desenvolvimento teve sua origem na 2ª Conferência Internacional sobre a World Wide Web (WWW) em 1994 na cidade de Chicago, onde Yuri Rubinsky, Stuart Weibel e Eric Miller, ambos da Online Computer Library Center (OCLC) e Joe Hardin da National Center for Supercomputing Applications (NCSA), promoveram uma discussão sobre semântica e Web (GRÁCIO, 2002). Em 1995 foi criado o Dublin Core e, no ano seguinte, a sua instituição base a Dublin Core Metadata Initiative (DCMI). O Dublin Core foi nomeado dessa forma, pois o primeiro evento se dava em Dublin, Ohio nos Estados Unidos e Core, por conter os metadados essenciais para qualquer descrição. (GRÁCIO, 2002). E podese predispor que o Dublin Core contemporiza a uma iniciativa criada para catalogação de recursos eletrônicos na Web, com uma proposta de expandir a representação e aperfeiçoando a recuperação de documentos em outros domínios, que não os bibliográficos. A Dublin Core Metadata Initiative tem reunido profissionais de diversas áreas e países para trabalharem juntos nas discussões sobre como os metadados podem ajudar a resolver a falta de descrição das informações no meio eletrônico. E a partir dessas discussões também levou o DCMI a organizar, no ano seguinte (1996) e se 5 repetindo até hoje, um evento chamado OCLC/NCSA Metadada Workshop (GRÁCIO, 2002). E durante os primeiros OCLC/NCSA Metadada Workshop principal discussão era o conjunto mínimo de elementos descritivos que representariam os recursos da Web. Segundo Grácio (2002) durante este primeiro evento, muitos participantes reconheceram a dificuldade de trabalhar com padrões que possuíssem muitos elementos e procuraram determinar uma relação de elementos não exaustiva e tediosa para descrever os recursos de rede. O Dublin Core possui um conjunto de 15 elementos para descrição. E esses elementos designam aos objetivos propostos e são suficientemente amplos e flexíveis para ser utilizados nas mais diversas situações (BAPTISTA; MACHADO, 1999). E segundo Souza; Vendrusculo e Melo (2000, p. 93) “O conjunto de metadados descrito pelo DC é composto de quinze elementos, os quais poderiam ser descritos como o mais baixo denominador comum para descrição de recurso (equivalente a uma ficha catalográfica)”. A seguir, no quadro 1, é representado cada um dos quinze elementos componentes do Dublin Core. Quadro 1 – Os quinze elementos do padrão Dublin Core e a definição de valores Elementos do Dublin Core 1. Título 2. Autor 3. Assunto/palavraschave 4. Descrição Definição do valor Identificador: Title Definição: Um nome dado para o recurso Comentário: Tipicamente, um título será o nome pelo qual o recurso é formalmente conhecido, podendo ser o próprio título. Identificador: Creator Definição: Uma entidade primeiramente responsável pelo conteúdo dos recursos. Comentário: Em autor incluem uma pessoa, uma organização ou um serviço. Identificador: Subject Definição: O tema (objeto ou ponto principal) do conteúdo do recurso. Comentário: Tipicamente, um Assunto será expresso com palavras-chave, descritores ou códigos de classificação que descrevem o tema do recurso (indica o conteúdo informativo). Identificador: Description Definição: Um relato do conteúdo do recurso. Comentário: Descrição pode incluir (mas não é limitado) a um “abstract”, tabelas de conteúdo, referências para uma representação de conteúdo ou um texto livre de relato do conteúdo. 6 5. Editor 6. Colaborador 7. Data 8. Tipo do recurso 9. Formato 10. Identificador do recurso 11. Fonte 12. Língua 13. Relação Identificador: Publisher Definição: Uma entidade responsável por tornar o recursodisponível. Comentário: No editor incluem uma pessoa, uma organização ou um serviço. Tipicamente, o nome de um editor deve ser usado para indicar a entidade. Identificador: Contributor Definição: Uma entidade responsável por fazer contribuiçõespara o conteúdo do recurso. Comentário: Exemplos de um Colaborador incluem uma pessoa, uma organização ou um serviço. Tipicamente, o nome do colaborador deve ser usado para indicar a entidade. Identificador: Date Definição: Uma data associada com um evento no ciclo de vida do recurso. Comentário: Tipicamente, data seráassociada com a criação ou a disponibilização do recurso. Recomendação para melhor uso de codificação dos valores de data é definido na norma ISO 8601 e segue o formato YYYYMM-DD, onde YYYY é o ano, MM é o mês e DD o dia. Identificador: Type Definição: A natureza ou a espécie do conteúdo do recurso. Comentário: Tipo inclui termos descrevendo categorias gerais, funções, espécies ou níveis de agregação para conteúdo. Recomendação para melhor uso é selecionar valores de vocabulário controlado. Para descrever manifestação física ou digital dos recursos, deve-se usar o elemento Formato. Identificador: Format Definição: A manifestação física ou digital do recurso. Comentário: Tipicamente, formato pode incluir o tipo da mídia ou as dimensões do recurso. O Formato pode ser usado para determinar o software, hardware ou outro equipamento necessário para mostrar ou operar o recurso. Exemplos de dimensões incluem tamanho e duração. Identificador: Identifier Definição: Uma referência não ambígua para o recurso dentro de um dado contexto. Comentário: A recomendação para melhor uso é identificar o recurso pelo significado de uma string ou número conforme um sistema de identificação formal. Exemplo de sistemas de identificação formal inclui o Identificador de Uniforme de Recursos (Uniform Resource Identificador – URI) e outros. Identificador: Source Definição: Uma referência para o recurso do qual o presente recurso é derivado. Comentário: O presente recurso pode ser derivado de uma fonte de recurso inteira ou em parte. A recomendação para melhor uso é identificar o recurso pelo significado da string ou do número conforme o sistema de identificação formal. Identificador: Language Definição: Uma língua do conteúdo intelectual do recurso. Comentário: A recomendação para melhor uso dos valores do elemento língua é definida pela RFC 1766 que inclui um código de língua em 2 letras (do padrão ISO 639), seguido opcionalmente pelo código de país em 2 letras também (do padrão ISO 3166). Identificador: Relation Definição: Uma referência para o recurso relacionado, como versão de um 7 14. Cobertura 15. Gerenciamento de Direitos autorais trabalho, tradução de um trabalho ou parte de um trabalho. Comentário: A recomendação para melhor uso é referenciar o recurso pelo significado da string ou do número conforme um sistema de identificação formal. Identificador: Coverage Definição: O âmbito do conteúdo do recurso. Comentário: Cobertura tipicamente inclui localização espacial (o nome de um lugar ou suas coordenadas geográficas), período temporal (um rótulo, uma data ou intervalo de datas do período) ou jurisdição (como o nome de uma entidade administrativa). A recomendação para melhor uso é selecionar valores de vocabulário controlado, como do Thesaurus de Nomes Geográficos (TGN) e, quando for apropriado, nomes de lugares ou períodos de tempo são usados em preferência a identificadores numéricos como conjunto de coordenadas ou intervalo de tempo. Identificador: Rights Definição: Informações sobre direitos do recurso. Comentário: Tipicamente, um elemento Direitos conterá uma declaração de gerenciamento de direitos para o recurso. Informações de Direitos frequentemente abrangem Direitos de Propriedade Intelectual (Intellectual Property Rights - IPR), Copyright, e várias propriedades de Direitos. Fonte: DCMI (2014, não paginado, tradução nossa). Portanto, o Dublin Core possui como características: a simplicidade significa que o Dublin Core pode ser facilmente gerado pelo responsável do documento; a interoperabilidade semântica apresenta a caraterística que o Dublin Core é um modelo unívoco que realiza uma interoperabilidade entre as áreas, ter o consenso internacional, é que o padrão tem a participação de mais de vinte países na busca por um escopo internacional na Web, a extensibilidade condiz que parte de uma modelo simplificado de descrição, a flexibilidade sob a elaboração de modelos permitindo que novos elementos possam ser acrescentados. (DCMI, 2014, não paginado, tradução nossa). 3 PROCEDIMENTOS METODOLÓGICOS Esse trabalho insere-se em uma pesquisa exploratória de caráter qualitativo de cunho teórico e prático. A análise exploratória e descritiva da literatura disponível sobre o tema proposto permite melhor aprofundamento teórico na área da Ciência da Informação, em especial no campo da Representação Descritiva. Dessa forma, o universo da pesquisa está pautado nos fundamentos da catalogação, no estudo do tratamento descritivo da informação e no 8 desenvolvimento da catalogação dos recursos informacionais, tendo como instrumento de análise a estrutura do padrão de metadados Dublin Core e a linguagem de marcação HyperText Markup Language (HTML). 4 ANÁLISE E DISCUSSÃO DOS RESULTADOS Os metadados quando aplicados fora do seu contexto original, adquirem um âmbito ainda mais expansivo. Na internet, os metadados podem ser incorporados à linguagem HTML como “tags meta” e o uso dos metadados do padrão Dublin Core facilita os usuários buscarem informações de uma maneira mais rápida e eficiente. O HTML consiste em uma linguagem de marcação utilizada para produção de páginas na Web e permite a criação de documentos que podem ser lidos em praticamente qualquer tipo de computador e transmitidos pela internet. Para escrever documentos HTML não é necessário mais do que um editor de texto simples e conhecimento dos códigos que compõem a linguagem, também denominados como tags. As tags servem para indicar a função de cada elemento da página Web e funcionam como comandos de formatação de textos, formulários, links (ligações), imagens, tabelas, entre outros. E os browsers (navegadores) são as ferramentas que identificam as tags e apresentam a página conforme está especificada e descrita. A linguagem HTML que atualmente se encontra na sua quinta versão (HTML5) com novos recursos e principalmente a manipulação de conteúdo gráfico e multimídia, suas variáveis ou evoluções, e permite basicamente, a elaboração de três tarefas. A diagramação ou formatação do texto na forma deseja, que costa no cabeçalho, títulos, parágrafos, ou lista de itens; A interligação (link) com outras páginas através de clique do mouse; A inserção de outros arquivos, contendo imagens, animação, som ou texto no corpo do documento a ser exibido. Os metadados em si, são encontrados em toda a expressão de uma página em HTML, podem ser inseridos na maioria das vezes no cabeçalho do código fonte dos documentos produzidos em tais recursos. E os padrões metadados 9 estabelecidos são similares aos elementos e estruturas de etiquetas meta padronizadas em HTML. A linguagem é precedida de comandos, e este comando devem estar precedidos por um início e fim, como exemplo: <HTML>...</HTML>. Embora, não seja de uso obrigatório alguns comandos possuem como função declarar que o documento está nesta linguagem, sendo inserido no começo do documento e no final. Logo, os metadados devem ser inseridos logo depois do título do documento, que é a primeira fonte para a indexação de uma página e para a elaboração da lista de endereço. O comando <TITLE> é uma etiqueta que deve ser incluída quando o documento necessita de um título. Recomenda-se o uso de um título curto e informativo, este dado será apresentado na barra de título ou no canto superior à direita da tela, dependendo do programa de visualização utilizado pelo usuário. Dessa forma, cada campo do Dublin Core compreende em uma maneira diferente das outras, como pode ser exemplificado pela descrição com base no Dublin Core apresentada na figura1. Figura 1 – Descrição utilizando o Dublin Core Fonte: Código fonte do FRBR Blog. Disponível em: <http://www.frbr.org/>. Logo, o HTML é uma linguagem de marcação simples para sua utilização e que fornece recursos necessários para descrever, identificar, processar, localizar, recuperar, e filtrar um objeto/ documento digital. Sendo assim, observa-se que Dublin Core e HTML estão inteiramente relacionados, ou seja, HTML é uma linguagem intrínseca à descrição na estrutura Dublin Core em páginas Web. 10 5 CONSIDERAÇÕES FINAIS Como considerações finais, observa-se que o padrão Dublin Core apresenta uma forma simples e composta por quinze elementos de identificação, que também podem ser qualificados no acréscimo de outros elementos. Os elementos qualificados do Dublin Core constituem-se em uma melhor descrição e precisão semântica do recurso, que está sendo inseridos nos campos. Contudo essa descrição mais aprofundada fica a critério do profissional da informação, e da mesma forma, nos elementos de baixo denominador onde existe a possibilidade de não utilizar todos os elementos apresentados pelo Dublin Core. O HTML conjunto ao Dublin Core permite verificar que o padrão de metadados aprimora a localização, representação e recuperação das informações em ambiente Web assim permitindo maior aproveitamento de seus recursos. Da mesma forma, essa interoperabilidade das fontes de informação na internet demonstra a contribuição do trabalho do bibliotecário para que o conhecimento não fique disperso ao que se constitui o meio digital. Com este estudo, o uso do Dublin Core torna a representação descritiva dos documentos mais ágil, flexível ao ambiente digital, buscando garantir o controle e o acesso aos recursos nele descrito. REFERÊNCIAS ALVES, R. C. V. Metadados como elementos do processo de catalogação. 2010. 134 f. Tese (Doutorado em Ciência da Informação)– Faculdade de Filosofia e Ciências, Universidade Estadual Paulista, Marília, 2010. Disponível em: <http://www.marilia.unesp.br/Home/PosGraduacao/CienciadaInformacao/Dissertacoes/alves_rachel.pdf>. Acesso em: 01 jul. 2014. BAPTISTA, A. A.; MACHADO, A. B. A utilização do Dublin Core qualificado na descrição semântica de uma revista científica em linha. Departamento de Sistema de Informação, Universidade do Minho, Guimarães, Portugal. 2014. Disponível em: <http://repositorium.sdum.uminho.pt/handle/1822/381>. Acesso em: 15 mai. 2014. CATARINO, M. E.; SOUZA, T. B. A representação descritiva no contexto da web semântica. TransInformação, v. 24, n. 2, 2012. Disponível em: <http://www.scielo.br/pdf/tinf/v24n2/a01v24n2.pdf>. Acesso em: 18 jul. 2014. 11 BUCKLAND, M. K. Descrição e pesquisa: metadados como infra-estrutura. Brazillian Journal of Information Science, Marília, v. 0, n. 0, jul./dez. 2006. Disponível em: <http://dialnet.unirioja.es/servlet/articulo?codigo=4366507>.Acesso em: 14 mai. 2014. DUBLIN CORE METADATA INICIATIVE (DCMI). Metadata Innovation. 2014. Disponível em: <http://dublincore.org/>. Acesso em: 16 mai. 2014. GRÁCIO, J. C. A. Metadados para a descrição de recursos da Internet: o padrão Dublin Core, aplicações e a questão da interoperabilidade. 2002. 127 f. Dissertação (Mestrado em Ciência da Informação)– Faculdade de Filosofia e Ciências, Universidade Estadual Paulista, Marília, 2002. Disponível em: <http://www.marilia.unesp.br/Home/PosGraduacao/CienciadaInformacao/Dissertacoes/gracio_jca_dr_mar.pdf>. Acesso em: 13 mai. 2014. SANTOS, P. L. V. A. C.; SIMIONATO, A. C.; ARAKAKI, F. A. Definição de metadados para recursos informacionais: apresentação da metodologia BEAM. Informação & Informação, Londrina, v. 19, n. 146, 2014. Disponível em: <http://www.uel.br/revistas/uel/index.php/informacao/article/view/15251>. Acesso em: 13 mai. 2014. SOUZA, M. I. F.; VENDRUSCULO, L. G.; MELO G. C. Metadados para descrição de recursos de informação eletrônica: utilização do padrão Dublin Core. Ciência da Informação, Brasília, v. 29, n. 1, p. 93-102, jan./abr. 2000. Disponível em: <http://www.scielo.br/pdf/ci/v29n1/v29n1a10.pdf>. Acesso em: 13 mai. 2014.