Adoção do Padrão Dublin Core para Metadados dos Dados

Transcrição

Adoção do Padrão Dublin Core para Metadados dos Dados
Proc. Int’l Conf. on Dublin Core and Metadata Applications 2015
Adoção do Padrão Dublin Core para Metadados dos Dados
Científicos Abertos: E-Quilt Prototype Experimento.
Adriana Carla S. de
Oliveira.
University of Knoxville,
United States of America
[email protected]
Guilherme Ataíde Dias.
Federal University of
Paraíba, Brazil
[email protected]
Virgínia M. de Souza.
Federal University of Paraíba, Brazil
[email protected]
Renata Lemos dos
Anjos.
Federal University of
Paraíba, Brazil
renatalemosdosanjos@g
mail.com
Pedro Luiz P. Corrêa.
University of São Paulo, Brazil
[email protected]
Keywords: ciência aberta; quarto paradigma; ciclo de vida dos dados; padrão Dublin Core
1. Quarto Paradigma e os Dados Abertos
O estado da arte da comunicação científica está centrado no quarto paradigma. Traduz em sua
essência a ciência aberta, os dados científicos abertos e o gerenciamento, compartilhamento,
agregação, curadoria, preservação e cooperação científica, para uso e reuso de pesquisas
científicas. Estamos na era dos dados intensivos. Hey apud Specht (2015) corrobora,
This one of the greatest motivations for the re-use of existing data for knowledge
creation. With the advancement of technology in capturing and processing data, we have
reached the fourth paradigm of data-intensive science and communication, where
collaboration between different domain skill sets is required to successfully conduct
meta-analysis. (Hey apud Specht, 2015).
Os dados intensivos no quarto paradigma reforçam a necessidade de aprimorar as habilidades e
adotar tecnologias, ferramentas e metodologias colaborativas para o contexto da ciência aberta.
Open-data has created an unprecedented opportunity with new challenges for ecosystem
scientists. Skills in data management are essential to acquire, manage, publish, access and
re-use data. These skills span many disciplines and require trans-disciplinary
collaboration. (Specht et al., 2015, p.1)
A pesquisa em andamento se apoia no modelo do ciclo de vida dos dados e no quarto
paradigma. O ciclo de vida dos dados adotado para o desenvolvimento dos estágios do
experimento e-Quilt Prototype é o Data Lifecycle desenvolvido pela DataONE. Este ciclo é
representado por 8 estágios. Tenopir et al. (2011, p. 2) ressalta a importância do modelo,
The collected data are processed through scientific data management and following the
data lifecycle model. Different elements can be found in a dataset. For describing the
dataset, it is necessary the adoption of metadata standards, follow the data lifecycle for its
management and ensure their use and reuse in a long-term. In this way, “the data
lifecycle cannot be considered independently from research lifecycle, as data are an
indispensable element of scientific research.
O gerenciamento de dados científicos abertos está demonstrado na Figura 1.
223
Proc. Int’l Conf. on Dublin Core and Metadata Applications 2015
FIG. 1. Data Lifecycle.
Essa fase do experimento está apoiada no estágio Describe. Os dados compartilhados no eQuilt Prototype é resultado da pesquisa intitulada, levantamento epidemiológico em saúde bucal,
desenvolvida pelo Departamento de Odontologia Social da UFPB, realizado nas cidades de
Caaporã e João Pessoa, Paraíba, Brasil, no período de 2013-2015. Os dados primários coletados
em campos foram compartilhados no protótipo e estão sendo tratados nos moldes do Data
Lifecycle.
TABELA 1: Sistemática de descrição dos metadados
FASE
1
Aplicação do Padrão Dublin Core ao
Recurso Áudio do e-Quilt Prototype
Descrição dos metadados com base nos 22
elementos e recursos do padrão
FASE
2
Aplicação dos metadados no Dublin
Core Advanced Generation
Geração automática do código de metadados
FASE
3
Análise de adequação dos
metadados do Recurso Áudio
Aplicação do critério de conformidade do
recurso ao padrão Dublin Core
Adotou-se para descrição dos metadados contidos no e-Quilt Prototype, os 22 elementos do
padrão Dublin Core e a ferramenta para geração automática Dublin Core Advanced Generation.
1.1. Resultados Parciais
O e-Quilt Prototype possui os elementos suficientes para a descrição de metadados em
conformidade com um padrão internacional. Observou que os sub-elementos e recursos sugeridos
no padrão Dublin Core são passíveis de serem adotados aos metadados do recurso analisado,
como demonstrado na Tabela 2.
TABELA 2: Análise de adequação do recurso ‘áudio’ do e-Quilt Prototype aos elementos do Padrão DC.
ATRIBUTO DE ADEQUAÇÃO DO RECURSO ÁUDIO
CRITÉRIOS
Em conformidade
Em conformidade parcial
ELEMENTOS DC
20
2
CITÉRIOS
Não conformidade
Não se aplica
ELEMENTOS DC
0
0
Os elementos Identifier e Rights do recurso apresentaram conformidade parcial ao padrão. No
elemento Identifier, os sub-elementos DOI e ISBN não possuem atribuição. O recurso analisado é
derivado do protótipo que não possui DOI, e o ISBN não se aplica a este recurso, pois o mesmo é
aplicável a recursos impressos. O elemento Rights, apresentou conformidade parcial no subelemento Licence e foi descrito como não atribuído. Informou-se nos metadados que a base da
legislação que rege a proteção autoral do recurso áudio está em consonância com a Lei de
Direitos Autorais (LDA) n. 9.610-1998 – Brasil. Essa análise se pauta pela adoção de uma licença
pública aplicável a publicações eletrônicas e de abrangência internacional.
224
Proc. Int’l Conf. on Dublin Core and Metadata Applications 2015
O recurso áudio é derivado do recurso principal artigo, ambos contidos na ambiência do eQuilt Prototype. Para o recurso áudio foi analisado que o mesmo possui uma adequação
considerável ao padrão Dublin Core. E quanto à ferramenta Dublin Core Advanced Generation
adotada, observou-se que a mesma possui limitação quanto à limpeza automática de caracteres
(símbolos, acentos etc.) que devem ser desprezados manualmente durante a descrição dos
metadados. Por fim, analisou-se que a descrição dos metadados é um processo de detalhamento
que requer a adoção de critérios de qualidade e validação dos dados.
References
DataONE. Data Life Cycle model. Disponível em: <https://www.dataone.org> Acessed: 2015 Mar 15.
Dublin Core Metadata Initiative. Dublin Core Metadata Element Set, version 1.1. (2014) Available:
http://dublincore.org/documents/dces/. Accessed 2015 Mar 15.
Specht, A., et al., Data management challenges in analysis and synthesis in the ecosystem sciences, Sci Total Environ
(2015), http://dx.doi.org/10.1016/j.scitotenv.2015.03.092 Accessed: 2015 Mar 05.
Tenopir, C., Allard, S., Douglass, K., Aydinoglu, A. U. et al (June 2011). Data Sharing by Scientists: Practices and
Perceptions,
PLoS
ONE.
Volume
6,
Issue
6.
Available:
http://www.plosone.org/article/info%3Adoi%2F10.1371%2Fjournal.pone.0021101 Accessed: 2015 Mar 06.
225