E-Quilt Prototype - Dublin Core® Metadata Initiative

Transcrição

E-Quilt Prototype - Dublin Core® Metadata Initiative
ADOÇÃO DO PADRÃO DUBLIN CORE
PARA GERENCIAMENTO DE DADOS
CIENTÍFICOS: um experimento
E-Quilt Prototype
THE ADOPTION OF DUBLIN CORE STANDARD FOR SCIENTIFIC
DATA MANAGEMENT: an E-Quilt Prototype Experiment
Adriana Carla S. de Oliveira
Guilherme Ataíde Dias
Renata Lemos dos Anjos
Vírginia Miranda de Souza
Universidade Federal da Paraíba/PPGCI
[email protected]
Universidade Federal da Paraíba/MPGOA
[email protected]
Universidade Federal da Paraíba
[email protected]
Universidade Federal da Paraíba
[email protected]
Apresentação
O poster é um extrato da pesquisa de doutorado que apresenta o estado contemporâneo da comunicação
científica e do quarto paradigma baseado no data sharing e no data management. A infraestrutura tecnológica,
padrões, protocolos e metodologias são essenciais para a ciência inovadora e aberta na perspectiva da eScience.
Concomitante a feitura da tese, está em desenvolvimento um experimento de pesquisa chamado e-Quilt Prototype. O
e-Quilt está apoiado no data life cycle model e nas tecnologias que apoiam o data sharing e o management. O objetivo
desse pôster é apresentar a adoção do padrão e ferramenta Dublin Core para a descrição de metadados de dados
científicos abertos. Foi utilizado o método quadripolar, a técnica de pesquisa exploratória, descritiva e experimental e
a abordagem qualitativa. Adotou-se o modelo data life cycle do DataONE para o processo de gerenciamento dos dados.
A análise foi focada na adequação de conformidade dos metadados dos dados científicos contidos no e-Quilt Prototype
ao elementos do padrão Dublin Core. A amostragem foi realizada com o recurso no formato sonoro e do tipo áudio.
O estado da arte contemporâneo baseado no Forth
Paradigm e no Open Science Data Management
O estado da arte da comunicação científica está centrado no chamado Forth Paradigm (Quarto Paradigma) da
eScience. Este paradigma traduz em sua essência a ciência aberta e inovadora baseada em dados primários de pesquisa
e nas questões que envolvem o gerenciamento, compartilhamento, agregação, curadoria, preservação e cooperação
científica, para uso e reuso de investigações científicas a longo prazo.
A pesquisa em andamento se apóia no data life cycle model. O ciclo de vida dos dados adotado para o
desenvolvimento dos estágios do experimento e-Quilt Prototype é o Data Lifecycle desenvolvido pelo DataONE conforme
demonstrado na figura 1.
FASE 1:
Aplicação do Padrão Dublin Core
ao Recurso Áudio do e-Quilt Prototype
FASE 2:
Aplicação dos metadados no
Dublin Core Advanced Generation
FASE 3:
Análise de adequação dos
metadados do Recurso Áudio
Descrição dos metadados com base
nos 22 elementos e recursos do padrão
Geração automática do código de metadados
Aplicação do critério de conformidade
do recurso ao padrão Dublin Core
Figura 3 - Sistemática de descrição dos metadados
Fonte: Elaborado pelos autores (2015).
Adotou-se para descrição dos metadados o recurso 'áudio' disposto no e-Quilt Prototype. Foram analisados os
22 (vinte e dois) elementos do padrão Dublin Core considerando a adequação ao recurso. A ferramenta Dublin Core
Advanced Generation foi utilizada para geração automática dos códigos de metadados.
Análise da adoção do padrão Dublin Core ao e-Quilt Prototype
1. Considerando-se apenas o recurso áudio contido no e-Quilt Prototype para esta fase da pesquisa, constatou-se
que os metadados descritos e analisados com o padrão Dublin Core possuem conformidade internacional.
2. Foi constatado que os subelementos e recursos adotados de acordo com o padrão Dublin Core pode ser
adotados aos metadados do recurso áudio numa perspectiva da eScience.
3. Dos 22 (vinte e dois) elementos do padrão analisados e aplicados ao recurso áudio, apenas 02 (dois)
elementos apresentaram o critério de 'conformidade parcial', conforme demonstrado na tabela 1.
Tabela 1. Análise de adequação do recurso ‘áudio’ do e-Quilt Prototype aos elementos do Padrão DC
Figura 1 - Data Lifecycle Model
Fonte: DataONE (2015).
Fonte: Elaborado pelos autores (2015).
O modelo Data Lifecycle é representado por 8 (oito) estágios dentro de toda a cadeia do ciclo de vida dos dados
do experimento de pesquisa.
Sistemática do experimento e-Quilt Prototype
MO
DE
LO
CIENTÍFICA BAS
O
Ã
EA
AÇ
C
DO
I
N
U
NO
M
O
EC
Plan
CE
EN
CI
ES
D
Esta fase do experimento está apoiada no estágio Describe e reflete a descrição dos metadados do recurso
áudio conforme demonstrada na figura 2.
Analyze
Collect
Integrate
Assure
Discover
Describe
4. Os elementos Identifier e Rights do recurso áudio analisados de acordo com o padrão apresentaram
conformidade parcial.
5. No elemento Identifier que se divide nos subelementos DOI e ISBN, constatou-se que ambos não possuem atribuição.
6. Quanto ao subelemento identificador DOI não teve atribuição, pois o áudio é um recurso derivado do
protótipo. Sendo assim o identificador deve ser atribuído a ao recurso principal.
7. O identificador ISBN não se aplica a este recurso, pois o mesmo é aplicável a recursos de natureza impressa.
8. O elemento Rights apresentou 'conformidade parcial' em virtude da Lei de Direitos Autorais (LDA) em
vigência no Brasil não possuir menção à proteção autoral de áudio em uma ambiência aberta e compartilhada.
9. O subelemento Licence 'não possui conformidade' com o padrão. A análise se pauta pela necessidade de
se adotar uma licença pública aplicável aos dados de pesquisa compartilhados e abertos com abrangência
internacional. Esta licença será adotada em outra fase do experimento.
Resultados Parciais
1. O recurso áudio é derivado do recurso principal artigo, ambos contidos na ambiência do e-Quilt Prototype. Para
o recurso áudio constatou-se que o mesmo possui uma adequação considerável ao padrão Dublin Core. Essa etapa
de descrição atendeu ao estágio Describe do modelo do Data Life Cycle.
2. Quanto a ferramenta Dublin Core Advanced Generation adotada, observou-se que a mesma possui limitação
quanto a limpeza automática de caracteres (símbolos, acentos, colchetes etc.) que devem ser desprezados durante
a descrição dos metadados. Esse procedimento foi realizado manualmente.
3. Por fim, analisou-se que a descrição dos metadados é um processo de detalhamento que requer a adoção de critérios
de qualidade e validação dos dados. Pode ser adotada para este estágio guidelines e boas práticas que já são aplicadas
no cenário internacional.
Preserve
P
e
DA
DOS
CIENTÍFICOS AB
S
O
T
ER
Figura 2 – Estágio Describe do Data Lifecycle model.
Fonte: Adaptado do Data Life Cycle Model do DataONE (2015).
Os dados primários coletados em campo foram compartilhados no e-Quilt Prototype e estão sendo tratados nos
moldes do Data Lifecycle. A sistemática adotada para a descrição dos metadados do recurso áudio foi desenvolvida
em 3 (três) fases conforme representada na figura 3.
Referências
California Digital Library (2015) Available: http://www.cdlib.org/groups/rmg/. Accessed: 2015 Mar 05.
DataONE. Data Life Cycle model. Disponível em: https://www.dataone.org. Accessed: 2015 Mar 05.
Dublin Core Metadata Initiative. Dublin Core Metadata Element Set, version 1.1. (2014) Available:
http://dublincore.org/documents/dces/. Accessed: 2015 Mar 15.
Tenopir, C., Allard, S., Douglass, K., Aydinoglu, A. U. et al. Data Sharing by Scientists: Practices and Perceptions,
PLoS ONE. Volume 6, Issue 6. Available: http://www.plosone.org/article/info%3Adoi%2F10.1371%2Fjournal.pone.
0021101. Accessed: 2015 Mar 15.

Documentos relacionados

Adoção do Padrão Dublin Core para Metadados dos Dados

Adoção do Padrão Dublin Core para Metadados dos Dados adotar tecnologias, ferramentas e metodologias colaborativas para o contexto da ciência aberta. Open-data has created an unprecedented opportunity with new challenges for ecosystem scientists. Skil...

Leia mais