E-Quilt Prototype - Dublin Core® Metadata Initiative
Transcrição
E-Quilt Prototype - Dublin Core® Metadata Initiative
ADOÇÃO DO PADRÃO DUBLIN CORE PARA GERENCIAMENTO DE DADOS CIENTÍFICOS: um experimento E-Quilt Prototype THE ADOPTION OF DUBLIN CORE STANDARD FOR SCIENTIFIC DATA MANAGEMENT: an E-Quilt Prototype Experiment Adriana Carla S. de Oliveira Guilherme Ataíde Dias Renata Lemos dos Anjos Vírginia Miranda de Souza Universidade Federal da Paraíba/PPGCI [email protected] Universidade Federal da Paraíba/MPGOA [email protected] Universidade Federal da Paraíba [email protected] Universidade Federal da Paraíba [email protected] Apresentação O poster é um extrato da pesquisa de doutorado que apresenta o estado contemporâneo da comunicação científica e do quarto paradigma baseado no data sharing e no data management. A infraestrutura tecnológica, padrões, protocolos e metodologias são essenciais para a ciência inovadora e aberta na perspectiva da eScience. Concomitante a feitura da tese, está em desenvolvimento um experimento de pesquisa chamado e-Quilt Prototype. O e-Quilt está apoiado no data life cycle model e nas tecnologias que apoiam o data sharing e o management. O objetivo desse pôster é apresentar a adoção do padrão e ferramenta Dublin Core para a descrição de metadados de dados científicos abertos. Foi utilizado o método quadripolar, a técnica de pesquisa exploratória, descritiva e experimental e a abordagem qualitativa. Adotou-se o modelo data life cycle do DataONE para o processo de gerenciamento dos dados. A análise foi focada na adequação de conformidade dos metadados dos dados científicos contidos no e-Quilt Prototype ao elementos do padrão Dublin Core. A amostragem foi realizada com o recurso no formato sonoro e do tipo áudio. O estado da arte contemporâneo baseado no Forth Paradigm e no Open Science Data Management O estado da arte da comunicação científica está centrado no chamado Forth Paradigm (Quarto Paradigma) da eScience. Este paradigma traduz em sua essência a ciência aberta e inovadora baseada em dados primários de pesquisa e nas questões que envolvem o gerenciamento, compartilhamento, agregação, curadoria, preservação e cooperação científica, para uso e reuso de investigações científicas a longo prazo. A pesquisa em andamento se apóia no data life cycle model. O ciclo de vida dos dados adotado para o desenvolvimento dos estágios do experimento e-Quilt Prototype é o Data Lifecycle desenvolvido pelo DataONE conforme demonstrado na figura 1. FASE 1: Aplicação do Padrão Dublin Core ao Recurso Áudio do e-Quilt Prototype FASE 2: Aplicação dos metadados no Dublin Core Advanced Generation FASE 3: Análise de adequação dos metadados do Recurso Áudio Descrição dos metadados com base nos 22 elementos e recursos do padrão Geração automática do código de metadados Aplicação do critério de conformidade do recurso ao padrão Dublin Core Figura 3 - Sistemática de descrição dos metadados Fonte: Elaborado pelos autores (2015). Adotou-se para descrição dos metadados o recurso 'áudio' disposto no e-Quilt Prototype. Foram analisados os 22 (vinte e dois) elementos do padrão Dublin Core considerando a adequação ao recurso. A ferramenta Dublin Core Advanced Generation foi utilizada para geração automática dos códigos de metadados. Análise da adoção do padrão Dublin Core ao e-Quilt Prototype 1. Considerando-se apenas o recurso áudio contido no e-Quilt Prototype para esta fase da pesquisa, constatou-se que os metadados descritos e analisados com o padrão Dublin Core possuem conformidade internacional. 2. Foi constatado que os subelementos e recursos adotados de acordo com o padrão Dublin Core pode ser adotados aos metadados do recurso áudio numa perspectiva da eScience. 3. Dos 22 (vinte e dois) elementos do padrão analisados e aplicados ao recurso áudio, apenas 02 (dois) elementos apresentaram o critério de 'conformidade parcial', conforme demonstrado na tabela 1. Tabela 1. Análise de adequação do recurso ‘áudio’ do e-Quilt Prototype aos elementos do Padrão DC Figura 1 - Data Lifecycle Model Fonte: DataONE (2015). Fonte: Elaborado pelos autores (2015). O modelo Data Lifecycle é representado por 8 (oito) estágios dentro de toda a cadeia do ciclo de vida dos dados do experimento de pesquisa. Sistemática do experimento e-Quilt Prototype MO DE LO CIENTÍFICA BAS O Ã EA AÇ C DO I N U NO M O EC Plan CE EN CI ES D Esta fase do experimento está apoiada no estágio Describe e reflete a descrição dos metadados do recurso áudio conforme demonstrada na figura 2. Analyze Collect Integrate Assure Discover Describe 4. Os elementos Identifier e Rights do recurso áudio analisados de acordo com o padrão apresentaram conformidade parcial. 5. No elemento Identifier que se divide nos subelementos DOI e ISBN, constatou-se que ambos não possuem atribuição. 6. Quanto ao subelemento identificador DOI não teve atribuição, pois o áudio é um recurso derivado do protótipo. Sendo assim o identificador deve ser atribuído a ao recurso principal. 7. O identificador ISBN não se aplica a este recurso, pois o mesmo é aplicável a recursos de natureza impressa. 8. O elemento Rights apresentou 'conformidade parcial' em virtude da Lei de Direitos Autorais (LDA) em vigência no Brasil não possuir menção à proteção autoral de áudio em uma ambiência aberta e compartilhada. 9. O subelemento Licence 'não possui conformidade' com o padrão. A análise se pauta pela necessidade de se adotar uma licença pública aplicável aos dados de pesquisa compartilhados e abertos com abrangência internacional. Esta licença será adotada em outra fase do experimento. Resultados Parciais 1. O recurso áudio é derivado do recurso principal artigo, ambos contidos na ambiência do e-Quilt Prototype. Para o recurso áudio constatou-se que o mesmo possui uma adequação considerável ao padrão Dublin Core. Essa etapa de descrição atendeu ao estágio Describe do modelo do Data Life Cycle. 2. Quanto a ferramenta Dublin Core Advanced Generation adotada, observou-se que a mesma possui limitação quanto a limpeza automática de caracteres (símbolos, acentos, colchetes etc.) que devem ser desprezados durante a descrição dos metadados. Esse procedimento foi realizado manualmente. 3. Por fim, analisou-se que a descrição dos metadados é um processo de detalhamento que requer a adoção de critérios de qualidade e validação dos dados. Pode ser adotada para este estágio guidelines e boas práticas que já são aplicadas no cenário internacional. Preserve P e DA DOS CIENTÍFICOS AB S O T ER Figura 2 – Estágio Describe do Data Lifecycle model. Fonte: Adaptado do Data Life Cycle Model do DataONE (2015). Os dados primários coletados em campo foram compartilhados no e-Quilt Prototype e estão sendo tratados nos moldes do Data Lifecycle. A sistemática adotada para a descrição dos metadados do recurso áudio foi desenvolvida em 3 (três) fases conforme representada na figura 3. Referências California Digital Library (2015) Available: http://www.cdlib.org/groups/rmg/. Accessed: 2015 Mar 05. DataONE. Data Life Cycle model. Disponível em: https://www.dataone.org. Accessed: 2015 Mar 05. Dublin Core Metadata Initiative. Dublin Core Metadata Element Set, version 1.1. (2014) Available: http://dublincore.org/documents/dces/. Accessed: 2015 Mar 15. Tenopir, C., Allard, S., Douglass, K., Aydinoglu, A. U. et al. Data Sharing by Scientists: Practices and Perceptions, PLoS ONE. Volume 6, Issue 6. Available: http://www.plosone.org/article/info%3Adoi%2F10.1371%2Fjournal.pone. 0021101. Accessed: 2015 Mar 15.
Documentos relacionados
Adoção do Padrão Dublin Core para Metadados dos Dados
adotar tecnologias, ferramentas e metodologias colaborativas para o contexto da ciência aberta. Open-data has created an unprecedented opportunity with new challenges for ecosystem scientists. Skil...
Leia mais