preservação da autenticidade e da integridade de documentos em

Transcrição

preservação da autenticidade e da integridade de documentos em
PRESERVAÇÃO DA AUTENTICIDADE E DA INTEGRIDADE DE
DOCUMENTOS EM BIBLIOTECAS DIGITAIS DE TESES E
DISSERTAÇÕES
Amarílis Montagnolli Gomes Corrêa1
1
Mestranda em Ciência da Informação, Escola de Comunicações e Artes – Universidade de São
Paulo, São Paulo – SP
RESUMO
Os avanços tecnológicos impõem um grande desafio para a preservação do patrimônio
digital. Além de garantir a longevidade e acessibilidade dos documentos, é necessário
preservá-los autênticos e íntegros para que os usuários confiem neles como fonte de
informação e objeto de estudo. As práticas para preservação do acervo das bibliotecas
digitais de teses e dissertações das três universidades estaduais paulistas (Universidade de
São Paulo - USP, Universidade Estadual Paulista Júlio Mesquita Filho - Unesp e
Universidade Estadual de Campinas - Unicamp) demonstram a necessidade de melhorias.
Palavras-Chave: Preservação digital; Bibliotecas digitais; Autenticidade; Integridade.
ABSTRACT
Technological innovations raise a set of great challenges to the preservation of digital
heritage. Besides assuring the longevity and accessibility of digital documents, it is also
important to preserve their authenticity and integrity so one can trust and use digital
documents as information source and study objects. The preservation practices for the
collection of the digital libraries of theses and dissertations of the three state universities of
Sao Paulo (Universidade de São Paulo - USP, Universidade Estadual Paulista Júlio Mesquita
Filho - Unesp e Universidade Estadual de Campinas - Unicamp) show that they need to be
improved.
Keywords: Digital preservation; Digital libraries; Authenticity; Integrity.
1 Introdução
A tendência de produzirmos um patrimônio digital cada vez maior exige
estudos sobre preservação digital, definição de conceitos, critérios e técnicas para a
avaliação e certificação da autenticidade e da integridade dos documentos que
constituem essa memória. A escolha dos atributos autenticidade e integridade se
deve à importância de comprovar aos pesquisadores que o documento consultado é
fonte confiável, garantindo que ele não sofreu alterações (CULLEN, 2000).
Para contextualizar essa preocupação, procurei conhecer as práticas de
preservação das três universidades estaduais paulistas (Universidade de São Paulo,
Universidade Estadual de Campinas e Universidade Estadual Paulista) para o
acervo de suas bibliotecas digitais de teses e dissertações. A escolha se justifica
pela parceria entre essas instituições, por alguns aspectos pioneiros de seus
projetos e porque os acervos representam uma importante parte da produção
intelectual das universidades e desde 2006 são obrigatoriamente divulgados na
internet(1).
2 Preservação da autenticidade e integridade de documentos digitais
O avanço tecnológico torna cada vez mais prático criar, editar e armazenar
documentos. As facilidades proporcionadas e a longa convivência com documentos
analógicos, nos induz a agir como se a preservação de documentos digitais não
dependesse da interferência humana (REAGAN, 2009), como acontece com a de
alguns suportes analógicos que podem sobreviver por milhares de anos.
Um grande dilema tem sido combinar as capacidades, inversamente
proporcionais, de produzir e de preservar o patrimônio digital(2) (CONWAY, 2001;
SAYÃO, 2006). Preservação digital
exige políticas, estratégias e ações para garantir, ao longo dos anos,
acesso a conteúdo válido apesar dos desafios impostos pelos
suportes (mídias) e mudanças tecnológicas. [...] Estratégias e ações
de preservação digital devem contemplar a criação de conteúdo, sua
integridade e preservação” (AMERICAN LIBRARY ASSOCIATION,
2007, online).
Preservação digital é um processo complexo que deve orientar usuários e
guardiões do patrimônio desde a criação dos documentos. Dentre os pontos
relevantes, a escolha pela preservação da autenticidade e integridade de
documentos digitais se explica pela necessidade do guardião oferecer garantias de
que o patrimônio sob sua custódia é autêntico e permanece íntegro. Os usuários
precisam poder confiar nos documentos digitais para usá-los sem receio, assim
como estão acostumados a trabalhar e a confiar nos documentos analógicos
(CULLEN, 2000). Há desconfiança em relação à validade de documentos digitais,
eles são considerados mais suscetíveis a manipulações e alterações imperceptíveis,
pelo menos à primeira vista, do que documentos analógicos. Estes também são
passíveis de adulterações intencionais, mas “quando se afirma que documentos
digitais podem ser mais facilmente alterados, o que está sendo comparado é a
facilidade para alterar o arquivo eletrônico com a dificuldade em alterar um texto
impresso” (TANSELLE, 2001, p. 134, grifo nosso).
Não é fácil distinguir o conceito de autenticidade do de integridade, eles são
atributos complementares para validar um documento, mas que não coexistem
necessariamente, pois podemos ter, por exemplo, um documento autêntico cujo
conteúdo foi manipulado. A autenticidade se refere à garantia da confiabilidade e da
validade do documento como um todo (autoria, data e local de publicação, por
exemplo) e a integridade se refere à garantia de validade do conteúdo atestando sua
fidelidade em relação ao conteúdo original criado pelo autor, atestando que ele não
sofreu alterações. É importante ressaltar que a avaliação desses dois atributos não
está relacionada ao conteúdo dos documentos em si, “provar a autenticidade [e a
integridade] de um documento não o torna mais confiável do que era quando foi
criado” (DURANTI, 1995, p. 7).
São muitas as sugestões e tentativas para o sucesso da preservação digital,
verificação e preservação dos atributos autenticidade e integridade, porém ainda não
termos um “corpo de conhecimentos” consolidado (SAYÃO, 2006, p. 118).
3 Bibliotecas digitais: repositórios digitais confiáveis
Bibliotecas, museus e arquivos sempre foram as instituições responsáveis por
preservar a memória coletiva, reunir, organizar, proteger e divulgá-la (CONWAY,
2001; PEREIRA; RUTINA, 1999)(3). Vivemos um momento de grandes mudanças
nas formas de produzir, gerenciar e consumir produção intelectual, e as bibliotecas
digitais se apresentam como uma das responsáveis pela preservação e
disseminação do patrimônio digital. Encontramos muitos projetos denominados
biblioteca digital mas que não estão de acordo com as definições desse conceito,
definições que devem inspirar sua elaboração e desenvolvimento.
Bibliotecas digitais são organizações que fornecem os recursos,
incluindo uma equipe especializada, para selecionar, estruturar,
oferecer acesso intelectual, explicar/ aclarar, distribuir, preservar a
integridade, e garantir a permanência das coleções digitais para que
elas estejam prontamente acessíveis e disponíveis [...] (DIGITAL
LIBRARY FEDERATION, 1998, online).
Para completar essa definição, as bibliotecas digitais devem apoiar o ciclo
completo de criação, disseminação, uso e preservação de documentos; combinar as
funções das bibliotecas tradicionais com serviços de informação em rede (DUGUID,
1997; HENSHAW, 1994(4) apud PEREIRA; RUTINA, 1999).
No Brasil, as universidades são um dos principais centros de produção de
conhecimento, mas ainda parecem se preocupar pouco com a preservação
sistemática de seu patrimônio científico (MARTINS, 2006) apesar dos vários projetos
para divulgá-lo para a comunidade acadêmica e para a sociedade em geral.
Não é suficiente disponibilizar o acesso remoto ao patrimônio científico, o
repositório digital precisa ser confiável, e para provar-se e manter-se como tal deve
demonstrar seu comprometimento com a missão de garantir o acesso e a
preservação de documentos digitais igualmente confiáveis a longo prazo
(RESEARCH LIBRARIES GROUP, 2002). Determinar a confiança em um repositório
implica em avaliar seu processo de preservação e também a instituição como um
todo, a sua organização, equipe, políticas e procedimentos, sustentabilidade
financeira, licenças e responsabilidades sob as quais deve trabalhar (ONLINE
COMPUTER LIBRARY CENTER; CENTER FOR RESEARCH LIBRARIES, 2007).
O processo de avaliação e certificação da confiabilidade de um repositório é
detalhado e complexo, são muitos os requisitos que devem ser atendidos e já
existem iniciativas nacionais e internacionais dedicadas a estabelecer os parâmetros
a serem adotados na construção e avaliação de repositórios digitais. Por exemplo, o
Modelo de Requisitos para Sistemas Informatizados de Gestão Arquivística de
Documentos (e-ARQ Brasil)(5) elaborado pela Câmara Técnica de Documentos
Eletrônicos do Conselho Nacional de Arquivos e o documento elaborado pelo Center
for Research Libraries e Online Computer Library Center, o Trustworthy Repositories
Audit & Certification: Criteria and Checklist(6).
4 A prática das universidades estaduais paulistas para preservação
digital: síntese e algumas considerações
Para conhecer as práticas de preservação do acervo das bibliotecas digitais
de teses e dissertações e as práticas adotadas para avaliar e atestar a autenticidade
e integridade dos documentos nesses acervos, optou-se pela aplicação de um
questionário via e-mail(7). Os questionários foram aplicados junto ao Diretor do
Sistema de Bibliotecas da Unicamp, à Coordenadora Geral de Bibliotecas da Unesp
e à Diretora Técnica do Sistema Integrado de Bibliotecas da USP, que recomendou o
encaminhamento do questionário ao Centro de Informática de São Carlos
(CISC/USP).
Mesmo sem ter uma política de preservação digital formalizada (mas, Unesp e
Unicamp demonstram intenção de elaborar uma), as três universidades adotaram
estratégias de preservação conforme recomendações internacionais e práticas de
instituições consideradas modelos. Os padrões de metadados são o MARC e o
Dublin Core, internacionalmente recomendados, e as estratégias de preservação
são backup e migração. Outra característica comum é a adoção do modelo OAIS na
estrutura de suas bibliotecas digitais e a parceria com iniciativas internacionais para
aprimorar suas práticas. Além disso, aparentemente as universidades contam com
boa infraestrutura tecnológica e equipe de profissionais especializados.
Em relação aos conceitos de autenticidade e integridade, não há definições
formalmente estabelecidas. Em resposta ao questionário apenas Unesp explicou o
que entende por cada um dos conceitos e reforçou a importância de garantir a
preservação deles e de contar com uma estrutura que permita identificar possíveis
alterações sofridas por um documento após sua criação. A Unicamp desenvolve
estudos em parceira com o Arquivo Nacional e o Projeto InterPARES(8), por isso
ainda não adotou definições e a USP não se pronunciou a respeito.
A ausência de definições formais ou de uma política de preservação não
representam falta de preocupação com os dois atributos. USP, Unesp e Unicamp,
verificam a autenticidade e a integridade dos documentos antes de depositá-los nas
bibliotecas digitais. As estratégias adotadas são semelhantes: as seções de pósgraduação e os bibliotecários são os responsáveis por verificar as informações
fornecidas pelos autores e por conferir a compatibilidade da versão digital com a
versão impressa. No entanto, não há procedimentos para verificar a preservação da
integridade ao longo do tempo, as universidades não julgam o procedimento
necessário devido à restrição de acesso aos arquivos e metadados após o depósito.
Aparentemente, elas não consideram a possibilidade dos arquivos sofrerem
alterações não-intencionais. Também não existem estratégias para certificar ou
explicitar para os usuários que os documentos disponíveis nas bibliotecas digitais
tiveram sua autenticidade e integridade verificados e preservados. As universidades
consideram a própria disponibilidade para consulta como o certificado de garantia.
Como não existe uma política formalizada, nenhuma das universidades
estabeleceu a periodicidade para a revisão dos procedimentos de trabalho e de
preservação. As mudanças são feitas conforme a necessidade e, quando ocorrem,
são registradas através de normas. A Unesp e a USP afirmam divulgar todas as
normas no sites das bibliotecas digitais, mas o se encontra são instruções para
depósito e normas de criação das bibliotecas, não informações sobre as práticas
para preservação do acervo. A Unicamp admite que não há divulgação por não ter
uma política.
5 Considerações Parciais/Finais
Não há consenso para a definição de conceitos-chave e sobre as melhores
estratégias de preservação, talvez porque ainda não tenha decorrido tempo
suficiente para avaliar a eficiência de cada uma. Temos muitos grupos de pesquisa
em vários países, muitas sugestões e relatos de instituições que estão
experimentando propostas, analisando os resultados obtidos, as dificuldades e
soluções adotadas. No Brasil, aparentemente faltam relatos do gênero. A maioria
deles refere-se a projetos de digitalização, criação de sites ou repositórios para
possibilitar o acesso ao patrimônio digital, o que parece ser a prioridade, ou seja, os
relatos não costumam detalhar a estrutura, as estratégias de preservação adotadas,
e a rotina do gerenciamento. O rápido avanço tecnológico exige que estratégias de
preservação sejam postas em prática o quanto antes e ainda assim os projetos não
costumam estabelecer políticas de preservação antes de entrarem em operação.
Apesar da importância, discussões sobre preservação digital e, em especial, sobre
preservação da autenticidade e integridade de documentos parecem ser
prorrogadas.
USP, Unesp e Unicamp têm prestígio no meio acadêmico e perante a
sociedade, elas são selos de qualidade para seus projetos e sua produção científica.
Elas estão cientes da importância da preservação a longo prazo e da preservação
da autenticidade e integridade de documentos digitais, porém, suas atuações ainda
são tímidas e precisam formalizar sua dedicação à preservação e adotar uma
postura mais transparente de suas práticas. Seus projetos de biblioteca digital de
teses e dissertações estão bem encaminhados, seguem padrões internacionais
importantes, mas se forem observados sob a ótica dos parâmetros recomendados
para repositórios digitais, ainda precisam de melhorias para serem efetivamente
considerados repositórios confiáveis para a preservação de documentos digitais,
principalmente no que diz respeito à preservação da autenticidade e da integridade.
Este trabalho não tem a pretensão de julgar as práticas das três
universidades estaduais paulistas nem de nenhuma outra instituição que ainda
trabalhe nas mesmas condições. Tampouco tem a pretensão de apontar soluções,
pois não é fácil tomar decisões cujas consequências podem ser irreversíveis,
sobretudo quando é necessário considerar aspectos tecnológicos em constante
mutação. O objetivo é chamar a atenção dos guardiões de patrimônio digital para a
urgência de sair do campo teórico e assumir uma posição mais ativa, formalizar
políticas que orientem suas ações e implantar estratégias para a preservação e
certificação da autenticidade e integridade de documentos digitais.
6 Referências
AMERICAN LIBRARY ASSOCIATION. Definitions of digital preservation. 2007. Disponível
em:
<http://www.lita.org/ala/mgrps/divs/alcts/resources/preserv/defdigpres0408.cfm>. Acesso em:
23 nov. 2009.
CONWAY, Paul. Preservação no universo digital. 2. ed. Rio de Janeiro: Projeto
Conservação Preventiva em Bibliotecas e Arquivos: Arquivo Nacional, 2001. (Conservação
Preventiva em Bibliotecas e Arquivos, 52). Disponível em: <http://www.arqsp.org.br/cpba/>.
Acesso em: 15 mar. 2007.
CULLEN, Charles T. Authentication of digital objects: lessons from a historian’s research. In:
COUNCIL ON LIBRARY AND INFORMATION RESOURCES. Authenticity in a digital
environment. May 2000. p. 1-7. Disponível em:
<http://www.clir.org/PUBS/reports/pub92/pub92.pdf>. Acesso em: 8 abr. 2007.
DIGITAL LIBRARY FEDERATION. A working definition of digital library. 1998. Disponível
em: <http://www.diglib.org/about/dldefinition.htm>. Acesso em: 26 maio 2007.
DUGUID, Paul. Report of the Santa Fe Planning Workshop on Distributed Knowledge
Work Environments: digital libraries. University of Michigan School of Information, sept.
1997. Disponível em:
Acesso
<http://web.archive.org/web/19981202153946/http://www.si.umich.edu/SantaFe/>.
em: 5 maio 2009.
DURANTI, Luciana. Reliability and authenticity: the concepts and their implications.
Archivaria, n. 39, p. 5-10, spring 1995. Disponível em:
<http://journals.sfu.ca/archivar/index.php/archivaria/article/view/12063/13035>. Acesso em:
15 mar. 2009.
DURANTI, Luciana. Introducción. In: _____ (Ed.). La conservación a largo plazo de
documentos electrónicos auténticos: hallazgos del Proyecto InterPares. Cartagena:
Concejalía de Cultura : 3000 Informática, 2005. p. 15-22.
InterPARES. Project overview. Disponível em: <http://www.interpares.org/welcome.cfm>.
Acesso em: 15 fev. 2009.
MARTINS, Roberto de A. A memória científica nas universidades: estratégias para
preservação do patrimônio científico e tecnológico brasileiro. Disponível em:
<http://ghtc.ifi.unicamp.br/pdf/ram-121.pdf>. Acesso em: 10 abr. 2010.
ONLINE COMPUTER LIBRARY CENTER; CENTER FOR RESEARCH LIBRARIES.
Trustworthy repositories audit & certification: criteria and checklist. Version 1.0. Feb.
2007. Disponível em:
<http://www.crl.edu/sites/default/files/attachments/pages/trac_0.pdf>. Acesso em: 1 fev.
2010.
PEREIRA, Edmeire Cristina; RUTINA, Raquel. O século XXI e o sonho da biblioteca
universal: quase seis mil anos de evolução na produção, registro e socialização do
conhecimento. Perspectivas em Ciência da Informação, Belo Horizonte, v. 4, n. 1, p. 5-19,
jan./jun. 1999. Disponível em:
<http://portaldeperiodicos.eci.ufmg.br/index.php/pci/article/viewFile/590/359>. Acesso em: 24
maio 2007.
REAGAN, Brad. The digital ice age. Popular Mechanics, New York, oct. 2009. Section
Technology : Gadgets : Industry News. Disponível em:
<http://www.popularmechanics.com/technology/industry/4201645.html?page=1>. Acesso em:
14 fev. 2007.
RESEARCH LIBRARIES GROUP. Trusted digital repositories: attributes and
responsibilities. May 2002. Disponível em:
<http://www.oclc.org/research/activities/past/rlg/trustedrep/repositories.pdf>. Acesso em: 22
nov. 2009.
SAYÃO, Luís Fernando. Preservação digital no contexto das bibliotecas digitais: uma breve
introdução. In: MARCONDES, Carlos H. et al. (Org.). Bibliotecas digitais: saberes e
práticas. 2. ed. Salvador: UFBA, 2006. p. 113-143.
TANSELLE, G. Thomas. Thoughts on the authenticity of electronic texts. Studies in
Bibliography, v. 54, p. 133-136, 2001. Disponível em: <http://etext.virginia.edu/bsuva/sb/>.
Acesso em: 18 jul. 2009.
UNESCO UNITED NATIONS EDUCATIONAL, SCIENTIFIC AND CULTURAL
ORGANIZATION. Charter on the preservation of the digital heritage. Oct. 2003.
Disponível em:
<http://portal.unesco.org/en/ev.phpURL_ID=17721&URL_DO=DO_TOPIC&URL_SECTION=201.html>. Acesso em: 20 mar.
2007.
7 Notas
(1) A Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES), subordinada
ao Ministério da Educação, tornou obrigatória a divulgação de teses de doutorado e
dissertações de mestrado na internet. Para isso, publicou em 15 de fevereiro de 2006, a
Portaria nº 13 que institui a divulgação digital das teses e dissertações produzidas pelos
programas de doutorado e mestrado reconhecidos. Disponível em:
<http://www.capes.gov.br/images/stories/download/legislacao/Portaria_013_2006.pdf>.
Acesso em: 10 fev. de 2010.
(2) Segundo definição da Unesco (2003, online), patrimônio digital compreende “fontes
culturais, educacionais, científicas, administrativas, técnicas, legais, médicas e outros tipos
de informação criadas digitalmente ou convertidas a partir de um suporte analógico. [...]
textos, base de dados, imagens fixas (fotografia, gravura, pintura) ou em movimento,
gravações sonoras, softwares e páginas da internet entre muitos outros tipos que não param
de ser criados. Geralmente são efêmeros e exigem manutenção para serem preservados
para a geração presente e para as futuras”.
(3) Os arquivos são as instituições mais antigas no exercício de guarda de documentos. No
Ocidente, datam desde 3.000 a 500 a.C., quando entre os sumérios, egípcios, assírios e
babilônios estavam, exclusivamente, a serviço das autoridades como arquivos reais,
religiosos e diplomáticos (BELLOTTO, 2002). Apenas no final do século XVIII, com a
Revolução Francesa, é que os arquivos públicos passam a ser abertos aos cidadãos, mas
ainda apenas com uso jurídico-administrativo. Para os historiadores, os arquivos começam a
se abrir na segunda metade do século XIX (BELLOTTO, 2002).
(4) HENSHAW, Rod. The library as a place. College & Research Libraries, p. 283-285, july
1994.
(5) Disponível em:
<http://www.conarq.arquivonacional.gov.br/media/publicacoes/earqmet/earqbrasilv1.1.pdf>.
Acesso em: 31 maio 2010.
(6) Disponível em: <http://www.crl.edu/sites/default/files/attachments/pages/trac_0.pdf>.
Acesso em: 1 fev. 2010.
(7) Os questionários foram respondidos entre março e abril de 2010.
(8) InterPARES significa Investigação Internacional sobre Documentos Autênticos
Permanentes em Sistemas Eletrônicos. Foi criado, em 1999, a partir do crescente interesse
nos resultados de outro projeto: Preservation of the integrity of electronic records,
desenvolvido pela School of Library, Archival and Information Studies, da University of British
Columbia (DURANTI, 2005). “O projeto tem por objetivo desenvolver conhecimentos
essenciais para a preservação de documentos digitais autênticos e fornecer padrões,
políticas, estratégias e planos de ação capazes de garantir a longevidade deste material e a
possibilidade dos usuários confiarem na sua autenticidade” (InterPARES, online).