digitalizacao-de-documentos
Transcrição
digitalizacao-de-documentos
DIGITALIZAÇÃO DE DOCUMENTOS Sônia Teresinha Duarte de Oliveira1 RESUMO O processo de digitalização propicia os meios de se codificar documentos capturados através de um scanner ou máquina fotográfica digital e disponibilizá-los em forma de imagem, texto ou som para armazenagem, transmissão e recuperação em sistemas computadorizados. Apresenta as câmaras digitais, os tipos de scanners e fatores a serem considerados na escolha dos mesmos: resolução, usabilidade, profundidade de cores, área de escaneamento, tempo de digitalização. Destaca os tipos de software e computadores a serem utilizados para este sistema. Cita a importância de existir um programa de controle de qualidade em todas as fases do processo de digitalização e uma infra-estrutura para arquivar material digital. Conclui que a digitalização trás novos rumos para o uso da tecnologia digital faz com que seus recursos sejam utilizados para armazenar, preservar e dar acesso aos conteúdos informacionais de uma biblioteca. PALAVRAS-CHAVE: Digitalização de documentos. Bibliotecas. Imagem digital. Scanner. Máquina fotográfica digital. 1 INTRODUÇÃO O uso da tecnologia digital é um recurso utilizado em bibliotecas para armazenar, preservar e dar acesso ao seu acervo. Este material quando digitalizado recebe um novo formato: do analógico para o digital. Este artigo foi elaborado com o objetivo de apresentar os estudos que estão feitos sobre digitalização de documentos: orientações básicas necessárias à digitalização de materiais em formato de texto, fotografia, mapas e ilustrações. 1 Aluna do curso de Biblioteconomia da Universidade Federal do Rio Grande do Sul. Trabalho realizado como pré-requisito para aprovação na disciplina Produção de Documentos Eletrônicos ministrada pelo Professor Alexandre Semeler. Porto Alegre, novembro de 2008. E-mail: [email protected]. 2 ASPECTOS GERAIS Um dos objetivos deste trabalho é apresentar os conceitos referentes a este assunto. Iniciamos com os dados analógicos: neles as representações dos dados ou eventos são contínuas e se parecem com o original. Humanos percebem o mundo de forma analógica, por exemplo, podem enxergar infinitas graduações de cor e forma. A habilidade de capturar a natureza sutil do mundo real é a vantagem das representações analógicas. No entanto a reprodução é marcada pela deterioração dos dados originais. Já os dados digitais são representados por valores numéricos medidos em intervalos distintos, ou seja, de forma descontínua. Dados no formato digital podem ser manipulados, processados e transmitidos facilmente. As reproduções são idênticas aos originais. Finalmente temos a digitalização de documentos que é uma das medidas utilizadas em arquivos em bibliotecas para proceder a reformatação de seus acervos. O processo de reformatação é a adoção de medidas que visam transpor os dados informacionais de um determinado suporte para outro. Temos como exemplo deste a digitalização. O processo de digitalização propicia os meios de se codificar documentos capturados através de um scanner ou máquina fotográfica digital e disponibilizá-los em forma de imagem, texto ou som para armazenagem, transmissão e recuperação em sistemas computadorizados. O produto da digitalização, a imagem digital, não substitui legalmente a informação armazenada no suporte original. Ela passa a ser um novo mecanismo de acesso ao conteúdo informacional. Além disto, ela ajuda na preservação dos materiais originais reduzindo seu manuseio e facilita atividades de pesquisa. 3 INSTRUMENTOS A digitalização requer os seguintes instrumentos: a) Scanner ou câmara digital para capturar e converter a imagem; b) Computador para processá-la e armazená-la; c) Softwares para captura e manipulação de texto e imagens; d) Impressora ou um monitor para visualizá-la. Segundo a Embrapa a característica física do material a ser digitalizado afeta diretamente o produto digital que será obtido no processo. Este aspecto, além da relevância intelectual do conteúdo da obra, são os aspectos a serem observados na seleção dos materiais a serem digitalizados. Devem-se levar em conta as seguintes propriedades físicas dos materiais: a) tipo e categoria do recurso (é um livro impresso, texto escrito à mão, programa de tv em VHS, é um original ou uma reprodução?); b) data (quantos anos tem? Sabe quando foi feito?); c) tamanho e dimensões físicas (é um livro de tamanho regular? É uniforme? Qual é o tamanho em cm? Qual a duração da fita de vídeo em horas, minutos, segundos)? d) tipo de mídia (papel, madeira, couro, vídeo cassete magnético, combinação de materiais)? e) formato (disco de 78 rpm, fita cassete analógica, DAT Betacam SP tape, NTSC ou PAL formato de vídeo); f) estrutura do material (ele é encadernado?); g) condições de preservação (qual o estado de conservação? Deve ser preservado? Requer manuseio especial?). 3.1 Scanners Existem scanners de vários tipos, tamanhos e níveis de qualidade. A escolha de um scanner depende do objetivo do trabalho, do formato, tipo e tamanho do material que se pretende digitalizar. Dentre os fatores a considerar na hora de escolher um scanner temos: resolução, usabilidade, profundidade de cores, área de escaneamento, tempo de digitalização (EMBRAPA, 2006). Em relação à resolução temos que a mesma é o fator determinante na qualidade de um scanner, o nível máximo de detalhamento que pode ser capturado de uma imagem. A resolução óptica de um scanner é medida pela capacidade de leitura de seu sensor de imagem. Quanto maior a resolução óptica melhor. Quanto à usabilidade algumas interfaces são bastante simples, limitando-se a definir cor, resolução, e área de digitalização; outras apresentam interfaces complexas com várias opções de tratamento de imagem, que soma tempo, processamento do computador, e, em muitos casos, a paciência do usuário. A profundidade de cores trata-se do número de cores que cada ponto captado pelo scanner pode ter. Quanto maior a profundidade de cores maior a quantidade de informações capturadas pelo scanner, e, portanto, maior a similaridade entre a cópia e o original. Quanto à área de digitalização do scanner, normalmente delimitada pela superfície de vidro do equipamento, costuma variar um pouco de um modelo para outro. Em geral todos os scanners são capazes de digitalizar documentos com a largura máxima de uma folha tamanho carta, e o comprimento de uma folha formato A4. Tampas removíveis facilitam a digitalização de objetos de grande espessura, como livros e revistas. A capacidade de aceitar acessórios extras, tais como alimentador de folhas avulsas, são oferecidos como opcionais em alguns modelos mais sofisticados. Para scanear slides, diapositivos, negativos ou transparências, o ideal é que se utilize um scanner próprio para esse tipo de material. Outro fator a considerar é o tempo de digitalização. Ele é uma característica normalmente associada ao desempenho do scanner e é o tempo que o equipamento demora em digitalizar um documento. Isso pode ser influenciado por vários fatores, entre eles, a resolução desejada, o número de passadas do carro sensor e as características do programa de digitalização. Os tipos básicos de scanners são: o de mão o de página o mesa o slides o microfilme o 3D o copystand 3.2 Câmaras digitais Apesar de ter um alto valor de investimento, as câmaras digitais disponíveis no mercado não são boas para o escaneamento de grandes arquivos, com exceção das câmaras de alta resolução (Kontron, Zeutschel, Leica) usadas por grandes instituições e empresas no ramo comercial de imagens. A câmara digital de alta resolução não tem nenhuma limitação para o escaneamento e podem capturar numa resolução extremamente alta. Porém elas têm requerimentos específicos sobre iluminação, e exigem um alto nível de habilidade do operador. As vantagens destas câmaras estão no grande potencial para scanear materiais de tamanho grande, todos os formatos de mídia, materiais encadernados, e o baixo risco na operação com os materiais frágeis. As câmaras digitais não usam filme para capturar imagens. As fotografias são armazenadas numa mídia interna ou em cartões de memória. A capacidade varia de 4 MB a 512 MB e está aumentando cada vez mais com o progresso da tecnologia. Os cartões de memória guardam um número razoável de imagens, dependendo da resolução escolhida e da capacidade do cartão. Se for utilizado o formato TIFF de imagens, os arquivos serão grandes, e logo esgotarão a capacidade do cartão. Portanto, deve-se optar por transferir as imagens diretamente para o computador, antes de tirar novas fotografias. 3.3 Software Há dois tipos de software necessários para a digitalização de imagens. Um deles é o software de scaneamento que vêm com o scanner, o outro, é o software de edição de imagens, normalmente aplicado após a captura da imagem. Alguns softwares, como o Adobe Photoshop, podem servir tanto como software de escaneamneto como de edição de imagem. O software de escaneamento geralmente é limitado quanto à funcionalidade. Ele deve ter pelo menos a funcionalidade de salvar os arquivos de imagens em formatos padrões, tais como TIFF, JPG, GIF etc. Os tipos de softwares que convergem arquivos de imagens de um formato para outro também são úteis. Os softwares de edição de imagens são usados para “limpar” a imagem, removendo imperfeições, pontos, manchas etc., e para correção, tais como ajuste do nível de brilho e contraste. Algumas de suas funções são: realçar a imagem, controlar o zoom, acomodar diferentes formatos de arquivos, fornecer controle para gama, preto e branco e cores, fornecer um histograma, possibilitar ao usuário criar e salvar situações customizadas. A escolha deste produto é baseada no nível de manipulação de imagens desejadas e no nível de especialização dos indivíduos que vão utilizá-lo (EMBRAPA, 2006). 3.4 Computador A escolha do computador para o processo de digitalização é de grande importância. Os principais componentes que devem ser considerados neste momento são: a) computador com o máximo de memória possível; b) processador otimizado para manipulação de imagens; c) computador com capacidade para conexões do tipo USB ou IEEE1394; d) gravador de CD e DVD; e) monitor de alta qualidade, com tela acima de 17 polegadas, alta resolução, alta velocidade, sem tremulações e com suporte para vídeo RAM que possa produzir imagens representativas do original digitalizado. 4 CRIAÇÃO DE ARQUIVOS DIGITAIS No processo de digitalização, recomenda-se a criação de três versões de uma imagem: a imagem mestra, a imagem de acesso e a imagem em miniatura. Dependendo da necessidade de detalhes detectada numa imagem, deve-se criar uma imagem de acesso com uma resolução mais alta do que a sugerida. 4.1 Arquivo mestre Trata-se de arquivos de imagens digitais que contém o máximo de atributos das imagens originais. O arquivo mestre deve ser de alta qualidade, visto que preserva o conteúdo informacional do original, possibilitando variados usos e formatos alternativos para atendimento às varias demandas, evitando re-trabalho de digitalização. A cópia mestra não deve ser editada nem compactada. Os arquivos de imagens mestras são muito grandes para serem armazenados on-line. Uma alternativa é armazenar esses arquivos em CD ou DVD. 4.2 Arquivos de imagens derivadas Arquivos derivados são criados a partir da imagem digital mestra e são usados geralmente para acesso na WEB. Estes arquivos incluem imagens de acesso, dimensionados para a tela de um monitor médio, me suas respectivas miniaturas. São geralmente armazenados on-line (EMBRAPA, 2006). 5 CONTROLE DE QUALIDADE O processo de digitalização exige um controle de qualidade em todas as suas fases. Ela é avaliada tanto subjetivamente, através da inspeção visual, como objetivamente no software de imagens. O ambiente para inspeção visual de imagens é também importante: os monitores devem estar ajustados e a sala deve ser escura, ou pelo menos com as luzes apagadas, sem luz do sol ou luz ofuscante. A inspeção visual deve considerar: a) imagem com tamanho incorreto; b) imagem com resolução incorreta; c) nome do arquivo incorreto; d) formato de arquivo incorreto; e) imagem gravada de modo incorreto (imagem colorida graduada em escala de cinza); f) perda de detalhes por causa de superexposição ou sombras; g) interferência excessiva especialmente em áreas escuras ou sombras; h) no geral muito clara ou muito escura; i) valores tonais desiguais. 6 DENOMINAÇÃO DOS ARQUIVOS O nome do arquivo deve ser dado antes de começar o processo de digitalização. Ele deve ser um conjunto de informações que identifique unicamente aquela imagem. O nome do arquivo deve incluir o nome da coleção ou unidade assim como o número da imagem, mais a extensão apropriada (.gif, .jpg, .tif). Os nomes dos arquivos não podem ter mais de oito caracteres e não devem incluir espaços ou símbolos tais como. /, ou # etc. Se o material destina-se a acesso on-line, há necessidade de adicionar equipamento extra para integrar o meio de armazenagem às redes. Para que uma coleção digital seja acessada via WEB, faz-se necessário os serviços de manutenção de rede e suporte, e uma equipe treinada. O procedimento mais comum para projetos digitais é armazenar as imagens mestre on-line 24 horas. Imagens mestras podem ser vistas mediante solicitação, pessoalmente ou por meio de empréstimos de CDs (EMBRAPA, 2006). 7 METADADOS E OBJETOS DIGITAIS Metadado significa “informações sobre os dados”, informações criadas sobre o material e a versão digital, o registro de sua identidade, criação, uso, e estrutura. O propósito do metadado é facilitar a pesquisa, o uso, a administração e reutilização de material digital. Os metadados podem ser divididos em três categorias: descritivos, administrativos e estruturais. O metadado descritivo descreve e identifica as informações sobre os recursos digitais, facilitando a busca, acesso e administração do repositório. As informações são do tipo bibliográficas tais como: o criador/autor, título, data da criação, palavras-chave, entre outras (EMBRAPA, 2006). O metadado administrativo é usado para facilitar o rastreamento, migração e reuso dos elementos digitais. As informações típicas desta categoria são: informações sobre a criação, controle de qualidade, direitos, entre outras. O termo “metadado técnico” também é utilizado para indicar a data de captura da imagem e as características técnicas da imagem. O metadado estrutural descreve a estrutura interna do recurso digital e sua relação com suas partes. É usado para possibilitar a navegação e a apresentação. 8 CONSIDERAÇÕES FINAIS Este trabalho que teve como base o Guia para digitalização de documentos da Embrapa nos auxilia a entender como é o processo de digitalização, seus principais conceitos e nos dá um caminho para montarmos este sistema em uma biblioteca. REFERÊNCIAS BESSER, H. Selecting scanners. In:____. Introduction to Imaging. Los Angeles, Getty Research Institute, 2003.Disponível em: http://www.getty.edu/research/conducting_research/standards/introimages/scanners.html. Acesso em 27 nov 2008. CORNELL UNIVERSITY LIBRARY. Tipos de escáneres. In: ____. Llevando la Teoria a la Práctica: tutorial de digitalización de imágenes. Ithaca, Cornell University, 2003. Disponível em: http://www.library.cornell.edu/preservation/tutorial2/spanish-update/technicalB-03.html. Acesso em 27 nov 2008. EMPRESA BRASILEIRA DE PESQUISA AGROPECUÁRIA. Guia para digitalização de documentos: versão 2.0. Brasília, DF, 2006. 43 p. Disponível em: http://www.sct.embrapa.br/goi/manuais/GuiaDigitalizacao.pdf. Acesso em 18 nov. 2008.
Documentos relacionados
Anexo - Conarq - Arquivo Nacional
documentos originais devem ser registrados em planilha e sempre que possível, devem ser encapsulados ao próprio objeto digital ou armazenados em um banco de dados. É necessário que os equipamentos ...
Leia maisCONARQ - Recomendações para Digitalização
documentos originais devem ser registrados em planilha e sempre que possível, devem ser encapsulados ao próprio objeto digital ou armazenados em um banco de dados. É necessário que os equipamentos ...
Leia mais