digitalizacao-de-documentos

Transcrição

digitalizacao-de-documentos
DIGITALIZAÇÃO DE DOCUMENTOS
Sônia Teresinha Duarte de Oliveira1
RESUMO
O processo de digitalização propicia os meios de se codificar documentos
capturados através de um scanner ou máquina fotográfica digital e disponibilizá-los em
forma de imagem, texto ou som para armazenagem, transmissão e recuperação em sistemas
computadorizados. Apresenta as câmaras digitais, os tipos de scanners e fatores a serem
considerados na escolha dos mesmos: resolução, usabilidade, profundidade de cores, área
de escaneamento, tempo de digitalização. Destaca os tipos de software e computadores a
serem utilizados para este sistema. Cita a importância de existir um programa de controle
de qualidade em todas as fases do processo de digitalização e uma infra-estrutura para
arquivar material digital. Conclui que a digitalização trás novos rumos para o uso da
tecnologia digital faz com que seus recursos sejam utilizados para armazenar, preservar e
dar acesso aos conteúdos informacionais de uma biblioteca.
PALAVRAS-CHAVE: Digitalização de documentos. Bibliotecas. Imagem digital.
Scanner. Máquina fotográfica digital.
1 INTRODUÇÃO
O uso da tecnologia digital é um recurso utilizado em bibliotecas para armazenar,
preservar e dar acesso ao seu acervo. Este material quando digitalizado recebe um novo
formato: do analógico para o digital.
Este artigo foi elaborado com o objetivo de apresentar os estudos que estão feitos
sobre digitalização de documentos: orientações básicas necessárias à digitalização de
materiais em formato de texto, fotografia, mapas e ilustrações.
1
Aluna do curso de Biblioteconomia da Universidade Federal do Rio Grande do Sul. Trabalho realizado como pré-requisito para
aprovação na disciplina Produção de Documentos Eletrônicos ministrada pelo Professor Alexandre Semeler. Porto Alegre, novembro de
2008. E-mail: [email protected].
2 ASPECTOS GERAIS
Um dos objetivos deste trabalho é apresentar os conceitos referentes a este assunto.
Iniciamos com os dados analógicos: neles as representações dos dados ou eventos são
contínuas e se parecem com o original. Humanos percebem o mundo de forma analógica,
por exemplo, podem enxergar infinitas graduações de cor e forma. A habilidade de capturar
a natureza sutil do mundo real é a vantagem das representações analógicas. No entanto a
reprodução é marcada pela deterioração dos dados originais.
Já os dados digitais são representados por valores numéricos medidos em intervalos
distintos, ou seja, de forma descontínua. Dados no formato digital podem ser manipulados,
processados e transmitidos facilmente. As reproduções são idênticas aos originais.
Finalmente temos a digitalização de documentos que é uma das medidas utilizadas
em arquivos em bibliotecas para proceder a reformatação de seus acervos.
O processo de reformatação é a adoção de medidas que visam transpor os dados
informacionais de um determinado suporte para outro. Temos como exemplo deste a
digitalização.
O processo de digitalização propicia os meios de se codificar documentos
capturados através de um scanner ou máquina fotográfica digital e disponibilizá-los em
forma de imagem, texto ou som para armazenagem, transmissão e recuperação em sistemas
computadorizados.
O produto da digitalização, a imagem digital, não substitui legalmente a informação
armazenada no suporte original. Ela passa a ser um novo mecanismo de acesso ao conteúdo
informacional. Além disto, ela ajuda na preservação dos materiais originais reduzindo seu
manuseio e facilita atividades de pesquisa.
3 INSTRUMENTOS
A digitalização requer os seguintes instrumentos:
a) Scanner ou câmara digital para capturar e converter a imagem;
b) Computador para processá-la e armazená-la;
c) Softwares para captura e manipulação de texto e imagens;
d) Impressora ou um monitor para visualizá-la.
Segundo a Embrapa a característica física do material a ser digitalizado afeta
diretamente o produto digital que será obtido no processo. Este aspecto, além da relevância
intelectual do conteúdo da obra, são os aspectos a serem observados na seleção dos
materiais a serem digitalizados.
Devem-se levar em conta as seguintes propriedades físicas dos materiais:
a) tipo e categoria do recurso (é um livro impresso, texto escrito à mão, programa de tv
em VHS, é um original ou uma reprodução?);
b) data (quantos anos tem? Sabe quando foi feito?);
c) tamanho e dimensões físicas (é um livro de tamanho regular? É uniforme? Qual é o
tamanho em cm? Qual a duração da fita de vídeo em horas, minutos, segundos)?
d) tipo de mídia (papel, madeira, couro, vídeo cassete magnético, combinação de
materiais)?
e) formato (disco de 78 rpm, fita cassete analógica, DAT Betacam SP tape, NTSC ou
PAL formato de vídeo);
f) estrutura do material (ele é encadernado?);
g) condições de preservação (qual o estado de conservação? Deve ser preservado?
Requer manuseio especial?).
3.1 Scanners
Existem scanners de vários tipos, tamanhos e níveis de qualidade. A escolha de um
scanner depende do objetivo do trabalho, do formato, tipo e tamanho do material que se
pretende digitalizar. Dentre os fatores a considerar na hora de escolher um scanner temos:
resolução, usabilidade, profundidade de cores, área de escaneamento, tempo de
digitalização (EMBRAPA, 2006).
Em relação à resolução temos que a mesma é o fator determinante na qualidade de
um scanner, o nível máximo de detalhamento que pode ser capturado de uma imagem. A
resolução óptica de um scanner é medida pela capacidade de leitura de seu sensor de
imagem. Quanto maior a resolução óptica melhor.
Quanto à usabilidade algumas interfaces são bastante simples, limitando-se a definir
cor, resolução, e área de digitalização; outras apresentam interfaces complexas com várias
opções de tratamento de imagem, que soma tempo, processamento do computador, e, em
muitos casos, a paciência do usuário.
A profundidade de cores trata-se do número de cores que cada ponto captado pelo
scanner pode ter. Quanto maior a profundidade de cores maior a quantidade de informações
capturadas pelo scanner, e, portanto, maior a similaridade entre a cópia e o original.
Quanto à área de digitalização do scanner, normalmente delimitada pela superfície
de vidro do equipamento, costuma variar um pouco de um modelo para outro. Em geral
todos os scanners são capazes de digitalizar documentos com a largura máxima de uma
folha tamanho carta, e o comprimento de uma folha formato A4.
Tampas removíveis facilitam a digitalização de objetos de grande espessura, como
livros e revistas. A capacidade de aceitar acessórios extras, tais como alimentador de folhas
avulsas, são oferecidos como opcionais em alguns modelos mais sofisticados.
Para scanear slides, diapositivos, negativos ou transparências, o ideal é que se utilize
um scanner próprio para esse tipo de material.
Outro fator a considerar é o tempo de digitalização. Ele é uma característica
normalmente associada ao desempenho do scanner e é o tempo que o equipamento demora
em digitalizar um documento. Isso pode ser influenciado por vários fatores, entre eles, a
resolução desejada, o número de passadas do carro sensor e as características do programa
de digitalização.
Os tipos básicos de scanners são:
o de mão
o de página
o mesa
o slides
o microfilme
o 3D
o copystand
3.2 Câmaras digitais
Apesar de ter um alto valor de investimento, as câmaras digitais disponíveis no
mercado não são boas para o escaneamento de grandes arquivos, com exceção das câmaras
de alta resolução (Kontron, Zeutschel, Leica) usadas por grandes instituições e empresas no
ramo comercial de imagens.
A câmara digital de alta resolução não tem nenhuma limitação para o escaneamento
e podem capturar numa resolução extremamente alta. Porém elas têm requerimentos
específicos sobre iluminação, e exigem um alto nível de habilidade do operador. As
vantagens destas câmaras estão no grande potencial para scanear materiais de tamanho
grande, todos os formatos de mídia, materiais encadernados, e o baixo risco na operação
com os materiais frágeis.
As câmaras digitais não usam filme para capturar imagens. As fotografias são
armazenadas numa mídia interna ou em cartões de memória. A capacidade varia de 4 MB a
512 MB e está aumentando cada vez mais com o progresso da tecnologia. Os cartões de
memória guardam um número razoável de imagens, dependendo da resolução escolhida e
da capacidade do cartão. Se for utilizado o formato TIFF de imagens, os arquivos serão
grandes, e logo esgotarão a capacidade do cartão. Portanto, deve-se optar por transferir as
imagens diretamente para o computador, antes de tirar novas fotografias.
3.3 Software
Há dois tipos de software necessários para a digitalização de imagens. Um deles é o
software de scaneamento que vêm com o scanner, o outro, é o software de edição de
imagens, normalmente aplicado após a captura da imagem.
Alguns softwares, como o Adobe Photoshop, podem servir tanto como software de
escaneamneto como de edição de imagem.
O software de escaneamento geralmente é limitado quanto à funcionalidade. Ele
deve ter pelo menos a funcionalidade de salvar os arquivos de imagens em formatos
padrões, tais como TIFF, JPG, GIF etc.
Os tipos de softwares que convergem arquivos de imagens de um formato para
outro também são úteis.
Os softwares de edição de imagens são usados para “limpar” a imagem, removendo
imperfeições, pontos, manchas etc., e para correção, tais como ajuste do nível de brilho e
contraste. Algumas de suas funções são: realçar a imagem, controlar o zoom, acomodar
diferentes formatos de arquivos, fornecer controle para gama, preto e branco e cores,
fornecer um histograma, possibilitar ao usuário criar e salvar situações customizadas. A
escolha deste produto é baseada no nível de manipulação de imagens desejadas e no nível
de especialização dos indivíduos que vão utilizá-lo (EMBRAPA, 2006).
3.4 Computador
A escolha do computador para o processo de digitalização é de grande importância.
Os principais componentes que devem ser considerados neste momento são:
a) computador com o máximo de memória possível;
b) processador otimizado para manipulação de imagens;
c) computador com capacidade para conexões do tipo USB ou IEEE1394;
d) gravador de CD e DVD;
e) monitor de alta qualidade, com tela acima de 17 polegadas, alta resolução, alta
velocidade, sem tremulações e com suporte para vídeo RAM que possa produzir
imagens representativas do original digitalizado.
4 CRIAÇÃO DE ARQUIVOS DIGITAIS
No processo de digitalização, recomenda-se a criação de três versões de uma
imagem: a imagem mestra, a imagem de acesso e a imagem em miniatura. Dependendo da
necessidade de detalhes detectada numa imagem, deve-se criar uma imagem de acesso com
uma resolução mais alta do que a sugerida.
4.1 Arquivo mestre
Trata-se de arquivos de imagens digitais que contém o máximo de atributos das
imagens originais. O arquivo mestre deve ser de alta qualidade, visto que preserva o
conteúdo informacional do original, possibilitando variados usos e formatos alternativos
para atendimento às varias demandas, evitando re-trabalho de digitalização.
A cópia mestra não deve ser editada nem compactada. Os arquivos de imagens
mestras são muito grandes para serem armazenados on-line. Uma alternativa é armazenar
esses arquivos em CD ou DVD.
4.2 Arquivos de imagens derivadas
Arquivos derivados são criados a partir da imagem digital mestra e são usados
geralmente para acesso na WEB. Estes arquivos incluem imagens de acesso,
dimensionados para a tela de um monitor médio, me suas respectivas miniaturas. São
geralmente armazenados on-line (EMBRAPA, 2006).
5 CONTROLE DE QUALIDADE
O processo de digitalização exige um controle de qualidade em todas as suas fases.
Ela é avaliada tanto subjetivamente, através da inspeção visual, como objetivamente no
software de imagens. O ambiente para inspeção visual de imagens é também importante: os
monitores devem estar ajustados e a sala deve ser escura, ou pelo menos com as luzes
apagadas, sem luz do sol ou luz ofuscante. A inspeção visual deve considerar:
a) imagem com tamanho incorreto;
b) imagem com resolução incorreta;
c) nome do arquivo incorreto;
d) formato de arquivo incorreto;
e) imagem gravada de modo incorreto (imagem colorida graduada em escala de cinza);
f) perda de detalhes por causa de superexposição ou sombras;
g) interferência excessiva especialmente em áreas escuras ou sombras;
h) no geral muito clara ou muito escura;
i) valores tonais desiguais.
6 DENOMINAÇÃO DOS ARQUIVOS
O nome do arquivo deve ser dado antes de começar o processo de digitalização. Ele
deve ser um conjunto de informações que identifique unicamente aquela imagem. O nome
do arquivo deve incluir o nome da coleção ou unidade assim como o número da imagem,
mais a extensão apropriada (.gif, .jpg, .tif). Os nomes dos arquivos não podem ter mais de
oito caracteres e não devem incluir espaços ou símbolos tais como. /, ou # etc.
Se o material destina-se a acesso on-line, há necessidade de adicionar equipamento
extra para integrar o meio de armazenagem às redes. Para que uma coleção digital seja
acessada via WEB, faz-se necessário os serviços de manutenção de rede e suporte, e uma
equipe treinada.
O procedimento mais comum para projetos digitais é armazenar as imagens mestre
on-line 24 horas. Imagens mestras podem ser vistas mediante solicitação, pessoalmente ou
por meio de empréstimos de CDs (EMBRAPA, 2006).
7 METADADOS E OBJETOS DIGITAIS
Metadado significa “informações sobre os dados”, informações criadas sobre o
material e a versão digital, o registro de sua identidade, criação, uso, e estrutura. O
propósito do metadado é facilitar a pesquisa, o uso, a administração e reutilização de
material digital. Os metadados podem ser divididos em três categorias: descritivos,
administrativos e estruturais.
O metadado descritivo descreve e identifica as informações sobre os recursos
digitais, facilitando a busca, acesso e administração do repositório. As informações são do
tipo bibliográficas tais como: o criador/autor, título, data da criação, palavras-chave, entre
outras (EMBRAPA, 2006).
O metadado administrativo é usado para facilitar o rastreamento, migração e reuso
dos elementos digitais. As informações típicas desta categoria são: informações sobre a
criação, controle de qualidade, direitos, entre outras. O termo “metadado técnico” também é
utilizado para indicar a data de captura da imagem e as características técnicas da imagem.
O metadado estrutural descreve a estrutura interna do recurso digital e sua relação
com suas partes. É usado para possibilitar a navegação e a apresentação.
8 CONSIDERAÇÕES FINAIS
Este trabalho que teve como base o Guia para digitalização de documentos da
Embrapa nos auxilia a entender como é o processo de digitalização, seus principais
conceitos e nos dá um caminho para montarmos este sistema em uma biblioteca.
REFERÊNCIAS
BESSER, H. Selecting scanners. In:____. Introduction to Imaging. Los Angeles, Getty Research Institute,
2003.Disponível em: http://www.getty.edu/research/conducting_research/standards/introimages/scanners.html.
Acesso em 27 nov 2008.
CORNELL UNIVERSITY LIBRARY. Tipos de escáneres. In: ____. Llevando la Teoria a la Práctica: tutorial
de
digitalización
de
imágenes.
Ithaca,
Cornell
University,
2003.
Disponível
em:
http://www.library.cornell.edu/preservation/tutorial2/spanish-update/technicalB-03.html. Acesso em 27 nov
2008.
EMPRESA BRASILEIRA DE PESQUISA AGROPECUÁRIA. Guia para digitalização de documentos:
versão 2.0. Brasília, DF, 2006. 43 p. Disponível em: http://www.sct.embrapa.br/goi/manuais/GuiaDigitalizacao.pdf.
Acesso em 18 nov. 2008.

Documentos relacionados

Anexo - Conarq - Arquivo Nacional

Anexo - Conarq - Arquivo Nacional documentos originais devem ser registrados em planilha e sempre que possível, devem ser encapsulados ao próprio objeto digital ou armazenados em um banco de dados. É necessário que os equipamentos ...

Leia mais

CONARQ - Recomendações para Digitalização

CONARQ - Recomendações para Digitalização documentos originais devem ser registrados em planilha e sempre que possível, devem ser encapsulados ao próprio objeto digital ou armazenados em um banco de dados. É necessário que os equipamentos ...

Leia mais