Gestao da Documentacao por Imagens um tipo - Sima

Transcrição

Gestao da Documentacao por Imagens um tipo - Sima
Gestão da Documentação por Imagens: um
Tipo Específico de GED
Resumo
Empresas e pessoas desenvolvem seus próprios meios para guardar documentos
importantes, porém, mesmo com todos os cuidados, eles continuam desaparecendo.
A frustração diante da incapacidade de se encontrar o arquivo certo quando mais se
precisa dele é bem conhecida. Os métodos tradicionais de se armazenar papéis,
documentos, e registros eletrônicos requerem grande esforço de gerenciamento.
Conforme cresce o número de documentos, em geral, o tempo e o esforço
despendidos para gerenciá-los aumenta na mesma proporção. Os Sistemas de
Imagens de Documentos (SID), revolucionaram o processo de arquivamento e
oferecem hoje ambientes mais apropriados para a gestão dos documentos de uma
organização. Neste artigo define-se o que são os Sistemas de Imagens de
Documentos, colocando-os sob a perspectiva mais ampla do Gerenciamento
Eletrônico de Documentos (GED). O artigo esclarece também o que se pode esperar
e se deve procurar em sistemas do tipo SID e como eles implementam os processos
de armazenagem e de recuperação. Dessa forma o artigo pretende constituir uma
fonte de informações que auxilie em processos de análise de aquisição de softwares
na área da gestão da documentação em organizações de todos os tipos e tamanhos.
Palavras-chave: GED, Gestão Eletrônica de Documentos, Sistemas de Imagens de
Documentos, document imaging.
1 Introdução
Todas as organizações produzem documentos em papel ou em meio eletrônico. Em
geral, quanto maior a empresa maior a quantidade de documentos que precisam ser
guardados organizadamente e com método, ou seja, gerenciados (classificados,
indexados e armazenados) para serem recuperados quando forem necessários.
Pessoas físicas ou jurídicas desenvolvem seus próprios meios de armazenar
documentos importantes, porém eles continuam desaparecendo. A frustração gerada
pela incapacidade de se encontrar o arquivo certo quando mais se precisa dele é bem
conhecida por todos. O fato é que os métodos tradicionais de se armazenar papéis e
registros eletrônicos requerem grande quantidade de esforço para gerenciá-los.
Conforme cresce o número de documentos, em geral, o tempo e o esforço
despendidos para gerenciá-los também aumenta.
Os sistemas de Document Imaging, referenciados neste texto como “Sistemas de
Imagem de Documentos” (SID), revolucionaram o processo de arquivamento de
informações e oferecem hoje um ambiente eficiente para se encontrar, recuperar e
compartilhar todos os documentos de uma organização.
Neste artigo é explicado o que é um Sistema de Imagem de Documentos; qual a sua
relação com o Gerenciamento Eletrônico de Documentos (GED); o que se pode
procurar e esperar de um sistema desse tipo; e como eles facilitam o processo de
armazenagem e recuperação de documentos. Espera-se que o artigo se constitua em
uma fonte de informações rica para os leitores, os auxiliando em processos de análise
de aquisição de software na área da gestão da documentação.
2 Sistema de Imagens de Documentos
O Gerenciamento Eletrônico de Documentos (GED) surgiu da aplicação da Tecnologia
da Informação (TI) ao gerenciamento de documentos, ou na terminologia arquivística,
à Gestão de Documentos. A diferença é que o GED processa a Gestão de
Documentos de forma eletrônica. Deve-se ressaltar, entretanto, que o GED não
engloba somente a gestão de “documentos eletrônicos” (aqueles originalmente
produzidos em meio eletrônico), mas também trata documentos em papel que são
processados de forma eletrônica.
Para KOCH (1998, p.22), citado por FLORES (FLORES 2000), o GED é a somatória
de todas as tecnologias que visam gerenciar informações de forma eletrônica,
reforçando que não é necessário que os documentos estejam em meio eletrônico, mas
sim, que o tratamento dispensado a estes sejam concretizados com o uso destas
tecnologias, como por exemplo a elaboração de Tabelas de Temporalidade, Planos de
Classificação, entre outros. Ainda, segundo KOCH,
“o GED visa gerenciar o ciclo de vida das informações desde sua criação
até o seu arquivamento. As informações podem, originalmente, estar em
mídias analógicas ou digitais em todas as fases de sua vida. Podem ser
criadas em papel, revisadas no papel, processadas a partir de papel e
arquivadas em papel”.
KOCH (1998) divide o GED em dois grupos de soluções, de acordo com o ciclo de
vida das informações, a saber: os de gerenciamento de documentos – Document
Management, e os de gerenciamento de imagens de documentos – Document
Imaging. No primeiro grupo, as informações estão em estado dinâmico, enquanto que
no segundo, são estáticas.
Um sistema de "document imaging" ou Sistema de Imagens de Documentos (SID)
automatiza o processo de conversão de documentos em papel ou microfilme em
imagens eletrônicas (ou bitmaps) no computador. Uma vez armazenadas no
computador essas imagens digitais dos documentos originais podem ser recuperadas
sem esforço e com rapidez, por meio de variados métodos do busca.
A conversão do documento de papel ou microfilme é bastante similar à utilização de
uma copiadora: os documentos em papel podem ser "escaneados" e aqueles em
microfilme podem ser salvos em formato de imagem. Uma vez convertido para
imagem, a cada documento são associadas informações para sua indexação (título,
palavras-chaves, ou outras informações ou atributos). Mais tarde, os documentos
podem ser encontrados simplesmente pela utilização de parte do título ou qualquer
outra informação que serviu para sua indexação.
O sistema pode ainda "ler" cada página do documento em formato de imagem usando
um processo chamado OCR - "Optical Character Recognition" - para criação de um
arquivo no formato texto que vai servir para a sua indexação completa (full-text
indexing). Pode-se utilizar o texto do documento para buscas por palavras que permite
encontrar qualquer documento que contenha uma determinada palavra, frase ou
padrão de caracteres qualquer. Quais documentos podem ser lidos e quais as ações
ou alterações que os usuários do sistema podem realizar dependerão do controle de
acesso adotado pelo sistema.
Todos os SIDs devem possuir pelo menos os 5 componentes básicos listados abaixo e
detalhados na seqüência deste artigo:
ferramentas para captura dos documentos, escaneamento e importação para
trazer os documentos para dentro do sistema;
métodos de arquivamento e armazenamento de documentos;
sistemas de organização taxonômica e indexação de documentos;
mecanismos de busca para se encontrar documentos com rapidez;
mecanismos de controle de acesso para fornecer documentos somente às
pessoas autorizadas.
Selecionar o sistema de imagens de documentos certo para uma organização é sem
dúvida uma tarefa estimulante e desafiadora. Há muitos aspectos a considerar para se
ter certeza de que o sistema escolhido atenderá às necessidades da organização.
Servir de guia para qualquer um que esteja escolhendo um sistema desse tipo é o
principal objetivo deste artigo. Neste sentido, encontram-se a seguir as descrições
detalhadas dos cinco componentes básicos identificados acima e que compõem os
SIDs.
Porquê Sistemas de Imagens de Documentos
2.1
Duas principais razões podem ser citadas: conveniência e redução de custos.
Enquanto a primeira, por si só, já motivaria a aquisição de um sistema de gestão de
imagens de documentos, a segunda é crucial para se justificar o investimento. Estes
sistemas têm potencial para colocar salas repletas de arquivos literalmente nas pontas
dos dedos das pessoas que os manipulam. Isso se transforma em redução de custos
na medida em que proporciona economia de tempo e aumento de produtividade para
as pessoas. Considere, a título de exemplo, os passos necessários para que um
funcionário de uma organização qualquer recupere um documento em uma sala de
arquivo:
1.
Sair do seu posto de trabalho e caminhar até a sala de arquivos;
2.
Encontrar o armário apropriado;
3.
Encontrar a gaveta apropriada;
4.
Encontrar a pasta apropriada na gaveta;
5.
Encontrar o documento na pasta;
6.
Retornar ao posto de trabalho com o documento;
7.
Usar o documento;
8.
Sair do seu posto de trabalho e caminhar até a sala de arquivos;
9.
Retornar o documento ao seu lugar;
10. Retornar ao posto de trabalho.
São dez passos para se encontrar e usar um documento. Entretanto, as coisas não
funcionam sempre da forma descrita. Por exemplo, considere o seguinte:
1. O documento pode estar em uso por outra pessoa, assim o funcionário não terá acesso no
momento imediato. Isso incorrerá em perda de produtividade duplicada, não apenas o
funcionário não realizará a tarefa que exigia a obtenção do documento, como esta tarefa terá de
ser realocada em momento menos conveniente. Além disso, caso a outra pessoa tenha se
esquecido de devolver o documento, levará algum tempo para que este esteja disponível
novamente.
2. O documento pode ter sido armazenado erroneamente; será então necessário uma procura
manual nos locais onde este poderia ser logicamente encontrado. Além disso, o documento
pode ter sido retornado a um local mais conveniente na visão do funcionário -- não onde ele
deveria estar realmente.
3. Caso a empresa não permita levar documentos para seus postos de trabalho, então será
necessário fazer uma cópia do documento. Na maioria das empresas tal procedimento exige
autorização específica que será contabilizada em algum centro de custo -- assim a simples
recuperação do documento custará dinheiro. Além disso, com esse procedimento a empresa
acabará com várias cópias do mesmo documento; um funcionário não informado da atualização
recente do documento poderá então estar usando uma versão desatualizada deste último.
4. Caso os arquivos, gavetas e pastas não tenham sido etiquetados de forma clara, a
pesquisa pode demorar um tempo significativo. Este é um problema real, caso não haja uma
pessoa responsável pela manutenção do sistema de arquivos.
Os vários óbices listados acima podem não parecer muito problemáticos se tomados
individualmente, porém, o total de tempo consumido mensalmente, de cada
funcionário numa empresa que enfrente estes problemas será certamente
considerável.
Imagine quando a empresa interage extensivamente por telefone com seus clientes.
Nesse caso, o cliente espera na linha enquanto o documento é recuperado, fato
recorrente em empresas de contabilidade, por exemplo. Caso o cliente esteja usando
um número do tipo 0800, esse procedimento irá incorrer em custos relevantes para a
empresa. Multiplique este custo por várias pessoas e ele se tornará proibitivo.
Por outro lado, um sistema de imagens de documentos permite localizar-se um
documento quase que instantaneamente, sem que para isso o funcionário tenha que
deixar seu posto de trabalho. Além disso, os documentos nunca são perdidos,
armazenados incorretamente, ou indisponíveis e muito pouco tempo é necessário para
a recuperação e apresentação do documento na tela do computador ou na
impressora.
Vejamos a seguir os principais módulos que compõem um Sistema de Imagem de
Documentos.
3 Capturando documentos
Existem três métodos para se capturar arquivos para dentro do sistema de imagens de
documentos.
1- Escaneamento, para arquivos em papel.
2-
Conversão, para a criação de imagens eletrônicas inalteráveis de
documentos.
3- Importação, para a criação de versões alteráveis de documentos eletrônicos.
Vejamos cada um destes métodos separadamente.
3.1
Escaneamento
O escaneamento de um documento produz uma imagem que será então armazenada
no sistema. Para a escolha do scanner adequado é muito importante considerar o
tamanho e volume de papel a ser escaneado e o investimento a ser feito. A
capacidade para utilizar uma grande variedade de scanners é uma das características
que definem um bom sistema de captura de imagens.
Um scanner deve ter um sistema automático de alimentação (Automatic Document
Feeder – ADF) para funcionar a contento ligado a um SID. Esse dispositivo ADF
permite que uma quantidade de papel seja colocada em uma bandeja e tracionada
automaticamente, uma página
de cada vez,
acelerando o processo de
escaneamento.
A imagem v inculada não pode ser exibida. Talv ez o arquiv o tenha sido mov ido, renomeado ou excluído. Verifique se o v ínculo aponta para o arquiv o e o local corretos.
Em geral, os scanners que não
foram originalmente desenhados
de imagens gráficas e requerem
documento
seja
inserido
Figura Erro! Indicador não definido. Scanner com ADF.
possuem ADF
para a captura
que
cada
manualmente,
um de cada vez.
Os scanners podem tratar uma grande variedade
de tamanhos de papéis, desde cartões de visita até projetos de engenharia. A maioria
das organizações necessita escanear documentos de tamanho padrão A4 (21,0 x 29,7
cm). Para os departamentos que utilizam plantas e projetos de arquitetura, por
exemplo, existem scanners de grande porte que suportam documentos de tamanhos
variados. Em geral, quanto maior o tamanho do papel que pode ser manipulado pelo
scanner, maior será o seu custo. Outras opções, tais como cor ou gradação de cinza
(usado para fotografia) também aumentam o preço dos scanners.
A velocidade do scanner é outra característica que deve ser considerada. Scanners
para a captura de imagens manuseiam entre 10-200 páginas por minuto. Eles podem
ser simples ou duplos. Os scanners duplos permitem que ambos os lados de um
documento de duas faces sejam escaneados de uma só vez. Assim como as outras
opções, a velocidade e a capacidade de capturar documentos frente e verso
aumentam o preço dos aparelhos. Em alguns casos, é mais econômico comprar dois
scanners de capacidade para capturar 20 páginas por minuto do que um de 40
páginas por minuto. Porém, essa opção só poderá ser utilizada em sistemas de
imagens de documentos que suportarem configurações com múltiplas estações de
captura.
Se existe um grande volume de documentos para ser escaneado, por exemplo
milhares ou milhões de páginas, talvez seja mais prático e econômico contratar uma
empresa para fazer o trabalho. Neste caso, o sistema de imagem precisará ser capaz
de trabalhar com bancos de dados sincronizados entre a informações capturadas pela
empresa contratada e aquelas escaneadas na própria organização.
Em casos de terceirização, é também desejável que as imagens juntamente com os
índices gerados, sejam transportáveis. É preciso se certificar de que os documentos
escaneados fora da empresa poderão ser incorporados ao sistema sem interrupções
ou reindexações já realizadas.
Se a empresa possui vários escritórios e necessita compartilhar os documentos com
cada um deles, a capacidade de transportar as informações constitui um meio simples
de se distribuir arquivos.
3.2
Conversão
A conversão de documentos é o processo de transformação dos documentos
eletrônicos em imagens permanentes para serem armazenadas no SID. As aplicações
do Windows, tais como Microsoft word, Excel ou Autodesk AutoCAD, podem imprimir
arquivos gerando imagens inalteráveis. Essas imagens são geralmente armazenadas
em arquivos no formato TIFF (Tagged Image File Format). O processo de conversão
também gera um arquivo de texto completo, retendo o formato visual e o layout
original do documento. Esse arquivo de texto pode ser usado para a indexação
completa do documento o que, mais tarde, permite a recuperação das informações.
Convertendo documentos em imagens
A conversão eletrônica de documentos salta o processo de escaneamento, economiza
papel e recursos de impressão e produz imagens de melhor qualidade que quando
escaneadas a partir do papel. Esse método é o bastante adequado para arquivos
eletrônicos permanentes.
3.3
Importação de documentos
A importação de arquivos é outro método eficaz para trazer para dentro do SID
arquivos eletrônicos tais como documentos do office (da Microsoft), gráficos, áudio ou
vídeos. Os arquivos podem ser movidos, “arrastados e soltos”, para dentro do sistema
de imagens, mas são versões modificáveis e permanecem em seu formato original,
por isso esse tipo de importação é o mais usado em sistemas GED. Esses arquivos
podem ser visualizados em seu formato original ou ser usados através de um
visualizador embutido no SID.
4 Armazenando Documentos
Uma vez transpostos para dentro do sistema, os documentos devem ser armazenados
por longos períodos de tempo. Os sistemas de armazenamento devem considerar as
constantes e freqüentes alterações na tecnologia, o aumento do número e volume dos
documentos e serem à prova do tempo. As necessidades de investimento e o
orçamento designado para a guarda das imagens são certamente melhor
determinadas pela própria organização interessada no processo.
Um bom sistema SID deve ser capaz de usar os vários dispositivos de armazenagem
disponíveis no mercado atual e futuro, isso garante uma armazenagem por longo
tempo. Isso permite selecionar o melhor equipamento para as necessidades de cada
organização, no momento e no futuro.
Para garantir a capacidade de leitura no futuro, como o SID é usado para
arquivamento digital de longo prazo, os arquivos devem de preferência ser
armazenados em formato não-proprietário. A indústria de computadores avança tão
rapidamente que a guarda de imagens de documentos ou arquivos texto em formato
proprietário pode deixar a empresa refém da sorte e dos caprichos de uma única
companhia.
Atualmente existem 5 opções para armazenagem:
Discos Rígidos (Hard drives);
Discos tipo Magneto-óptico ;
Vários tipos de Compact discs (CDs);
DVDs (Digital Video Disk);
CDs tipo WORM (Write Once, Read Many).
As vantagens e desvantagens de cada uma destas mídias de armazenamento e
estocagem são descritas abaixo.
4.1
Mídia magnética (discos rígidos)
A velocidade cada vez maior no tempo de resposta e a dramática redução do preço
faz dos discos rígidos ou RAID (Redundant Array of Independent Disks) a escolha
mais comum para os sistemas de armazenamento.
Sistemas RAID permitem a formatação de múltiplos discos rígidos e, de forma
transparente ao usuário, os coloca como um único dispositivo capaz de armazenar
grandes volumes de dados. Esses sistemas protegem os dados contra perdas e danos
fornecendo redundância de dados e tolerância à falha contra problemas de hardware.
Esses dispositivos são relativamente baratos, podem ser acoplados e usados em
conjunto para armazenar grande número de documentos e fornecem os melhores
tempos de resposta.
A desvantagem da mídia magnética é que, apesar de barata, ela ainda contém partes
móveis sujeitas a falhas mecânicas. Os arquivos de dados podem ser completamente
apagados. É preciso fazer backups regulares para que possam ser recuperados em
caso de perdas ou de danos em arquivos.
4.2
Sistema Magneto-Óptico (MO)
Já há alguns anos os discos MO representam uma alternativa bastante popular para
se fazer backups de arquivos em computadores pessoais. Como o próprio termo diz, a
mídia MO emprega as duas tecnologias: ótica e magnética para obter uma alta
capacidade de armazenagem de dados. Um MO típico é um pouco maior que um
disquete convencional de 3.5-polegadas, e tem aparência similar. Mas, enquanto o
velho disquete pode armazenar 1.44 MB, um MO pode conter muito maior quantidade,
variando de 100 MB a até vários GB.
Um leitor de MO lê altas densidades de dados porque usa uma combinação de laser e
de cabeça magnética de leitura e gravação. O laser aquece a superfície do disquete
para que esta seja mais facilmente magnetizada, e permite também que a região
magnetizada seja precisamente localizada e mais precisamente limitada.
Um laser menos intenso é usado para ler os dados do disquete. Os dados podem ser
apagados ou regravados um número ilimitado de vezes, como num disquete
convencional de 3.5 polegadas.
Os principais benefícios da mídia MO incluem a conveniência de transporte fácil, o
baixo custo, a confiabilidade, e, para alguns modelos, uma grande disponibilidade de
acesso pela padronização da indústria.
Uma limitação do MO é que eles são relativamente lentos se comparados a outras
mídias e ainda sujeitos a falhas mecânicas, apesar de serem mais rápidos que os
disquetes convencionais. Os dados também podem ser completamente apagados.
Com a diminuição agressiva nos preços dos discos rígidos a popularidade do MO tem
sido mais e mais abalada.
A imagem v inculada não pode ser exibida. Talv ez o arquiv o tenha sido mov ido, renomeado ou excluído. Verifique se o v ínculo aponta para o arquiv o e o local corretos.
A imagem v inculada não pode ser exibida. Talv ez o arquiv o tenha sido mov ido, renomeado ou excluído. Verifique se o v ínculo aponta para o arquiv o e o local corretos.
Figura Erro! Indicador não definido. - Driver de leitura e discos
Magneto-Ópticos.
Os MOs podem ser usados em jukeboxes com capacidade para armazenar centenas
de discos.
4.3
Compact Discs
CD são discos de plástico usados para guardar informação digital inventados pelas
empresas Sony e Philips no início dos anos 80. Originalmente desenvolvidos para
sistemas de áudio como uma alternativa aos discos de vinil e fitas (audiotapes), os
CDs são hoje também extensivamente usados para armazenar dados. A informação
digital é gravada em um CD, codificada em uma série de covas microscópicas na
superfície reflexiva de alumínio do disco. O disco é protegido por uma cobertura de
plástico transparente e é lido por um dispositivo que usa luz infra-vermelha para ler os
padrões formados pelas superfícies cavadas ou lisas gravadas no disco. Como nada
fica em contato direto com a porção codificada do CD, ele não se desgasta no
processo de leitura.
Os formatos padrão de CDs incluem o CD-ROM (Compact Disc Read Only Memory)
que são mídias pré-impressas e não graváveis; os CD-R (CD Recordable) que podem
ser gravados uma única vez; e os CD-RW (CD Rewritable), que podem ser regravados
inúmeras vezes.
Os CDs são mídias seguras que fornecem armazenagem por longos períodos, em
alguns casos até 100 anos. Além disso, não requerem máquinas ou programas
especializados para recuperar a informação gravada. Os CDs seguem especificações
ISO-9600, o que lhes garante acesso em diversas plataformas, diferentemente dos
discos Magneto-Óptico.
Uma desvantagem é a limitação da capacidade em 650MB. Os CD-ROMs são
acessados através de drivers, com torres e jukeboxes para mais de 500 discos, sendo
um método conveniente para armazenar um grande número de imagens de
documentos.
4.4
DVDs
Os DVDs (Digital Video Disc) representam a última geração da tecnologia de
armazenamento ótico. Um DVD é essencialmente um CD maior e mais rápido que
pode conter mais informações, vídeo, áudio e dados binários. O DVD atinge grande
capacidade de armazenamento colocando mais dados no mesmo espaço físico que o
CD, o que é pôde ser feito através de várias alterações:
•
As trilhas são mais próximas umas das outras. A distância inter-trilhas foi
reduzida para 0.74 micron, menos da metade da distância em um CD, que é de
1.6 micron;
•
Os pequenos furos em cada trilha são ainda menores;
•
Novas tecnologias de compressão de dados mais eficientes, que minimizam o
armazenamento de dados repetitivos e desnecessários;
•
Duas camadas separadas de trilhas podem ser combinadas em um único
disco.
Assim
como
os CDs, os
DVDs
permitem
também
acesso
randômico
a
qualquer ponto
do disco. Não
há
necessidade de se avançar e retornar seqüencialmente como nas fitas e, claro, não há
necessidade de se rebobinar. Como em toda tecnologia ótica, não existe contato entre
a superfície do disco e uma cabeça física de leitura. O disco é tocado por um feixe de
luz laser, o que não traz desgaste ou estrago ocasionado pela leitura repetitiva de uma
determinada área do disco. Além disso, a camada plástica superior protege o disco
contra impressões digitais e poeira. Os cuidados são os mesmos que para os CDs.
Isso significa que os DVDs podem ser tocados milhares de vezes e representam hoje
a melhor opção de longo prazo para armazenagem nos SIDs.
A desvantagem dessa mídia é seu custo elevado e a batalha por padronização travada
pelos fabricantes que ainda não se estabilizou. Entre o VHS e o Beta, diferentes
fabricantes estão usando formatos diferentes para os DVDs regraváveis.
5 Indexando documentos
Cada vez que um escritório recebe ou gera documentos em papel, estes precisam ser
organizados para serem utilizados posteriormente. Geralmente os documentos são
etiquetados, ordenados, indexados e colocados em pastas e armazenados em um
arquivo físico. Sem o cumprimento destes passos, nada poderia ser encontrado em
uma organização com certo grau de dinâmica e complexidade. O cenário não se
modifica em se tratando de documentos eletrônicos. Um sistema de imagens de
documentos deve poder propor diferentes métodos para se organizar informações
para uso futuro. Qualquer que seja a metodologia utilizada, esta deve ser facilmente
compreendida e utilizada pelas pessoas encarregadas de recuperar documentos
assim como pelas pessoas encarregadas de organiza-los.
Não há consenso sobre o quanto as políticas de uma instituição deveriam ou poderiam
ser alteradas para implantação de um sistema de imagens de documentos. Em geral,
quanto mais um SID puder se adaptar aos procedimentos existentes melhor e mais
chances o sistema terá de ser efetivamente utilizado no dia-a-dia pelos funcionários.
Existem três formas básicas para se organizar documentos em um SID:
Indexação por campos (Index Fields);
Indexação de texto completo (Full-text Indexing);
Diretório/Arquivo.
5.1
Indexação por campos
Um método tradicional usado para arquivos em papel que pode ser facilmente
transposto para um sistema eletrônico com vantagens é a indexação de documentos
usando campos de categorias e palavras-chave.
Um SID deve permitir aos usuários adaptar templates (moldes de telas) com os
campos a serem indexados de forma flexível, possibilitando a criação de telas de
recuperação de documentos com diferentes tipos de campos, como data, número etc.
Campos de índices podem ser utilizados para categorizar documentos, rastrear a
criação ou datas de retenção, gravar o assunto, entre outros usos.
Um SID deveria igualmente permitir o uso de menus para agilizar a escolha dos
campos de índice e possuir ferramentas para auxiliar a entrada de informações de
forma automática nesses campos.
5.2
Indexação de texto completo
Provendo indexação de texto completo, um SID elimina o tempo necessário para que
pessoas qualificadas leiam e indexem manualmente os documentos utilizando
palavras-chave. Para oferecer essa funcionalidade o software deve possuir
capacidade de OCR (Optical Character Recognition). Este processo “lê” uma página
escaneada e então indexa cada palavra da página. Isso reduz dramaticamente o custo
de indexação e provê ao mesmo tempo melhoria da capacidade de recuperação de
documentos.
Com a indexação de texto completo, documentos podem ser encontrados utilizando-se
qualquer palavra ou frase que possa estar presente no documento, mesmo que as
palavras não sejam parte das palavras-chave utilizadas na indexação por campos.
Concluindo, deve-se ressaltar que existe ainda a questão da língua. Tipicamente,
quando o OCR original é aplicado o sistema usa um alfabeto inglês. Caso seja
necessário o uso de multilinguagem, então o sistema deve suportar OCR e a busca
considerando outras línguas. Além disso, é preciso ou desejável que o sistema realize
o OCR e a indexação de texto completo sem intervenção humana.
5.3
Folder/File Structure
Juntamente com a indexação por campos e por texto completo, um SID deverá prover
também um modo visual para se encontrar documentos. Na maioria dos escritórios,
documentos são normalmente encontrados procurando-os em determinadas pastas,
em uma gaveta em arquivos físicos. Um SID deve recriar esse sistema hierárquico
através da visualização de pastas aninhadas em vários níveis.
A interface com visualização gráfica de uma estrutura de pastas facilitará a transição
de um sistema de armazenagem em papel para o sistema eletrônico e tornará o
sistema mais fácil de usar, principalmente por usuários inexperientes.
6 Recuperando documentos
A qualidade do processo de recuperação de documentos está diretamente ligada ao
sistema de indexação utilizado. O sistema deve interagir com os usuários através de
ferramentas simples e intuitivas, sem a necessidade de uso de códigos, símbolos ou
operadores complicados e difíceis de memorizar. Isso é importante, pois possibilita a
localização de qualquer documento da coleção com base apenas no que o usuário
sabe no momento sobre o documento.
Em alguns casos isso significa ter que navegar em uma árvore de pastas (diretórios),
em outros, significa realizar uma pesquisa por campos.
Por outro lado, se tudo o que o usuário souber sobre o documento for uma palavra ou
frase que ele contém, a pesquisa em texto (full-text) ajudará a recuperar os arquivos
relevantes.
Qualquer que seja o método utilizado, o importante é que o processo de recuperação
de documentos pelo usuário seja absolutamente intuitivo, simples e amigável.
Usuários familiarizados com o conteúdo de um documento devem poder usar esta
informação para encontrar exatamente o que precisam. Alguns sistemas permitem
apenas busca por palavras-chave indexadas. Este método nem sempre ajuda já que,
em geral, a pessoa que selecionou as palavras-chave não é a mesma que irá procurar
o documento. Para ser realmente útil o sistema deve permitir a pesquisa baseada na
indexação completa do texto (full-text indexing).
Da mesma forma, utilizar o nome do documento ou a árvore de diretórios pode ser
simples e intuitivo, mas pode também não ser o melhor método ou o mais rápido.
Algumas vezes a pessoa sabe exatamente qual documento procura, mas não sabe
onde ele pode ser encontrado, em qual diretório foi colocado, ou como o documento
foi nomeado.
Usar campos indexados para encontrar um documento particular também pode ser
útil. Um sistema completo deve oferecer aos usuários a possibilidade de criar moldes
(ou templates) de formulários de busca com campos definidos pelo usuário. Pesquisas
por campos indexados permitem aos usuários passarem por milhões de registros
instantaneamente a procura do que lhes interessa. Claro que nesse caso o usuário
deverá estar consciente de como o documento foi categorizado e quais campos
indexados foram associados aos documentos.
Para maximizar a efetividade das buscas um sistema completo deve ser capaz de
combinar pesquisa por campos com pesquisa em texto.
7 Controlando o Acesso
Finalmente, um componente importante e mesmo de presença obrigatória em um SID
é o módulo de controle de acesso.
Ambientes computacionais modernos estão configurados, em geral, em rede
permitindo que pessoas diferentes utilizem diversos tipos de equipamentos a partir de
diferentes localidades para pesquisar informações. Um sistema para ser completo
deve oferecer aos seus diferentes usuários níveis de acesso apropriados, sem
comprometimento da confidencialidade ou da segurança. Assim, um sistema deve
apresentar duas características fundamentais:
disponibilidade ampla;
segurança.
7.1
Disponibilidade Ampla
Um SID deve oferecer diferentes formas de acesso aos arquivos. O método mais
usado é o do modelo cliente/servidor, que disponibiliza uma aplicação cliente
específica no desktop do usuário. Essa interface permite o escaneamento, indexação
e recuperação de documentos. O controle da documentação por imagem não deve e
não pode ser mais um processo restrito a um único escritório. Cada vez mais os
usuários em escritórios localizados remotamente necessitam de mobilidade para a
troca de documentos com colegas, ou para poderem trabalhar a distancia.
Freqüentemente realizado com uso de CDs, notebook, ou e-mail.
Além disso, o compartilhamento de documentos através da Internet ou intranet permite
que a aplicação de controle documental seja disponibilizada por toda a rede da
empresa e até para o público externo. Usuários devem ser capazes de pesquisar,
recuperar e visualizar documentos com a ajuda de qualquer navegador web por mais
simples que seja, de qualquer local e plataforma computacional (Windows, Macintosh,
Unix, etc.).
7.2
Segurança
Como as organizações usam os SIDs para arquivar uma grande variedade de
documentos, públicos e privados, um sistema de controle de acesso deve estar
presente e é fundamental. O controle deve permitir ao administrador do sistema
determinar quais diretórios e documentos os determinados usuários podem visualizar,
e quais ações podem executar nos documentos (editar, copiar, deletar, etc.).
Um sistema de segurança robusto deve dar acesso a todas as pessoas autorizadas,
seja local ou remotamente através da Web, tudo isso sem comprometer a segurança.
8 Considerações finais
Os Sistemas de Imagem de Documentos visam desenvolver princípios que melhorem
a produtividade em ambientes organizacionais com atividades que fazem uso de
grande quantidade de documentos em papel, tais como, gerenciamento de processos
jurídicos, manutenção de registros de pacientes, processamento de cartão de crédito,
processamento de patentes e processamento de pedidos, manutenção de registros
pessoais, etc.
Tais sistemas propiciariam basicamente três benefícios:
1.
Economia de espaço físico nas organizações; a digitalização e o
armazenamento de imagens eletrônicas dos documentos eliminaria a
necessidade de grandes armários-arquivos. Isso, evidentemente, quando a
substituição for desejada. Um único CD-ROM pode conter até 12.500 páginas.
2.
A possibilidade de recuperação rápida de várias categorias de documentos e
por várias pessoas ao mesmo tempo. Além da economia do tempo gasto com
arquivos mal armazenados e/ou mal classificados.
3.
A possibilidade de se fazer cópias de segurança, em CDs/DVDs ou discos
magneto-ópticos, dos documentos vitais para a organização, e armazenamento
delas fora do seu local original, por medida de segurança. Nota-se nas
organizações atuais que a maioria dos documentos não é copiada por falta de
espaço para armazenar as cópias.
Este tipo de sistema de gestão de imagens de documentos suscita vários problemas
que fazem parte atualmente de uma vasta área de pesquisa dividida em duas linhas
de principais, Sistema de Imagens de documentos (ou "Document Imaging Systems")
e ainda, mais genericamente o GED (Gestão Eletrônica de Documentos ou
"Management of Electronic Records").
Pode-se verificar, pela literatura da área, que o estágio atual de evolução científica e
tecnológica ainda é muito recente, os padrões estão sendo desenvolvidos e propostos
ao mercado. Ainda há um largo campo para pesquisa de novos métodos e técnicas
para minimizarem os problemas da gestão de documentos.
9 Bibliografia
[1] FLORES, Daniel. Análise do programa de legislação educacional integrada –
Prolei: uma abordagem arquivística na gestão eletrônica de documentos – GED
Dissertação de Mestrado, UFSM, Santa Maria, RS, Brasil, 2000.
[2] KOCH, Walter. Gerenciamento eletrônico de documentos – GED. São Paulo:
Cenadem, 1998.
[3] Bax, MP. “Projeto SigDoc, sistema de gestão documetal por imagem”, Projeto de
pesquisa submetido à FAPEMIG e aprovado em 1998.
>> FIM <<

Documentos relacionados

ged – gerenciamento eletrônico de documentos

ged – gerenciamento eletrônico de documentos Todo o acervo microfilmado segue um rigoroso procedimento de preparo que, na maioria dos casos, é mais demorado do que a microfilmagem em si. Através dos rolos de microfilmes podemos ter acesso a d...

Leia mais