Guia Rápido Modo Avançado
Transcrição
Guia Rápido Modo Avançado
SED 2.0 Guia Rápido Módulo 1 – Servidor de OCR Sistema Eletrônico de Documentos Nesta Edição 1 Parâmetros da Digitalização 2 Configuração do MODO AVANÇADO 3 Adicionando Documento ao Cadastro 4 Utilizando ABBYY FineReader (Digitalização em TIF) 5 Parametrizando Servidor OCR 6 Utilizando ABBY Hot Folder 7 Monitorando Servidor de OCR Utilizando Servidor OCR com ABBYY FineReader e ABBYY Hot Folder PÁGINA 2 GUIA DE ORIENTAÇÃO RÁPIDA – [MODO AVANÇADO] Introdução O objetivo desse guia é fornecer informações específicas sobre a versão avançada do sistema de digitalização com processamento do OCR no servidor, todas as informações sobre a utilização do SED (Sistema Eletrônico de Documentos) estão contidas no GUIA RÁPIDO DO SED MODO CLÁSSICO, é importante ler o guia antes de continuar, essa edição abortará somente informações sobre o MODO AVANÇADO. Parâmetros da Digitalização Clique no menu “Configurações e Parâmetros”, item “Parâmetros da Digitalização”: Nessa tela será definido o tipo de processamento que será adotado e também todos os parâmetros que o sistema irá usar para localizar os documentos e vincula-los ao sistema. MODO CLÁSSICO: processamento do OCR em tempo real significa que a cada documento digitalizado o sistema fará o reconhecimento do OCR e indexação, ou seja, o operador só poderá seguir para o próximo documento após a conclusão desse processo, é o mesmo recurso disponibilizado na versão 1.0, detalhes dessa utilização vide Guia rápido de utilização do SED 2.0 – MODO CLÁSSICO. MODO AVANÇADO: processamento do OCR no Servidor significa que haverá a necessidade de um reconhecimento do OCR e indexação posterior ao cadastro do documento, o operador do sistema irá vincular ao cadastro um documento do tipo “imagem”, agilizando assim o seu cadastramento. FIORILLI SOC. CIVIL LTDA. – SOFTWARE [email protected] (17) 3264-9000 PÁGINA 3 GUIA DE ORIENTAÇÃO RÁPIDA – [MODO AVANÇADO] Configuração do MODO AVANÇADO. Escolha o tipo de processamento. Use os botões para alterar os parâmetros, localizar um diretório, limpar o campo de parâmetros e botão de ajuda. Configurações Locais e Parâmetros do Sistema: Selecione o Arquivo Executável do Aplicativo do Scanner: opção personalizada. Só terá efeito na máquina local, deve ser selecionado o programa que será usado, pode ser o padrão disponibilizado pelo suporte do Scanner ou outro que prefira. Selecione o Diretório Temporário onde serão Salvos os Arquivos da Digitalização (PDF’s/TIFF’s): Esta opção deve ser direcionada a uma pasta local no computador, pois esse parâmetro só terá efeito na maquina local. Selecione o Diretório onde serão Processados os Arquivos OCR’s: Selecione aqui onde vão ser armazenados os arquivos digitalizados em Imagem TIFF e ou PDF que ficaram pendentes de processamento OCR, esse processamento será feito por programas de terceiros, que transformará os arquivos de imagem em arquivos PDF/A, mais detalhes sobre essa operação serão descritos a seguir nesse mesmo guia, esta pasta deve se um caminho local ou pasta na rede compartilhada; Selecione o Diretório onde ficaram armazenados os Arquivos da Digitalização: Selecione aqui onde vão ser armazenados definitivamente os arquivos digitalizados sendo um caminho local ou pasta na rede compartilhada; Nome do Arquivo Temporário: Preencha com o nome do arquivo gerado pelo programa do scanner, não informe a extensão do arquivo nesse campo; Selecione a Extensão do Arquivo Temporário: Selecione aqui entre as opções de extensão suportadas pelo sistema (Arquivos PDF, Arquivos TIF e Arquivos TIFF); [x] Esse Terminal Será Usado para Digitalização de Documento: Marque esse opção somente para os terminais que realmente vão trabalhar em conjunto com o Scanner. Botão “Padrão”: Clique sobre esse botão para selecionar os valores padrões de uma instalação local normal, qualquer alteração deve ser corrigida manualmente. (Essa opção sobrescreve os parâmetros acima) Observação: Para que os terminais visualizem os arquivos digitalizados é necessário acesso ao diretório onde serão armazenados as imagens e arquivos em anexos, o acesso a esse diretório pode ser por meio de compartilhamento ou mapeamento, a visualização se fara automaticamente. FIORILLI SOC. CIVIL LTDA. – SOFTWARE [email protected] (17) 3264-9000 PÁGINA 4 GUIA DE ORIENTAÇÃO RÁPIDA – [MODO AVANÇADO] Cadastro de Documentos Antes de iniciarmos a digitalização de documentos precisamos fazer o cadastro individual do documento, todas as informações referentes aos cadastros no sistema estão no GUIA RÁPIDA DO SED MODO CLÁSSICO, as mudanças quanto a utilização se dão a partir do momento que o SED faz a chamada ao aplicativo externo de digitalização. Clique em “Adicionar” para anexar novos documentos a lista de digitalizações. FIORILLI SOC. CIVIL LTDA. – SOFTWARE [email protected] (17) 3264-9000 PÁGINA 5 GUIA DE ORIENTAÇÃO RÁPIDA – [MODO AVANÇADO] Adicionando Documentos Digitalizados. Após clicar sobre o botão “Adicionar” a tela de “Documentos em Anexo”, será exibida, note que dessa vez o botão “Scan PDF” aparece desabilitado, isso porque no MODO AVANÇADO, somente é permitido a digitalização com resultado em arquivos de imagem, nesses casos recomendamos que se use arquivos do tipo TIF com múltiplas páginas. Utilize o botão “Scan TIF”: Botão “Scanner TIF”: Clique para iniciar o processo de digitalização dos documentos, opção exclusiva para arquivos de imagem (tif, tiff). FIORILLI SOC. CIVIL LTDA. – SOFTWARE [email protected] (17) 3264-9000 PÁGINA 6 GUIA DE ORIENTAÇÃO RÁPIDA – [MODO AVANÇADO] Utilizando o ABBYY FineReader. Vale salientar que se o objetivo da digitalização for um trabalho mais detalhado que exija uma melhor performance do resultado, seja ele relativo a capacidade de digitalização (processamento páginas por minuto) ou seja pelo melhor resultado de OCR (reconhecimento de caracteres), possa haver a necessidade da utilização de software de terceiros, nós testamos a ferramenta da ABBYY, o FineReader 11 (software necessita de licenciamento), o resultado foi satisfatório mas a Fiorilli Software deixa claro que não comercializa esse produto e a utilização dele é de total responsabilidade de você cliente, o SED (Sistema Eletrônico de Documentos) funcionará com qualquer outro aplicativo desde que atenda os requisitos mínimos, inclusive todo scanner traz com sigo um programa semelhante. Ao clicar no botão “Scanner TIF” para executar o software que será utilizado para acessar as funções do Scanner, esse aplicativo foi parametrizado como mostra a imagem na página 4 desse guia. Utilização. A tela abaixo mostra o ABBYY FineReader 11 Corporate Edition, necessária para a opção de processamento de OCR em Servidor por conter o aplicativo ABBYY Hot Folder, que será apresentando logo adiante. Observações Importantes: Um dos pré-requisitos para utilização da versão em MODO AVANÇADO do SED é a necessidade de aplicativos de terceiros que sejam capazes de transformar arquivos de imagem, no nosso caso arquivos TIFF para arquivos no formato de PDF/A. utilizamos e testamos o ABBYY Hot Folder, vale lembrar que será preciso apenas uma licença desse aplicativo, que trabalhará no servidor, as outras estações de trabalho podem usar a versão Professinal Edition do ABBYY FineReader. FIORILLI SOC. CIVIL LTDA. – SOFTWARE [email protected] (17) 3264-9000 PÁGINA 7 GUIA DE ORIENTAÇÃO RÁPIDA – [MODO AVANÇADO] Configurando. Primeiro passo, vamos ocultar a Barra de Ferramentas Principal, isso facilitará a operação do sistema, para isso desmarque a opção clicando com o botão invertido do mouse em uma parte neutra do menu e depois clicando sobre o item, com mostra figura a baixo. Segundo passo, deixe marcada a opção Barra de acesso rápido. Terceiro passo, clique em Personalizar, para adicionar alguns comandos necessários para melhorar a utilização do Programa, selecione em Categorias a opção Todos os comandos, depois localize na lista o item Salvar Imagens, depois clique no botão “>>” para adicionar o botão na barra de ferramentas Acesso rápido. FIORILLI SOC. CIVIL LTDA. – SOFTWARE [email protected] (17) 3264-9000 PÁGINA 8 GUIA DE ORIENTAÇÃO RÁPIDA – [MODO AVANÇADO] Quarto passo selecione o item Salvar Imagens e em seguida clique no botão Para cima, até posicionar o item abaixo de o botão Digitalizar, isso fara com que sua barra de ferramentas fique mais produtiva. O resultado dever ser igual ao apresentado na imagem a seguir: FIORILLI SOC. CIVIL LTDA. – SOFTWARE [email protected] (17) 3264-9000 PÁGINA 9 GUIA DE ORIENTAÇÃO RÁPIDA – [MODO AVANÇADO] Acesse o menu “Ferramentas” sub menu “Opções” Na aba “Documento” selecione o Idioma ”Seleção automática”, Tipo de documento “Auto” e Modo de cor “Quatro cores”. FIORILLI SOC. CIVIL LTDA. – SOFTWARE [email protected] (17) 3264-9000 PÁGINA 10 GUIA DE ORIENTAÇÃO RÁPIDA – [MODO AVANÇADO] Na aba “Digitalizar/Abrir” marque a opção ”Não ler nem analisar automaticamente as imagens de páginas capturadas”, selecione o “Driver“ referente ao Scanner que será utilizado e marque a opção “Usar interface nativa”. Na aba “Ler” não será preciso fazer nenhuma modificação, pois não usaremos esse recurso no momento da digitalização. FIORILLI SOC. CIVIL LTDA. – SOFTWARE [email protected] (17) 3264-9000 PÁGINA 11 GUIA DE ORIENTAÇÃO RÁPIDA – [MODO AVANÇADO] Clique no botão “OK” para salvar as alterações pois as próximas etapas não serão necessárias. Obs. Essas configurações devem ser especificadas apenas uma vez, não terá necessidade de refaze-las novamente. FIORILLI SOC. CIVIL LTDA. – SOFTWARE [email protected] (17) 3264-9000 PÁGINA 12 GUIA DE ORIENTAÇÃO RÁPIDA – [MODO AVANÇADO] Digitalizando Documento. Com o ABBYY FineReader iniciado clique no botão “Digitalizar”, como mostra a figura abaixo. Na tela a seguir verifique se os parâmetros estão corretos: Resolução: “300 dpi” (atende as normas do CONARQ); Modo de Cor: “Colorido” (atende as normas do CONARQ); Tamanho do papel: “A4 (210x297 mm.)”. Clique no botão “Digitalizar” para iniciar o processo, iniciando o processo de digitalização: FIORILLI SOC. CIVIL LTDA. – SOFTWARE [email protected] (17) 3264-9000 PÁGINA 13 GUIA DE ORIENTAÇÃO RÁPIDA – [MODO AVANÇADO] O resultado será exibido como uma imagem no centro do programa, como mostra a imagem abaixo. FIORILLI SOC. CIVIL LTDA. – SOFTWARE [email protected] (17) 3264-9000 PÁGINA 14 GUIA DE ORIENTAÇÃO RÁPIDA – [MODO AVANÇADO] Salvar Documento. Em MODO AVANÇADO, precisamo ficar atentos quanto as opções para salvar os arquivo de Imagem (TIF) corretamente, para isso clique no botão Salvar que colocamos na Barra de Ferramentas como mostrado na página 8. O local, nome do arquivo e extensão devem ser as mesmas informadas nos parâmetros (pagina 4). Selecione o local onde será salvo os aquivos temporários, da proxima vez não será necessário selecionar esse caminho, poís o Abbyy Finer Reader lembra o ultimo diretório usado, informe o nome do arquivo do mesmo jeito que foi parametrizado, selecione o Tipo “TIFF, cor, compressão JPEG”, marque a opção “Salvar como arquivo de imagem com várias páginas” e clique em Salvar. FIORILLI SOC. CIVIL LTDA. – SOFTWARE [email protected] (17) 3264-9000 PÁGINA 15 GUIA DE ORIENTAÇÃO RÁPIDA – [MODO AVANÇADO] Ao fechar o Abby Fine Reader será solicitado se deseja salvar as alterações do documento, clique em Não. Processando e Anexando Documento. Ao fechar o ABBYY FineReader salvando o arquivo na pasta temporaria com o nome especifico informado nos parâmetros, o sistema automaticamente vinculára o documento ao SED 2.0, ao contrario do que acontece no MODO CLÁSSICO nesse momento o SED não processará o arquivo apenas exibindo a imagem TIFF como demonstrado abaixo, uma copia fiel do documento original colorido e com todas as suas caracteristicas preservadas. Clique em Salvar para concluir o processo de digitalização. FIORILLI SOC. CIVIL LTDA. – SOFTWARE [email protected] (17) 3264-9000 PÁGINA 16 GUIA DE ORIENTAÇÃO RÁPIDA – [MODO AVANÇADO] Parametrizando Servidor de OCR Para acessar o módulo de processamento de OCR dê um duplo clique no ícone criado na área de trabalho “SED 2.0 Servidor de OCR” Provavelmente no primeiro acesso ao módulo, aparecerá a seguinte mensagem, “Problemas com os Diretórios Configurados”, isso é normal, clique em OK para continuar. Selecione o diretório onde serão processados os arquivos do OCR, nesse exemplo utilizamos uma pasta chamada de ABBYY simplesmente para fazer uma referência ao programa responsável pela conversão das imagens TIF para arquivos PDF/A. FIORILLI SOC. CIVIL LTDA. – SOFTWARE [email protected] (17) 3264-9000 PÁGINA 17 GUIA DE ORIENTAÇÃO RÁPIDA – [MODO AVANÇADO] Em Parâmetros para OCR é possível personalizar a indexação das palavras salvas no OCR: Validar Palavras do OCR com Dicionário: marque/desmarque para validar ou não o resultado do reconhecimento do OCR (Optical Character Recognition - Reconhecimento ótico de caracteres), quando marcado essa opção o sistema irá validar as palavras usando como base alguns dos dicionários mais populares mundo, são eles: Português Brasileiro, Português Portugal, Inglês, Espanhol, Alemão, Italiano e Francês. Dessa forma o sistema irá otimizar o armazenamento das palavras que resultara numa melhor performance do sistema, agilizando as pesquisar e diminuindo o tamanho do arquivo de banco de dados, é aconselhável que se use essa opção. Salvar Números que Não Constam no Dicionário: marque/desmarque para escolher entre salvar números na indexação ou não, marque essa opção se acha relevante que o sistema use números além de palavras no momento das pesquisas por texto dos documentos. Servidor de OCR O servidor de OCR iniciará no lado direito do Desktop, a sua função é capturar os arquivos que serão convertidos pelo ABBYY Hot Folder, processá-los armazenando o resultado do seu OCR e indexando-o ao banco de dados e movendo os arquivos para sua pasta definitiva. O servidor mostra o status do seu monitoramento exibindo as pastas conforme parametrizado e a “String” de conexão com o banco de dados. FIORILLI SOC. CIVIL LTDA. – SOFTWARE [email protected] (17) 3264-9000 PÁGINA 18 GUIA DE ORIENTAÇÃO RÁPIDA – [MODO AVANÇADO] Utilizando o ABBYY Hot Folder. Vale salientar que a Fiorilli Software não comercializa esse produto e a utilização dele é de total responsabilidade de você cliente, o SED (Sistema Eletrônico de Documentos) funcionará com qualquer outro aplicativo desde que atenda os requisitos mínimos. Nós testamos a ferramenta da ABBYY, o FineReader 11 (software necessita de licenciamento), o resultado foi satisfatório e por isso vamos exemplificar aqui detalhadamente como deverá funcionar. Esclarecendo: o ABBYY Hot Folder tem a função de converter arquivos TIF para arquivos PDF/A, isso para tornar mais rápido o processo de digitalização nos terminais, pois assim não a necessidade o usuario ficar esperando os tais processamentos, tanto de reconhecimento de caracteres (OCR) quanto o de indexação no texto no banco de dados. Com isso esperamos que a produtividade aumente de forma consideravel elevando o numero de paginas digitalizadas por dia/máquina/usuario. Clique no botão “Nova”, para criar uma nova tarefa no ABBYY Hot Folder, como mostra a figura abaixo: Defina um nome para a nova Tarefa, Clique na opção Recorrente. FIORILLI SOC. CIVIL LTDA. – SOFTWARE [email protected] (17) 3264-9000 PÁGINA 19 GUIA DE ORIENTAÇÃO RÁPIDA – [MODO AVANÇADO] Etapa 1: Recorrente – marque a opção Todos os dias em Iniciar tarefa, depois defina um horário para que seja iniciado o processo. FIORILLI SOC. CIVIL LTDA. – SOFTWARE [email protected] (17) 3264-9000 GUIA DE ORIENTAÇÃO RÁPIDA – [MODO AVANÇADO] PÁGINA 20 Etapa 2: Abrir arquivo da pasta – escolha Abrir arquivo da pasta em Etapas: Selecione a pasta onde estão sendo salvos os arquivos TIF’s oriundos da digitalização; Desmarque a opção “Processar subpastas”; Selecione o Tipo de Arquivo no nosso caso “Arquivos TIFF (*.tif, *.tiff)”; Em Documentos, selecione a opção “Criar um documento separado para cada arquivo”; Em Imagens processadas, marque a opção “Mover para pasta” e depois crie uma pasta chamada “TIFF-BKP” dentro da pasta “OCR” e a selecione-a nesse parâmetro. FIORILLI SOC. CIVIL LTDA. – SOFTWARE [email protected] (17) 3264-9000 PÁGINA 21 GUIA DE ORIENTAÇÃO RÁPIDA – [MODO AVANÇADO] Etapa 3: Analisar e ler – marque a opção “Analisar e ler”, depois selecione a em Idioma “Seleção automática”. FIORILLI SOC. CIVIL LTDA. – SOFTWARE [email protected] (17) 3264-9000 PÁGINA 22 GUIA DE ORIENTAÇÃO RÁPIDA – [MODO AVANÇADO] Etapa 4: Salvar – Em salvar escolha a opção “Salvar documento”, depois em “Salvar como” selecione o tipo “Documento PDF/A”, e em “Pasta” selecione o diretório definitivo Após concluir as Etapas acima, clique no botão OK para salvar as alterações. FIORILLI SOC. CIVIL LTDA. – SOFTWARE [email protected] (17) 3264-9000 PÁGINA 23 GUIA DE ORIENTAÇÃO RÁPIDA – [MODO AVANÇADO] Iniciando o Monitoramento com ABBYY Hot Folder Para iniciar o monitoramento da pasta, basta selecionar a tarefa pré-configurada e clicar no botão “Começar agora”. O ABBYY Hot Folder exibirá o status do processamento, exibindo a quantidade de arquivos, quantidade de páginas e porcentagem concluída da operação. Quando o processo terminar todos os arquivos TIF’s armazenados na pasta “OCR” serão copiados já convertidos em arquivos PDF/A para a pasta “ABBYY”. FIORILLI SOC. CIVIL LTDA. – SOFTWARE [email protected] (17) 3264-9000 PÁGINA 24 GUIA DE ORIENTAÇÃO RÁPIDA – [MODO AVANÇADO] Iniciando o Monitoramento com Servidor OCR – Fiorilli SED Para iniciar o monitoramento da pasta parametrizada, basta clicar sobre o botão “Iniciar Processo de OCR”, da mesma forma para interromper, basta clicar sobre o botão “Parar Processo de OCR”. Status do Serviço em Execução, se está Ativado (verde) ou Desativado (vermelho); O arquivo que está sendo processado no momento, o nome do arquivo PDF (azul); Tempo restante para o processo monitoramento que é de 30 segundos. Clique no botão “Detalhes” para visualizar uma miniatura do documento que está sendo processado, tambem será possivel observar o status do processamento, página processado, palavra validada, etc. FIORILLI SOC. CIVIL LTDA. – SOFTWARE [email protected] (17) 3264-9000 PÁGINA 25 GUIA DE ORIENTAÇÃO RÁPIDA – [MODO AVANÇADO] Clique no botão “Parar Processo de OCR” para interromper o monitoramento da pasta, e a qualquer momento clique em “Iniciar Processo de OCR” para continuar. Após o conclusão dos processamentos o Servidor ficará monitorando o diretorio a cada 30 segundos, nessa situação o seu status continuará como “Ativado“. FIORILLI SOC. CIVIL LTDA. – SOFTWARE [email protected] (17) 3264-9000 PÁGINA 26 FIORILLI SOC. CIVIL LTDA. – SOFTWARE GUIA DE ORIENTAÇÃO RÁPIDA – [MODO AVANÇADO] [email protected] (17) 3264-9000
Documentos relacionados
FUJITSU Image Scanner SP-1120 Modelo básico da SP Series para
imagem se necessário, ele também converte automaticamente as imagens em imagens extremamente limpas, acelerando o OCR, mesmo quando são digitalizados documentos amassados ou sujos ou com padrão de ...
Leia mais