Ferramentas de Tradução e Terminologia
Transcrição
Ferramentas de Tradução e Terminologia
Ferramentas de Tradução e Terminologia José João Dias de Almeida Alberto Manuel B. Simões [email protected] [email protected] Departamento de Informática Universidade do Minho Conteúdo 1 Introdução 6 2 Cultura Geral 7 2.1 Tipos de cheiros . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7 2.2 Compactação de cheiros 9 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.2.1 Instalação do WinZip . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9 2.2.2 Utilização do WinZip . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9 3 Internet como fonte de informação 3.1 3.2 10 Pesquisa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10 3.1.1 Directorias Temáticas . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10 3.1.2 Motores de Pesquisa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10 3.1.3 Uso de Motores de Pesquisa . . . . . . . . . . . . . . . . . . . . . . . . . 11 3.1.4 Uso avançado de Motores de Pesquisa . . . . . . . . . . . . . . . . . . . 11 Biblioteca de referência . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12 4 Corpora 4.1 14 Introdução aos corpora e linguística de corpora . . . . . . . . . . . . . . . . . . 14 4.1.1 Exemplos de uso de corpora . . . . . . . . . . . . . . . . . . . . . . . . . 14 4.1.2 Construção de corpora . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14 4.1.3 Terminologia, glossários, dicionários 15 . . . . . . . . . . . . . . . . . . . . 5 Tradução 16 5.1 Tradução automática exploratória . . . . . . . . . . . . . . . . . . . . . . . . . . 16 5.2 Tradução assistida por computador . . . . . . . . . . . . . . . . . . . . . . . . . 16 6 Gestão de terminologia 6.1 Trados MultiTerm 18 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18 6.1.1 Interface . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18 6.1.2 Pesquisa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21 6.1.3 Denição de Estrutura . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22 6.1.4 Inserção de uma cha terminológica . . . . . . . . . . . . . . . . . . . . 24 6.1.5 Hiper-ligações . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26 6.1.6 Exportação . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26 6.1.7 Filtros . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27 6.1.8 Modelos de Inserção 28 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1 7 Gestor de Memórias de tradução 7.1 Trados Workbench 29 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8 Sistema de alinhamento 8.1 30 Trados WinAlign . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30 8.1.1 Denição do Projecto . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30 8.1.2 Alinhamento . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33 9 Tradução de formatos especícos 9.1 29 36 Trados TagEditor . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10 Gestão de projectos de tradução 10.1 Trados Workspace 36 37 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . A Documentos de leitura sugerida 37 38 2 Lista de Figuras 6.1 Estrutura da janela principal do MultiTerm 6.2 Estrutura do registo de um conceito . . . . . . . . . . . . . . . . . . . . 19 . . . . . . . . . . . . . . . . . . . . . . . . 20 6.3 Denição de estrutura de uma base terminológica . . . . . . . . . . . . . . . . . 23 6.4 Inserção de uma cha terminológica . . . . . . . . . . . . . . . . . . . . . . . . 25 6.5 Denição de ltros . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28 8.1 Denições de Alinhamento (línguas) 8.2 Denições de Alinhamento (cheiros) . . . . . . . . . . . . . . . . . . . . . . . . 32 8.3 Denições de Alinhamento (exportação) . . . . . . . . . . . . . . . . . . . . . . 33 8.4 Pré-alinhamento . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34 8.5 Processo de alinhamento . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34 . . . . . . . . . . . . . . . . . . . . . . . . 3 31 Lista de Tabelas 6.1 Linguagem de denição de ltros . . . . . . . . . . . . . . . . . . . . . . . . . . 4 28 Lista de Exercícios 2.1 Instalação de um compactador . . . . . . . . . . . . . . . . . . . . . . . . . . . 9 3.1 Pesquisa de traduções . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12 6.1 Navegação sobre uma base terminológica . . . . . . . . . . . . . . . . . . . . . . 20 6.2 Pesquisa Simples . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21 6.3 Pesquisa Global . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21 6.4 Pesquisa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22 6.5 Denição da estrutura de uma base terminológica . . . . . . . . . . . . . . . . . 25 6.6 Inserção de cha terminológica 26 6.7 Hiper-ligações . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26 6.8 Exportação de base terminológica . . . . . . . . . . . . . . . . . . . . . . . . . . 27 fuzzy . . . . . . . . . . . . . . . . . . . . . . . . . . . 5 Capítulo 1 Introdução Este documento pretende dar apoio à disciplina de Ferramentas de Tradução e Terminologia do curso de Línguas Estrangeiras Aplicadas da Universidade do Minho. 6 Capítulo 2 Cultura Geral Sem o intuito de ser um manual de introdução à informática, este capítulo pretende apresentar alguns conceitos básicos sobre o uso de um computador e gestão de cheiros. 1. Instalação de software simples (Ex. software domínio público, software de demonstração, etc); 2. Aprender a visualizar e imprimir PDF e alguns outros formatos comuns (ir buscar o Acrobat Reader, instalá-lo e utilizá-lo); 3. Aprender a mandar documentos (qualquer tipo) via mail em anexo (attachment). 2.1 Tipos de cheiros Com certeza que já reparou na grande panóplia de diferentes tipos de documentos existente no mundo da Informática. Em particular, se usa o Microsoft Windows, deve ter reparado que vários documentos apresentam ícones diferentes. Cada um destes ícones representa um tipo de cheiro diferente. Apesar de existir sistemas como o Microsoft Windows que apresentam ícones para cada tipo de cheiro, normalmente os diversos tipos são identicados por um conjunto de letras que aparecem no m do nome do cheiro precedidas por um ponto. sebenta.doc fotografia.jpg manual.pdf documento.xml Nos nomes de cheiros apresentados, .doc, .jpg, .pdf e .xml são exemplos de extensões de nomes de cheiros. A cada uma destas extensões está associado um tipo de documento e, muitas vezes, um tipo de aplicação. Esta secção pretende apresentar uma pequena listagem de tipos de cheiros, e aplicações a ele relacionadas. .txt é o mais simples formato existente. Limita-se a uma sequência de caracteres, sem qualquer tipo de formação. Para a sua edição sugere-se, em Windows, o de notas. No caso de se usar o wordpad ou o Microsoft Word voltar a gravar o documento em formato de texto; 7 notepad ou bloco deve-se ter o cuidado de .doc extensão de documentos criados com o Microsoft Word ou Wordpad. Embora úteis para a criação de documentos, são completamente inecientes em relação à sua portabilidade, e intercâmbio entre sistemas; .rtf conhecido como Ritch Text Format, é um formato baseado em texto puro com um conjunto de comandos (normalmente precedidos por uma barra invertida) que permitem a sua formatação. Podemos considerá-lo como o antecessor do formato edição sugere-se o .pdf Microsoft Windows Portable Document Format. ou o WordPad ; .doc. Para a sua Formato de hiper-documentos portáveis entre sistemas. Além de permitirem a formatação de texto e inclusão de imagens, suportam hiperligações entre zonas do documento, tornando-se documentos interactivos. visualização é necessário o .ps Acrobat Reader, um programa da Adobe Para a sua que é gratuito. PostScript, pode ser considerado o predecessor do formato PDF, mais vocacionado para o modo como as impressoras funcionam do que para a sua visualização. .xml eXtensible Markup Language é um formato baseado em texto puro que utiliza etiquetas (sequências especiais de caracteres) para delimitar zonas nos documentos. Embora use comandos, é o formato ideal para intercâmbio de informação por se basear em texto puro. Por esta razão, pode ser editado em ferramentas como o NotePad, embora existam ferramentas dedicadas à sua edição. .html/.htm HyperText Markup Language é uma linguagem baseada em SGML (uma vari- ante do XML) para a descrição de páginas para a Internet. Ultimamente, é considerado como uma instância especíca da linguagem XML para a Web. Programas como o crosoft Word, Microsoft Frontpage ou Netscape Composer Mi- permitem a sua modicação, mantendo o formato original; .tmx Translation Memories Exchange é um formato também baseado em XML com o objectivo de permitir o intercâmbio de memórias de tradução entre os vários sistemas existentes. Voltaremos a falar sobre este formato na secção 7 da página 29; .jpg formato para imagens, baseado num algoritmo de compressão com perdas. É eciente na compressão de fotograas, uma vez que a razão entre as perdas introduzidas pelo algoritmo e a compressão é compensadora; .gif formato para imagens, baseado em compressão sem perdas, em que cada imagem pode usar um máximo de 256 cores. É usado para imagens como diagramas, em que a qualidade é importante, e o número de cores desprezável. Suporta transparência. e a criação de animações para Internet, baseadas na sobreposição de imagens; .png Portable Network Graphics é um novo formato para imagens, algo entre o tipo JPG e GIF. Suporta 16 milhões de cores, e utiliza um algoritmo de compressão sem percas. Suporta transparência a vários níveis, e está cada vez mais a ser o formato adoptado para páginas na Web; .bmp Bitmap é um formato quase sem compressão e que suporta vários níveis de cores, desde 256 a 16 milhões. Visto não usar compressão não é aconselhado o seu uso em páginas de Internet uma vez que os seus tamanhos são, normalmente, gigantescos; 8 .zip um dos mais comuns formatos de documentos ou pastas compactadas. Estes cheiros especiais de que iremos falar na secção 2.2, utilizam algoritmos ecientes de compactação sem percas para reduzir o tamanho de um ou vários documentos, de forma a serem transportáveis em suportes com memória reduzida; Para o seu manuseio, sugere-se o uso da aplicação .rar WinZip ou WinRar ; outro formato de documentos compactados com as mesmas características dos cheiros ZIP. Em alguns casos, a sua eciência é maior na relação entre o espaço original e espaço compactado. Para abrir documentos com esta extensão deve usar a aplicação .ppt .xls WinRar ; formato do Microsoft PowerPoint, para apresentações multimédia; formato do Microsoft Excel, para folhas de cálculo. .mtw formato do Trados MultiTerm para bases de dados terminológicas. Ver secção 6.1. .mdx formato do Trados MultiTerm para denições de exportação. Ver secção 6.1.6. 2.2 Compactação de cheiros A compactação de cheiros tem como objectivo a redução dos seus tamanhos de forma a permitir transportá-los de forma mais rápida (pela Internet, por exemplo) ou de forma a que caibam em dispositivos de memória reduzida (por exemplo, uma disquete). Esta compactação pode ser feita apenas a um cheiro ou a um conjunto deles. Ao compactar juntamente vários cheiros, existe a vantagem de que o programa de compactação irá criar apenas um cheiro que contém todos os cheiros compactados. Embora seja possível com os programas actuais abrir e alterar documentos compactados, tal nem sempre é uma boa ideia por gastar mais recursos do computador respectivo. A compactação é obtida com base na catalogação de partes que se repetem ao longo do documento, criando um dicionário que associa a cada uma destas partes um pequeno código que a irá substituir ao longo do documento. 2.2.1 Instalação do WinZip Exercício 2.1 Instalação de um compactador Instale um sistema de compactação/descompactação no seu computador. WinZip, na sua versão shareware em http://www.winzip.com. 2.2.2 Utilização do WinZip 9 Pode arranjar o Capítulo 3 Internet como fonte de informação Embora a utilização de dicionários, gramáticas e enciclopédias seja imprescindível para o tradutor, existe informação que não se pode obter pelos métodos tradicionais. Exemplo de casos em que estes utensílios não são sucientes é a tradução de textos técnicos com termos emergentes que nem sempre estão incluídos em dicionários. Para colmatar este problema, sugere-se a utilização de Internet como fonte de informação quer para a desambiguação do uso de determinados termos, quer para a denição de termos menos comuns. 3.1 Pesquisa Devido à grande quantidade de informação disponível na Internet, várias formas de a catalogar foram aparecendo. Em particular, apareceram páginas (ou sites ) que permitem a pesquisa sobre um grande conjunto de páginas catalogadas. Estes centros de informação dividem-se em dois grandes grupos: motores de pesquisa e directorias temáticas. 3.1.1 Directorias Temáticas sites, como por exemplo o SAPO1 , dispõem de uma árvore temática (muito semelhante a um thesaurus ) em que estão organizadas as várias páginas de Internet catalogadas. Este tipo Vários de estrutura permite uma navegação semanticamente orientada sobre a sua base de dados. Em certos casos, estes sites também incluem uma zona de pesquisa a partir de um conjunto de palavras. No entanto, este método distingue-se das motores de pesquisa por permitirem apenas a pesquisa sobre os documentos que se encontram catalogados na árvore temática. 3.1.2 Motores de Pesquisa Estes sites, embora também possam incluir directorias temáticas, têm um tipo de funciona- mento diferente; usam robots que percorrem a Internet seguindo ligações entre páginas, e vão catalogando cada uma delas. Esta catalogação não as insere numa árvore temática, indexando apenas o seu conteúdo. Ao realizar uma pesquisa num destes 1 http://www.sapo.pt 10 sites, o sistema irá percorrer toda a sua base de dados de páginas indexadas e não só as que foram colocadas manualmente na árvore temática. Exemplos de motores de pesquisa são: google2 , yahoo3 , altavista4 . 3.1.3 Uso de Motores de Pesquisa Ao visitar um motor de pesquisa acabamos por encontrar uma página com um local para introduzir o texto que estamos a procurar. Depois de o escrever e escolher o botão respectivo para iniciar a pesquisa, o sistema irá apresentar uma lista de entradas (normalmente, as dez primeiras) ordenadas de acordo com os critérios do motor de pesquisa. Assim como cada motor de pesquisa tem os seus critérios de relevância sobre as páginas, cada um tem uma linguagem associada que permite aumentar o poder de pesquisa. Por exemplo, o Google[1] tem as seguintes propriedades: todos • as páginas apresentadas contêm • alguns termos introduzidos são ignorados, quando são reconhecidos como termos dema- os termos introduzidos para pesquisa; siado comuns. Exemplos destes termos são letras soltas ou • não faz stemming, http ou .com; ou seja, não procura sub-padrões. Se procurar telef o google não irá encontrar telefone ou telefax. Se está em dúvida, use ambas as palavras; • não é sensível às maiúsculas ou minúsculas, ou a acentos e marcas diacríticas; • para procurar frases completas, como to be or not to be use aspas na pesquisa: be or not to be" "to ; 3.1.4 Uso avançado de Motores de Pesquisa Alguns destes motores de pesquisa suportam métodos de pesquisa mais ecientes do que os apresentados na secção anterior. Para isso, usam uma linguagem especíca para denir certos critérios de pesquisa. Alguns detalhes técnicos acerca do Google: • embora ignore palavras comuns, letras ou algarismos (visto que aumentam o tempo de pesquisa), indica que palavras foram ignoradas. No entanto, se alguma destas palavras é essencial para encontrar os resultados que procura, pode usar o sinal + (mais) antes da palavra em questão. Não esquecer o espaço antes do sinal. Se quiser procurar o primeiro episódio da Guerra das Estrelas poderia usar Star Episode +I; • por vezes uma palavra pode ter dois signicados. Wars Ao procurar pela palavra canto poderia encontrar quer páginas relativas a canções, como páginas referentes a pássaros. Neste caso, pode pedir ao Google que procure páginas em que determinada palavra não exista. Isto pode ser obtido usando o sinal - (menos) antes da palavra em questão: canto -pássaro; 2 http://www.google.com http://www.yahoo.com 4 http://www.altavista.com 3 11 • se procura páginas que contenham uma de várias palavras use o operador OR (em maiúsculas). Se deseja procurar um destino de férias mas ainda não decidiu entre Londres e Paris, tente: férias • londres OR paris; procura o contacto de um funcionário da Universidade do Minho. tural que a página que lhe interessa esteja num dos uminho.pt). sites Nesse caso, é na- da Universidade (dentro de Poderá usar o operador site: para esse m: reitor site:uminho.pt. De forma semelhante, para obter páginas no web português (.pt) pode usar pt; • pode querer saber que páginas estão a apontar para determinado endereço, por exemplo, para a sua página pessoal. Para isso usa-se o operador link: antes do ende- reço em questão. Por exemplo, para encontrar páginas que liguem ao Google iria usar link:www.google.com; • o operador related: irá listar páginas semelhantes ao endereço indicado. related:www.google.com irá listar as páginas parecidas com a do Google; • para obter informação sobre determinada página usa o operador info:. Experimente info:www.google.com; • se usar o operador allintitle:, todas as palavras que lhe seguem têm de aparecer no título da página para que o Google as mostre; • de forma semelhante, o operador intitle: irá obrigar a que a palavra que se lhe segue apareça no título (e não todas); • o operador allinurl: irá restringir a páginas em que todas as palavras que se lhe seguem estejam no URL da página em questão; • com funcionalidade semelhante, o operador inurl: irá restringir a páginas em que a palavra que se lhe segue esteja no URL da página em questão; Note que nos operadores que acabam em dois pontos (:) não deve incluir um espaço entre eles e a palavra que se lhe segue. Exercício 3.1 Pesquisa de traduções Tente usar o Google e as propriedades de pesquisa avançada para encontrar traduções de termos que não sejam triviais de traduzir. Tente descobrir qual a forma ocial de traduzir Computer Graphics. 3.2 Biblioteca de referência Constituição de informação organizada sobre referências temáticas tais como: • enciclopédias; • dicionários, glossários; • cronologias; 12 • informação cultural geográca; • bibliotecas digitais; • revistas; • repositórios terminologias, memórias de tradução, . . . 13 Capítulo 4 Corpora 4.1 Introdução aos corpora e linguística de corpora • Entende-se por corpus (mono-lingue) como um grande conjunto fechado de texto em determinada língua, e por vezes, de determinado género linguístico. • Da mesma forma, entende-se por corpus bilingue dois conjuntos de texto, em línguas distintas, que podem ser a tradução um do outro. • Corpora paralelos (semelhante a memórias de tradução) tipicamente corpora bilingue com alinhamento à frase • Corpora comparados dada a diculdade em arranjar corpora paralelos, por vezes constitui-se corpora bilingues por junção de textos de temática muito semelhante. (exemplo: juntar artigos de jornal Ingleses e Portugueses a descrever o desastre do Prestige. Embora não sejam a tradução um do outro, é de esperar que a haja terminologia semelhante) • Corpora etiquetado corpora em que é acrescentada informação adicional ligada à palavra, à estrutura ou a outras coisas. 4.1.1 Exemplos de uso de corpora • Corpora pesquisável pela Internet; 4.1.2 Construção de corpora • "juntar"textos (como resultado de processos anteriores, digitalização, via rede, ...); • alinhamento de textos paralelos; • questões associadas a formatos (durabilidade, independência de ferramentas, plataformas, etc); • ferramentas ligadas a corpora 14 4.1.3 Terminologia, glossários, dicionários • Exemplo do Babylon (babylon builder: constrói glossários (.gls) textuais; babylon: disponibiliza muitos glossários, dicionários de tradução); • Exemplo do Trados MultiTerm; (estrutura mais complexa e poderosa; dependente de plataforma mas capaz de exportar em TEI, RTF, formatos textuais; integrado no sistema de tradução Trados) • FreeDict; • Thesaurus; 15 Capítulo 5 Tradução A tradução pode ter grau de exigência variada consoante o objectivo a que se destina. Desta forma, convencionamos que: • tradução exploratória é destinada a obter um documento traduzido, mesmo que com palavras por traduzir ou mal traduzidas, e erros sintácticos, apenas para compreender total ou parcialmente o conteúdo do documento; • tradução humana é aquela que tem validação humana. Pode ser totalmente manual ou ajudada por computador. 5.1 Tradução automática exploratória Este tipo de tradução é, normalmente, completamente automática e portanto, autónoma do tradutor. É baseada em dicionários de palavras ou termos e raramente ou quase nunca tem em conta a estrutura gramatical de cada língua. Embora sem qualidade, este tipo de tradução pode ser útil como dicionário de tradução (embora se obtenha apenas uma possível tradução) ou então como processo rápido para compreender parcialmente o conteúdo do documento, podendo mais tarde vir a traduzir manualmente em caso de interesse. Estes sistemas são normalmente disponibilizados por motores de pesquisa na web, de forma a que qualquer utilizador possa ler um qualquer documento da aldeia global. Exemplo de um destes sistemas é o babelsh, que pode ser visitado em http://babelfish.altavista.com. 5.2 Tradução assistida por computador A tradução assistida por computador pode ser dividida em dois grupos. Um em que o tradutor usa a máquina apenas como dicionário de tradução, e outro em que são usados sistemas de abstracção sobre tipos de documentos, sistemas de gestão de memórias de tradução, gestores de terminologia, etc. É deste tipo de tradução que vamos falar. Normalmente, estas ferramentas são designadas de CAT Tools Computer Assisted Translation Tools. Exemplos de ferramentas CAT comerciais são o Trados e o DéjàVu. Estas ferramentas envolvem os seguintes componentes: 16 • gestor de terminologias mais do que um dicionário de tradução, uma base terminológica associa termos a conceitos, podendo agregar exemplos de uso, denições, comentários, etc.; • memórias de tradução sempre que é efectuada uma tradução para determinado cliente, o trabalho efectuado não vai ser deitado fora. Usando memórias de tradução, traduções de textos iguais ou semelhantes a traduções anteriormente efectuadas podem voltar a ser usadas; • gestor de projectos de tradução normalmente um trabalho de tradução não envolve apenas a tradução de determinado documento. Ao existir uma aplicação de gestão de projectos, é possível organizar documentos, bases terminológicas e memórias de tradução especícas do projecto num local comum; • editor de tradução permite a abstracção sobre os tipos de documentos a traduzir, de forma a que o tradutor não precise de se preocupar com o formato interno dos documentos; 17 Capítulo 6 Gestão de terminologia Uma das principais ajudas para uma tradução bem feita é um conjunto de terminologia adequada ao documento a traduzir. Determinados termos, em algumas áreas, têm traduções que pelo seu uso durante vários anos, e por várias instituições, caram cristalizados e são as traduções ociais. Nestes casos, os tradutores não devem tentar fazer a sua própria tradução, mesmo que julgue que a sua seria melhor. Como estes termos e respectivas traduções ociais não aparecem em dicionários, o tradutor deve ter um conjunto de bases terminológicas, para cada uma das áreas em que está a trabalhar. Estas bases terminológicas podem ser disponibilizadas pelo cliente da tradução (o que acontece só em casos de empresas de grandes dimensões) ou, geralmente, devem ser constituídas e mantidas pelos tradutores. Para a sua construção o tradutor deve usar não só documentos que tem à sua disponibilidade, desde dicionários a enciclopédias, como também a Internet, como vimos no capítulo 3, ou ainda a discussão com técnicos da área em que a tradução de insere. Cada base terminológica deve ser fechada ( self-contained ), ou seja, deve conter os termos da área, relacionando-os entre si. Podemos denir de forma abstracta uma base terminológica como sendo um conjunto de registos terminológicos. Cada um destes registos contém um ou mais termos em várias línguas, que se referem ao mesmo conceito. Em vários casos pode ser necessário associar ao conceito ou a algum dos termos uma denição, categorização gramatical e/ou morfológica da palavra, exemplos de uso ou qualquer outro tipo de informação adicional. 6.1 Trados MultiTerm O pacote de ferramentas Trados inclui um gestor de terminologia[3] bastante poderoso. Permite não só a construção de bases terminológicas (com um formato congurável), como a sua consulta ou exportação em diversos formatos. 6.1.1 Interface Quando iniciamos o MultiTerm (escolhendo no botão Iniciar/Start a opção adequada) deverá aparecer uma janela de diálogo a questionar o utilizador sobre se deseja acesso restrito à base terminológica. Isto deve-se à aplicação ter sido desenvolvida para funcionar numa rede de computadores. Neste ambiente, torna-se importante que quando um utilizador efectue 18 alterações à base terminológica não possa existir outro utilizador a realizar também alterações (mas apenas a consultar). Assim sendo, sempre que desejamos realizar alterações nas bases terminológicas, devemos escolher a opção que nos dá acesso restrito. Figura 6.1 Estrutura da janela principal do MultiTerm Depois da aplicação iniciada deverá aparecer uma janela semelhante à apresentada na gura 6.1. As zonas apresentadas correspondem a: Barra de menu onde se podem escolher as operações passiveis de serem realizadas sobre a base terminológica e os seus registos; Barra de diálogo zona que permite a navegação sobre a base terminológica. Esta é com- posta pelos campos da língua de origem e língua de destino, pelos botões de navegação para os conceitos seguintes e anteriores, pelo conceito actual e pelo campo de pesquisa; Denição do conceito zona onde é mostrada a cha terminológica do conceito actual (ex- plicada na gura 6.2); Barra de mensagens onde aparecem mensagens importantes do sistema que explicam os erros ou sucessos das operações efectuadas; Língua de origem permite a escolha da língua de origem da consulta, de entre as línguas existentes na base terminológica; Língua de destino permite a escolha da língua de destino da consulta, de entre as línguas existentes na base terminológica; Conceito actual mostra o conceito que está a ser visualizado nesse momento (na língua de origem); 19 Próximo conceito botão com o próximo conceito (pela ordem lexicográca) da base termi- nológica. Pode ser usado para navegar sequencialmente pelos vários termos existentes. Conceito anterior botão (que não aparece na imagem) à esquerda do conceito actual que permite aceder ao conceito anterior da base terminológica; Campo de pesquisa zona que permite efectuar pesquisas de termos na língua de origem sobre a base terminológica (ver secção 6.1.2); Figura 6.2 Estrutura do registo de um conceito Por sua vez, a gura 6.2 mostra a estrutura típica de uma cha terminológica: Cabeçalho contém um conjunto de campos referentes ao conceito, como um todo. Neste exemplo podemos reparar não só no número de registo, como também no assunto em que se insere este conceito, assim como uma nota; Língua de Origem contém os vários termos na língua de origem que se inserem neste con- ceito, assim como denições, notas ou propriedades a eles associados; Língua de Destino contém os vários termos na língua de destino que se inserem neste con- ceito, assim como denições, notas ou propriedades a eles associados; Outras Línguas contém termos noutras línguas que não as seleccionadas como língua de origem ou língua de destino; Exercício 6.1 Navegação sobre uma base terminológica Execute o Trados MultiTerm. Utilize uma base terminológica (por exemplo, sample.mtw) para experimentar a alteração das línguas de origem e destino, assim como o uso dos botões para aceder ao próximo ou ao termo anterior. 20 6.1.2 Pesquisa Existem três tipos de pesquisa: simples, global e fuzzy. Cada uma tem a sua funcionalidade especíca. Pesquisa Simples Permite pesquisar um termo directamente. É útil quando sabemos exactamente que termo estamos a procurar, ou com que caracteres ele começa. Para realizar este tipo de pesquisa escreve-se no campo de pesquisa o termo, ou as primeiras letras do termo que procuramos, e carrega-se na tecla Enter. A pesquisa funciona da seguinte forma: • se o termo existe, este é apresentado; • se o termo existe e é apresentado, e o botão do termo seguinte é o mesmo termo, signica que existem palavras homónimas na base terminológica; • se o termo não existe, o MultiTerm irá apresentar o termo existente lexicamente seguinte ao termo procurado. Também é apresentada na barra de mensagens Not found . Exercício 6.2 Pesquisa Simples Tente efectuar várias pesquisas usando o campo de pesquisa. Experimente com palavras não existentes, e experimente usar apenas os primeiros caracteres de cada palavra; Pesquisa Global Este tipo de pesquisa é semelhante ao tipo de pesquisa simples. Na verdade, não é mais do que a pesquisa simples usando-se um caracter especial (o asterisco *) para representar qualquer sequência de caracteres. Ou seja, se escrever na caixa de pesquisa qualquer coisa como *ware numa base terminológica, o MultiTerm iria apresentar uma janela com todos os termos (da língua de origem seleccionada) que terminam com ware. Da mesma forma, a*z irá apresentar todos os termos que começam com a letra a e terminal com a letra z. Pode, também, utilizar mais do que uma vez o asterisco. Assim, *xyz* iria apresentar todos os termos que contenham a sequência de caracteres apresentada. Exercício 6.3 Pesquisa Global sample.mtw procure vários termos, utilizando o asterisco. *berry*. Utilizando a base terminológica exemplo, tente Pesquisa *berry e Por Fuzzy Este tipo de pesquisa, a forma mais poderosa para encontrar um termo numa base terminológica, baseia-se num índice criado com todos os termos existentes, incluindo também formas ortogracamente erradas. Por exemplo, para a palavra carro o índice iria incluir carro acrro craro caror 21 e, possivelmente, outras variantes. No entanto, este índice tem de ser construído antes de ser possível realizar uma pesquisa deste tipo. Como estes índices incluem várias combinações para cada palavra, são lentos a serem construídos. Para a criação do índice deve seleccionar a língua de origem da pesquisa que deseja realizar. Depois, no menu File escolhe-se a opção Create Fuzzy Index . É necessário conrmar a criação do índice na janela que se lhe segue. O MultiTerm irá começar a criar imagens fuzzy de todos os termos da base terminológica. Quando o índice estiver pronto a ser usado, a mensagem irá aparecer na barra de mensagens. Fuzzy index successfully created Depois de criado o índice, pode-o usar escrevendo um cardinal (#) antes do termo a pesquisar. Para perceber melhor experimente os exemplos do exercício 6.4. Exercício 6.4 Pesquisa fuzzy sample.mtw experimente criar um índice fuzzy para o inglês, e efectuar #grape bunch ou #bunsh of prapes. Em ambos os casos, o encontrar bunch of grapes. Na base terminológica várias pesquisas. Experimente MultiTerm deverá 6.1.3 Denição de Estrutura Uma base terminológica MultiTerm é um conjunto de registos indexados por língua. registo pode conter termos em várias línguas. Cada Cada termo, ou todo o registo (o conceito), pode ter a si associado um conjunto de campos. Além desta estrutura, cada língua pode ter propriedades de ordenação, e o registo pode ainda conter imagens. Existem vários tipos de campos numa base terminológica: campos indexados normalmente correspondem às línguas existentes na base terminológica. Só estes campos é que permitem o uso do campo de pesquisa; campos de texto podem estar associados ao conceito ou a um campo indexado e correspon- dem a informação textual. São usados para campos como: denição, contexto, origem, gramática, exemplos; campos enumerados também podem estar associados ao conceito ou a um campo indexado. No entanto, correspondem a campos cujo valor (texto inserido) tem de ser escolhido de entre uma lista de escolhas possíveis. São usados para campos como: género, categoria; campos mistos são campos enumerados que permitem a inserção de texto extra além do existente na lista de escolha; Para denir uma base terminológica usa-se a opção Create new termbase no menu File . Irá aparecer uma janela semelhante à apresentada na gura 6.3. Depois de denir a estrutura desejada, deve utilizar o botão OK , seguindo-se a escolha do nome do cheiro onde vai gravar a base terminológica. Campos indexados Para adicionar um campo indexado procede-se da seguinte forma: 1. seleccionar um campo indexado (língua) já existente; 22 Figura 6.3 Denição de estrutura de uma base terminológica 23 2. usar o botão Add ; 3. escrever o nome do campo; Da mesma forma, é simples apagar um campo indexado já existente. Neste caso, seleccionase o campo indexado (língua) a apagar e usa-se o botão Delete. Campos de texto São denidos e apagados exactamente da mesma forma dos campos indexados: 1. seleccionar um campo de texto já existente; 2. usar o botão Add ; 3. escrever o nome do campo; ou seleccionar o campo a apagar e usar o botão Delete. Campos enumerados A denição de campos enumerados é feita a dois níveis. Realiza-se um primeiro passo semelhante ao realizado para os campos anteriores: 1. seleccionar um campo enumerado já existente; 2. usar o botão Add ; 3. escrever o nome do campo; Passa-se a denir os valores que este campo pode conter. Na caixa respectiva, escreve-se em cada linha um dos textos pré-denidos que o campo pode conter. Para mudar de linha usa-se a combinação de teclas Ctrl+Enter. Para apagar um destes valores usa-se o teclado como num editor de texto comum. Para apagar todo o campo enumerado, selecciona-se o campo em questão e usa-se o botão Delete. Campos mistos Como referido acima, pode existir necessidade de manter um campo enumerado que permita a adição de mais algum texto. A sua denição é realizada criando um campo enumerado normal e, os valores que devam permitir texto extra, têm de terminar com o caracter dois pontos :. 6.1.4 Inserção de uma cha terminológica Para inserir uma cha terminológica usa-se a opção Add Entry no menu Edit . Irá aparecer uma janela semelhante à apresentada na gura 6.4. A gura mostra não só a janela de inserção mas também a janela que lhe irá aparecer se usar o botão Entry Header . Esta janela mostra apenas informação como a data de inserção do registo, data em que foi alterado e número de ordem do registo. 24 Exercício 6.5 Denição da estrutura de uma base terminológica Tente denir um novo tipo de base terminológica com a seguinte estrutura: • campos indexados: português, inglês, francês; • campos de texto: denição, nota, exemplo; • campos enumerados: género (masculino/feminino), número (singular/plural), categoria gramatical (verbo/nome/adjectivo/. . . ); Figura 6.4 Inserção de uma cha terminológica Os outros dois botões permitem cancelar totalmente a edição da cha terminológica ou gravar o registo. As outras duas áreas permitem a edição do registo e ver as mensagens do sistema em relação à edição que está a efectuar. A inserção de dados é bastante dependente do local onde o cursor do rato se encontra. Sempre que for necessário colocar o rato sobre determinado local na área de edição, repare na barra de mensagens se tem o rato no sítio correcto. Para inserir um campo indexado deve usar a tecla I. Irá aparecer a lista de línguas existentes na base terminológica. Depois de escolher a língua que deseja inserir irá aparecer uma janela onde deve escrever o termo que está a inserir. Repare que ao colocar o cursor sobre um dos termos indexados a língua em questão irá aparecer na barra de mensagens. Para inserir um campo de texto, enumerado ou misto associado ao conceito em geral, deve colocar o rato de forma a que a barra de mensagens não mostre qualquer língua. Normalmente, a forma mais simples de obter este estado é colocar o rato ligeiramente abaixo do botão Cancel . Para inserir o campo associado a determinada língua deve colocar o rato sobre a língua em questão. 25 A inserção de um campo de texto é efectuada usando a tecla T. Irá escolher o campo de texto em questão e escrever o texto respectivo. Da mesma forma, para inserir um campo enumerado ou misto irá usar a tecla A. Para apagar um termo ou campo use a tecla E. Exercício 6.6 Inserção de cha terminológica Usando a denição do exercício anterior introduza dois ou três registos, associando campos não só aos vários termos mas também ao conceito geral; 6.1.5 Hiper-ligações O MultiTerm permite inserir hiper-ligações nos campos de texto ou nos campos mistos. Desta forma, torna-se simples de colocar numa denição, exemplo ou nota um texto que ao ser clicado salte para um outro termo. Estas hiper-ligações são criadas utilizando um acento circunexo antes e depois da palavra (ou termo) que deverá ser procurado na base terminológica. Assim, poderia colocar numa denição um texto do género: chimpanzé: mamífero muito parecido com um ^macaco^. que irá tornar a palavra macaco numa ligação para o termo com o mesmo nome. Exercício 6.7 Hiper-ligações Experimente criar uma hiper-ligação entre dois dos termos que inseriu no exemplo anterior. Verique que depois de gravadas, a hiper-ligação funciona! 6.1.6 Exportação Para que a base terminológica seja de alguma forma útil é importante que seja pesquisável mas também que possa ser usada para outros ns. Por esta razão, o MultiTerm inclui funcionalidades de exportação da base terminológica para outros formatos, desde formatos simples de texto até um formato RTF pronto a ser incluído num documento Word e impresso tal e qual um dicionário prossional. 1 possível denir os seus próprios formatos de exportação. A exportação da base terminológica é realizada em dois passos. É ainda Em primeiro lugar é necessário denir estruturalmente a forma como a exportação é realizada. No segundo passo, exporta-se realmente a base terminológica. Embora o Trados MultiTerm já inclua formatos de exportação continua a ser necessário efectuar o primeiro passo. É preciso carregar a denição de exportação para o formato desejado. Para isso usa-se a opção Dene export para a denição do formato de exportação. no menu File . A janela apresentada é usada No entanto, é possível utilizar o botão Load para carregar um formato já existente. Depois de pressionado irá aparecer uma janela a pedir o nome da função de exportação. Usa-se o botão 1 Browse para escolher a denição a partir este tópico não irá ser coberto neste documento. Para mais informações consulte o manual de terminologia da Trados 26 de um cheiro do nosso disco. Irá surgir uma janela semelhante às usadas para abrir cheiros, em que se deve seleccionar o tipo de exportação desejado. Estes cheiros, de extensão .mdx encontram-se na directoria em que c:\Program Files\trados\T5_fl\TT\. o Trados foi instalado. Normalmente corresponde a Nesta directoria devem existir os seguintes formatos de exportação: backup.mdx permite exportar no formato de backup da Trados, um formato textual legível num editor de texto; list.mdx rtf.mdx formato textual que corresponde à lista dos termos da base terminológica; exportação 2 num formato pronto para um processador de texto como o Microsoft Word, que gera um formato de dicionário pronto a ser impresso; tei.mdx exportação no formato TEI (Text Encoding Initiative) em XML; ventura.mdx exportação para a aplicação Corel Ventura; Para qualquer um destes tipos de exportação, o processo segue escolhendo-se o cheiro em causa e usando-se o botão Open . O MultiTerm voltará à janela de denição de formatos de exportação, mas agora com um formato em memória. Termina-se este primeiro passo usando o botão Close . Segue-se a exportação. No menu Export all entries File escolhe-se uma das opções Export this entry ou conforme se deseje exportar apenas uma ou todas as chas terminológicas, respectivamente. O MultiTerm abrirá uma janela onde deverá escrever o nome do cheiro em que deseja exportar a base terminológica. Exercício 6.8 Exportação de base terminológica Experimente exportar uma base terminológica (por exemplo, a matos. Experimente o formato Backup sample.mtw) para vários for- e abra o cheiro gerado com o Bloco de Notas (note- pad). Tente realizar a exportação da base terminológica no formato RTF e abrir o respectivo documento gerado do Microsoft Word. 6.1.7 Filtros O MultiTerm permite a denição de ltros para seleccionar chas terminológicas com determinadas propriedades. Por exemplo, é possível procurar todas as chas terminológicas sobre determinado assunto, ou procurar todas as chas terminológicas que não têm um termo em determinada língua. A gura 6.5 mostra a janela onde se denem ltros. Pode aceder à janela usando no menu View a opção Dene Filter . 2 A exportação no formato RTF é ligeiramente mais complicada do que a exportação num dos outros formatos. Na verdade, antes de proceder ao carregamento do formato de exportação é preciso copiar um cheiro especial que contém o cabeçalho RTF do documento a gerar. É necessário procurar o cheiro MultiTerm.rtx no disco do seu computador (normalmente na directoria c:\Program Files\trados\T5_fl\TT\) e copiá-lo para junto do cheiro da base terminológica. Supondo que a sua base terminológica se chama c:\base.mtw terá de copiar o cheiro MultiTerm.rtx para c:\base.rtx. Só depois poderá realizar a exportação neste formato. Deverá também ter cuidado ao gravar o cheiro gerado, porque deve escolher a extensão correcta: .rtf 27 Figura 6.5 Denição de ltros Cada linha da tabela é composta por duas partes: do lado esquerdo aparece o nome do campo que estamos a analisar, e do lado direito, o critério de ltragem denido sobre esse campo. Para a denição de critérios usam-se os caracteres especiais apresentados na tabela 6.1. Tabela 6.1 Linguagem de denição de ltros * ! !* o campo existe (mesmo que vazio) o campo existe e não é vazio o campo não existe o campo está vazio xyz *xyz* !(...) conteúdo do campo igual a xyz o campo contém a sequência de caracteres xyz negação da propriedade entre parêntesis ... 6.1.8 Modelos de Inserção ... 28 Capítulo 7 Gestor de Memórias de tradução Com certeza de que se já realizou algum tipo de tradução comercial, deverá ter reparado que determinadas frases, slogans ou termos aparecem de forma repetida nos vários documentos a traduzir. É natural que se estiver a traduzir um conjunto de manuais de uma aplicação, cada um dos manuais contenha uma notícia de direitos de cópia, uma secção introdutória e outras zonas que de uma forma ou de outra aparecem repetidamente em todos os documentos. Nestes casos, a utilização de memórias de tradução torna a tradução mais simples e ao mesmo tempo mais coerente. Sempre que o sistema encontre uma frase semelhante a uma que já foi traduzida, irá mostrar esse caso e sugerir a reutilização desse texto. Um gestor de memórias de tradução permite a consulta destas memórias de tradução, a sua edição, importação e exportação em diferentes formatos. ... 7.1 Trados Workbench ... • Consulta (procura paralela de pares de frases que concordem com um determinado padrão - concordance) • Edição • importação/exportação em alguns formatos 29 Capítulo 8 Sistema de alinhamento Se já realizou diversas traduções sem utilizar uma ferramenta de tradução especíca, é provável que tenha um conjunto de trabalhos antigos perdidos pelo seu computador, completamente desaproveitados. Os sistemas de alinhamento têm como objectivo a reutilização destes trabalhos em memórias de tradução para que o sistema possa vir a reutilizar o trabalho já realizado. Outros sistemas existem para alinhar textos à palavra. Estes sistemas, menos populares, usam texto já alinhado à frase para, por meios estatísticos, construir dicionários de tradução. 8.1 Trados WinAlign O WinAlign[2] é a ferramenta que a Trados fornece para o alinhamento de textos à frase. Na verdade, não é mais do que um sistema que dado um conjunto de pares de cheiros os parte em blocos e os apresenta a par. Cabe ao utilizador unir os blocos entre as duas línguas. Depois de alinhados, pode-se exportar a memória de tradução produzida para ser utilizada em traduções posteriores. ... • Produção de material a incorporar em memórias de tradução; • Projecto de alinhamento; • Alinhamento orientado à palavra; 8.1.1 Denição do Projecto A criação de um projecto de alinhamento é feita em vários passos. É necessário indicar ao Trados quais as línguas a usar, que cheiros vão ser alinhados, tipo dos cheiros, nível de relevância estrutural e vários outros parâmetros. Para iniciar, use a opção New Project no menu File . Irá surgir uma janela semelhante à apresentada na gura 8.1. Cada separatória apresenta um tópico diferente de conguração. General Nesta zona conguram-se as propriedades principais do projecto de alinhamento: Project Name nome do projecto. Não é o nome do cheiro criado, mas sim, algum tipo de descrição que o permita caracterizar; 30 Figura 8.1 Denições de Alinhamento (línguas) File Type tipo de cheiros a alinhar. Embora um projecto de alinhamento possa alinhar vários pares de cheiros, estes têm de ser todos do mesmo tipo. Aqui deve ser escolhido o tipo adequado e caso se trate de um formato XML ou SGML, escolher o DTD a si associado; Source Settings Target Settings Source Language ) e congurar o nível Source Segmentation ); permite escolher a língua de origem ( de segmentação do documento ( permite escolher a língua de destino e congurar o nível de segmentação do documento; Intermediate Result Files O que tem impreterivelmente directoria onde o Trados deve colocar cheiros auxiliares. de ser preenchido é o nome do projecto, tipos de cheiros e línguas a alinhar. Files Aqui determinam-se que cheiros vão ser alinhados. Usa-se o botão Add... de cada uma das colunas para adicionar os cheiros. No lado esquerdo os cheiros da língua de origem e no lado direito os cheiros da língua de destino. O botão Remove permite remover algum cheiro adicionado por engano. Depois de adicionados os cheiros é necessário associar os cheiros da língua de origem com os da língua de destino. Se as colunas de cheiros os mostram pela ordem correcta (o primeiro da esquerda corresponde ao primeiro da direita, o segundo, ao segundo direita e 31 Figura 8.2 Denições de Alinhamento (cheiros) assim sucessivamente) basta usar o botão Align File Names para criar a associação entre os cheiros. Se, por outro lado, os cheiros estão por ordem incorrecta, é necessário fazer a associação de forma manual. Para isso, use o rato para arrastar as folhas à beira de cada cheiro para a folha respectiva do outro cheiro. Alignment ... Structure Recognition ... Interface ... Export Esta separatória permite congurar o método de exportação da memória de tradução gerada pelo alinhamento dos cheiros. A primeira zona permite escolher entre os dois formatos possíveis para serem exportados: • Translator's Workbench Import Format entre aplicações da Trados. 32 formato proprietário da Trados, para uso Figura 8.3 Denições de Alinhamento (exportação) • Translation Memory Exchange Format (TMX) formato independente da aplica- ção, em XML, para intercâmbio de memórias de tradução entre aplicações; ... 8.1.2 Alinhamento Depois de criado o projecto camos com uma janela idêntica à apresentada na gura 8.4. Aqui são apresentados os pares de cheiros. Para alinhar cada um dos pares faz-se um duplo-clique sobre um dos cheiros. Irá aparecer uma janela como a da gura 8.5. Esta é a janela principal no processo de alinhamento. A parte superior mostra uma esquematização do alinhamento entre capítulos e secções dos cheiros. A parte inferior é o alinhamento entre as frases de cada uma das secções. As ligações apresentadas indicam que os segmentos do lado esquerdo correspondem aos segmentos a si ligados do lado direito. A diferença entre os vários tipos de traços correspondem à qualidade do alinhamento. O alinhamento automático é apresentado por traços picotados ou tracejados. O alinhamento realizado pelo tradutor são traços a cheio. O processo limita-se a alterar (ou não) as ligações efectuadas automaticamente. As ligações erradas podem ser removidas usando o botão direito do rato sobre a folha ligada de forma errada, e escolhendo a opção disconnect . Depois de removidas as ligações erradas procede-se ao novo alinhamento que se efectua arrastando as folhas dos segmentos correspondentes. É importante lembrar que um segmento de um dos lados pode ser ligado a vários segmentos do outro lado. No entanto, não é possível ligar um conjunto de segmentos de um lado a um conjunto de segmentos do outro lado. Quando este tipo de ligação é necessário edita-se os 33 Figura 8.4 Pré-alinhamento Figura 8.5 Processo de alinhamento 34 segmentos de um dos lados de forma a que isso se resolva. Para editar os segmentos utiliza-se o botão do lado direito do rato sobre o segmento em causa, e usa-se a opção segment . Edit active Aqui pode-se alterar o texto, seleccionar alguma porção, copiar e, editando outro segmento, colar essa porção de texto. 35 Capítulo 9 Tradução de formatos especícos Um tradutor tem de estar preparado para traduzir os mais diversos formatos de documentos. Desde simples documentos Microsoft Word, páginas de Internet ou documentos DocBook, é necessário efectuar a tradução mantendo a mesma estrutura conceptual e visual. Como é difícil o tradutor conhecer todos os formatos existentes, e possuir todas as aplicações necessárias para a sua manipulação, é habitual os sistemas de tradução terem capacidade de manusear os mais diversos formatos existentes. Não só a capacidade de os mostrar, mas a capacidade de compreender a estrutura do documento e desta forma, ajudar o tradutor a mantê-la. 9.1 Trados TagEditor O TagEditor[5, 4] Dado um formato especíco F, há necessidade de: • extrair as frases a traduzir, • utilizar um editor de tradução capaz: de utilizar as memórias de tradução e de utilizar a terminologia do projecto que permita traduzir as várias frases e enriquecer as memórias de tradução • encaixar as frases traduzidas na estrutura do texto original 36 Capítulo 10 Gestão de projectos de tradução Quando nos deparamos com a tradução de uma grande quantidade de textos, distribuídos por vários cheiros, é necessária alguma organização para manter o trabalho em ordem. Por exemplo, pode ser útil criar uma memória de tradução ou base terminológica por cliente. Embora determinada tecnologia possa ser associada a uma área, existem empresas que usam diferentes termos para o mesmo objecto. 10.1 Trados Workspace [4] • denição de um projecto de tradução língua origem, destino memória de tradução a utilizar terminologia a utilizar lista dos (grupos de) cheiros a traduzir estado actual da tradução 37 Apêndice A Documentos de leitura sugerida • Intomàtica Aplicada a la Traducció - Mikel L. Forcada i Juan Ortiz, Universidade de Alincante; Muito do conteúdo deste livro não é falado durante a disciplina, especialmente devida à baixa escolaridade desta disciplina. No entanto recomenda-se a sua leitura, pondo especial cuidado nos capítulos III, IV, V, VI, X. • Acetatos apresentados durante as aulas; • Documentação do Trados (ver CD da disciplina) • Ligações Internet recomendadas: Google (http://www.google.com) - onde se recomenda a leitura da ajuda em relação a expressões de pesquisa e ans Biblioteca de referência da disciplina (http://natura.di.uminho.pt/cgi-bin/biblioteca.pl) - recomendando-se que explore as várias ligações nela contidas e que contribua com outras sugestões • Corpora - Projecto AC/DC (http://cgi.portugues.mct.pt/acesso) • Página da disciplina (http://natura.di.uminho.pt/~jj/ftt) 38 Bibliograa [1] Google advanced search guide. http://www.google.com. [2] TRADOS Ireland Ltd, Dublin, Ireland. TRADOS 5 - Advanced Alignment Guide, 2001. [3] TRADOS Ireland Ltd, Dublin, Ireland. TRADOS 5 - Advanced Terminology Guide, 2001. [4] TRADOS Ireland Ltd, Dublin, Ireland. TRADOS 5 - Specialist Guide, 2001. [5] TRADOS Ireland Ltd, Dublin, Ireland. TRADOS 5 - Translation Guide, 2001. 39 Índice pesquisa global, 21 compactadores, 9 pesquisa simples, 21 winzip, 9 directorias temáticas, 10 exportação base terminológica, 26 extensões, 7 .bmp, 8 .doc, 8 .gif, 8 .htm, 8 .html, 8 .jpg, 8 .mdx, 9, 27 .mtw, 9 .pdf, 8 .png, 8 .ppt, 9 .ps, 8 .rar, 9 .rtf, 8, 26, 27 .tmx, 8 .txt, 7 .xls, 9 .xml, 8, 27 .zip, 9 cheiros compactação, 9 descompactação, 9 extensões, 7 motores de busca, 10 motores de pesquisa, 10 MultiTerm exportação, 26 inserção, 24 inter-ligações, 26 pesquisa fuzzy, 21 40