Ferramentas de Tradução e Terminologia

Transcrição

Ferramentas de Tradução e Terminologia
Ferramentas de Tradução e Terminologia
José João Dias de Almeida
Alberto Manuel B. Simões
[email protected]
[email protected]
Departamento de Informática
Universidade do Minho
Conteúdo
1 Introdução
6
2 Cultura Geral
7
2.1
Tipos de cheiros . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
7
2.2
Compactação de cheiros
9
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
2.2.1
Instalação do WinZip
. . . . . . . . . . . . . . . . . . . . . . . . . . . .
9
2.2.2
Utilização do WinZip . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
9
3 Internet como fonte de informação
3.1
3.2
10
Pesquisa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
10
3.1.1
Directorias Temáticas
. . . . . . . . . . . . . . . . . . . . . . . . . . . .
10
3.1.2
Motores de Pesquisa
. . . . . . . . . . . . . . . . . . . . . . . . . . . . .
10
3.1.3
Uso de Motores de Pesquisa . . . . . . . . . . . . . . . . . . . . . . . . .
11
3.1.4
Uso avançado de Motores de Pesquisa
. . . . . . . . . . . . . . . . . . .
11
Biblioteca de referência . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
12
4 Corpora
4.1
14
Introdução aos corpora e linguística de corpora
. . . . . . . . . . . . . . . . . .
14
4.1.1
Exemplos de uso de corpora . . . . . . . . . . . . . . . . . . . . . . . . .
14
4.1.2
Construção de corpora . . . . . . . . . . . . . . . . . . . . . . . . . . . .
14
4.1.3
Terminologia, glossários, dicionários
15
. . . . . . . . . . . . . . . . . . . .
5 Tradução
16
5.1
Tradução automática exploratória . . . . . . . . . . . . . . . . . . . . . . . . . .
16
5.2
Tradução assistida por computador . . . . . . . . . . . . . . . . . . . . . . . . .
16
6 Gestão de terminologia
6.1
Trados MultiTerm
18
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
18
6.1.1
Interface . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
18
6.1.2
Pesquisa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
21
6.1.3
Denição de Estrutura . . . . . . . . . . . . . . . . . . . . . . . . . . . .
22
6.1.4
Inserção de uma cha terminológica
. . . . . . . . . . . . . . . . . . . .
24
6.1.5
Hiper-ligações . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
26
6.1.6
Exportação
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
26
6.1.7
Filtros . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
27
6.1.8
Modelos de Inserção
28
. . . . . . . . . . . . . . . . . . . . . . . . . . . . .
1
7 Gestor de Memórias de tradução
7.1
Trados Workbench
29
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
8 Sistema de alinhamento
8.1
30
Trados WinAlign . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
30
8.1.1
Denição do Projecto
. . . . . . . . . . . . . . . . . . . . . . . . . . . .
30
8.1.2
Alinhamento
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
33
9 Tradução de formatos especícos
9.1
29
36
Trados TagEditor . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
10 Gestão de projectos de tradução
10.1 Trados Workspace
36
37
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
A Documentos de leitura sugerida
37
38
2
Lista de Figuras
6.1
Estrutura da janela principal do MultiTerm
6.2
Estrutura do registo de um conceito
. . . . . . . . . . . . . . . . . . . .
19
. . . . . . . . . . . . . . . . . . . . . . . .
20
6.3
Denição de estrutura de uma base terminológica . . . . . . . . . . . . . . . . .
23
6.4
Inserção de uma cha terminológica
. . . . . . . . . . . . . . . . . . . . . . . .
25
6.5
Denição de ltros
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
28
8.1
Denições de Alinhamento (línguas)
8.2
Denições de Alinhamento (cheiros) . . . . . . . . . . . . . . . . . . . . . . . .
32
8.3
Denições de Alinhamento (exportação)
. . . . . . . . . . . . . . . . . . . . . .
33
8.4
Pré-alinhamento
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
34
8.5
Processo de alinhamento . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
34
. . . . . . . . . . . . . . . . . . . . . . . .
3
31
Lista de Tabelas
6.1
Linguagem de denição de ltros
. . . . . . . . . . . . . . . . . . . . . . . . . .
4
28
Lista de Exercícios
2.1
Instalação de um compactador
. . . . . . . . . . . . . . . . . . . . . . . . . . .
9
3.1
Pesquisa de traduções
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
12
6.1
Navegação sobre uma base terminológica . . . . . . . . . . . . . . . . . . . . . .
20
6.2
Pesquisa Simples
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
21
6.3
Pesquisa Global . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
21
6.4
Pesquisa
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
22
6.5
Denição da estrutura de uma base terminológica . . . . . . . . . . . . . . . . .
25
6.6
Inserção de cha terminológica
26
6.7
Hiper-ligações . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
26
6.8
Exportação de base terminológica . . . . . . . . . . . . . . . . . . . . . . . . . .
27
fuzzy
. . . . . . . . . . . . . . . . . . . . . . . . . . .
5
Capítulo 1
Introdução
Este documento pretende dar apoio à disciplina de Ferramentas de Tradução e Terminologia
do curso de Línguas Estrangeiras Aplicadas da Universidade do Minho.
6
Capítulo 2
Cultura Geral
Sem o intuito de ser um manual de introdução à informática, este capítulo pretende apresentar
alguns conceitos básicos sobre o uso de um computador e gestão de cheiros.
1. Instalação de software simples (Ex. software domínio público, software de demonstração,
etc);
2. Aprender a visualizar e imprimir PDF e alguns outros formatos comuns (ir buscar o
Acrobat Reader, instalá-lo e utilizá-lo);
3. Aprender a mandar documentos (qualquer tipo) via mail em anexo (attachment).
2.1 Tipos de cheiros
Com certeza que já reparou na grande panóplia de diferentes tipos de documentos existente
no mundo da Informática. Em particular, se usa o Microsoft Windows, deve ter reparado que
vários documentos apresentam ícones diferentes. Cada um destes ícones representa um tipo
de cheiro diferente.
Apesar de existir sistemas como o Microsoft Windows que apresentam ícones para cada
tipo de cheiro, normalmente os diversos tipos são identicados por um conjunto de letras que
aparecem no m do nome do cheiro precedidas por um ponto.
sebenta.doc
fotografia.jpg
manual.pdf
documento.xml
Nos nomes de cheiros apresentados,
.doc, .jpg, .pdf
e
.xml
são exemplos de
extensões
de nomes de cheiros. A cada uma destas extensões está associado um tipo de documento e,
muitas vezes, um tipo de aplicação.
Esta secção pretende apresentar uma pequena listagem de tipos de cheiros, e aplicações
a ele relacionadas.
.txt
é o mais simples formato existente. Limita-se a uma sequência de caracteres, sem qualquer tipo de formação. Para a sua edição sugere-se, em Windows, o
de notas.
No caso de se usar o
wordpad
ou o
Microsoft Word
voltar a gravar o documento em formato de texto;
7
notepad
ou
bloco
deve-se ter o cuidado de
.doc
extensão de documentos criados com o
Microsoft Word
ou
Wordpad.
Embora úteis para
a criação de documentos, são completamente inecientes em relação à sua portabilidade,
e intercâmbio entre sistemas;
.rtf
conhecido como Ritch Text Format, é um formato baseado em texto puro com um conjunto de comandos (normalmente precedidos por uma barra invertida) que permitem a
sua formatação. Podemos considerá-lo como o antecessor do formato
edição sugere-se o
.pdf
Microsoft Windows
Portable Document Format.
ou o
WordPad ;
.doc.
Para a sua
Formato de hiper-documentos portáveis entre sistemas.
Além de permitirem a formatação de texto e inclusão de imagens, suportam hiperligações entre zonas do documento, tornando-se documentos interactivos.
visualização é necessário o
.ps
Acrobat Reader, um programa da Adobe
Para a sua
que é gratuito.
PostScript, pode ser considerado o predecessor do formato PDF, mais vocacionado para
o modo como as impressoras funcionam do que para a sua visualização.
.xml
eXtensible Markup Language é um formato baseado em texto puro que utiliza etiquetas
(sequências especiais de caracteres) para delimitar zonas nos documentos. Embora use
comandos, é o formato ideal para intercâmbio de informação por se basear em texto
puro. Por esta razão, pode ser editado em ferramentas como o
NotePad, embora existam
ferramentas dedicadas à sua edição.
.html/.htm
HyperText Markup Language é uma linguagem baseada em SGML (uma vari-
ante do XML) para a descrição de páginas para a Internet. Ultimamente, é considerado
como uma instância especíca da linguagem XML para a Web. Programas como o
crosoft Word, Microsoft Frontpage
ou
Netscape Composer
Mi-
permitem a sua modicação,
mantendo o formato original;
.tmx
Translation Memories Exchange é um formato também baseado em XML com o objectivo de permitir o intercâmbio de memórias de tradução entre os vários sistemas
existentes. Voltaremos a falar sobre este formato na secção 7 da página 29;
.jpg
formato para imagens, baseado num algoritmo de compressão com perdas. É eciente
na compressão de fotograas, uma vez que a razão entre as perdas introduzidas pelo
algoritmo e a compressão é compensadora;
.gif
formato para imagens, baseado em compressão sem perdas, em que cada imagem pode
usar um máximo de 256 cores. É usado para imagens como diagramas, em que a qualidade é importante, e o número de cores desprezável. Suporta transparência. e a criação
de animações para Internet, baseadas na sobreposição de imagens;
.png
Portable Network Graphics é um novo formato para imagens, algo entre o tipo JPG e
GIF. Suporta 16 milhões de cores, e utiliza um algoritmo de compressão sem percas.
Suporta transparência a vários níveis, e está cada vez mais a ser o formato adoptado
para páginas na Web;
.bmp
Bitmap é um formato quase sem compressão e que suporta vários níveis de cores, desde
256 a 16 milhões. Visto não usar compressão não é aconselhado o seu uso em páginas
de Internet uma vez que os seus tamanhos são, normalmente, gigantescos;
8
.zip
um dos mais comuns formatos de documentos ou pastas compactadas.
Estes cheiros
especiais de que iremos falar na secção 2.2, utilizam algoritmos ecientes de compactação
sem percas para reduzir o tamanho de um ou vários documentos, de forma a serem
transportáveis em suportes com memória reduzida; Para o seu manuseio, sugere-se o uso
da aplicação
.rar
WinZip
ou
WinRar ;
outro formato de documentos compactados com as mesmas características dos cheiros
ZIP. Em alguns casos, a sua eciência é maior na relação entre o espaço original e espaço
compactado. Para abrir documentos com esta extensão deve usar a aplicação
.ppt
.xls
WinRar ;
formato do Microsoft PowerPoint, para apresentações multimédia;
formato do Microsoft Excel, para folhas de cálculo.
.mtw
formato do Trados MultiTerm para bases de dados terminológicas. Ver secção 6.1.
.mdx
formato do Trados MultiTerm para denições de exportação. Ver secção 6.1.6.
2.2 Compactação de cheiros
A compactação de cheiros tem como objectivo a redução dos seus tamanhos de forma a
permitir transportá-los de forma mais rápida (pela Internet, por exemplo) ou de forma a que
caibam em dispositivos de memória reduzida (por exemplo, uma disquete).
Esta compactação pode ser feita apenas a um cheiro ou a um conjunto deles. Ao compactar juntamente vários cheiros, existe a vantagem de que o programa de compactação irá
criar apenas um cheiro que contém todos os cheiros compactados.
Embora seja possível com os programas actuais abrir e alterar documentos compactados,
tal nem sempre é uma boa ideia por gastar mais recursos do computador respectivo.
A compactação é obtida com base na catalogação de partes que se repetem ao longo do
documento, criando um dicionário que associa a cada uma destas partes um pequeno código
que a irá substituir ao longo do documento.
2.2.1 Instalação do WinZip
Exercício 2.1 Instalação de um compactador
Instale um sistema de compactação/descompactação no seu computador.
WinZip, na sua versão
shareware
em
http://www.winzip.com.
2.2.2 Utilização do WinZip
9
Pode arranjar o
Capítulo 3
Internet como fonte de informação
Embora a utilização de dicionários, gramáticas e enciclopédias seja imprescindível para o
tradutor, existe informação que não se pode obter pelos métodos tradicionais. Exemplo de
casos em que estes utensílios não são sucientes é a tradução de textos técnicos com termos
emergentes que nem sempre estão incluídos em dicionários.
Para colmatar este problema, sugere-se a utilização de Internet como fonte de informação
quer para a desambiguação do uso de determinados termos, quer para a denição de termos
menos comuns.
3.1 Pesquisa
Devido à grande quantidade de informação disponível na Internet, várias formas de a catalogar
foram aparecendo.
Em particular, apareceram páginas (ou
sites )
que permitem a pesquisa
sobre um grande conjunto de páginas catalogadas.
Estes centros de informação dividem-se em dois grandes grupos: motores de pesquisa e
directorias temáticas.
3.1.1 Directorias Temáticas
sites, como por exemplo o SAPO1 , dispõem de uma árvore temática (muito semelhante a
um thesaurus ) em que estão organizadas as várias páginas de Internet catalogadas. Este tipo
Vários
de estrutura permite uma navegação semanticamente orientada sobre a sua base de dados.
Em certos casos, estes
sites
também incluem uma zona de pesquisa a partir de um conjunto
de palavras. No entanto, este método distingue-se das motores de pesquisa por permitirem
apenas a pesquisa sobre os documentos que se encontram catalogados na árvore temática.
3.1.2 Motores de Pesquisa
Estes
sites,
embora também possam incluir directorias temáticas, têm um tipo de funciona-
mento diferente; usam robots que percorrem a Internet seguindo ligações entre páginas, e vão
catalogando cada uma delas. Esta catalogação não as insere numa árvore temática, indexando
apenas o seu conteúdo. Ao realizar uma pesquisa num destes
1
http://www.sapo.pt
10
sites,
o sistema irá percorrer
toda a sua base de dados de páginas indexadas e não só as que foram colocadas manualmente
na árvore temática.
Exemplos de motores de pesquisa são:
google2 , yahoo3 , altavista4 .
3.1.3 Uso de Motores de Pesquisa
Ao visitar um motor de pesquisa acabamos por encontrar uma página com um local para
introduzir o texto que estamos a procurar. Depois de o escrever e escolher o botão respectivo
para iniciar a pesquisa, o sistema irá apresentar uma lista de entradas (normalmente, as dez
primeiras) ordenadas de acordo com os critérios do motor de pesquisa.
Assim como cada motor de pesquisa tem os seus critérios de relevância sobre as páginas,
cada um tem uma linguagem associada que permite aumentar o poder de pesquisa.
Por exemplo, o Google[1] tem as seguintes propriedades:
todos
•
as páginas apresentadas contêm
•
alguns termos introduzidos são ignorados, quando são reconhecidos como termos dema-
os termos introduzidos para pesquisa;
siado comuns. Exemplos destes termos são letras soltas ou
•
não faz
stemming,
http
ou
.com;
ou seja, não procura sub-padrões. Se procurar telef o google não
irá encontrar telefone ou telefax. Se está em dúvida, use ambas as palavras;
•
não é sensível às maiúsculas ou minúsculas, ou a acentos e marcas diacríticas;
•
para procurar frases completas, como to be or not to be use aspas na pesquisa: be or not to be"
"to
;
3.1.4 Uso avançado de Motores de Pesquisa
Alguns destes motores de pesquisa suportam métodos de pesquisa mais ecientes do que os
apresentados na secção anterior. Para isso, usam uma linguagem especíca para denir certos
critérios de pesquisa.
Alguns detalhes técnicos acerca do Google:
•
embora ignore palavras comuns, letras ou algarismos (visto que aumentam o tempo de
pesquisa), indica que palavras foram ignoradas. No entanto, se alguma destas palavras
é essencial para encontrar os resultados que procura, pode usar o sinal + (mais) antes
da palavra em questão. Não esquecer o espaço antes do sinal.
Se quiser procurar o primeiro episódio da Guerra das Estrelas poderia usar Star
Episode +I;
•
por vezes uma palavra pode ter dois signicados.
Wars
Ao procurar pela palavra canto
poderia encontrar quer páginas relativas a canções, como páginas referentes a pássaros.
Neste caso, pode pedir ao Google que procure páginas em que determinada palavra não
exista. Isto pode ser obtido usando o sinal - (menos) antes da palavra em questão:
canto
-pássaro;
2
http://www.google.com
http://www.yahoo.com
4
http://www.altavista.com
3
11
•
se procura páginas que contenham uma de várias palavras use o operador OR (em
maiúsculas). Se deseja procurar um destino de férias mas ainda não decidiu entre Londres
e Paris, tente: férias
•
londres OR paris;
procura o contacto de um funcionário da Universidade do Minho.
tural que a página que lhe interessa esteja num dos
uminho.pt).
sites
Nesse caso, é na-
da Universidade (dentro de
Poderá usar o operador site: para esse m: reitor
site:uminho.pt.
De forma semelhante, para obter páginas no web português (.pt) pode usar pt;
•
pode querer saber que páginas estão a apontar para determinado endereço, por exemplo, para a sua página pessoal.
Para isso usa-se o operador link:
antes do ende-
reço em questão. Por exemplo, para encontrar páginas que liguem ao Google iria usar
link:www.google.com;
•
o operador related: irá listar páginas semelhantes ao endereço indicado.
related:www.google.com irá listar as páginas parecidas com a do Google;
•
para obter informação sobre determinada página usa o operador info:. Experimente
info:www.google.com;
•
se usar o operador allintitle:, todas as palavras que lhe seguem têm de aparecer no
título da página para que o Google as mostre;
•
de forma semelhante, o operador intitle: irá obrigar a que a palavra que se lhe segue
apareça no título (e não todas);
•
o operador allinurl:
irá restringir a páginas em que todas as palavras que se lhe
seguem estejam no URL da página em questão;
•
com funcionalidade semelhante, o operador inurl: irá restringir a páginas em que a
palavra que se lhe segue esteja no URL da página em questão;
Note que nos operadores que acabam em dois pontos (:) não deve incluir um espaço entre
eles e a palavra que se lhe segue.
Exercício 3.1 Pesquisa de traduções
Tente usar o Google e as propriedades de pesquisa avançada para encontrar traduções de
termos que não sejam triviais de traduzir. Tente descobrir qual a forma ocial de traduzir
Computer Graphics.
3.2 Biblioteca de referência
Constituição de informação organizada sobre referências temáticas tais como:
•
enciclopédias;
•
dicionários, glossários;
•
cronologias;
12
•
informação cultural geográca;
•
bibliotecas digitais;
•
revistas;
•
repositórios terminologias, memórias de tradução, . . .
13
Capítulo 4
Corpora
4.1 Introdução aos corpora e linguística de corpora
•
Entende-se por
corpus
(mono-lingue) como um grande conjunto fechado de texto em
determinada língua, e por vezes, de determinado género linguístico.
•
Da mesma forma, entende-se por
corpus bilingue
dois conjuntos de texto, em línguas
distintas, que podem ser a tradução um do outro.
•
Corpora paralelos (semelhante a memórias de tradução) tipicamente corpora bilingue
com alinhamento à frase
•
Corpora comparados dada a diculdade em arranjar corpora paralelos, por vezes
constitui-se corpora bilingues por junção de textos de temática muito semelhante. (exemplo: juntar artigos de jornal Ingleses e Portugueses a descrever o desastre do Prestige.
Embora não sejam a tradução um do outro, é de esperar que a haja terminologia semelhante)
•
Corpora etiquetado corpora em que é acrescentada informação adicional ligada à palavra, à estrutura ou a outras coisas.
4.1.1 Exemplos de uso de corpora
•
Corpora pesquisável pela Internet;
4.1.2 Construção de corpora
•
"juntar"textos (como resultado de processos anteriores, digitalização, via rede, ...);
•
alinhamento de textos paralelos;
•
questões associadas a formatos (durabilidade, independência de ferramentas, plataformas, etc);
•
ferramentas ligadas a corpora
14
4.1.3 Terminologia, glossários, dicionários
•
Exemplo do Babylon (babylon builder: constrói glossários (.gls) textuais; babylon: disponibiliza muitos glossários, dicionários de tradução);
•
Exemplo do Trados MultiTerm; (estrutura mais complexa e poderosa; dependente de
plataforma mas capaz de exportar em TEI, RTF, formatos textuais; integrado no sistema
de tradução Trados)
•
FreeDict;
•
Thesaurus;
15
Capítulo 5
Tradução
A tradução pode ter grau de exigência variada consoante o objectivo a que se destina. Desta
forma, convencionamos que:
•
tradução exploratória é destinada a obter um documento traduzido, mesmo que com
palavras por traduzir ou mal traduzidas, e erros sintácticos, apenas para compreender
total ou parcialmente o conteúdo do documento;
•
tradução humana é aquela que tem validação humana. Pode ser totalmente manual ou
ajudada por computador.
5.1 Tradução automática exploratória
Este tipo de tradução é, normalmente, completamente automática e portanto, autónoma do
tradutor. É baseada em dicionários de palavras ou termos e raramente ou quase nunca tem
em conta a estrutura gramatical de cada língua.
Embora sem qualidade, este tipo de tradução pode ser útil como dicionário de tradução (embora se obtenha apenas uma possível tradução) ou então como processo rápido para
compreender parcialmente o conteúdo do documento, podendo mais tarde vir a traduzir manualmente em caso de interesse.
Estes sistemas são normalmente disponibilizados por motores de pesquisa na web, de forma
a que qualquer utilizador possa ler um qualquer documento da aldeia global. Exemplo de um
destes sistemas é o babelsh, que pode ser visitado em
http://babelfish.altavista.com.
5.2 Tradução assistida por computador
A tradução assistida por computador pode ser dividida em dois grupos. Um em que o tradutor
usa a máquina apenas como dicionário de tradução, e outro em que são usados sistemas de
abstracção sobre tipos de documentos, sistemas de gestão de memórias de tradução, gestores
de terminologia, etc.
É deste tipo de tradução que vamos falar. Normalmente, estas ferramentas são designadas de CAT Tools Computer Assisted Translation Tools. Exemplos de ferramentas CAT
comerciais são o Trados e o DéjàVu.
Estas ferramentas envolvem os seguintes componentes:
16
•
gestor de terminologias mais do que um dicionário de tradução, uma base terminológica
associa termos a conceitos, podendo agregar exemplos de uso, denições, comentários,
etc.;
•
memórias de tradução sempre que é efectuada uma tradução para determinado cliente,
o trabalho efectuado não vai ser deitado fora. Usando memórias de tradução, traduções
de textos iguais ou semelhantes a traduções anteriormente efectuadas podem voltar a
ser usadas;
•
gestor de projectos de tradução normalmente um trabalho de tradução não envolve
apenas a tradução de determinado documento. Ao existir uma aplicação de gestão de
projectos, é possível organizar documentos, bases terminológicas e memórias de tradução
especícas do projecto num local comum;
•
editor de tradução permite a abstracção sobre os tipos de documentos a traduzir,
de forma a que o tradutor não precise de se preocupar com o formato interno dos
documentos;
17
Capítulo 6
Gestão de terminologia
Uma das principais ajudas para uma tradução bem feita é um conjunto de terminologia adequada ao documento a traduzir. Determinados termos, em algumas áreas, têm traduções que
pelo seu uso durante vários anos, e por várias instituições, caram cristalizados e são as traduções ociais. Nestes casos, os tradutores não devem tentar fazer a sua própria tradução,
mesmo que julgue que a sua seria melhor. Como estes termos e respectivas traduções ociais
não aparecem em dicionários, o tradutor deve ter um conjunto de bases terminológicas, para
cada uma das áreas em que está a trabalhar.
Estas bases terminológicas podem ser disponibilizadas pelo cliente da tradução (o que acontece só em casos de empresas de grandes dimensões) ou, geralmente, devem ser constituídas
e mantidas pelos tradutores. Para a sua construção o tradutor deve usar não só documentos
que tem à sua disponibilidade, desde dicionários a enciclopédias, como também a Internet,
como vimos no capítulo 3, ou ainda a discussão com técnicos da área em que a tradução de
insere.
Cada base terminológica deve ser fechada (
self-contained ),
ou seja, deve conter os termos
da área, relacionando-os entre si.
Podemos denir de forma abstracta uma base terminológica como sendo um conjunto de
registos terminológicos. Cada um destes registos contém um ou mais termos em várias línguas,
que se referem ao mesmo conceito. Em vários casos pode ser necessário associar ao conceito
ou a algum dos termos uma denição, categorização gramatical e/ou morfológica da palavra,
exemplos de uso ou qualquer outro tipo de informação adicional.
6.1 Trados MultiTerm
O pacote de ferramentas Trados inclui um gestor de terminologia[3] bastante poderoso. Permite não só a construção de bases terminológicas (com um formato congurável), como a sua
consulta ou exportação em diversos formatos.
6.1.1 Interface
Quando iniciamos o MultiTerm (escolhendo no botão Iniciar/Start a opção adequada) deverá
aparecer uma janela de diálogo a questionar o utilizador sobre se deseja acesso restrito à
base terminológica. Isto deve-se à aplicação ter sido desenvolvida para funcionar numa rede
de computadores.
Neste ambiente, torna-se importante que quando um utilizador efectue
18
alterações à base terminológica não possa existir outro utilizador a realizar também alterações
(mas apenas a consultar). Assim sendo, sempre que desejamos realizar alterações nas bases
terminológicas, devemos escolher a opção que nos dá acesso restrito.
Figura 6.1 Estrutura da janela principal do MultiTerm
Depois da aplicação iniciada deverá aparecer uma janela semelhante à apresentada na
gura 6.1. As zonas apresentadas correspondem a:
Barra de menu
onde se podem escolher as operações passiveis de serem realizadas sobre a
base terminológica e os seus registos;
Barra de diálogo
zona que permite a navegação sobre a base terminológica. Esta é com-
posta pelos campos da língua de origem e língua de destino, pelos botões de navegação
para os conceitos seguintes e anteriores, pelo conceito actual e pelo campo de pesquisa;
Denição do conceito
zona onde é mostrada a cha terminológica do conceito actual (ex-
plicada na gura 6.2);
Barra de mensagens
onde aparecem mensagens importantes do sistema que explicam os
erros ou sucessos das operações efectuadas;
Língua de origem
permite a escolha da língua de origem da consulta, de entre as línguas
existentes na base terminológica;
Língua de destino
permite a escolha da língua de destino da consulta, de entre as línguas
existentes na base terminológica;
Conceito actual
mostra o conceito que está a ser visualizado nesse momento (na língua de
origem);
19
Próximo conceito
botão com o próximo conceito (pela ordem lexicográca) da base termi-
nológica. Pode ser usado para navegar sequencialmente pelos vários termos existentes.
Conceito anterior
botão (que não aparece na imagem) à esquerda do conceito actual que
permite aceder ao conceito anterior da base terminológica;
Campo de pesquisa
zona que permite efectuar pesquisas de termos na língua de origem
sobre a base terminológica (ver secção 6.1.2);
Figura 6.2 Estrutura do registo de um conceito
Por sua vez, a gura 6.2 mostra a estrutura típica de uma cha terminológica:
Cabeçalho
contém um conjunto de campos referentes ao conceito, como um todo.
Neste
exemplo podemos reparar não só no número de registo, como também no assunto em
que se insere este conceito, assim como uma nota;
Língua de Origem
contém os vários termos na língua de origem que se inserem neste con-
ceito, assim como denições, notas ou propriedades a eles associados;
Língua de Destino
contém os vários termos na língua de destino que se inserem neste con-
ceito, assim como denições, notas ou propriedades a eles associados;
Outras Línguas
contém termos noutras línguas que não as seleccionadas como língua de
origem ou língua de destino;
Exercício 6.1 Navegação sobre uma base terminológica
Execute o Trados MultiTerm.
Utilize uma base terminológica (por exemplo,
sample.mtw)
para experimentar a alteração das línguas de origem e destino, assim como o uso dos botões
para aceder ao próximo ou ao termo anterior.
20
6.1.2 Pesquisa
Existem três tipos de pesquisa: simples, global e
fuzzy.
Cada uma tem a sua funcionalidade
especíca.
Pesquisa Simples
Permite pesquisar um termo directamente. É útil quando sabemos exactamente que termo
estamos a procurar, ou com que caracteres ele começa.
Para realizar este tipo de pesquisa escreve-se no
campo de pesquisa o termo, ou as primeiras
letras do termo que procuramos, e carrega-se na tecla Enter.
A pesquisa funciona da seguinte forma:
•
se o termo existe, este é apresentado;
•
se o termo existe e é apresentado, e o botão do termo seguinte é o mesmo termo, signica
que existem palavras homónimas na base terminológica;
•
se o termo não existe, o MultiTerm irá apresentar o termo existente lexicamente seguinte
ao termo procurado. Também é apresentada na barra de mensagens Not found .
Exercício 6.2 Pesquisa Simples
Tente efectuar várias pesquisas usando o campo de pesquisa. Experimente com palavras não
existentes, e experimente usar apenas os primeiros caracteres de cada palavra;
Pesquisa Global
Este tipo de pesquisa é semelhante ao tipo de pesquisa simples. Na verdade, não é mais do que
a pesquisa simples usando-se um caracter especial (o asterisco *) para representar qualquer
sequência de caracteres.
Ou seja, se escrever na caixa de pesquisa qualquer coisa como *ware numa base terminológica, o MultiTerm iria apresentar uma janela com todos os termos (da língua de origem
seleccionada) que terminam com ware. Da mesma forma, a*z irá apresentar todos os termos que começam com a letra a e terminal com a letra z. Pode, também, utilizar mais
do que uma vez o asterisco. Assim, *xyz* iria apresentar todos os termos que contenham a
sequência de caracteres apresentada.
Exercício 6.3 Pesquisa Global
sample.mtw procure vários termos, utilizando o asterisco.
*berry*.
Utilizando a base terminológica
exemplo, tente
Pesquisa
*berry
e
Por
Fuzzy
Este tipo de pesquisa, a forma mais poderosa para encontrar um termo numa base terminológica, baseia-se num índice criado com todos os termos existentes, incluindo também formas
ortogracamente erradas. Por exemplo, para a palavra carro o índice iria incluir
carro
acrro
craro
caror
21
e, possivelmente, outras variantes.
No entanto, este índice tem de ser construído antes de ser possível realizar uma pesquisa
deste tipo.
Como estes índices incluem várias combinações para cada palavra, são lentos a
serem construídos.
Para a criação do índice deve seleccionar a língua de origem da pesquisa que deseja realizar.
Depois, no menu File escolhe-se a opção Create Fuzzy Index .
É necessário conrmar a
criação do índice na janela que se lhe segue. O MultiTerm irá começar a criar imagens
fuzzy
de todos os termos da base terminológica.
Quando o índice estiver pronto a ser usado, a
mensagem irá aparecer na barra de mensagens.
Fuzzy index successfully created Depois de criado o índice, pode-o usar escrevendo um cardinal (#) antes do termo a pesquisar. Para perceber melhor experimente os exemplos do exercício 6.4.
Exercício 6.4 Pesquisa fuzzy
sample.mtw experimente criar um índice fuzzy para o inglês, e efectuar
#grape bunch ou #bunsh of prapes. Em ambos os casos, o
encontrar bunch of grapes.
Na base terminológica
várias pesquisas. Experimente
MultiTerm deverá
6.1.3 Denição de Estrutura
Uma base terminológica MultiTerm é um conjunto de registos indexados por língua.
registo pode conter termos em várias línguas.
Cada
Cada termo, ou todo o registo (o conceito),
pode ter a si associado um conjunto de campos. Além desta estrutura, cada língua pode ter
propriedades de ordenação, e o registo pode ainda conter imagens.
Existem vários tipos de campos numa base terminológica:
campos indexados
normalmente correspondem às línguas existentes na base terminológica.
Só estes campos é que permitem o uso do campo de pesquisa;
campos de texto
podem estar associados ao conceito ou a um campo indexado e correspon-
dem a informação textual. São usados para campos como: denição, contexto, origem,
gramática, exemplos;
campos enumerados
também podem estar associados ao conceito ou a um campo indexado.
No entanto, correspondem a campos cujo valor (texto inserido) tem de ser escolhido de
entre uma lista de escolhas possíveis. São usados para campos como: género, categoria;
campos mistos
são campos enumerados que permitem a inserção de texto extra além do
existente na lista de escolha;
Para denir uma base terminológica usa-se a opção Create new termbase no menu File .
Irá aparecer uma janela semelhante à apresentada na gura 6.3. Depois de denir a estrutura
desejada, deve utilizar o botão OK , seguindo-se a escolha do nome do cheiro onde vai gravar
a base terminológica.
Campos indexados
Para adicionar um campo indexado procede-se da seguinte forma:
1. seleccionar um campo indexado (língua) já existente;
22
Figura 6.3 Denição de estrutura de uma base terminológica
23
2. usar o botão
Add ;
3. escrever o nome do campo;
Da mesma forma, é simples apagar um campo indexado já existente. Neste caso, seleccionase o campo indexado (língua) a apagar e usa-se o botão
Delete.
Campos de texto
São denidos e apagados exactamente da mesma forma dos campos indexados:
1. seleccionar um campo de texto já existente;
2. usar o botão
Add ;
3. escrever o nome do campo;
ou seleccionar o campo a apagar e usar o botão
Delete.
Campos enumerados
A denição de campos enumerados é feita a dois níveis. Realiza-se um primeiro passo semelhante ao realizado para os campos anteriores:
1. seleccionar um campo enumerado já existente;
2. usar o botão
Add ;
3. escrever o nome do campo;
Passa-se a denir os valores que este campo pode conter. Na caixa respectiva, escreve-se em
cada linha um dos textos pré-denidos que o campo pode conter. Para mudar de linha usa-se
a combinação de teclas Ctrl+Enter. Para apagar um destes valores usa-se o teclado como
num editor de texto comum.
Para apagar todo o campo enumerado, selecciona-se o campo em questão e usa-se o botão
Delete.
Campos mistos
Como referido acima, pode existir necessidade de manter um campo enumerado que permita a
adição de mais algum texto. A sua denição é realizada criando um campo enumerado normal
e, os valores que devam permitir texto extra, têm de terminar com o caracter dois pontos :.
6.1.4 Inserção de uma cha terminológica
Para inserir uma cha terminológica usa-se a opção Add Entry no menu Edit .
Irá aparecer
uma janela semelhante à apresentada na gura 6.4.
A gura mostra não só a janela de inserção mas também a janela que lhe irá aparecer se
usar o botão Entry Header .
Esta janela mostra apenas informação como a data de inserção
do registo, data em que foi alterado e número de ordem do registo.
24
Exercício 6.5 Denição da estrutura de uma base terminológica
Tente denir um novo tipo de base terminológica com a seguinte estrutura:
•
campos indexados: português, inglês, francês;
•
campos de texto: denição, nota, exemplo;
•
campos enumerados: género (masculino/feminino), número (singular/plural), categoria
gramatical (verbo/nome/adjectivo/. . . );
Figura 6.4 Inserção de uma cha terminológica
Os outros dois botões permitem cancelar totalmente a edição da cha terminológica ou
gravar o registo. As outras duas áreas permitem a edição do registo e ver as mensagens do
sistema em relação à edição que está a efectuar.
A inserção de dados é bastante dependente do local onde o cursor do rato se encontra.
Sempre que for necessário colocar o rato sobre determinado local na área de edição, repare na
barra de mensagens se tem o rato no sítio correcto.
Para inserir um campo indexado deve usar a tecla I. Irá aparecer a lista de línguas
existentes na base terminológica. Depois de escolher a língua que deseja inserir irá aparecer
uma janela onde deve escrever o termo que está a inserir.
Repare que ao colocar o cursor sobre um dos termos indexados a língua em questão irá
aparecer na barra de mensagens.
Para inserir um campo de texto, enumerado ou misto associado ao conceito em geral, deve
colocar o rato de forma a que a barra de mensagens não mostre qualquer língua. Normalmente,
a forma mais simples de obter este estado é colocar o rato ligeiramente abaixo do botão
Cancel .
Para inserir o campo associado a determinada língua deve colocar o rato sobre a língua
em questão.
25
A inserção de um campo de texto é efectuada usando a tecla T. Irá escolher o campo
de texto em questão e escrever o texto respectivo. Da mesma forma, para inserir um campo
enumerado ou misto irá usar a tecla A.
Para apagar um termo ou campo use a tecla E.
Exercício 6.6 Inserção de cha terminológica
Usando a denição do exercício anterior introduza dois ou três registos, associando campos
não só aos vários termos mas também ao conceito geral;
6.1.5 Hiper-ligações
O MultiTerm permite inserir hiper-ligações nos campos de texto ou nos campos mistos. Desta
forma, torna-se simples de colocar numa denição, exemplo ou nota um texto que ao ser
clicado salte para um outro termo.
Estas hiper-ligações são criadas utilizando um acento circunexo antes e depois da palavra
(ou termo) que deverá ser procurado na base terminológica.
Assim, poderia colocar numa denição um texto do género:
chimpanzé: mamífero muito parecido com um ^macaco^.
que irá tornar a palavra macaco numa ligação para o termo com o mesmo nome.
Exercício 6.7 Hiper-ligações
Experimente criar uma hiper-ligação entre dois dos termos que inseriu no exemplo anterior.
Verique que depois de gravadas, a hiper-ligação funciona!
6.1.6 Exportação
Para que a base terminológica seja de alguma forma útil é importante que seja pesquisável
mas também que possa ser usada para outros ns.
Por esta razão, o MultiTerm inclui funcionalidades de exportação da base terminológica
para outros formatos, desde formatos simples de texto até um formato RTF pronto a ser
incluído num documento Word e impresso tal e qual um dicionário prossional.
1
possível denir os seus próprios formatos de exportação.
A exportação da base terminológica é realizada em dois passos.
É ainda
Em primeiro lugar é
necessário denir estruturalmente a forma como a exportação é realizada. No segundo passo,
exporta-se realmente a base terminológica.
Embora o Trados MultiTerm já inclua formatos de exportação continua a ser necessário
efectuar o primeiro passo. É preciso carregar a denição de exportação para o formato desejado. Para isso usa-se a opção Dene export para a denição do formato de exportação.
no menu File .
A janela apresentada é usada
No entanto, é possível utilizar o botão Load para carregar um formato já existente. Depois de pressionado irá aparecer uma janela a pedir
o nome da função de exportação. Usa-se o botão 1
Browse para escolher a denição a partir
este tópico não irá ser coberto neste documento. Para mais informações consulte o manual de terminologia
da Trados
26
de um cheiro do nosso disco. Irá surgir uma janela semelhante às usadas para abrir cheiros, em que se deve seleccionar o tipo de exportação desejado. Estes cheiros, de extensão
.mdx encontram-se na directoria em que
c:\Program Files\trados\T5_fl\TT\.
o Trados foi instalado. Normalmente corresponde a
Nesta directoria devem existir os seguintes formatos de exportação:
backup.mdx
permite exportar no formato de
backup
da Trados, um formato textual legível
num editor de texto;
list.mdx
rtf.mdx
formato textual que corresponde à lista dos termos da base terminológica;
exportação
2 num formato pronto para um processador de texto como o Microsoft
Word, que gera um formato de dicionário pronto a ser impresso;
tei.mdx
exportação no formato TEI (Text Encoding Initiative) em XML;
ventura.mdx
exportação para a aplicação Corel Ventura;
Para qualquer um destes tipos de exportação, o processo segue escolhendo-se o cheiro em
causa e usando-se o botão Open .
O MultiTerm voltará à janela de denição de formatos de
exportação, mas agora com um formato em memória. Termina-se este primeiro passo usando
o botão Close .
Segue-se a exportação. No menu Export all entries File escolhe-se uma das opções Export this entry ou
conforme se deseje exportar apenas uma ou todas as chas terminológicas,
respectivamente. O MultiTerm abrirá uma janela onde deverá escrever o nome do cheiro em
que deseja exportar a base terminológica.
Exercício 6.8 Exportação de base terminológica
Experimente exportar uma base terminológica (por exemplo, a
matos. Experimente o formato
Backup
sample.mtw)
para vários for-
e abra o cheiro gerado com o Bloco de Notas (note-
pad). Tente realizar a exportação da base terminológica no formato RTF e abrir o respectivo
documento gerado do Microsoft Word.
6.1.7 Filtros
O MultiTerm permite a denição de ltros para seleccionar chas terminológicas com determinadas propriedades. Por exemplo, é possível procurar todas as chas terminológicas sobre
determinado assunto, ou procurar todas as chas terminológicas que não têm um termo em
determinada língua.
A gura 6.5 mostra a janela onde se denem ltros. Pode aceder à janela usando no menu
View a opção Dene Filter .
2
A exportação no formato RTF é ligeiramente mais complicada do que a exportação num dos outros
formatos. Na verdade, antes de proceder ao carregamento do formato de exportação é preciso copiar um
cheiro especial que contém o cabeçalho RTF do documento a gerar.
É necessário procurar o cheiro MultiTerm.rtx no disco do seu computador (normalmente na directoria
c:\Program Files\trados\T5_fl\TT\) e copiá-lo para junto do cheiro da base terminológica. Supondo que
a sua base terminológica se chama c:\base.mtw terá de copiar o cheiro MultiTerm.rtx para c:\base.rtx.
Só depois poderá realizar a exportação neste formato.
Deverá também ter cuidado ao gravar o cheiro gerado, porque deve escolher a extensão correcta: .rtf
27
Figura 6.5 Denição de ltros
Cada linha da tabela é composta por duas partes: do lado esquerdo aparece o nome do
campo que estamos a analisar, e do lado direito, o critério de ltragem denido sobre esse
campo.
Para a denição de critérios usam-se os caracteres especiais apresentados na tabela 6.1.
Tabela 6.1 Linguagem de denição de ltros
*
!
!*
o campo existe (mesmo que vazio)
o campo existe e não é vazio
o campo não existe
o campo está vazio
xyz
*xyz*
!(...)
conteúdo do campo igual a xyz
o campo contém a sequência de caracteres xyz
negação da propriedade entre parêntesis
...
6.1.8 Modelos de Inserção
...
28
Capítulo 7
Gestor de Memórias de tradução
Com certeza de que se já realizou algum tipo de tradução comercial, deverá ter reparado que
determinadas frases, slogans ou termos aparecem de forma repetida nos vários documentos a
traduzir. É natural que se estiver a traduzir um conjunto de manuais de uma aplicação, cada
um dos manuais contenha uma notícia de direitos de cópia, uma secção introdutória e outras
zonas que de uma forma ou de outra aparecem repetidamente em todos os documentos.
Nestes casos, a utilização de memórias de tradução torna a tradução mais simples e ao
mesmo tempo mais coerente. Sempre que o sistema encontre uma frase semelhante a uma que
já foi traduzida, irá mostrar esse caso e sugerir a reutilização desse texto.
Um gestor de memórias de tradução permite a consulta destas memórias de tradução, a
sua edição, importação e exportação em diferentes formatos.
...
7.1 Trados Workbench
...
•
Consulta (procura paralela de pares de frases que concordem com um determinado padrão - concordance)
•
Edição
•
importação/exportação em alguns formatos
29
Capítulo 8
Sistema de alinhamento
Se já realizou diversas traduções sem utilizar uma ferramenta de tradução especíca, é provável
que tenha um conjunto de trabalhos antigos perdidos pelo seu computador, completamente desaproveitados. Os sistemas de alinhamento têm como objectivo a reutilização destes trabalhos
em memórias de tradução para que o sistema possa vir a reutilizar o trabalho já realizado.
Outros sistemas existem para alinhar textos à palavra. Estes sistemas, menos populares,
usam texto já alinhado à frase para, por meios estatísticos, construir dicionários de tradução.
8.1 Trados WinAlign
O WinAlign[2] é a ferramenta que a Trados fornece para o alinhamento de textos à frase.
Na verdade, não é mais do que um sistema que dado um conjunto de pares de cheiros os
parte em blocos e os apresenta a par. Cabe ao utilizador unir os blocos entre as duas línguas.
Depois de alinhados, pode-se exportar a memória de tradução produzida para ser utilizada
em traduções posteriores.
...
•
Produção de material a incorporar em memórias de tradução;
•
Projecto de alinhamento;
•
Alinhamento orientado à palavra;
8.1.1 Denição do Projecto
A criação de um projecto de alinhamento é feita em vários passos. É necessário indicar ao
Trados quais as línguas a usar, que cheiros vão ser alinhados, tipo dos cheiros, nível de
relevância estrutural e vários outros parâmetros.
Para iniciar, use a opção New Project no menu File .
Irá surgir uma janela semelhante
à apresentada na gura 8.1. Cada separatória apresenta um tópico diferente de conguração.
General
Nesta zona conguram-se as propriedades principais do projecto de alinhamento:
Project Name
nome do projecto. Não é o nome do cheiro criado, mas sim, algum tipo de
descrição que o permita caracterizar;
30
Figura 8.1 Denições de Alinhamento (línguas)
File Type
tipo de cheiros a alinhar.
Embora um projecto de alinhamento possa alinhar
vários pares de cheiros, estes têm de ser todos do mesmo tipo. Aqui deve ser escolhido
o tipo adequado e caso se trate de um formato XML ou SGML, escolher o DTD a si
associado;
Source Settings
Target Settings
Source Language ) e congurar o nível
Source Segmentation );
permite escolher a língua de origem (
de segmentação do documento (
permite escolher a língua de destino e congurar o nível de segmentação do
documento;
Intermediate Result Files
O que
tem impreterivelmente
directoria onde o Trados deve colocar cheiros auxiliares.
de ser preenchido é o nome do projecto, tipos de cheiros e
línguas a alinhar.
Files
Aqui determinam-se que cheiros vão ser alinhados.
Usa-se o botão Add...
de cada uma
das colunas para adicionar os cheiros. No lado esquerdo os cheiros da língua de origem e
no lado direito os cheiros da língua de destino. O botão Remove permite remover algum
cheiro adicionado por engano.
Depois de adicionados os cheiros é necessário associar os cheiros da língua de origem
com os da língua de destino. Se as colunas de cheiros os mostram pela ordem correcta (o
primeiro da esquerda corresponde ao primeiro da direita, o segundo, ao segundo direita e
31
Figura 8.2 Denições de Alinhamento (cheiros)
assim sucessivamente) basta usar o botão Align File Names para criar a associação entre
os cheiros. Se, por outro lado, os cheiros estão por ordem incorrecta, é necessário fazer a
associação de forma manual.
Para isso, use o rato para arrastar as folhas à beira de cada
cheiro para a folha respectiva do outro cheiro.
Alignment
...
Structure Recognition
...
Interface
...
Export
Esta separatória permite congurar o método de exportação da memória de tradução gerada
pelo alinhamento dos cheiros.
A primeira zona permite escolher entre os dois formatos possíveis para serem exportados:
• Translator's Workbench Import Format
entre aplicações da Trados.
32
formato proprietário da Trados, para uso
Figura 8.3 Denições de Alinhamento (exportação)
• Translation Memory Exchange Format (TMX)
formato independente da aplica-
ção, em XML, para intercâmbio de memórias de tradução entre aplicações;
...
8.1.2 Alinhamento
Depois de criado o projecto camos com uma janela idêntica à apresentada na gura 8.4.
Aqui são apresentados os pares de cheiros.
Para alinhar cada um dos pares faz-se um
duplo-clique sobre um dos cheiros. Irá aparecer uma janela como a da gura 8.5.
Esta é a janela principal no processo de alinhamento. A parte superior mostra uma esquematização do alinhamento entre capítulos e secções dos cheiros.
A parte inferior é o
alinhamento entre as frases de cada uma das secções.
As ligações apresentadas indicam que os segmentos do lado esquerdo correspondem aos
segmentos a si ligados do lado direito. A diferença entre os vários tipos de traços correspondem
à qualidade do alinhamento. O alinhamento automático é apresentado por traços picotados
ou tracejados. O alinhamento realizado pelo tradutor são traços a cheio.
O processo limita-se a alterar (ou não) as ligações efectuadas automaticamente. As ligações
erradas podem ser removidas usando o botão direito do rato sobre a folha ligada de forma
errada, e escolhendo a opção disconnect .
Depois de removidas as ligações erradas procede-se
ao novo alinhamento que se efectua arrastando as folhas dos segmentos correspondentes.
É importante lembrar que um segmento de um dos lados pode ser ligado a vários segmentos
do outro lado. No entanto, não é possível ligar um conjunto de segmentos de um lado a um
conjunto de segmentos do outro lado.
Quando este tipo de ligação é necessário edita-se os
33
Figura 8.4 Pré-alinhamento
Figura 8.5 Processo de alinhamento
34
segmentos de um dos lados de forma a que isso se resolva. Para editar os segmentos utiliza-se
o botão do lado direito do rato sobre o segmento em causa, e usa-se a opção segment .
Edit active
Aqui pode-se alterar o texto, seleccionar alguma porção, copiar e, editando outro
segmento, colar essa porção de texto.
35
Capítulo 9
Tradução de formatos especícos
Um tradutor tem de estar preparado para traduzir os mais diversos formatos de documentos.
Desde simples documentos Microsoft Word, páginas de Internet ou documentos DocBook, é
necessário efectuar a tradução mantendo a mesma estrutura conceptual e visual.
Como é difícil o tradutor conhecer todos os formatos existentes, e possuir todas as aplicações necessárias para a sua manipulação, é habitual os sistemas de tradução terem capacidade
de manusear os mais diversos formatos existentes. Não só a capacidade de os mostrar, mas
a capacidade de compreender a estrutura do documento e desta forma, ajudar o tradutor a
mantê-la.
9.1 Trados TagEditor
O TagEditor[5, 4]
Dado um formato especíco F, há necessidade de:
•
extrair as frases a traduzir,
•
utilizar um editor de tradução capaz:
de utilizar as memórias de tradução e
de utilizar a terminologia do projecto
que permita traduzir as várias frases e enriquecer as memórias de tradução
•
encaixar as frases traduzidas na estrutura do texto original
36
Capítulo 10
Gestão de projectos de tradução
Quando nos deparamos com a tradução de uma grande quantidade de textos, distribuídos
por vários cheiros, é necessária alguma organização para manter o trabalho em ordem. Por
exemplo, pode ser útil criar uma memória de tradução ou base terminológica por cliente.
Embora determinada tecnologia possa ser associada a uma área, existem empresas que usam
diferentes termos para o mesmo objecto.
10.1 Trados Workspace
[4]
•
denição de um projecto de tradução
língua origem, destino
memória de tradução a utilizar
terminologia a utilizar
lista dos (grupos de) cheiros a traduzir
estado actual da tradução
37
Apêndice A
Documentos de leitura sugerida
• Intomàtica Aplicada a la Traducció
- Mikel L. Forcada i Juan Ortiz, Universidade
de Alincante;
Muito do conteúdo deste livro não é falado durante a disciplina, especialmente devida
à baixa escolaridade desta disciplina.
No entanto recomenda-se a sua leitura, pondo
especial cuidado nos capítulos III, IV, V, VI, X.
•
Acetatos apresentados durante as aulas;
•
Documentação do Trados (ver CD da disciplina)
•
Ligações Internet recomendadas:
Google (http://www.google.com) - onde se recomenda a leitura da ajuda em relação
a expressões de pesquisa e ans
Biblioteca de referência da disciplina (http://natura.di.uminho.pt/cgi-bin/biblioteca.pl)
- recomendando-se que explore as várias ligações nela contidas e que contribua com
outras sugestões
•
Corpora - Projecto AC/DC (http://cgi.portugues.mct.pt/acesso)
•
Página da disciplina (http://natura.di.uminho.pt/~jj/ftt)
38
Bibliograa
[1] Google advanced search guide. http://www.google.com.
[2] TRADOS Ireland Ltd, Dublin, Ireland.
TRADOS 5 - Advanced Alignment Guide, 2001.
[3] TRADOS Ireland Ltd, Dublin, Ireland.
TRADOS 5 - Advanced Terminology Guide, 2001.
[4] TRADOS Ireland Ltd, Dublin, Ireland.
TRADOS 5 - Specialist Guide, 2001.
[5] TRADOS Ireland Ltd, Dublin, Ireland.
TRADOS 5 - Translation Guide, 2001.
39
Índice
pesquisa global, 21
compactadores, 9
pesquisa simples, 21
winzip, 9
directorias temáticas, 10
exportação
base terminológica, 26
extensões, 7
.bmp, 8
.doc, 8
.gif, 8
.htm, 8
.html, 8
.jpg, 8
.mdx, 9, 27
.mtw, 9
.pdf, 8
.png, 8
.ppt, 9
.ps, 8
.rar, 9
.rtf, 8, 26, 27
.tmx, 8
.txt, 7
.xls, 9
.xml, 8, 27
.zip, 9
cheiros
compactação, 9
descompactação, 9
extensões, 7
motores de busca, 10
motores de pesquisa, 10
MultiTerm
exportação, 26
inserção, 24
inter-ligações, 26
pesquisa fuzzy, 21
40

Documentos relacionados