18.4 翻译结果的可干预性 615
18.4 翻译结果的可干预性
交互式机器翻译体现了一种用户的行为“干预”机器翻译结果的思想。实际上,
在机器翻译出现错误时,人们总是希望一种直接有效的方式“改变”译文,最
时间内达到改善翻译质量的目的。比如,如果机器翻译系统可以输出多个候选译文,
用户可以在其中挑选最好的译文进行输出。也就是,人为干预了译文候选的排序
程。另一个例子译记忆Translation Memory,TM。翻译记忆记录了高质量的源
语言-目标语言句对,有时也可以被看作是一种先验知识或“记忆”因此,当进行机
器翻译时,使用翻译记忆指导翻译过程也可以被看作是一种干预手段
[1181, 1182]
虽然干预机器翻译系统的方式很多,最常用的还是对源语言特定片段翻译的
预,以期望最终句子的译文满足某些约束。这个问题也被称作基于约束的翻译Constraint-
based Translation。比如,在翻译网页时,需要保持译文中的网页标签与源文一致。
另一个典型例子是术语翻译。在实际应中,经常会遇到公司名称、品牌名称、
品名称等专有名词和行术语,以及不同含义的缩写,比如,对于“小牛翻译”
个专有名词,不同的机器翻译系统给出的结果不一样:Maverick translationCalf
translation
The mavericks translation
”等等,而它正确的翻译应该为“
NiuTrans
对于这些类似的特殊词汇,机器翻译引擎很难翻译得准确。一方面,因为模型大
是在通用数据集上训练出来的,并不能保证数据集能涵盖所有的语言现象。另一
面,即使是这些术语在训练数据中出现,它们通常也是低频的,模型不容易捕捉
们的规律。为了保证翻译的准确性,对术语翻译进行干预是十分有必要的,对领
适应等问题的求解也是非常有意义的。
汇约束翻Lexically Constrained Translation)而言,在不干预的情况下
模型直接翻译出正确术语是很难的,因为术语的译文很可能是未登录词,因此必
人为提供额外的术语词典,那么我们的目标就是让模型的翻译输出遵守用户提供
术语约束。这个过程如图18.3所示。
源文
小牛翻译的总部在哪里?
译文
Where is the headquarters
of NiuTrans?
“小牛翻译”=NiuTrans
18.3 词汇约束翻译过程
在统计机器翻译中,翻译本质上是由短和规则构成的推导,因此修改译文
较容易,比如,可以在一个源语言片段所对应的翻译候选集中添加希望得到的译文。
而神经机器翻译是一个端到端模型,翻译过程本质上是连续空间中元素的一系列
射、组合和代数运算。虽然在模型训练阶段仍然可以通过修改损失函数等手段引
约束,但是在推断阶段进行直接干预并不容易,因为我们无法像修改符号系统那
616 Chapter 18. 机器翻译应用技术 肖桐 朱靖波
直接修改模型(如短语翻译表)来影响译文生成。实践中主要有两种解决思路:
强制生成。这种方法并不改变模型,而是在推断过程中按照一定的策略来实施
约束,一般是修改束搜索算法以确保输出必须包含指定的词或者短语
[1183, 1184, 1185, 1186]
例如,在获得译文输出后,利用注意力机制获取词对齐,之后通过词对齐得到
源语言和目标语言片段的对应关系,最后对指定译文片段进行强制替换。或者,
对包含正确术语的翻译候选进行额外的加分,以确保推断时这样的翻译候选的
排名足够靠前。
数据增强。这类方法通过修改机器翻译模型的训练数据来实现术语约束。通常
根据术语词典对训练数据进行一定的修改,例如,将术语的译文添加到源文句
子中,之后将原始语料库和合成语料库进行混合训练,期望模型能够学会自动
利用术语信息来指导解码,或者是在训练数据中利用占位符来替换术语,待翻
译完成后再进行还原
[1187, 1188, 1189, 1190]
强制生成的方法是在搜索策略上进行制,与模型结构无关,这类方法能保
输出满足约束,但是会影响翻译速度。数据增强的方法是通过构造特定格式的数
让模型训练,从而让模型具有自动适应术语约束的能力,通常不会影响翻译速度,
并不能保证输出能满足约束。
此外,机器翻译在应用时通常还需要进译前译后的处理,译前处理指的是
翻译前对源语言句子进行修改和规范,从而能生成比较通顺的译文,提高译文的
读性和准确率。在实际应用时,由于用户输入的形式多样,可能会包含比如术语、
写、数学公式等,有些甚至可能还包含网页标签,因此对源文进行预处理是很有
要的。常见的处理工作包括格式转换、标点符号检査、术语编辑、标签识别等修正,
待翻译完成后,则需要对机器译文进行进一步的编辑和修正,从而使其符合使用
范,比如进行标点、格式检查,术语、标签还原等,这些过程通常都是按照设定的处
理策略自动完成的。另外, 译文长度的控制、译文多样性的控制等也可以丰富机器翻
译系统干预的手段(见第十四章)