18.3 交互式机器翻译 613
18.3 交互式机器翻译
机器翻译的结果会存在错误,因此很多时候需要人工的修改才能被使用。例如,
译后编辑Post-editing)中,翻译人员对机器翻译的译文进行修改,最终使译文达
到要求。不过,译后编辑的成本很高,因为它需要翻译人员阅读机器翻译的结果,
时做出修改的动作。有时候,由于译文修改的内容较为复杂,译后编辑的时间甚
比人工直接翻译源语言句子的时间都长。因此在机器翻译应用中,需要更高效的
式调整机器翻译的结果,使其达到可用的程度。比如,可以使用质量评估方法(见第
四章)选择模型置信度较高的译文进行译后编辑,对置信度低的译文直接进行人工
翻译。而另一种思路是,让人的行为直接影响机器翻译生成译文的过程,让人和
器翻译系统进行交互,在不断的修正中生成更好的译文。这种方法也被称作交互式机
器翻译Interactive Machine TranslationIMT)。
交互式机器翻译的大致流程如下:机器翻译系统根据用户输入的源语言句子
测出可能的译文交给用户,然后用户在现有翻译的基础上进行接受、修改或者删
等操作,然后翻译系统根据用户的反馈信息再次生成比前一次更好的翻译并提交
用户。以此循环,直到得到最终的译文。
18.2使 TranSmart 子,
将一个汉语句子“疼痛//可能///夜间/使//醒来。”翻译成英语“Pain may also
wake you up during the night .在开始交互之前,系统首先推荐一个可能的译文Pain
may also wake you up at night .。在第一次交互中,用户将单词 at 替换 during,然
后系统根据用户修改后的译文立即给出新的译文候选,提供给用户选择。循环往复,
直到用户接受了系统当前推荐的译文。
18.2 使用 TranSmart 系统进行交互式翻译的实例
交互式机器翻译系统主要通过用户的反馈来提升译文的质量,不同类型的反
信息则影响着系统最终的性能。根据反馈形式的不同,可以将交互式机器翻译分
以下几种:
基于前缀的交互式机器翻译。早期的交互式机器翻译系统都是采用基于前缀的
614 Chapter 18. 机器翻译应用技术 肖桐 朱靖波
方式。员使系统初始文,左到翻译性,
并在第一个错误的位置进行更正。这为系统提供了一种双重信号:表明该位置
上的单词须是翻译员修改过后的词,并且该置之前的词(即前缀)
都是正确的。之后系统根据已经检查过的前缀再生成后面的译文
[647, 1175, 1176, 1177]
基于片段的交互式机器翻译。根据用户提供的反馈来生成更好的翻译结果是交
互式翻译系统的关键。而基于前缀的系统则存在一个严重的缺陷,当翻译系统
获得确定的翻译前缀之后,再重新生成译文时会将原本正确的翻译后缀(即该
位置之后的单词)遗漏了,因此会引入新的错误。在基于片段的交互式机器翻
译系统中,翻译人员除了纠正第一个错误的单词,还可以指定在未来迭代中保
留的单词序列。之后系统根据这些反馈信号再生成新的译文
[705, 1178]
基于评分的交互式机器翻译。随着计算机算力的提升,有时会出现“机器等人”
的现象,因此如何提升人参与交互的效率也是需要考虑的问题。与之前的系统
不同,基于评分的交互式机器翻译系统不需要翻译人员选择、纠正或删除某个
片段,而是使用翻译人员对译文的评分来强化机器翻译的学习过程
[666, 1179]
除此之外,基于在线学习的方法也受到了关注,这类方法也可以被看作是交
式翻译与增量训练的一种结合。用户总是希望翻译系统能从反馈中自动纠正以前
错误。当用户最终确认一个修改过后的译文后,翻译系统将源语言句子与该修正
的译文作为训练语料继续训练
[1180]
实际上,交互式机器翻译是机器翻译大规模应用
的重要途径之一,它为打通翻译人员和机器翻译系统之间的障碍提供了手段。不过,
交互式机器翻译也有许多挑战等待解决。一个是如何设计交互方式?理想的交互
式应该是更加贴近翻译人员输入文字的习惯,比如,利用输入法完成交互;另一
是如何把交互式翻译嵌入到翻译的生产流程里?这本身不完全是一个技术问题,
能需要更多的产品设计来求解。