18.3 交互式机器翻译 613
18.3 交互式机器翻译
机器翻译的结果会存在错误,因此很多时候需要人工的修改才能被使用。例如,
在译后编辑(Post-editing)中,翻译人员对机器翻译的译文进行修改,最终使译文达
到要求。不过,译后编辑的成本很高,因为它需要翻译人员阅读机器翻译的结果,同
时做出修改的动作。有时候,由于译文修改的内容较为复杂,译后编辑的时间甚至
比人工直接翻译源语言句子的时间都长。因此在机器翻译应用中,需要更高效的方
式调整机器翻译的结果,使其达到可用的程度。比如,可以使用质量评估方法(见第
四章),选择模型置信度较高的译文进行译后编辑,对置信度低的译文直接进行人工
翻译。而另一种思路是,让人的行为直接影响机器翻译生成译文的过程,让人和机
器翻译系统进行交互,在不断的修正中生成更好的译文。这种方法也被称作交互式机
器翻译(Interactive Machine Translation,IMT)。
交互式机器翻译的大致流程如下:机器翻译系统根据用户输入的源语言句子预
测出可能的译文交给用户,然后用户在现有翻译的基础上进行接受、修改或者删除
等操作,然后翻译系统根据用户的反馈信息再次生成比前一次更好的翻译并提交给
用户。以此循环,直到得到最终的译文。
图18.2给出了一个使用 TranSmart 系统进行交互式机器翻译的例子,在这里要
将一个汉语句子“疼痛/也/可能/会/在/夜间/使/你/醒来。”翻译成英语“Pain may also
wake you up during the night .”。在开始交互之前,系统首先推荐一个可能的译文“Pain
may also wake you up at night .”。在第一次交互中,用户将单词 at 替换成 during,然
后系统根据用户修改后的译文立即给出新的译文候选,提供给用户选择。循环往复,
直到用户接受了系统当前推荐的译文。
图 18.2 使用 TranSmart 系统进行交互式翻译的实例
交互式机器翻译系统主要通过用户的反馈来提升译文的质量,不同类型的反馈
信息则影响着系统最终的性能。根据反馈形式的不同,可以将交互式机器翻译分为
以下几种:
• 基于前缀的交互式机器翻译。早期的交互式机器翻译系统都是采用基于前缀的