18. 机器翻译应用技术
随着机器翻译品质的不断提升,越来越多的应用需求被挖掘出来。但是,一个
优秀的机器翻译引擎并不意味着机器翻译可以被成功应用。机器翻译技术落地需要
“额外”考虑很多因素,例如,数据处理方式、交互方式、应用的领域等,甚至机器
翻译模型也要经过改造才能适应到不同的场景中。
本章将重点介绍机器翻译应用中所面临的一些实际问题,以及解决这些问题可
以采用的策略。本章所涉及的内容较为广泛,一方面会大量使用本书前十七章的模
型和方法,另一方面也会介绍新的技术手段。最终,本章会结合机器翻译的特点展
示一些机器翻译可以应用的场景。
18.1 机器翻译的应用并不简单
近几年,无论从评测比赛的结果,还是论文发表数量上看,机器翻译的研究可
谓火热。但是,客观的说,我们离机器翻译完美的应用还有相当的距离。这主要是
因为,成熟的系统需要很多技术的融合。因此,机器翻译系统研发也是一项复杂的
系统工程。而机器翻译研究大多是对局部模型和方法的调整,这也会造成一个现象:
很多论文里报道的技术方法可能无法直接应用于真实场景的系统。机器翻译面临以
下几方面挑战:
• 机器翻译模型很脆弱。实验环境下,给定翻译任务,甚至给定训练和测试数据,
机器翻译模型可以表现得很好。但是,应用场景是不断变化的。经常会出现训
练数据缺乏、应用领域与训练数据不匹配、用户的测试方法与开发者不同等等