196 Chapter 6. 基于扭曲度和繁衍率的模型 肖桐 朱靖波
6.5 小结及拓展阅读
本章在 IBM 模型 1 的基础上进一步介绍了 IBM 模型 2-5 以及 HMM。同时,本
章引入了两个新的概念
——
扭曲度和繁衍率。它们都是机器翻译中的经典概念,也
经常出现在机器翻译的建模中。另一方面,通过对上述模型的分析,本章进一步探
讨建模中的若干基础问题,例如,如何把翻译问题分解为若干步骤,并建立合理的
模型解释这些步骤;如何对复杂问题进行化简,以得到可以计算的模型等等。这些
思想也在很多自然语言处理问题中被使用。此外,关于扭曲度和繁衍率还有一些问
题值得关注:
• 扭曲度是机器翻译中的一个经典概念。广义上来说,事物位置的变换都可以用
扭曲度进行描述,比如,在物理成像系统中,扭曲度模型可以帮助进行镜头校
正
[265, 266]
。在机器翻译中,扭曲度本质上在描述源语言和目标语言单词顺序的偏
差。这种偏差可以用于对调序的建模。因此扭曲度的使用也可以被看作是一种
对调序问题的描述,这也是机器翻译区别于语音识别等任务的主要因素之一。
在早期的统计机器翻译系统中,如 Pharaoh
[81]
,大量使用了扭曲度这个概念。虽
然,随着机器翻译的发展,更复杂的调序模型被提出
[23, 267, 268, 269, 270, 271]
,但是扭曲
度所引发的对调序问题的思考是非常深刻的,这也是 IBM 模型最大的贡献之
一。
• IBM 模型的另一个贡献是在机器翻译中引入了繁衍率的概念。本质上,繁衍率
是一种对翻译长度的建模。在 IBM 模型中,通过计算单词的繁衍率就可以得
到整个句子的长度。需要注意的是,在机器翻译中译文长度对翻译性能有着至
关重要的影响。虽然,在很多机器翻译模型中并没有直接使用繁衍率这个概念,
但是几乎所有的现代机器翻译系统中都有译文长度的控制模块。比如,在统计
机器翻译和神经机器翻译中,都把译文单词数量作为一个特征用于生成合理长
度的译文
[
22, 80, 272]
。此外,在神经机器翻译中,非自回归的解码中也使用繁衍率
模型对译文长度进行预测
[273]
。