196 Chapter 6. 基于扭曲度和繁衍率的模型肖桐朱靖波

6.5 小结及拓展阅读

本章在 IBM 模型 1 的基础上进一步介绍了 IBM 模型 2-5 以及 HMM。同时，本

章引入了两个新的概念

——

扭曲度和繁衍率。它们都是机器翻译中的经典概念，也

经常出现在机器翻译的建模中。另一方面，通过对上述模型的分析，本章进一步探

讨建模中的若干基础问题，例如，如何把翻译问题分解为若干步骤，并建立合理的

模型解释这些步骤；如何对复杂问题进行化简，以得到可以计算的模型等等。这些

思想也在很多自然语言处理问题中被使用。此外，关于扭曲度和繁衍率还有一些问

题值得关注：

• 扭曲度是机器翻译中的一个经典概念。广义上来说，事物位置的变换都可以用

扭曲度进行描述，比如，在物理成像系统中，扭曲度模型可以帮助进行镜头校

正

[265, 266]

。在机器翻译中，扭曲度本质上在描述源语言和目标语言单词顺序的偏

差。这种偏差可以用于对调序的建模。因此扭曲度的使用也可以被看作是一种

对调序问题的描述，这也是机器翻译区别于语音识别等任务的主要因素之一。

在早期的统计机器翻译系统中，如 Pharaoh

[81]

，大量使用了扭曲度这个概念。虽

然，随着机器翻译的发展，更复杂的调序模型被提出

[23, 267, 268, 269, 270, 271]

，但是扭曲

度所引发的对调序问题的思考是非常深刻的，这也是 IBM 模型最大的贡献之

一。

• IBM 模型的另一个贡献是在机器翻译中引入了繁衍率的概念。本质上，繁衍率

是一种对翻译长度的建模。在 IBM 模型中，通过计算单词的繁衍率就可以得

到整个句子的长度。需要注意的是，在机器翻译中译文长度对翻译性能有着至

关重要的影响。虽然，在很多机器翻译模型中并没有直接使用繁衍率这个概念，

但是几乎所有的现代机器翻译系统中都有译文长度的控制模块。比如，在统计

机器翻译和神经机器翻译中，都把译文单词数量作为一个特征用于生成合理长

度的译文

[

22, 80, 272]

。此外，在神经机器翻译中，非自回归的解码中也使用繁衍率

模型对译文长度进行预测

[273]

。