196 Chapter 6. 基于扭曲度和繁衍率的模型 肖桐 朱靖波
6.5 小结及拓展阅读
本章在 IBM 模型 1 的基础上进一步介绍了 IBM 模型 2-5 以及 HMM。同时,本
章引入了两个新的概念
——
扭曲度和繁衍率。它们都是机器翻译中的经典概念,
经常出现在机器翻译的建模中。另一方面,通过对上述模型的分析,本章进一步
讨建模中的若干基础问题,例如,如何把翻译问题分解为若干步骤,并建立合理
模型解释这些步骤;如何对复杂问题进行化简,以得到可以计算的模型等等。这
思想也在很多自然语言处理问题中被使用。此外,关于扭曲度和繁衍率还有一些
题值得关注:
扭曲度是机器翻译中的一个经典概念。广义上来说,事物位置的变换都可以用
扭曲度进行描述,比如,在物理成像系统中,扭曲度模型可以帮助进行镜头校
[265, 266]
在机器翻译中,扭曲度本质上在描述源语言和目标语言单词顺序的偏
差。这种偏差可以用于对调序的建模。因此扭曲度的使用也可以被看作是一种
对调问题述,这机器译区语音等任主要素之一。
在早期的统计机器翻译系统中, Pharaoh
[81]
大量使用了扭曲度这个概念。
然,随着机器翻译的发展,更复杂的调序模型被提出
[23, 267, 268, 269, 270, 271]
但是扭曲
度所引发对调序问的思是非常深的,这 IBM 模型最大贡献
一。
IBM 模型的另一个贡献是在机器翻译中引入了繁衍率的概念。本质上,繁衍率
是一种对译长的建模。 IBM 模型中,通计算词的衍率可以
到整个句子的长度。需要注意的是,在机器翻译中译文长度对翻译性能有着至
关重要的影响。虽然,在很多机器翻译模型中并没有直接使用繁衍率这个概念,
但是几乎所有的现代机器翻译系统中都有译文长度的控制模块。比如,在统计
机器翻译和神经机器翻译中,都把译文单词数量作为一个特征用于生成合理长
度的译文
[
22, 80, 272]
。此外,在神经机器翻译中,非自回归的解码中也使用繁衍率
模型对译文长度进行预测
[273]