198 Chapter 7. 基于短语的模型 肖桐 朱靖波
7.1.1 词的翻译带来的问题
首先,回顾一下基于单词的统计翻译模型是如何完成翻译的。图7.1展示了一个
实例。其中,左侧是一个单词的“翻译表”,它记录了源语言(汉语)单词和目标语
言(英语)单词之间的对应关系,以及这种对应的可能性大小(用 P 表示)。在翻译
时,会使用这些单词一级的对应,生成译文。图7.1右侧就展示了一个基于词的模型
生成的翻译结果,其中 s 和 t 分别表示源语言和目标语言句子,单词之间的连线表示
两个句子中单词一级的对应。
单词翻译表 P
我 → I 0.6
喜欢 → like 0.3
绿 → green 0.9
茶 → tea 0.8
我
喜欢
绿
茶
s =
I
like
green
tea
t =
图 7.1 基于单词的翻译实例
图7.1体现的是一个典型的基于单词对应关系的翻译方法。它非常适合组合性翻
译(Compositional Translation)的情况,也就是通常说的直译。不过,自然语言作为
人类创造的高级智能的载体,远比想象的复杂。比如,即使是同一个单词,词义也会
根据不同的语境产生变化。
图7.2给出了一个新的例子,其中为了便于阅读,单词之间用空格或者斜杠进行
分割。如果同样使用概率化的单词翻译对问题进行建模,对于输入的句子“我/喜
欢/红/茶”,翻译概率最大的译文是“I like red tea”。显然,“red tea”并不是英语中
“红/茶”的说法,正确的译文应该是“black tea”。
单词翻译表 P
我 → I 0.6
喜欢 → like 0.3
红 → red 0.8
红 → black 0.1
茶
→
tea 0.8
“红茶”为一种搭配,应
该翻译为“black tea”
我
喜欢
红
茶
s
=
I
like red
tea
t
=
图 7.2 基于单词的模型对固定搭配“红/茶”进行翻译
这里的问题在于,“black tea”不能通过“红”和“茶”这两个单词直译的结果
组合而成,也就是,把“红”翻译为“red”并不符合“红/茶”这种特殊搭配的翻译。
虽然在训练数据中“红”有很高的概率被翻译为“red”,但是在这个例子中,应该选
择概率更低的译文“black”。那如何做到这一点呢?如果让人来做,这个事不难,因
为所有人学习英语的时候都知道“红”和“茶”放在一起构成了一个短语,或者说一
种搭配,这种搭配的译文是固定的,记住就好。同理,如果机器翻译系统也能学习并
记住这样的搭配,显然可以做得更好。这也就形成了基于短语的机器翻译建模的基