8. 基于句法的模型
人类的语言是具有结构的,这种结构往往体现在句子的句法信息上。比如,
们进行翻译时会将待翻译句子的主干确定下来,之后得到译文的主干,最后形成
整的译文。一个人学习外语时,也会先学习外语句子的基本构成,比如,主语、谓语
等,之后用这种句子结构知识生成外语句子。
使用句法分析可以很好地处理翻译中的结构调序、远距离依赖等问题。因此,
于句法的机器翻译模型长期受到研究者关注。比如,早期基于规则的方法里就大
使用了句法信息来定义翻译规则。进入统计机器翻译时代,句法信息的使用同样
主要研究方向之一。这也产生了很多基于句法的机器翻译模型及方法,而且在很
任务上取得非常出色的结果。本章将对这些模型和方法进行介绍,内容涉及机器
译中句法信息的表示、基于句法的翻译建模、句法翻译规则的学习等。
8.1 翻译中句法信息的使用
使用短语的优点在于可以捕捉到具有完整意思的连续词串,因此能够对局部
下文信息进行建模。当单词之间的搭配和依赖关系出现在连续词串中时,短语可
很好地对其进行描述。但是,当单词之间距离很远时,使用短语的“效率”很低。
n-gram 语言模型一样,当短语长度变长时,数据会变得非常稀疏。比如,很多实
已经证明,如果在测试数据中有一个超过 5 单词的连续词串,那么它在训练数据
中往往是很低频的现象,更长的短语甚至都很难在训练数据中找到。
当然,可以使用平滑算法对长短语的概率进行估计,但是使用过长的短语在
230 Chapter 8. 基于句法的模型 肖桐 朱靖波
进口
过去
有了 大幅度 下降
The imports
drastically fell in the past five to ten years
8.1 汉英翻译中的不同距离下的依赖
际系统研发中仍然不现实。图8.1示了一个汉语到英语的翻译实例。源语言的两个
短语(蓝色和红色高亮)在目标语言中产生了调序。但是,这两个短语在源语言句子
中横跨 8 单词。如果直接使用 8 个单词构成的短语进行翻译,显然会有非常严
重的数据稀疏问题,因为很难期望在训练数据中见到一模一样的短语。
仅使用连续词串不能处理所有的翻译问题,其根本原因在于句子的表层串很
描述片段之间大范围的依赖。一个新的思路是使用句子的层次结构信息进行建模。
三章已经介绍了句法分析基础。对于每个句子,都可以用句法树描述它的结构。
S
VP
ADVP
VBN
fallen
RB
drastically
VBZ
have
NP
NP
this area
IN
in
NP
NN
imports
DT
The
8.2 一棵英语句法树(短语结构树)
8.2就展示了一棵英语句法树(短语结构树)。句法树描述了一种递归的结构,
每个句法结构都可以用一个子树来描述,子树之间的组合可以构成更大的子树,
终完成整个句子的表示。相比线性的序列结构,树结构更容易处理大片段之间的
系。比如,两个在序列中距离“很远”的单词,在树结构中可能会“很近”
句法树结构可以赋予机器翻译对语言进一步抽象的能力,这样,可以不需要使
用连续词串,而是通过句法结构来对大范围的译文生成和调序进行建模。8.3是一
个在翻译中融入源语言(汉语)句法信息的实例。这个例子中,介词短语“在 ... 后”
包含 11 个单词,因此,使用短语很难涵盖这样的片段。这时,系统会把“在 ... 后”
错误地翻译为In ...通过句法树,可以知道“在 ... 后”对应着一个完整的子树结
PP(介词短语)。因此也很容易知道介词短语中“在 ... 后”是一个模板(红色)
“在”“后”之间的部分构成从句部分(蓝色)最终得到正确的译文After ...
使用句法信息在机器翻译中并不新鲜。在基于规则和模板的翻译模型中,就
8.1 翻译中句法信息的使用 231
人工翻译: After the school team won the Championship of the China University Basketball Association for the first time ...
机器翻译: In the school team won the Chinese College Basketball League Championship for the first time ...
更好?:
After
the school team won the Championship of the China University Basketball Association for the first time
...
输入:
1
学校
2
球队
3
首次
4
夺得
5
中国
6
大学生
7
篮球
8
联赛
9
冠军
10
11
,
12
...
PP
PU VP
VP
短语结构树很容易捕捉
这种介词短语结构
1
学校
2
球队
3
首次
4
夺得
5
中国
6
大学生
7
篮球
8
联赛
9
冠军
10
11
8.3 使用句法结构进行机器翻译的实例
量使用了句法等结构信息。只是由于早期句法分析技术不成熟,系统的整体效果
不突出。在数据驱动的方法中,句法可以很好地融合在统计建模中。通过概率化
句法设计,可以对翻译过程进行很好的描述。