144 Chapter 5. 基于词的机器翻译建模 肖桐 朱靖波
等人提出了一个观点
[10]
:在翻译一个句子时,可以把其中的每个单词翻译成对应的
目标语言单词,然后调整这些目标语言单词的顺序,最后得到整个句子的翻译结果,
而这个过程可以用统计模型来描述。尽管在人看来使用两个语言之间对应的单词进
行翻译是很自然的事,但是对于计算机来说可是向前迈出了一大步。
先来看一个例子。图 5.1展示了一个汉语翻译到英语的例子。首先,可以把源语言
句子中的单词“我”、“对”、“你”、“感到”和“满意”分别翻译为“I”、“with”、“you”、“am”
和“satisfied”,然后调整单词的顺序,比如,“am”放在译文的第 2 个位置,“you”
应该放在最后的位置等等,最后得到译文“I am satisfied with you”。
我
对
你
感到
满意
I
am
satisfied with
you
图 5.1 汉语到英语的翻译实例及两种语言单词之间的对应关系
上面的例子反映了人在做翻译时所使用的一些知识:首先,两种语言单词的顺
序可能不一致,而且译文需要符合目标语的习惯,这也就是常说的翻译的流畅度;其
次,源语言单词需要准确地被翻译出来,也就是常说的翻译的准确性问题和充分性
问题。为了达到以上目的,传统观点认为翻译过程需要包含三个步骤
[17]
:
• 分析:将源语言句子表示为适合机器翻译的结构。在基于词的翻译模型中,处
理单元是单词,因此在这里也可以简单地将分析理解为分词
1
。
• 转换:把源语言句子中的每个单词翻译成目标语言单词。
• 生成:基于转换的结果,将目标语译文变成通顺且合乎语法的句子。
源文:我对你感到满意
分析
转换
生成
我
对
你
感到
满意
I
am
satisfied with
you
译文:I am satisfied with you
图 5.2 翻译过程中的分析、转换和生成
1
在后续章节中会看到,分析也包括对句子深层次结构的生成,但是这里为了突出基于单词的概念,
因此把问题简化为最简单的情况。