110 Chapter 4. 翻译质量评价 肖桐 朱靖波
表 4.1 汉译英译文质量评价实例
源文 那/只/敏捷/的/棕色/狐狸/跳过/了/那/只/懒惰/的/狗/。 评价得分
机器译文 1 The quick brown fox jumped over the lazy dog . 5
机器译文 2 The fast brown fox jumped over a sleepy dog . 4
机器译文 3 The fast brown fox jumps over the dog . 3
机器译文 4 The quick brown fox jumps over dog . 2
机器译文 5 A fast fox jump dog . 1
这里的一个核心问题是:从哪个角度对译文质量进行评价呢?常用的标准有:流
畅度(Fluency)和忠诚度(Fidelity)
[129]
。其中流畅度是指译文在目标语言中的流畅
程度,越通顺的译文流畅度越高;忠诚度是指译文表达源文意思的程度,如果译文
能够全面、准确的表达源文的意思,那么它具有较高的翻译忠诚度。在一些极端的
情况下,译文可以非常流畅,但是与源文完全不对应。或者,译文可以非常好的对应
源文,但是读起来非常不连贯。这些译文都不是很好的译文。
传统观点把翻译分为“信”、“达”、“雅”三个层次,而忠诚度体现的是一种“信”
的思想,而流畅度体现的是一种“达”的思想。不过“雅”在机器翻译评价中还不是
一个常用的标准,而且机器翻译还没有达到“雅”的水平,是未来所追求的目标。
给定评价标准,译文质量评价有很多实现方式。比如,可以使用人工评价的方
式让评委对每个译文进行打分(4.2节),也可以用自动评价的方式让计算机比对译文
和参考答案之间的匹配的程度(4.3节)。但是,自然语言的翻译是最复杂的人工智能
问题之一。这不仅仅体现在相关问题的建模和系统实现的复杂性上,译文质量评价
也同样面临着诸多挑战。
• 译文不唯一。自然语言表达的丰富性决定了同一个意思往往有很多种表达方式。
同一句话,由不同译者的翻译也往往存在差异。译者的背景、翻译水平、翻译
所处的语境,甚至译者的情绪都会对译文产生影响。如何在评价过程中尽可能
考虑多样的译文,是译文质量评价中最具挑战的问题之一。
• 评价标准不唯一。虽然流畅度和忠诚度给译文质量评价提供了很好的参考依据,
但是在实践中往往会有更多样的需求。比如,在专利翻译中,术语翻译的准确
性就是必须要考虑的因素,一个术语的翻译错误会导致整个译文不可用。此外,
术语翻译的一致性也是非常重要的,即使同一个术语有多种正确的译文,但是
在同一个专利文档中,术语翻译需要保持一致。不同的需求使得很难用统一的
标准对译文质量进行评价。在实践中,往往需要针对不同应用场景设计不同的
评价标准。
• 自动评价与人工评价存在着偏差。固然使用人工的方式可以准确地评估译文质量,
但是这种方式费时、费力。而且由于人工评价的主观性,其结果不易重现,也
就是不同人的评价结果会有差异。这些因素也造成了人工评价不能被过于频繁