1.3 机器翻译现状及挑战 33
源 语 言:从前有一个小岛,上面住着快乐、悲哀、知识和爱,还有其他各种情感。一天,情感们得知
小岛快要下沉了。于是,大家都准备船只,离开小岛,只有爱决定留下来,她想坚持到最后
一刻。过了几天,小岛真的要下沉了,爱想请人帮忙。
机器翻译:Once upon a time there was an island on which lived happiness,sorrow,knowledge,love and other
emotions. One day, the emotions learned that the island was going to sink.As a result,everyone pre
-pared the boat and left the island. Only Love decided to stay.She wanted to stick to it until the last
moment. After a few days, the island was really going to sink and love wanted help.
人工翻译:Once upon a time, there was a small island where lived all kinds of emotions like JOY,SADNESS,
KNOWLEDGE, and LOVE.One day, these emotions found that the island was sinking, so one by
one they prepared the boat and planned to leave. None but LOVE chose to stay there. She was deter
-mined to persist till the last moment.A few days later, almost the whole island sunk into the sea,
and LOVE had to seek for help.
图 1.7 机器翻译与人工翻译结果对比实例
• 自然语言翻译问题的复杂性极高。自然语言具有高度的概括性、灵活性、多样性,
这些都很难用几个简单的模型和算法进行描述。因此,翻译问题的数学建模和
计算机程序实现难度很大。虽然近几年 AlphaGo 等人工智能系统在围棋等领域
取得了令人瞩目的成绩,但是,相比翻译来说,围棋等棋类任务仍然“简单”。正
如不同人对同一句话的理解不尽相同,一个句子往往不存在绝对的标准译文,
其潜在的译文几乎是不可穷尽的。甚至人类译员在翻译一个句子、一个单词的
时候,都要考虑整个篇章的上下文语境。这些难点都不是传统棋类任务所具有
的。
• 计算机的“理解”与人类的“理解”存在鸿沟。人类一直希望把自己翻译时所使用
的知识描述出来,并用计算机程序进行实现,例如早期基于规则的机器翻译方
法就源自这个思想。但是,经过实践发现,人和计算机在“理解”自然语言上
存在着明显差异。首先,人类的语言能力是经过长时间在多种外部环境因素共
同作用下形成的,这种能力很难用计算机准确地刻画。况且人类的语言知识本
身就很难描述,更不用说让计算机来理解;其次,人和机器翻译系统理解语言
的目的不一样。人理解和使用语言是为了进行生活和工作,而机器翻译系统更
多的是为了对某些数学上定义的目标函数进行优化。也就是说,机器翻译系统
关注的是翻译这个单一目标,而并不是像人一样进行复杂的活动;此外,人和
计算机的运行方式有着本质区别。人类语言能力的生物学机理与机器翻译系统
所使用的计算模型本质上是不同的,机器翻译系统使用的是其自身能够理解的
“知识”,比如,统计学上的词语表示。这种“知识”并不需要人来理解,当然
从系统开发的角度,计算机也并不需要理解人是如何思考的。
• 单一的方法无法解决多样的翻译问题。首先,语种的多样性会导致任意两种语言
之间的翻译实际上都是不同的翻译任务。比如,世界上存在的语言多达几千种,
如果选择任意两种语言进行互译就会产生上百万种翻译方向。虽然已经有研究
者尝试用同一个框架甚至同一个翻译系统进行全语种的翻译,但是这类系统离