1. 机器翻译简介
1.1 机器翻译的概念
从广义上来讲,“翻译”是指把一个事物转化为另一个事物的过程。这个概念多
使用在对序列的转化上,比如,计算机程序的编译、自然语言文字的翻译、生物蛋白
质的合成等。在程序编译中,高级语言编写的程序经过一系列的处理后转化为可执
行的目标程序,这是一种从高级程序语言到低级程序语言的“翻译”。在人类语言的
翻译中,一种语言文字通过人脑转化为另一种语言表达,这是一种自然语言的“翻
译”。在蛋白质合成的第一步,RNA 分子序列转化为特定的氨基酸序列,这是一种生
物学遗传信息的“翻译”。甚至说给上联对出下联、给一幅图片写出图片的主题等都
可以被看作是“翻译”的过程。
这里更加关注人类语言之间的翻译问题,即自然语言的翻译。如图
1.1所示,通
过计算机可以将一段汉语文字自动转化为英语文字,汉语被称为源语言(Source Lan-
guage
),英语被称为
目标语言
(
Target Language
)。
一直以来,文字的翻译往往是由人完成。让计算机像人一样进行翻译似乎还是电
影中的桥段,因为很难想象语言的多样性和复杂性可以用计算机语言进行描述。但
是时至今日,人工智能技术的发展已经大大超越了人类传统的认知,用计算机进行
自动翻译也不再是一种梦想,它已经深入到人们生活的很多方面,并发挥着重要作
用。而这种由计算机进行自动翻译的过程也被称作机器翻译(Machine Translation)。
类似地,自动翻译、智能翻译、多语言自动转换等概念也是指同样的事情。如果将今
天的机器翻译和人工翻译进行对比,可以发现机器翻译系统所生成的译文还不够完