44 Chapter 1. 机器翻译简介 肖桐 朱靖波
1.6 推荐学习资源
1.6.1 经典书籍
首先,推荐一本书 Statistical Machine Translation
[26]
其作者是机器翻译领域著名
学者 Philipp Koehn 教授。该书是机器翻译领域内的经典之作,介绍了统计机器翻
技术的进展。该书从语言学和概率学两个方面介绍了统计机器翻译的构成要素,然
后介绍了统计机器翻的主要模型:基于词、基于短语和基于树的模型,以及机器
翻译评价、语言建模、判别式训练等方法。此外,作者在该书的最新版本中增加了神
经机器翻译的章节,方便研究人员全面了解机器翻译的最新发展趋势
[27]
Foundations of Statistical Natural Language Processing
[28]
中文《统计
言处理基础》作者是自然语言处理领域的权威 Chris Manning 教授和 Hinrich Sch
¨
utze
教授。该书对统计自然语言处理方法进行了全面介绍。书中讲解了统计自然语言处
理所需的语言学和概论基础知识,介绍了机器翻译评价、语言建模、判别式训练
以及整合语言学信息等基础方法。其中也包含了构建自然语言处理工具所需的基本
理论和算法,并且涵盖了数学和语言学基础内容以及相关的统计方法。
《统计自然语言处理(第 2 版)
[29]
由中国科学院自动化所宗成庆教授所著。
书中系统介绍了统计自然语言处理的基本概念、理论方法和最新研究进展,既有对
基础知识和理论模型的介绍,也有对相关问题的研究背景、实现方法和技术现状的
详细阐述。可供从事自然语言处理、机器翻译等研究的相关人员参考。
Ian GoodfellowYoshua BengioAaron Courville 三位机器学习领域的学者所
写的 Deep Learning
[30]
也是得一的参书。其解了关深学习用的法,
其中很多都会在深度学习模型设计和使用中用到。同时在该书的应用一章中也简单
讲解了神经机器翻译的任务定义和发展过程。
Neural Network Methods for Natural Language Processing
[31]
Yoav Goldberg 编写
的面向自然语言处理的深度学习参考书。相比 Deep Learning,该书聚焦在自然语言
处理中的深度学习方法,内容更加易读,非常适合刚入门自然语言处理及深度学习
应用的人员参考。
《机器学习》
[32]
由南京大学周志华教授所著,作为机器学习领域入门教材,
书尽可能地涵盖了机器学习基础知识的各个方面,试图尽可能少地使用数学知识介
绍机器学习方法与思想。
《统计学习方法(第 2 版)
[33]
由李航博士所著,该书对机器学习的有监督和无
监督等方法进行了全面而系统的介绍。可以作为梳理机器学习的知识体系,同时了
解相关基础概念的参考读物。
《神经网络与深度学习》
[34]
由复旦大学邱锡鹏教授所著,全面地介绍了神经网
络和深度学习的基本概念和常用技术,同时涉及了许多深度学习的前沿方法。该书
适合初学者阅读,同时又不失为一本面向专业人士的参考书。
1.6 推荐学习资源 45
1.6.2 相关学术会议
许多自然语言处理的相关学术组织会定期举办学术会议。计算语言学Compu-
tational Linguistics)和自然语言处Natural Language Processing)方面的会议为主。
与机器翻译相关的部分会议有:
AACL全称 Conference of the Asia-Pacific Chapter of the Association for Computa-
tional Linguistics为国际权威组织计算语言学会Association for Computational
LinguisticsACL)亚太地区分会。2020 年会议首次召开,是亚洲地区自然语
言处理领域最具影响力的会议之一。
AAMT全称 Asia-Pacific Association for Machine Translation Annual Conference
为亚-洋地器翻会举会,旨进亚泛太地区
机器翻译的研究和产业化。特别是对亚洲国家语言的机器翻译研究有很好的促
进,因此也成为了该地区十分受关注的会议之一。
ACL全称 Annual Conference of the Association for Computational Linguistics
自然语言处理领域最高级别的会议。由计算语言学会组织,每年举办一次,
题涵盖计算语言学的所有方向。
AMTA全称 Biennial Conference of the Association for Machine Translation in the
Americas,美国机器翻译协会组织的会议,每两年举办一次。AMTA 会议汇聚
了学术界、产业界和政府的研究人员、开发人员和用户,让工业界和学术界进
行交流。
CCL全称 China National Conference on Computational Linguistics中文为中国
计算语言学大会。中国计算语言学大会创办于 1991 年,由中国中文信息学
计算语言学专业委员会负责组织。经过 20 余年的发展,中国计算语言学大
已成为国内自然语言处理领域权威性最高、规模和影响最大的学术会议。作为
中国中文信息学会(国内一级学会)的旗舰会议,CCL 聚焦于中国境内各类语
言的智能计算和信息处理,为研讨和传播计算语言学最新学术和技术成果提供
了最广泛的高层次交流平台。
CCMT,全 China Conference on Machine Translation,中国翻译会,
由中国中文信息学会主办,旨在为国内外机器翻译界同行提供一个平台,促进
中国机器翻译事业。CCMT 不仅是国内机器翻译领域最具影响力、最权威的学
术和评测活动,而且也代表着汉语与民族语言翻译技术的最高水准,对民族语
言技术发展具有重要意义。
COLING全称 International Conference on Computational Linguistics自然语言
处理老牌顶级会议之一。该会议始于 1965 年,是由 ICCL 国际计算语言学委员
会主办。会议简称为 COLING是谐音瑞典著名作家 Albert Engstr
¨
om 小说中的
虚构人物 KolingenCOLING 每两年举办一次。
46 Chapter 1. 机器翻译简介 肖桐 朱靖波
EACL,全称 Conference of the European Chapter of the Association for Computa-
tional Linguistics ACL 欧洲分会,虽然在欧洲召开,会议也吸引了全世界的
大量学者投稿并参会。
EAMT全称 Annual Conference of the European Association for Machine Transla-
tion,欧洲机器翻译协会的年会。该会议汇聚了欧洲机器翻译研究、产业化等
方面的成果,同时也吸引了世界范围的关注。
EMNLP,全称 Conference on Empirical Methods in Natural Language Processing
自然语言处理另一个顶级会议之一,由 ACL 当中对语言数据和经验方法有
殊兴趣的团体主办,始于 1996 年。会议比较偏重于方法和经验性结果。
MT Summit全称 Machine Translation Summit是机器翻译领域的重要峰会。
会议的特色是与产业结合,在探讨机器翻译技术问题的同时,更多的关注机器翻
译的应用落地工作,因此备受产业界关注。该会议每两年举办一次,通常由欧洲
机器翻译协会The European Association for Machine TranslationEAMT美国
机器翻译协会The Association for Machine Translation in the AmericasAMTA
亚洲-太平洋地区机器翻译协会Asia-Pacific Association for Machine Translation
AAMT)举办。
NAACL全称 Annual Conference of the North American Chapter of the Association
for Computational Linguistics,为 ACL 美分会,在自然语言处理领域也属于
顶级会议,每年会选择一个北美城市召开会议。
NLPCC,全 CCF International Conference on Natural Language Processing and
Chinese ComputingNLPCC 由中国计算机学会CCF)主办的 CCF 中文信
息技术专业委员会年度学术会, 专注于自然语言处理及中文处理领域的研究
和应用创新。会议自 2012 年开始举办,主要活动有主题演讲、论文报告、技术
测评等多种形式。
WMT,全称 Conference on Machine Translation,前身为 Workshop on Statistical
Machine Translation机器翻译领域一年一度的国际会议。其举办的机器翻译评
测是国际公认的顶级机器翻译赛事之一。
除了会议之外,《中文信息学报》Computational LinguisticsMachine Translation
Transactions of the Association for Computational LinguisticsIEEE/ACM Transactions on
Audio, Speech, and Language ProcessingACM Transactions on Asian and Low Resource
Language Information ProcessingNatural Language Engineering 等期刊也发表了许多
与机器翻译相关的重要论文。