1.8 推荐学习资源 47
1.8 推荐学习资源
1.8.1 经典书籍
首先,推荐一本书Statistical Machine Translation[147]其作者是机器翻译领
域著名学者 Philipp Koehn 教授。该书是机器翻译领域内的经典之作,介绍了统计机
器翻译技术的进展。该书从语言学和概率学两个方面介绍了统计机器翻译的构成
素,然后介绍了统计机器翻译的主要模型:基于词、基于短语和基于树的模型,以及
机器翻译评价、语言建模、判别式训练等方法。此外,作者在该书的最新版本中增加
了神经机器翻译的章节,方便研究人员全面了解机器翻译的最新发展趋势 [148]
Foundations of Statistical Natural Language Processing[192] 中文译名《统计自
然语础》,作 Chris Manning 教授 Hinrich
Sch
¨
utze 教授。该书对统计自然语言处理方法进行了全面介绍。书中讲解了统计自然
语言处理所需的言学和概率论基础知识,介绍了机器翻译评价、语言建模、判
式训练以及整合语言学信息等基础方法。其中也包含了构建自然语言处理工具所
的基本理论和算法,提供了对数学和语言学基础内容广泛而严格的覆盖,以及统
方法的详细讨论。
《统计自然语言处理》[364] 由中国科学院自动化所宗成庆教授所著。该书中系
统介绍了统计自然语言处理的基本概念、理论方法和最新研究进展,既有对基础
识和理论模型的介绍,也有对相关问题的研究背景、实现方法和技术现状的详细
述。可供从事自然语言处理、机器翻译等研究的相关人员参考。
Ian GoodfellowYoshua BengioAaron Courville 三位机器学习领域的学者所
的《Deep Learning[90] 值得读的考书。解了关深学习的方
法,其中很多都会在深度学习模型设计和使用中用到。同时在该书的应用一章中
简单讲解了神经机器翻译的任务定义和发展过程。
Neural Network Methods for Natural Language Processing[88] Yoav Goldberg
编写的面向自然语言处理的深度学习参考书。相比《Deep Learning该书聚焦在自
然语言处理中的深度学习方法,内容更加易读,非常适合刚入门自然语言处理及
度学习应用的人员参考。
《机器学习》[
362] 由南京大学周志华教授所著,作为机器学习领域入门教材,
书尽可能地涵盖了机器学习基础知识的各个方面,试图尽可能少地使用数学知识
绍机器学习方法与思想。
《统计学习方法》[365] 由李航博士所著,该书对机器学习的有监督和无监督等
方法进行了全面而系统的介绍。可以作为梳理机器学习的知识体系,同时了解相
基础概念的参考读物。
《神经网络与深度学习》[367] 由复旦大学邱锡鹏教授所著,全面地介绍了神经
网络和深度学习的基本概念和常用技术,同时涉及了许多深度学习的前沿方法。
书适合初学者阅读,同时又不失为一本面向专业人士的参考书。
48 Chapter 1. 机器翻译简介 肖桐 朱靖波
1.8.2 网络资源
TensorFlow 官网提供了一个有关神机器翻译的教程,介绍了从数据处理开
TensorFlow 码,
https://www.tensorflow.org/tutorials/text/nmt_with_attention此外谷
歌和 Facebook 也分别提供了基于序列到序列机器翻译模型的高级教程。谷歌的版本
是基于 TensorFlow 实现,网址为:https://github.com/tensorflow/nmtFacebook
的教程主要是基于 PyTorch 实现,网址为:https://pytorch.org/tutorials/inte
rmediate/seq2seq_translation_tutorial.html网站上也包含一些综述论文,
中详细的介绍了神经机器翻译的发展历程,问题定义以及目前遇到的问题。
http://www.statmt.org是一介绍器翻究的站,该包含对统
计机器翻译研究的一些介绍资料,一些自然语言处理的会议,常用工具以及语料库。
http://www.mt-archive.infohttps://www.aclweb.org/anthology
网站上有许多介绍机器翻译和自然语言处理的论文,通过这些网站还可以了解到
然语言处理领域的一些重要期刊和会议。
1.8.3 专业组织和会议
许多自然语言处的相关学术组织会定期举办学术会议。与机器翻译相关的
议有:
ACL全称 Annual Conference of the Association for Computational Linguistics
自然语言处理领域最高级别的会议。每年举办一次,主题涵盖计算语言学的所
有方向。
NAACL全称 Annual Conference of the North American Chapter of the Association
for Computational Linguistics ACL 美分会,在自然语言处理领域也属于
顶级会议,每年会选择一个北美城市召开会议。
EMNLP全称 Conference on Empirical Methods in Natural Language Processing
自然语言处理另一个顶级会议之一, ACL 中对语言数据和经验方法有特
殊兴趣的团体主办,始于 1996 年。会议比较偏重于方法和经验性结果。
COLING全称 International Conference on Computational Linguistics自然语言
处理老牌顶级会议之一。该会议始于 1965 年,是由 ICCL 国际计算语言学委员
会主办。会议简称为 COLING是谐音瑞典著名作家 Albert Engstr
¨
om 小说中的
虚构人物 KolingenCOLING 每两年举办一次。
EACL,全称 Conference of the European Chapter of the Association for Computa
tional Linguistics ACL 欧洲分会,虽然在欧洲召开,会议也吸引了全世界的
大量学者投稿并参会。
AACL全称 Conference of the AsiaPacific Chapter of the Association for Compu
1.8 推荐学习资源 49
tational Linguistics ACL 亚太地区分会。2020 年会议首次召开,是亚洲地区
自然语言处理领域最具影响力的会议之一。
WMT全称 Conference on Machine Translation机器翻译领域一年一度研讨会,
是国际公认的顶级机器翻译赛事之一。
AMTA全称 Conference of the Association for Machine Translation in the Americas
AMTA 会议汇聚了学术界、产业界和政府的研究人员、开发人员和用户,让工
业界和学术界进行交流。
CCL全称 China National Conference on Computational Linguistics中文为中国
计算语言学大会。中国计算语言学大会创办于 1991 年,由中国中文信息学会
计算语言学专业委员会负责组织。经 20 年的发展,中国计算语言学大会
已成为国内自然语言处理领域权威性最高、规模和影响最大的学术会议。作为
中国中文信息学会(国内一级学会)的旗舰会议,CCL 聚焦于中国境内各类语
言的智能计算和信息处理,为研讨和传播计算语言学最新学术和技术成果提供
了最广泛的高层次交流平台。
NLPCC,全 CCF International Conference on Natural Language Processing and
Chinese ComputingNLPCC 由中国计算机学会CCF)主办的 CCF 中文信
息技术专业委员会年度学术会, 专注于自然语言处理及中文处理领域的研究
和应用创新。会议自 2012 年开始举办,主要活动有主题演讲、论文报告、技术
测评等多种形式。
CCMT,全 China Conference on Machine Translation中国译研会,
由中国中文信息学会主办,旨在为国内外机器翻译界同行提供一个平台,促进
中国机器翻译事业。CCMT 不仅是国内机器翻译领域最具影响力、最权威的学
术和评测活动,而且也代表着汉语与民族语言翻译技术的最高水准,对民族语
言技术发展具有重要意义。
除了会议之外,《中文信息学报》Computational LinguisticsMachine Trans
lationTransactions of the Association for Computational LinguisticsIEEE/ACM
Transactions on Audio, Speech, and Language ProcessingACM Transactions on Asian
and Low Resource Language Information ProcessingNatural Language Engineering
等期刊也发表了许多与机器翻译相关的重要论文。