9.1 深度学习与人工神经网络 283
人工智能领域始终存在着符号主义和联结主义之争。早期的人工智能研究在认
知学中被称为符号主义(Symbolicism),符号主义认为人工智能源于数理逻辑,希望
将世界万物的所有运转方式归纳成像文法一样符合逻辑规律的推导过程。符号主义
的支持者们坚信基于物理符号系统(即符号操作系统)假设和有限合理性原理,就
能通过逻辑推理来模拟智能。但被他们忽略的一点是,模拟智能的推理过程需要大
量的先验知识支持,哪怕是在现代,生物学界也很难准确解释大脑中神经元的工作
原理,因此也很难用符号系统刻画人脑逻辑。此外,联结主义则侧重于利用人工神
经网络中神经元的连接去探索并模拟输入与输出之间存在的某种关系,这个过程不
需要任何先验知识,其核心思想是“大量简单的计算单元连接到一起可以实现智能
行为”,这种思想也推动了反向传播等多种神经网络方法的应用,并发展了包括长短
时记忆模型在内的经典建模方法。2019 年 3 月 27 日,ACM 正式宣布将图灵奖授予
Yoshua Bengio, Geoffrey Hinton 和 Yann LeCun,以表彰他们提出的概念和工作使得深
度学习神经网络有了重大突破,这三位获奖人均是人工智能联结主义学派的主要代
表,从这件事中也可以看出联结主义对当代人工智能和深度学习的巨大影响。
2)分布式表示
分布式表示的主要思想是“一个复杂系统的任何部分的输入都应该是多个特征
共同表示的结果”,这种思想在自然语言处理领域的影响尤其深刻,它改变了刻画
语言世界的角度,将语言文字从离散空间映射到多维连续空间。例如,在现实世界
中,“张三”这个代号就代表着一个人。如果想要知道这个人亲属都有谁,因为有“如
果 A 和 B 姓氏相同且在同一个家谱中,那么 A 和 B 是本家”这个先验知识在,在知
道代号“张三”的情况下,可以得知“张三”的亲属是谁。但是如果不依靠这个先验
知识,就无法得知“张三”的亲属是谁。但在分布式表示中,可以用一个实数向量,
如 (0.1, 0.3,0.4) 来表示“张三”这个人,这个人的所有特征信息都包含在这个实数向
量中,通过在向量空间中的一些操作(如计算距离等),哪怕没有任何先验知识的存
在,也完全可以找到这个人的所有亲属。在自然语言处理中,一个单词也用一个实
数向量(词向量或词嵌入)表示,通过这种方式将语义空间重新刻画,将这个离散空
间转化成了一个连续空间,这时单词就不再是一个简单的词条,而是由成百上千个
特征共同描述出来的,其中每个特征分别代表这个词的某个“方面”。
随着第二代人工神经网络的“脱胎换骨”,学者们又对神经网络方法燃起了希望
之火,这也导致有些时候过分夸大了神经网络的能力。20 世纪 90 年代后期,由于在
语音识别、自然语言处理等应用中,人们对神经网络方法期望过高,但是结果并没
有达到预期,这也让很多人丧失了对神经网络方法的信任。相反,核方法、图模型等
机器学习方法取得了很好的效果,这导致神经网络研究又一次进入低谷。
3. 深度学习和神经网络方法的崛起
21 世纪初,随着深度学习浪潮席卷世界,人工神经网络又一次出现在人们的视
野中。深度学习的流行源于 2006 年 Hinton 等人成功训练了一个深度信念网络(Deep