![](data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAAxoAAASoCAIAAAAchyv1AAAACXBIWXMAABYlAAAWJQFJUiTwAAAbFUlEQVR42u3dXWyU9Z7A8X+hNLwUaOu2TEKKtZaNYGk1yFFehAMHSDgcIoleCCarSZf1qmAie2OONpSEm9ULgRjdpDEagRzDhhgi1aT4QtJykuUEKKToLuBIKxmn0hdMLZZpZy9GCQFd20qntPP5XD2dFtL58e88X/7P0zYEAAB+h6xkMmkKAADDNsEIAADkFACAnAIAkFMAAHIKAAA5BQAgpwAA5BQAgJwCAEBOAQDIKQAAOQUAIKcAAJBTAAByCgBATgEAyCkAAOQUAICcAgCQUwAAcgoAQE4BACCnAADkFACAnAIAkFMAAMgpAAA5BQAgpwAA5BQAAHIKAEBOAQDIKQAAOQUAgJwCAJBTAAByCgBATgEAyCkAAOQUAICcAgCQUwAAcgoAADkFACCnAADkFACAnAIAQE4BAMgpAAA5BQAgpwAAkFMAAHIKAEBOAQDIKQAA5BQAgJwCAJBTAAByCgBATgEAIKcAAOQUAICcAgCQUwAAyCkAADkFACCnAADkFAAAcgoAQE4BAMgpAAA5BQCAnAIAkFMAAHIKAEBOAQDIKQAA5BQAgJwCAJBTAAByCgAAOQUAIKcAAOQUAICcAgBATgEAyCkAADkFACCnAACQUwAAcgoAQE4BAMgpAAA5BQCAnAIAkFMAAHIKAEBOAQAgpwAA5BQAgJwCAJBTAADIKQAAOQUAIKcAAOQUAAByCgBATgEAyCkAADkFAICcAgCQUwAAcgoAQE4BAMgpAADkFACAnAIAkFMAAHIKAAA5BQAgpwAA5BQAgJwCAEBOAQDIKQAAOQUAIKcAAJBTAAByCgBATgEAyCkAADkFAICcAgCQUwAAcgoAQE4BACCnAADkFACAnAIAkFMAAMgpAAA5BQAgpwAA5BQAAHIKAEBOAQDIKQAAOQUAIKcAAJBTAAByCgBATgEAyCkAAOQUAICcAgCQUwAAcgoAADkFACCnAADkFACAnAIAQE4BAMgpAAA5BQAgpwAAkFMAAHIKAEBOAQDIKQAAOQUAgJwCAJBTAAByCgBATgEAIKcAAOQUAICcAgCQUwAAyCkAADkFACCnAADkFAAAcgoAQE4BAMgpAAA5BQAgpwAAkFMAAHIKAEBOAQDIKQAA5BQAgJwCAJBTAAByCgAAOQUAIKcAAOQUAICcAgBATgEAyCkAADkFACCnAADkFAAAcgoAQE4BAMgpAAA5BQCAnAIAkFMAAHIKAEBOAQAgpwAA5BQAgJwCAJBTAADIKQAAOQUAIKcAAOQUAAByCgBATgEAyCkAADkFACCnAACQUwAAcgoAQE4BAMgpAADkFACAnAIAkFMAAHIKAAA5BQAgpwAA5BQAgJwCAEBOAQDIKQAAOQUAIKcAAOQUAAByCgBATgEAyCkAADkFAICcAgCQUwAAcgoAQE4BACCnAADkFACAnAIAkFMAAMgpAAA5BQAgpwAA5BQAgJwyAgAAOQUAIKcAAOQUAICcAgBATgEAyCkAADkFACCnAACQUwAAcgoAQE4BAMgpAADkFACAnAIAkFMAAHIKAAA5BQAgpwAA5BQAgJwCAJBTAADIKQAAOQUAIKcAAOQUAAByCgBATgEAyCkAADkFAICcAgCQUwAAcgoAQE4BACCnAADkFACAnAIAkFMAAHIKAAA5BQAgpwAA5BQAgJwCAEBOAQDIKQAAOQUAIKcAAJBTAAByCgBATgEAyCkAAOQUAICcAgCQUwAAcgoAADkFACCnAADkFACAnAIAkFMAAMgpAAA5BQAgpwAA5BQAAHIKAEBOAQDIKQAAOQUAgJwCAJBTAAByCgBATgEAIKcAAOQUAICcAgCQUwAAcgoAADkFACCnAADkFACAnAIAQE4BAMgpAAA5BQAgpwAAkFMAAHIKAEBOAQDIKQAA5BQAgJwCAJBTAAByCgBATgEAIKcAAOQUAICcAgCQUwAAyCkAADkFACCnAADkFAAAcgoAQE4BAMgpAAA5BQCAnAIAkFMAAHIKAEBOAQAgpwAA5BQAgJwCAJBTAAByCgAAOQUAIKcAAOQUAICcAgBATgEAyCkAADkFACCnAACQUwAAcgoAQE4BAMgpAADkFACAnAIAkFMAAHIKAEBOAQAgpwAA5BQAgJwCAJBTAADIKQAAOQUAIKcAAOQUAAByCgBATgEAyCkAADkFAICcAgCQUwAAcgoAQE4BAMgpAADkFACAnAIAkFMAAHIKAAA5BQAgpwAA5BQAgJwCAEBOAQDIKQAAOQUAIKcAAJBTAAByCgBATgEAyCkAAOQUAICcAgCQUwAAcgoAQE4BACCnAADkFACAnAIAkFMAAMgpAAA5BQAgpwAA5BQAAHIKAEBOAQDIKQAAOQUAgJwCAJBTAAByCgBATgEAyCkAAOQUAICcAgCQUwAAcgoAADkFACCnAADkFACAnAIAQE4BAMgpAAA5BQAgpwAAkFMAAHIKAEBOAQDIKQAAOQUAgJwCAJBTAAByCgBATgEAIKcAAOQUAICcAgCQUwAAyCkAADkFACCnAADkFAAAcgoAQE4BAMgpAAA5BQCAnAIAkFMAAHIKAEBOAQDIKQAA5BQAgJwCAJBTAAByCgAAOQUAIKcAAOQUAICcAgBATgEAyCkAADkFACCnAACQUwAAcgoAQE4BAMgpAAA5BQCAnAIAkFMAAHIKAEBOAQAgpwAA5BQAgJwCAJBTAADIKQAAOQUAIKcAAOQUAAByCgBATgEAyCkAADkFACCnjAAAQE4BAMgpAAA5BQAgpwAAkFMAAHIKAEBOAQDIKQAA5BQAgJwCAJBTAAByCgAAOQUAIKcAAOQUAICcAgBATgEAyCkAADkFACCnAADkFAAAcgoAQE4BAMgpAAA5BQCAnAIAkFMAAHIKAEBOAQAgpwAA5BQAgJwCAJBTAADIKQAAOQUAIKcAAOQUAICcAgBATgEAyCkAADkFACCnAACQUwAAcgoAQE4BAMgpAADkFACAnAIAkFMAAHIKAAA5BQAgpwAA5BQAgJwCAEBOAQDIKQAAOQUAIKcAAOQUAAByCgBATgEAyCkAADkFAICcAgCQUwAAcgoAQE4BACCnAADkFACAnAIAkFMAAMgpAAA5BQAgpwAA5BQAgJwCAEBOAQDIKQAAOQUAIKcAAJBTAAByCgBATgEAyCkAAOQUAICcAgCQUwAAcgoAADkFACCnAADkFACAnAIAkFMAAMgpAAA5BQAgpwAA5BQAAHIKAEBOAQDIKQAAOQUAgJwCAJBTAAByCgBATgEAIKcAAOQUAICcAgCQUwAAyCkAADkFACCnAADkFACAnAIAQE4BAMgpAAA5BQAgpwAAkFMAAHIKAEBOAQDIKQAA5BQAgJwCAJBTAAByCgAAOQUAIKcAAOQUAICcAgCQUwAAyCkAADkFACCnAADkFAAAcgoAQE4BAMgpAAA5BQCAnAIAkFMAAHIKAEBOAQAgpwAA5BQAgJwCAJBTAAByCgAAOQUjJpFIGAJWIyCnYJiysrImTZpkDtwNIbVmzZri4uKenh7TADkFwJDt2rWroaEhFott3LjRNEBOATAEiURi7969NTU1qTcbGho2b95sjwrkFACD0t7evnDhwurq6q1bt6Ye2bdv34EDB8rKyhobG80H7hJZyWTSFOBXv0KyskIIvkwYLdu2bXv//fcPHjy4dOnSG6sxGo0+8cQTIYTTp08bEcgpkFNgNcKY52IfAICcAgCQUwAAcgoAQE4BACCnAADkFACAnAIAkFMAAMgpAAA5BQAgpwAA5BQAAHIKAEBOAQDIKQAAOQUAgJwCAJBTAAByCgBATgEAyCkAAOQUAICcAgCQUwAAcgoAADkFACCnAADkFACAnAIAQE7BYO3du7e2tjaRSNz8YE9Pz7Zt2/bu3Ws+AMgp+G01NTXFxcXRaDT1ZmNjY1lZ2e7du0tLSw0HgFtkJZNJU4BbnDlzZu3atbFY7MYjFRUVH3zwQUlJieEwaq/XWVkhBC/aIKdgzEgkEsXFxamiWr16dX19fXZ2trEgpwA5BUMQjUbvu+++SCTS3NxcWFhoIMgpQE7BcIoqhOAaH3IKkFMAcgoYKe4FIa3i8filS5d6enqMYoRMmzZt7ty5M2fONIrf1N3dffny5Xg8PrY+7c8//3wMrcY5c+YUFRVZbIz//+34jw5p0N/fX1dXd/jwYaNIm+eff37dunUTJ040ittXY319/VtvvWUUabN8+fLq6urJkycbBXIKhikajb7yyiudnZ1GkWYlJSUvv/yyvYGbxePxnTt33viJYqRNfn7+1q1bH3nkEaNATsGQnThxYseOHT+d3QsKnnzooZKCgsj06ZMnTTKcO+7a9eux77+PdnTUHT/e1dubenDPnj1upb/RUlVVVanjKXlTFlctLigpmB6ZPmmy1XjnDfQPdLV2dUQ7Tv3XqY5oR+rB7du3r1ixwnCQUzAE3d3d1dXVqX2p55csWTd//sQJfhB/OvQPDNT9/e+Hz55N7Qq8/fbbrvr19/e/8MILqX2p+5ffv7x6uYpKW1e11Lc0vdWUevO9995zbx/jj3MbI+jVV19NtdSLq1b9pbxcS6XNxAkT/m3Jkg3l5SGEzs7Ouro6M6mvr0+1VPmG8j/9+5+0VPpOMxMnlP+lfNWLq268LJgJcgoGKx6Pnzp1KoRQOXv2H8vKDCT9qh57LG/KlBDC4cOHr127lsmj6O/vT917PiVvymNVj1kb6Vf2x7L7l98fQjh16tSY+25KkFOMmkuXLqUO/nXxYtMYFRMnTNj2830qN/45MtOVK1dSB4urFk+Y6HVvdPzhX/6QOjh58qRpIKdgUM6fP586KM7LM43RUpyfnzo4evRoJm8JnDt3LnUwa94sq2K0TJ81PXXQ1NR0/vx5d+4ip+C3tba2hhBKCgrcMjWKZk3/6QR28eLFlpaWjC2qL7/8MnUw7Z+mWRWjaHbl7NSLQ1tb24ULFwwEOQWDMufn3RHuBi0tLdevX8/AJ97d3f3TS54rfaNq8szJIYT29vYQQltbm1+QgJwCxqSvv/7aELhLnD592hCQU8DY09bWZgjcJfr6+jJzuxQ5BYx5TmDcPX744QdDQE4BTmAwfD/++KMhIKcAJzAAOQUAgJwCAJBTQFolEonGxkZzAJBTwDCtW7du2bJlZ86cMQoAOQUMWWNjY0NDQwhh+s+/hQYAOQUM1nfffffUU0+FEDZt2lRSUmIgAHIKGIKLFy+uXLkyFoutXr363XffNRAAOQUMwaFDh6qqquLxeCQS2b9/f3Z2dtZtbv9TY+5jBvOXANxB2UYAGSIWi+3evTuEUFRU1Nramp3tyx/gzrA7BZkiEomUlpaGEOLx+K5duzLquff19VkAgJwC7oC6urrnnnsuhFBTU1NbWxtCSN7m9j815j7m9g/Iycnxrw/IKeDOePbZZ994441UUe3fv99AAOQUMGRPPvnkjh07QggvvvhiIpEwEAA5BQzZSy+9FIlEYrHYuXPnTANATgFDlp2dffz48a1bt86bN880AH7vi6oRQGYqKSl5/fXXzQHg97M7BQAgpwAA5BQAgJwCAJBTAADIKQAAOQUAIKcAAOQUAAByCgBATgEAyCkAADkFAICcAgCQUwAAcgoAQE4BACCngHEmkUisWbOmsbHRKAA5BTAcbW1tDQ0Ny5Yt6+npMQ1ATgEMWUlJSSQSCSFs2bLFNAA5BTAcBw8eDCEcOHCgtrbWNAA5BTBkS5cu3bdvXwihpqZmzZo1rvoBaZBtBJAJ+vr6Vq5cmWnPuqGhoaysrLW11QIARpTdKcgIOTk5mfnEY7HYuXPnLABgRNmdgkzx6aefpg7mz59fVFQ0jp9pe3t7RUVFLBaLRCKvvfbaggULPvroIwsAkFMAg9LT03OjpZqbmwsLC80EGGku9gHjypYtW7QUIKcAhqm9vf3AgQMhhOPHj2spQE4BDNOmTZtKSkrMAUgb904B40dhYWE8HrcvBaSZ3SlgvBWVIQByCgBATgEAyCkAAOQUAICcAgCQUwAAcgoAADnFaGi+fNkQRlH/wEDqYOrUqZk8h+Li4tTB9WvXrYpR1HmpM/jZYMgpGOoJrKu399p1J7BR811PT+ogEolk8hzKyspSB9/HvrcqRstA/0BHtOPmugU5BYM9gcW+dwIbNf/99depg9mzZ2fyHObMmZM6uHzWdumo6WrtEvfIKRjmCey1Tz65ccmJdLp2/frfTp5MHefm5mbyKIqKilIHJ/920vW+UTHQP/DJa5+Ie+QUDPkEtmHDhhBCtKPj/Z9P6qTTnmPHunp7QwirVq2aMCHTv9i3b98eQujt6j2255i1kX4t9S2pK30PPPDAjBkzDAQ5BYNVVVWVn58fQtj/j3/8x9GjbqJKm+7e3r9++OGxCxdCCIWFhZWVlTe/d9q0aRk4kxUrVjz00EMhhAvHLnz41w97u3utk/QY6B9o+s+mpreaQghTp05du3atmTD+ZCWTSVNg5ESj0erq6tRx3pQpf54/f25hYXF+vsmMkHPffvs/8fjhs2dTb06dOvWZZ565ZTPg8ccfnzhxYiZWZnd3dXV1Z2dn6s3yDeVF/1w0a94sy2aEdLZ2tv9ve8uRlt6un+L16aefvuVK36JFizKz75FTMDTxeHznzp3RaNQo0uzee+9dv379lClTbn4wJydnyZIlGTuTa9eu7dmz59gx1/vSrbCwcOPGjbdf5luxYkVWVpb5IKfgt/X399fX13/88ceiKm2nrkWLFs2bN+/2d82dO9eNwCdOnHjnnXesxrStxgULFlRWVt5+A9+sWbN+cZWCnIL/z9WrVz/77LNvvvnGKEbI7Nmzc3Nzf+3G89zc3IULF9oMSOnr6zt69KioGtGQmjlz5qRJk37xvTk5OY8++mhmXndm/Mk2AtJpxowZlZWVvq9ntJSXl2upm0/nS5YsueViKGnz4IMPainGDbtTjIKOjo4vvviir6/v7v9UGxoaSktLS0tLx/rM8/Pz58+f/2v7BJmsp6fn9OnTY2I1jhu5ubnl5eWTJ082CuQU/C79/f2xWOzq1avffvvtXftJnj17NvVtiYcOHcrLyxuj5628vLyCgoKCggKr7tckk8n29vYrV650dnbqqpGTk5OTn59/zz33FBYW2iVFTkFGaG9vr6ioiMViIYSKioqmpibfzg3AL/JjPOEXHDly5MavJQkhNDc3l5WVnTlzxmQAkFPw22pra9evX7969erm5ubUI1999VVRUVFFRcX+/fvNB4BbuNgHtzpy5EhXV9fmzZtDCKk7PJLJZCKRePPNNx9++OGlS5caEQByCgb9FfJzThkFAL/GxT4AADkFACCnAADkFACAnAIAQE4BAMgpAAA5BQAgpwAAkFMAAHIKAEBOAQDIKQAA5BQAgJwCAJBTAAByCgAAOQUAIKcAAOQUAICcAgCQUwAAyCkAADkFACCnAADkFAAAcgoAQE4BAMgpAAA5BQCAnAIAkFMAAHIKAEBOAQAgpwAA7pCsZDJpCgAAw2Z3CgBATgEAyCkAADkFACCnAACQUwAAcgoAQE4BAMgpAADkFACAnAIAkFMAAHIKAAA5BQAgpwAA5BQAgJwCAEBOAQDIKQAAOQUAIKcAAOQUAAByCgBATgEAyCkAADkFAICcAgCQUwAAcgoAQE4BACCnAADkFACAnAIAkFMAAMgpAAA5BQAgpwAA5BQAgJwCAEBOAQDIKQAAOQUAIKcAAJBTAAByCgBATgEAyCkAAOQUAICcAgCQUwAAcgoAADkFACCnAADkFACAnAIAQE4BAMgpAAA5BQAgpwAA5BQAAHIKAEBOAQDIKQAAOQUAgJwCAJBTAAByCgBATgEAIKcAAOQUAICcAgCQUwAAyCkAADkFACCnAADkFACAnAIAQE4BAMgpAAA5BQAgpwAAkFMAAHIKAEBOAQDIKQAA5BQAgJwCAJBTAAByCgAAOQUAIKcAAOQUAICcAgCQUwAAyCkAADkFACCnAADkFAAAcgoAQE4BAMgpAAA5BQCAnAIAkFMAAHIKAEBOAQAgpwAA5BQAgJwCAJBTAADIKQAAOQUAIKcAAOQUAICcAgBATgEAyCkAADkFACCnAACQUwAAcgoAQE4BAMgpAADkFACAnAIAkFMAAHIKAAA5BQAgpwAA5BQAgJwCAJBTAADIKQAAOQUAIKcAAOQUAAByCgBATgEAyCkAADkFAICcAgCQUwAAcgoAQE4BACCnAADkFACAnAIAkFMAAHIKAAA5BQAgpwAA5BQAgJwCAEBOAQDIKQAAOQUAIKcAAJBTAAByCgBATgEAyCkAAOQUAICcAgCQUwAAcgoAADkFACCnAADkFACAnAIAkFMAAMgpAAA5BQAgpwAA5BQAAHIKAEBOAQDIKQAAOQUAgJwCAJBTAAByCgBATgEAIKcAAOQUAICcAgCQUwAAcgoAADkFACCnAADkFACAnAIAQE4BAMgpAAA5BQAgpwAAkFMAAHIKAEBOAQDIKQAA5BQAgJwCAJBTAAByCgBAThkBAICcAgCQUwAAcgoAQE4BACCnAADkFACAnAIAkFMAAMgpAAA5BQAgpwAA5BQAAHIKAEBOAQDIKQAAOQUAgJwCAJBTAAByCgBATgEAyCkAAOQUAICcAgCQUwAAcgoAADkFACCnAADkFACAnAIAQE4BAMgpAAA5BQAgpwAAkFMAAHIKAEBOAQDIKQAAOQUAgJwCAJBTAAByCgBATgEAIKcAAOQUAICcAgCQUwAAyCkAADkFACCnAADkFAAAcgoAQE4BAMgpAAA5BQCAnAIAkFMAAHIKAEBOAQDIKQAA5BQAgJwCAJBTAAByCgAAOQUAIKcAAOQUAICcAgBATgEAyCkAADkFACCnAACQUwAAcgoAQE4BAMgpAAA5BQCAnAIAkFMAAHIKAEBOAQAgpwAA5BQAgJwCAJBTAADIKQAAOQUAIKcAAOQUAAByCgBATgEAyCkAADkFACCnAACQUwAAcgoAQE4BAMgpAADkFACAnAIAkFMAAHIKAAA5BQAgpwAA5BQAgJwCAEBOAQDIKQAAOQUAIKcAAJBTAAByCgBATgEAyCkAADkFAICcAgCQUwAAcgoAQE4BACCnAADkFACAnAIAkFMAAMgpAAA5BQAgpwAA5BQAAHIKAEBOAQDIKQAAOQUAIKcAAJBTAAByCgBATgEAyCkAAOQUAICcAgCQUwAAcgoAADkFACCnAADkFACAnAIAQE4BAMgpAAA5BQAgpwAA5BQAAHIKAEBOAQDIKQAAOQUAwFBkGQGMRclk0hAA7hL/B0iZT9mXkjevAAAAAElFTkSuQmCC)
472 Chapter 14. 神经机器翻译模型推断 肖桐 朱靖波
• 使用源语言句子的编码结果,在目标语言端自左向右逐词生成译文;
• 在目标语言的每个位置计算模型得分,同时进行剪枝;
• 当满足某种条件时终止搜索。
这个过程与统计机器翻译中自左向右翻译是一样的(见第七章),即在目标语言
的每个位置,根据已经生成的部分译文和源语言的信息,生成下一个译文单词
[80, 81]
。
它可以由两个模块实现
[671]
:
• 预测模块,它根据已经生成的部分译文和源语言信息,预测下一个要生成的译
文单词的概率分布
1
。因此预测模块实际上就是一个模型打分装置;
• 搜索模块,它会利用预测结果,对当前的翻译假设进行打分,并根据模型得分
对翻译假设进行排序和剪枝。
预测模块是由模型决定的,而搜索模块可以与模型无关。也就是说,不同的模型
可以共享同一个搜索模块完成推断。比如,对于基于循环神经网络的模型,预测模块
需要读入前一个状态的信息和前一个位置的译文单词,然后预测当前位置单词的概
率分布;对于 Transformer,预测模块需要对前面的所有位置做注意力运算,之后预测
当前位置单词的概率分布。不过,这两个模型都可以使用同一个搜索模块。图14.1给
出了神经机器翻译推断系统的结构示意图。
预测模块
源语言句子(编码器输出)
搜索模块
译文中已经生成的单词
预测当前位置的单词概率分布
图 14.1 神经机器翻译推断系统的结构
这是一个非常通用的结构框架,同样适用于统计机器翻译模型。因此,神经机
器翻译推断中的很多问题与统计机器翻译是一致的,比如:束搜索的宽度、解码终
止条件等等。
一般来说,设计机器翻译推断系统需要考虑三个因素:搜索的准确性、搜索的
时延、搜索所需要的存储。通常,准确性是研究人员最关心的问题,比如可以通过增
大搜索空间来找到模型得分更高的结果。而搜索的时延和存储消耗是实践中必须要
考虑的问题,比如可以设计更小的模型和更高效的推断方法来提高系统的可用性。
1
在统计机器翻译中,也可以同时预测若干个连续的单词,即短语。在神经机器翻译中也有类似于生
成短语的方法,但是主流的方法还是按单词为单位进行生成。