基于记忆的神经网络通过利用长时间记忆信息的能力来建模时序数据-电子发烧友网

传统的记忆架构做关系推理时有困难，DeepMind和伦敦大学学院的这篇论文提出关系推理模块RMC，能够在序列信息中执行关系推理，在WikiText-103, Project Gutenberg 和 GigaWord 数据集上达到了当前最佳性能。

基于记忆的神经网络通过利用长时间记忆信息的能力来建模时序数据。然而，目前还不清楚它们是否有能力利用它们记得的信息进行复杂的关系推理。

在这篇论文中，DeepMind和伦敦大学学院的研究人员首先证实一种直觉想法，即标准的记忆架构在一些涉及关系推理的任务上很困难。然后，研究者通过使用一个新的记忆模块——Relational Memory Core（RMC）——来改进这种缺陷，该模块采用multi-head dot product attention来允许记忆交互。

最后，研究者在一系列任务上测试RMC，这些任务可以从跨序列信息的更强大的关系推理中获益，并且在RL领域（例如Mini PacMan）、程序评估和语言建模中显示出巨大的受益，在WikiText-103、Project Gutenberg和GigaWord数据集上获得state-of-the-art的结果。

关系记忆核心RMC

人类使用复杂的记忆系统来访问和推理重要的信息，不管这些信息最初是什么时候被感知到的。在神经网络研究中，许多成功的序列数据建模方法也使用了记忆系统（memory systems），例如LSTM和记忆增强的神经网络（memory-augmented neural networks）。通过增强记忆容量、随时间的有限计算成本以及处理梯度消失的能力，这些网络学会了跨时间关联事件，以便熟练地存储和检索信息。

在这里，我们建议在考虑存储和检索的同时考虑记忆交互，这是卓有成效的。虽然目前的模型可以学习划分和关联分布式的、矢量化的记忆，但它们并不明显地倾向于这样做。我们假设，这样的偏见可以让一个模型更好地理解记忆是如何关联的，因此可以让它更好地进行关系推理。

首先，我们通过开发一个演示任务来强调顺序信息的关系推理，证明当前的模型在这个领域中存在困难。使用新的关系记忆核心（ Relational Memory Core，RMC），利用multi-head dot product attention让记忆彼此交互，我们解决并分析了这个问题。然后，我们将RMC应用到一系列任务中，这些任务可能会从更显式的memory-memory 交互中获益，因此，可能会增加随时间推移的的关系推理能力：在Wikitext-103、Project Gutenberg和GigaWord数据集中，部分观察到的强化学习任务、程序评估和语言建模。

关系推理（Relational reasoning）

我们认为关系推理是理解实体连接的方式的过程，并利用这种理解来实现更高阶的目标。例如，考虑对各种树与公园长椅之间的距离进行排序：将实体(树和长椅)之间的关系(距离)进行比较，以得到解决方案；如果我们单独考虑每个实体的属性(位置)，则无法得到解决方案。

由于我们通常可以很流畅地定义什么构成“实体”（entity）或“关系”（relation），因此我们可以想象一系列的神经网络诱导的偏见，可以用关系推理的语言表达出来。例如，可以用卷积核来计算一个感受野内的实体(像素)的关系(线性组合)。

在时域（temporal domain）中，关系推理可以包含在不同时间点比较和对比信息的能力。这里，注意力机制隐式地执行某种形式的关系推理；如果先前的隐藏状态被解释为entity，那么使用注意力来计算实体的加权和有助于消除RNN中存在的局部性偏差。

由于我们当前的架构解决复杂的时序任务，因此它们必须具备一些时间关系推理的能力。然而，目前还不清楚他们的归纳偏差是否受到限制，以及这些限制是否可以暴露在要求特定类型的时间关系推理的任务中。

模型

我们的指导设计原则是提供一个架构的主干，在这个基础上，模型可以学习如何划分信息，以及如何计算划分的信息之间的交互。为了实现这一点，我们从LSTM、 memory-augmented神经网络和non-local网络（特别是Transformer seq2seq模型）组装构建块。与记忆增强架构相似，我们考虑一组固定的memory slots；但是，我们允许使用注意里机制在memory slots之间进行交互。与之前的工作相反，我们在单个时间步上在记忆之间应用注意力，而不是跨过在先前的观察中计算出来的所有先前的表征。

图1：Relational Memory Core

图2：任务

我们在一组监督学习和强化学习任务中测试RMC。值得注意的是Nᵗʰ Farthest的任务和语言建模。在前者中，解决方案需要显式的关系推理，因为模型必须对向量之间的距离关系进行排序，而不是对向量本身排序。后者在大量自然数据上测试模型，并允许我们将性能与经过良好调优的模型进行比较。

实验

这里简要介绍应用RMC的实验任务，具体每个任务的详细信息以及模型的超参数设置等请阅读原论文。

说明性监督任务

Nᵗʰ Farthest

第N个最远的任务是为了强调跨时间的关系推理能力。输入是随机抽样的向量序列，目标是对形式问题的回答：“距离向量m的第n个最远的向量是什么?”，其中向量的值、它们的ID、n和m都是每个序列随机抽样的。我们强调模型必须对向量之间的距离关系进行排序，而不是对向量本身。

程序评估

Learning to Execute（LTE）数据集由图灵完整的伪代码编程语言中的算法片段组成，可分为三类：添加、控制和完整程序。输入是表示这些代码片段的字母数字词汇表上的字符序列，目标是一个数字字符序列，它是给定编程输入的执行输出。考虑到这些片断涉及变量的符号操作，我们认为它可能会影响模型的关系推理能力；由于符号运算符可以被解释为在操作数上定义一个关系，成功的学习可以反映对这个关系的理解。为了评估经典序列任务的模型性能，我们还对记忆任务进行了评估，在这些任务中，输出只是输入的一种排列形式，而不是来自一组操作指令的评估。

强化学习

Mini Pacman with viewport

我们遵循文献[23]中的Mini Pacman的表述。简而言之， agent在被ghosts追赶时在迷宫中导航以收集食物。我们用一个视图（viewport）来实现这个任务：围绕agent的5×5窗口，包含感知输入。因此，任务是部分可观察的。agent必须预测记忆中ghosts的动态，并据此计划导航，同时也要根据被拾取的食物的记忆信息。该任务要求在记忆空间中进行关系推理。

语言建模

最后，我们调查了基于词汇的语言建模任务。

结果

图3：模型分析

每行描述了特定序列的每个时间步的注意力矩阵。下面的文本阐明了序列的特定任务，该序列被编码并作为输入提供给模型。我们用红色标记任务中引用的矢量。

表1：测试程序评估和记忆任务的每个字符的准确性。

表2：WikiText-103、Project Gutenberg和GigaWord v5数据集上的验证和测试困惑度

总的来说，我们的结果显示，记忆交互的显式建模还提高强化学习任务，以及程序评估、比较推理和语言建模的性能，这表明在递归神经网络中加入关系推理能力的价值。

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

神经网络

神经网络

+关注

关注
42

文章
4572

浏览量
98743
数据集

数据集

+关注

关注
4

文章
1178

浏览量
24349
强化学习

强化学习

+关注

关注
4

文章
259

浏览量
11114

原文标题：DeepMind提出关系RNN：构建关系推理模块，强化学习利器

文章出处：【微信号：AI_era，微信公众号：新智元】欢迎添加关注！文章转载请注明出处。

神经网络教程（李亚非）

记忆神经网络　　7.1 联想记忆基本特点　　7.2 线性联想记忆LAM模型　　7.3 双向联想记忆BAM模型　　7.4

发表于 03-20 11:32

AI知识科普 | 从无人相信到万人追捧的神经网络

的复杂程度，通过调整内部大量节点之间相互连接的关系，从而达到处理信息的目的，并具有自学习和自适应的能力。简单来说，就是通过大量的样本训练神经网络

发表于 06-05 10:11

非局部神经网络，打造未来神经网络基本组件

`将非局部计算作为获取长时记忆的通用模块，提高神经网络性能在深度神经网络中，获取长时记忆（long-range dependency）至关重要。对于序列

发表于 11-12 14:52

【PYNQ-Z2试用体验】神经网络基础知识

能在外界信息的基础上改变内部结构，是一种自适应系统，通俗的讲就是具备学习功能。现代神经网络是一种非线性统计性数据建模工具。简单来说，就是给定输入，神

发表于 03-03 22:10

【案例分享】ART神经网络与SOM神经网络

指神经网络在学习新知识的同时要保持对之前学习的知识的记忆，而不是狗熊掰棒子SOM神经网络是一种竞争学习型的无监督神经网络，它能将高维输入数据

发表于 07-21 04:30

如何设计BP神经网络图像压缩算法？

，并能在脑海中重现这些图像信息，这不仅与人脑的海量信息存储能力有关，还与人脑的信息处理能力，包括数据

发表于 08-08 06:11

多片段时序数据建模预测实践资料分享

时序数据建模分析已经有很多相关的应用了，在这个领域里面LSTM网络绝对是占据着非常重要的作用，自从LSTM网络提出以来，陆陆续续又出现了很多相关的变种

发表于 06-30 07:52

如何构建神经网络？

原文链接：http://tecdat.cn/?p=5725 神经网络是一种基于现有数据创建预测的计算系统。如何构建神经网络？神经网络包括：输入层：根据现有

发表于 07-12 08:02

基于BP神经网络的PID控制

最近在学习电机的智能控制，上周学习了基于单神经元的PID控制，这周研究基于BP神经网络的PID控制。神经网络具有任意非线性表达能力，可以通过

发表于 09-07 07:43

一种基于高效采样算法的时序图神经网络系统介绍

图数据是一种非结构化的数据，但能够蕴含很多结构化数据中无法蕴含的信息。图数据无处不在，世界上大部分数据

发表于 09-28 10:34

如何进行高效的时序图神经网络的训练

现有的图数据规模极大，导致时序图神经网络的训练需要格外长的时间，因此使用多GPU进行训练变得成为尤为重要，如何有效地将多GPU用于时序图

发表于 09-28 10:37

与记忆神经网络的联想记忆的实验演示_英文版

与记忆神经网络的联想记忆的实验演示_英文版

发表于 09-26 16:31 •0次下载

基于记忆神经网络研究

首先。根据记忆神经网络训练形式的不同。介绍了强监督模型和弱监督模型的结构特征和各自应用场景以及处理方式，总结了两类主要模型的优缺点：随后。对两类模型的发展和应用（包括模型创新和应用创新1进行了简要

发表于 12-25 14:16 •1次下载

一种改进的前馈序列记忆神经网络结构

最早提出的FSMN的模型结构如图1（a）所示，其本质上是一个前馈全连接神经网络，通过在隐层旁添加一些记忆模块（memory block）来对周边的上下文信息进行

发表于 03-19 16:26 •6745次阅读

长短时记忆神经网络的算法

通过上一篇文章［人工智能之循环神经网络（RNN）］介绍，我们知道，RNN是一类功能强大的人工神经网络算法，RNN一个重要的优点在于，其能够在输入和输出序列之间的映射过程中利用上下文相

发表于 06-29 14:44 •4283次阅读

搜索历史

基于记忆的神经网络通过利用长时间记忆信息的能力来建模时序数据

评论

神经网络教程（李亚非）

AI知识科普 | 从无人相信到万人追捧的神经网络

非局部神经网络，打造未来神经网络基本组件

【PYNQ-Z2试用体验】神经网络基础知识

【案例分享】ART神经网络与SOM神经网络

如何设计BP神经网络图像压缩算法？

多片段时序数据建模预测实践资料分享

如何构建神经网络？

基于BP神经网络的PID控制

一种基于高效采样算法的时序图神经网络系统介绍

如何进行高效的时序图神经网络的训练

与记忆神经网络的联想记忆的实验演示_英文版

基于记忆神经网络研究

一种改进的前馈序列记忆神经网络结构

长短时记忆神经网络的算法