在没有灾难性遗忘的情况下，实现深度强化学习的伪排练-电子发烧友网

在没有灾难性遗忘的情况下，实现深度强化学习的伪排练

该新模型集成了伪排练，深度生成模型和双重内存方案，从而实现了一种高效的方法，即使任务数量增加，也不需要额外的存储要求。通过迭代，该模型学习了三个Atari游戏，并在这三个游戏中保持了高于人类水平的表现，高效程度不亚于经过单独训练的一组网络。

所有这些都是在不访问以前的任务数据的情况下实现的。与现有的深度增强任务算法相比，新模型已经表明它们不会像传统的模型一样忘记之前的任务。

潜在应用与效果

研究人员和人工智能社区可以利用新模型进一步改进研究工作，并将模型应用于前沿的电子游戏、自动驾驶汽车和机器人中。如果有足够大的网络，也许会诞生能处理多种任务的机器人特工。

原文：

https://arxiv.org/abs/1812.02464v2

双注意网络（DAN）用于改进视觉参考分辨率

最近，研究人员通过提出DAN增强了视觉参考分辨率，为解决视觉参考分辨率问题奠定了基础。DAN实现了两种类型的关注网络，包括REFER和FIND。REFER专门用于通过自我关注方法来学习查询和对话历史之间的关系。

相反，FIND采用图像特征和参考感知表示输入（REFER模块的输出），并通过实施自下而上的注意技术实现视觉接地。在VisDial v1.0和v0.9数据集上对DAN的定量和定性评估表明，它在很大程度上优于现有的可视对话模型。

潜在应用与效果

AI社区可以使用DAN来实现各种视觉对话任务的视觉参考分辨率，比如协作对话系统。因为它不依赖于之前的视觉注意力图，所以DAN可以通过实施REFER组件来解决不清晰的视觉效果，并使用FIND模型组件对可视图像进行地面解析参考。

原文：

https://arxiv.org/abs/1902.09368v1

用于增强边缘检测的动态特征融合（DFF）方法

来自中国的研究人员通过提出一种新的动态特征融合（DFF）策略来管理动态特征融合，该策略为不同的图像和位置分配不同的融合权重。DFF包括两个模块，特征提取器和自适应权重融合组件。该模型通过实施权重模型来实现动态特征融合，从而能够针对输入特征图中的每一单个位置推断多级特征上的适当融合权重。

在对标准基准数据集（如Cityscapes和SBD）进行实验后，DFF证明了它可以通过更精确地定位对象边缘和抑制不重要的边缘响应来大大提高模型性能。

潜在应用与效果

语义边缘检测旨在联合提取边缘及其类别信息，以实现领域中的高端应用，包括语义分割，对象识别等。DFF是第一个旨在学习自适应融合权重的研究工作，它以输入数据为条件，在SED研究中融合多层次特征，以促进和实现SED任务的最新技术。通过考虑高级和低级主干特征映射，可以改善位置自适应权重学习器。

原文：

https://arxiv.org/abs/1902.09104v1

用于自动驾驶的离线和在线角落案例检测框架

这项新研究定义了角落案例检测，并提出了一个框架，可以处理来自移动车辆的前置摄像头的视频信号，并为在线和离线用例生成角落案例分数。根据该系统框架背后的研究人员所说，角落案例检测系统可用作备用警告系统，以提供有关自动驾驶系统的异常场景的信息。另外，关于离线模式，角落情况检测框架可用于分析大量视频数据以返回异常数据。

角落案例检测框架针对Cityscapes数据集的分段和图像预测进行了训练，该数据集包含来自50个城市的各种街道图像。

潜在应用与效果

自动驾驶汽车研究人员和工程师可以实施角落案例框架，为自动驾驶系统开发更集中的训练，因为它有助于解决代表性不足的关键训练数据问题。该系统还有助于选择用于存储和（重新）训练AI模型的相关场景。

此外，此次提出的角落案例检测框架对于实现运动检测，图像注册，视频跟踪，图像镶嵌，3D建模，全景拼接，对象识别等方面的进一步开发是有效的。

原文：

https://arxiv.org/abs/1902.09184v1

车辆相遇情况的数据集生成器

训练数据的缺乏大大减缓了自动驾驶技术的发展速度。而近日发布的一种模拟模型，通过提供大量数据和资源，从而帮助工程师实现有效的自动车辆开发测试，正逐步消除这一限制。

多车辆轨迹生成器（MTG）可以将多车辆场景（驾驶相遇数据）编码成可用于产生新的高质量驾驶相遇数据的刻度表达。这种发生器模型包括双向变分自动编码器和多分支解码器两大部分。

该研究还提出了一种新的解开度量指标，该指标具有综合分析模拟出的轨迹及驾驶场景模型稳健度的可能性。与现有的VAE和infoGAN模型相比，这种新型生成器模型在生成高质量的驾驶场景信息方面更占优势。

潜在应用与效果

多车辆轨迹生成器是自动驾驶开发中的一大进步。不仅是自动驾驶技术能因此获益而加速发展，这一方法同样可以扩展到有类似数据短缺问题的深度学习其他研究领域。

原文：

https://arxiv.org/abs/1809.05680v5

用于高分辨率人体姿态估计的高分辨率网络（HRNet）

与以串联方式连接子网络的传统方法不同，新的HRNet方法以并联方式连接高分辨率子网络，从而可以保持高分辨率，并实现准确的关键点预测。此外，许多现有的融合型方案结合了低级和高级表示，而HRNet执行重复的多尺度融合以增强高分辨率表示，这对于高质量的姿态估计是必不可少的。

在COCO关键点检测和MPII人类姿势数据集中进行的实验表明，HRNet较于传统方式更加有效。此外，HRNet在PoseTrack数据集上进行测试上也表现出了在姿势跟踪方面的优势。所有模型和代码均可在此链接上公开获取。

潜在应用与效果

研究人员和开发人员可以将HRNet应用于高级对象检测，动态识别，语义分割，人机交互（HCI），虚拟现实，增强现实，人脸识别及比对，图像识别及分类，翻译以及其他依赖跟踪和识别人类活动而实现服务的应用，例如Amazon Go。我很期待有一天我的智能手机可以告诉我我的举重姿势是否正确。

原文：

https://arxiv.org/abs/1902.09212v1

用于图像复刻的深度强化学习方法（DRLIH）

DRLIH是第一个从深度强化学习角度去解决图像复刻挑战的研究项目。

这种深度学习网络包括特征表示网络和策略网络。策略网络利用递归神经网络（RNN）作为代理，按时间顺序将图像投影为二进制代码。

这样的网络设计有助于生成图像并将其投影到复刻代码1中，并计算复刻代码0的概率。研究人员还提出了一种顺序学习策略，通过纠正先前函数的错误来提高检索准确性，从而学习复刻函数。DRLIH方法已经在三个标准数据集上进行了测试，结果证明它比传统图像复刻方法有效。

潜在应用与效果

DRLIH 技术可以准确地表示，索引，检索和自动识别图像。通过查询图像是否为原始图像的构造或副本，它可用于图像有效性的验证。DRLIH还可用于本地存储或缓存的有效性验证，防止照片重新传输或重复存储，以及目前通过水印实现的版权保护等。

原文：

https://arxiv.org/abs/1802.02904v2

语境嵌入改进临床概念提取

新的研究提出了一种处理这一长期挑战的新方法。研究人员评估了各种嵌入方法，包括word2vec，GloVe fastText，ELMo和BERT。他们还进行了涵盖四个临床概念语料库的分析，以证明上述每种技术的普遍性。

更重要的是，他们使用大型临床语料库开发预训练的情境化嵌入，并将性能与预训练模型进行了比较。

最后，他们的论文详述了与开放领域语料库相比，预训练对临床语料库影响的详细分析，并总结报告了临床概念提取的性能提升：该提取在所有测试语料库中实现了最先进的结果。研究结果显示出语境嵌入在临床文本语料库中的优势，其在各类任务的完成上都优于传统模型。

潜在应用与效果

对于临床概念提取，上下文嵌入有大幅度改善自动文本处理的潜力。

此外，它还使研究人员对临床文本的访问更加无障碍，从而进一步推动该领域的信息管理和非结构化临床文本的数据挖掘。

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

人工智能

人工智能

+关注

关注
1776

文章
43765

浏览量
230551
自动驾驶

自动驾驶

+关注

关注
773

文章
13013

浏览量
163176
强化学习

强化学习

+关注

关注
4

文章
259

浏览量
11113

原文标题：DAN改进视觉参考分辨率，DRLIH实现图像复刻 | AI一周学术

文章出处：【微信号：BigDataDigest，微信公众号：大数据文摘】欢迎添加关注！文章转载请注明出处。

什么是深度强化学习?深度强化学习算法应用分析

什么是深度强化学习? 众所周知，人类擅长解决各种挑战性的问题，从低级的运动控制(如：步行、跑步、打网球)到高级的认知任务。

发表于 07-01 10:29 •1183次阅读

什么是<b class='flag-5'>深度</b><b class='flag-5'>强化学习</b>?<b class='flag-5'>深度</b><b class='flag-5'>强化学习</b>算法应用分析

* 灾难性**故障，求救，经验分享

我用***不久，出现 灾难性故障的次数很多（操作失败），有人说是盗版，有人说是误操作，有人说是电脑内存小。请问有没有人出现过同样的问题，又有如何的应对方法，分享一下你的经验，250元的考证，要是出现了这个问题，学子们又得浪费父母

发表于 05-03 14:36

***灾难性故障

打开不了，显示出Exception EOleException in moudle ***.exe at0036E780.灾难性故障

发表于 10-15 12:10

深度学习DeepLearning实战

一：深度学习DeepLearning实战时间地点：1 月 15日— 1 月18 日二：深度强化学习核心技术实战时间地点： 1 月 27 日— 1 月30 日(第一天报到授课三天；提前

发表于 01-09 17:01

将深度学习和强化学习相结合的深度强化学习DRL

深度强化学习DRL自提出以来，已在理论和应用方面均取得了显著的成果。尤其是谷歌DeepMind团队基于深度强化学习DRL研发的AlphaGo，将深

发表于 06-29 18:36 •2.8w次阅读

萨顿科普了强化学习、深度强化学习，并谈到了这项技术的潜力和发展方向

萨顿在专访中（再次）科普了强化学习、深度强化学习，并谈到了这项技术的潜力，以及接下来的发展方向：预测学习

发表于 12-27 09:07 •1.1w次阅读

DeepMind彻底解决人工智能灾难性遗忘问题

人工智能系统在设计上就倾向于在每次开始新的学习之前，忘记先前学到的所有东西，这被称为灾难性遗忘。

发表于 09-03 11:11 •3127次阅读

Batch的大小、灾难性遗忘将如何影响学习速率

所以，我们该如何在限制训练速度的情况下，还可以提高batch size，同时不用维持曲率效应带来的不稳定性？答案可能是其他因素在限制学习速率，而我们并没有考虑到曲率效应。我们认为这一其他因素就是

发表于 11-14 08:58 •3195次阅读

深度强化学习你知道是什么吗

强化学习非常适合实现自主决策，相比之下监督学习与无监督学习技术则无法独立完成此项工作。

发表于 12-10 14:34 •1111次阅读

83篇文献、万字总结强化学习之路

深度强化学习是深度学习与强化学习相结合的产物，它集成了深度学

发表于 12-10 18:32 •392次阅读

《自动化学报》—多Agent深度强化学习综述

突破.由于融合了深度学习强大的表征能力和强化学习有效的策略搜索能力,深度强化学习已经成为实现人工

发表于 01-18 10:08 •1247次阅读

强化学习的基础知识和6种基本算法解释

定标记训练数据的情况下获得正确的输出无监督学习(UL)：关注在没有预先存在的标签的情况下发现数据中的模式 强化学习(RL) ：关注智能体

发表于 12-20 14:00 •876次阅读

ESP32上的深度强化学习

电子发烧友网站提供《ESP32上的深度强化学习.zip》资料免费下载

发表于 12-27 10:31 •0次下载

强化学习的基础知识和6种基本算法解释

的情况下获得正确的输出无监督学习(UL)：关注在没有预先存在的标签的情况下发现数据中的模式强化学习(RL)：关注智能体在环境中如何采取行动以

发表于 01-05 14:54 •478次阅读

搜索历史

在没有灾难性遗忘的情况下，实现深度强化学习的伪排练

评论

什么是深度强化学习?深度强化学习算法应用分析

* 灾难性**故障，求救，经验分享

***灾难性故障

深度学习DeepLearning实战

深度强化学习实战

将深度学习和强化学习相结合的深度强化学习DRL

萨顿科普了强化学习、深度强化学习，并谈到了这项技术的潜力和发展方向

DeepMind彻底解决人工智能灾难性遗忘问题

Batch的大小、灾难性遗忘将如何影响学习速率

深度强化学习你知道是什么吗

83篇文献、万字总结强化学习之路

《自动化学报》—多Agent深度强化学习综述

强化学习的基础知识和6种基本算法解释

ESP32上的深度强化学习

强化学习的基础知识和6种基本算法解释