0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

DeepMind论文推出了一种新的神经网络——GQN

zhKF_jqr_AI 来源:未知 作者:李倩 2018-06-30 08:30 次阅读

编者按:今天,DeepMind的研究人员在Science上发表论文,推出了一种新的神经网络——GQN,只用几张二维照片,就能重建全部的三维场景,可以说是计算机视觉领域的又一关键突破。

让机器对空间环境进行感知似乎一直是DeepMind研究的重点,一个多月前我们曾报道过他们的另一项研究:DeepMind用AI解密大脑:当你找路时,大脑发生了什么。空间感知对人类来说很简单,例如当我们第一次走进一个房间,扫一眼就能知道屋里有哪些物品、它们都在哪个位置上。只看到桌子的三条腿,你也能推断出第四条腿的大致位置和形状。另外,即使你没有熟悉屋里的每个角落,也能大概描绘出它的平面图,或者能想象出从另一个角度看房间应该是什么样子的。

但是想让人工智能系统做到上述行为的确很困难。现在最先进的计算机视觉系统仍需要在大型经过标注的数据集上进行训练,而数据标注又是一项费时费力的工作,所以每次模型只能捕捉一小部分场景。随着网络越来越复杂,想详细了解的周围环境也越复杂:最近的座位在哪?沙发是什么材质的?所有影子的光源在哪?照明开关可能在哪?

在这次的研究中,DeepMind研究人员介绍了一种能感知周围环境的框架——GQN(Generative Query Network)。和婴儿或动物一样,GQN通过观察周围环境收集数据,从而学习,无需人类对场景进行标记,就能掌握大致空间结构。

GQN模型由两部分组成:一个表示网络和一个生成网络。表示网络将智能体所观察到的画面作为输入,生成一个表示(向量),描述了基本场景。之后,生成网络从此前没有观察到的角度对场景进行预测(或者说是“想象”)。

但是表示网络并不知道生成网络要从哪个视角预测场景,所以它必须找到一种高效、精确的描绘场景平面的方法。它通过捕捉最重要的元素,例如物体的位置、颜色和房间平面,进行简单表示。训练期间,生成器学习辨认物体、特征、关系和环境的规律。这一套“共享”的概念让表示网络能用一种高度简练、抽象的方式描绘场景,剩余的细节部分就由生成网络补充。例如,表示网络用一小串数字表示一个“蓝色方块”,生成网络就知道从某个角度应该如何用像素展现出来。

DeepMind研究人员在程序生成的虚拟3D环境中对GQN做了多次试验,包括多种不同物体,被摆放在不同的位置,并且形状、颜色、材质都不相同,同时还改变了光线方向和遮挡程度。通过在这些环境上进行训练,他们用GQN的表示网络去生成一个从未见过的场景。在实验中人们发现GQN展现出了几个重要特征:

GQN的生成网络可以在全新视角“想象”出此前没有见过的景象,精确度非常高。给定一个场景表示和新的相机角度,网络不需要任何先前信息就能生成精确的图像。所以生成网络也可以近似看成是从数据中学习的渲染器:

GQN的表示网络可以独自学习算数、定位、分类物体。就算在小型表示上,GQN也能在具体视角上做出非常精准的预测,和现实几乎一模一样。这说明了表示网络观察得非常仔细,例如下面这个由几个方块堆叠起来的场景:

GQN可以表示、测量并且减少不确定性。即使在没有完全看到所有场景的情况下,网络也可以解释其中的不确定之处。同时也能根据部分图像拼成完整的场景。下面的第一人称视角和自上而下的预测方法就是其中的“秘诀”。模型通过它预测的变化性表达不确定性,其中预测的变化性随着不断在迷宫中移动减少(灰色三角是观察位置)。

GQN表示支持稳定、数据高效的强化学习。给定GQN表示后,目前顶尖的深度强化学习智能体就开始学习以数据有效的方式完成任务。对这些智能体来说,生成网络中编入的信息可以看作是对环境固有的认知:

利用GQN我们观察到了更多数据有效的学习,比通常只利用原始像素的方法快了近4倍达到收敛水平

相较于前人研究,GQN是一种全新的学习现实场景的简单方法。重要的是,这种方法不需要对具体场景建模,或者花大量时间对内容标注,一个模型就能应用多个场景。它还学习了一种强大的神经渲染器,能够在任意角度生成精确的场景图像。

不过,与一些传统计算机视觉技术相比,这次所提出的方法仍然有很多限制,并且目前也都是在虚拟的合成场景上训练的。不过,随着更多可用数据的出现以及硬件的提升,研究人员希望进一步套索GQN的可能性,比如将它应用到现实场景中,同时提高成像分辨率。未来,研究GQN对更广泛的场景理解非常重要,例如加入时间的维度,让它学习对场景和移动的理解,同时应用到VR和AR技术中。尽管前路漫漫,这项工作对全自动场景辨别来说是重要一步。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 神经网络
    +关注

    关注

    42

    文章

    4575

    浏览量

    98782
  • 计算机视觉
    +关注

    关注

    8

    文章

    1600

    浏览量

    45623
  • 数据集
    +关注

    关注

    4

    文章

    1179

    浏览量

    24356

原文标题:DeepMind重磅论文:不用人类标记,几张图片就能渲染出3D场景

文章出处:【微信号:jqr_AI,微信公众号:论智】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    人工神经网络原理及下载

    人工神经网络是根据人的认识过程而开发出的一种算法。假如我们现在只有些输入和相应的输出,而对如何由输入得到输出的机理并不清楚,那么我们可以把输入与输出之间的未知过程看成是个“
    发表于 06-19 14:40

    【PYNQ-Z2试用体验】神经网络基础知识

    学习和认知科学领域,是一种模仿生物神经网络(动物的中枢神经系统,特别是大脑)的结构和功能的数学模型或计算模型,用于对函数进行估计或近似。神经网络由大量的人工
    发表于 03-03 22:10

    一种基于经优化算法优化过的神经网络设计FIR滤波器的方法介绍

    定程度上改善了传统方法的局限性,但这些方法自身也存在着些不足。之后,曾喆昭等人提出了一种基于余弦基神经网络的算法,给
    发表于 07-08 07:16

    【案例分享】ART神经网络与SOM神经网络

    一种常用的无监督学习策略,在使用改策略时,网络的输出神经元相互竞争,每时刻只有个竞争获胜的神经
    发表于 07-21 04:30

    人工神经网络实现方法有哪些?

    人工神经网络(Artificial Neural Network,ANN)是一种类似生物神经网络的信息处理结构,它的提出是为了解决些非线性,非平稳,复杂的实际问题。那有哪些办法能实现
    发表于 08-01 08:06

    卷积神经网络原理及发展过程

    Top100论文导读:深入理解卷积神经网络CNN(Part Ⅰ)
    发表于 09-06 17:25

    神经网络结构搜索有什么优势?

    ,稍有不同就无法复现论文的结果。而网络结构作为一种特殊的超参数,在深度学习整个环节中扮演着举足轻重的角色。在图像分类任务上大放异彩的ResNet、在机器翻译任务上称霸的Transformer等
    发表于 09-11 11:52

    如何构建神经网络

    原文链接:http://tecdat.cn/?p=5725 神经网络一种基于现有数据创建预测的计算系统。如何构建神经网络神经网络包括:输入层:根据现有数据获取输入的层隐藏层:使用反
    发表于 07-12 08:02

    分享一种400×25×2的三层BP神经网络

    本文首先简单的选取了少量的样本并进行样本归化,这样就得到了可供训练的训练集和测试集。然后训练了400×25×2的三层BP神经网络,最后对最初步的模型进行了误差分析并找到了一种效果显著的提升方法!
    发表于 07-12 06:49

    一种基于综合几何特征和概率神经网络的HGU轴轨识别方法

    摘要故障诊断是保证水轮发电机组安全运行的重要环节。轴心轨迹辨识是HGU故障诊断的一种有效方法。提出了一种基于综合几何特征和概率神经网络(CGC-PNN)的HGU轴轨识别方法。该方法从结
    发表于 09-15 08:18

    如何使用STM32F4+MPU9150去实现一种神经网络识别手势呢

    如何使用STM32F4+MPU9150去实现一种神经网络识别手势呢?其过程是怎样的?
    发表于 11-19 06:38

    隐藏技术: 一种基于前沿神经网络理论的新型人工智能处理器

    隐藏技术: 一种基于前沿神经网络理论的新型人工智能处理器 Copy东京理工大学的研究人员开发了一种名为“ Hiddenite”的新型加速器芯片,该芯片可以在计算稀疏“隐藏神经网络”时达
    发表于 03-17 19:15

    卷积神经网络模型发展及应用

    十余年来快速发展的崭新领域,越来越受到研究者的关注。卷积神经网络(CNN)模型是深度学习模型中最重要的一种经典结构,其性能在近年来深度学习任务上逐步提高。由于可以自动学习样本数据的特征表示,卷积
    发表于 08-02 10:39

    一种基于高效采样算法的时序图神经网络系统介绍

    成为了非常重要的问题。 基于以上问题,本文提出了一种基于高效采样算法的时序图神经网络系统 。首先我们介绍用于时序图神经网络采样的高效采样方法。采样常常被用于深度学习中以降低模型的训练时
    发表于 09-28 10:34

    Google AI子公司开发出一个神经网络GQN,其组成部分介绍

    Google AI 子公司 DeepMind 开发出一个神经网络,能根据一张 2D 图像“想象出”它的 3D 场景。该系统被称为Generative Query Network (GQN)。
    的头像 发表于 06-29 16:54 6565次阅读
    Google AI子公司开发出一个<b class='flag-5'>神经网络</b><b class='flag-5'>GQN</b>,其组成部分介绍