0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

AI环境探索模型升级 缩小搜索范围效率更高

工程师邓生 来源:VentureBeat,arXiv 作者:VentureBeat,arXiv 2021-02-13 10:31 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

近日,卡内基·梅隆大学、脸书等机构的研究人员提出了一个新的AI环境探索模型。这个新模型综合了传统环境探索模型和基于学习方法的环境探索模型的优点,更简单和不易出错。

这项研究已经发表在学术网站arXiv上,论文标题为《利用主动神经SLAM学习探索环境(Learning To Explore Using Active Neural SLAM)》。

论文链接:https://arxiv.org/pdf/2004.05155.pdf

e99e0ec582ba4f7fa20273f9c12cfe50.png

一、ANS模型:真实模拟探索环境

导航能力是智能代理的核心能力之一。导航任务有许多形式,比如点目标任务指导航到特定的坐标,语义导航任务指导航到去特定场景或对象的路径。

不论哪一种任务,在未知环境中导航的核心问题都是如何高效地探索尽可能多的环境。这样才能扩大在未知环境中找到目标的机会,或者在有限的时间里有效地预映射环境。

传统的探索模型原理是用传感器观察几何体。之后有研究者提出了基于学习的导航模型,该模型依据RGB图像直接推测出几何体。

基于学习的导航策略通过端到端(end-to-end)训练神经网络实现,可以处理原始的传感器数据,直接输出代理该执行的操作。这种策略有3个优势:

1、提高了输入方式选择的灵活性;

2、提高显式状态估计误差的稳健性;

3、通过学习掌握真实世界的结构规律性,使代理更有目的性地行动

理论上端到端的学习策略有上述优势,但也有局限性。

首先,纯粹从数据中学习映射、状态评估、路径规划可能会非常昂贵。因此,以往的端到端学习依赖于模仿学习和以百万计的经验框架。

其次,以往针对端到端学习策略的研究缺乏真实性。比如使用的是合成室内环境数据库SUNC、简化了代理动作、运行环境去除了传感器噪音等。

从表现来说,端到端的学习策略也往往比不需要任何学习的传统方法差。

为了解决全面端到端学习的局限性,卡内基·梅隆大学、脸书、伊利诺大学厄巴纳-香槟分校的研究人员推出了“主动神经即时定位与地图构建(ANS,Active Neural SLAM)模型”。

实验设计上,研究人员尽量使模型训练环境更真实,用到了生境模拟器和两个基于真实情景的数据库(Gibson和Matterport),不限制代理的动作,还模拟了传感器噪音。

二、缩小搜索范围,兼顾搜索性能和效率

本项研究中,导航模型的任务是在固定时间内覆盖最大范围。覆盖范围定义为地图中已知被穿越的总面积。

ANS模型包括一个学习神经即时定位与地图构建(SLAM,Simultaneous localization and mapping)模块,一个全局策略(global policy)和一个局部策略(local policy)。它们通过地图和一个分析路径规划器相连。

层次化和模块化的设计和分析规划的使用,大大减小了训练过程中的搜索范围,同时提高了性能和样本效率。

6892cb08fa96435096077975972be52b.png

▲模型示意图

训练过程中,学习神经SLAM模块产生自由空间地图,并依据输入的RGB图像和运动传感器数据预测代理的姿势。SLAM模块的学习提升了输入方式的灵活性。

全局策略利用代理的姿势来占据自由空间地图,并把学习现实世界环境布局的结构性规则作为长期目标。全局策略可以探索真实世界环境的布局。

长期目标可以为局部策略生成短期目标。局部策略通过学习,直接从RGB图像中映射出代理应该做出的动作,呈现可视化反馈。

b09b041196c7490e96e6507cc0027fcf.png

▲模型运行过程示意图

三、ANS模型能探索更大范围,比基线模型性能优秀

利用Gibson训练集,研究人员完成了对ANS模型的训练,运行了1000万帧探索任务的所有基线。结果如下表。

67dfc6baa75e4e77aef35bd9bbeed207.png

运行结果基于模型在14个未知场景中994次运行的结果进行平均。与最佳基线的24.863m^2/0.789相比,模型的覆盖率为32.701m^2/0.948。这个数值说明,与基线相比,ANS模型在穷尽探索上更有效。

研究人员还对比了模型和基线在较大训练集、较小训练集、全部Gibson训练集中的运行效果。

6a0dd40111dc4fa5a43813b64198aa89.png

较小训练集中,ANS模型能在500步探索完未知环境,而基线运行1000步后仍只探索了位置环境的85~90%(上图中)。

较大训练集中,随着情节的发展,ANS模型与基线之间的差距会扩大(上图左)。

基线模型中,代理经常只探索局部区域,这说明它们无法记住长期视野的探索区域,不能进行长期规划。相比之下,ANS采用全局策略,可以记忆探索过的区域,有效地规划并实现长期目标。

受到结果鼓舞,研究人员用ANS模型部署了一个环境探索机器人。通过调整摄相机的高度和垂直视野,并匹配栖息地模拟器,机器人成功探索出一个公寓的生活区域。

a9f4b3437ebe4b7a982c82e203c4137b.gif

结语:ANS模型效率更高,未来或有更多应用

ANS导航模型克服了之前的基于端对端学习策略的缺陷,基于更真实的数据库进行训练,最终探索效率有所提升。

研究人员认为这个模型在未来或许会有更多应用。“未来,ANS模型可以扩展到复杂的语义任务,比如语义目标导航和回答具体问题,这将创建出一个能捕获对象语义属性的地图。”

另外,这个模型也可以与先前的本地化工作结合,在此前创建的地图中重新定位,使之后的导航更高效。

责任编辑:PSY

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • AI
    AI
    +关注

    关注

    89

    文章

    38091

    浏览量

    296600
  • 搜索
    +关注

    关注

    0

    文章

    70

    浏览量

    16946
  • 模型
    +关注

    关注

    1

    文章

    3648

    浏览量

    51712
  • SLAM
    +关注

    关注

    24

    文章

    456

    浏览量

    33187
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    AI模型的配置AI模型该怎么做?

    STM32可以跑AI,这个AI模型怎么搞,知识盲区
    发表于 10-14 07:14

    【「AI芯片:科技探索与AGI愿景」阅读体验】+AI芯片到AGI芯片

    实例,从而保持高计算效率。 2、Q算法 Q项目将大模型功能与A*和Q-learning等复杂算法结合,进一步推动了AI领域的蓬勃发展,标志着向AGI方向迈出了重要的一步。 可能达到的高度: 自主学习
    发表于 09-18 15:31

    【「AI芯片:科技探索与AGI愿景」阅读体验】+AI的科学应用

    是一种快速反应能力,是直接的感知;灵感是一种通过思考和探索获得的创造性想法,是一种创意。 AI怎么模拟直觉与灵感呢?四、AI代替人类的假说 这可能吗? 用机器来生成假说: 1、直接生成 生成式
    发表于 09-17 11:45

    【「AI芯片:科技探索与AGI愿景」阅读体验】+AI的未来:提升算力还是智力

    持续发展体现在: 1、收益递减 大模型的基础的需要极大的算力,这首先源于昂贵的高性能AI芯片,然后是宝贵的电力、水等与环境相关的资源。 收益递减体现在: ①模型大小 ②训练数据量 ③训
    发表于 09-14 14:04

    【「AI芯片:科技探索与AGI愿景」阅读体验】+可期之变:从AI硬件到AI湿件

    的不同。随着AI热潮的兴起,大脑的抽象模型已被提炼成各种的AI算法,并使用半导体芯片技术加以实现。 而大脑是一个由无数神经元通过突触连接而成的复杂网络,是极其复杂和精密的。大脑在本质上就是一台湿润的软组织
    发表于 09-06 19:12

    【「AI芯片:科技探索与AGI愿景」阅读体验】+内容总览

    AI芯片:科技探索与AGI愿景》这本书是张臣雄所著,由人民邮电出版社出版,它与《AI芯片:前沿技术与创新未来》一书是姊妹篇,由此可见作者在AI芯片领域的功力和造诣。 作者毕业于上海交
    发表于 09-05 15:10

    睿海光电以高效交付与广泛兼容助力AI数据中心800G光模块升级

    核心网络支撑。未来,随着1.6T光模块的落地,睿海光电将进一步推动数据中心向更高性能、更智能化演进,携手全球伙伴开启AI新时代。 睿海光电——AI网络升级的可靠伙伴!
    发表于 08-13 19:01

    【书籍评测活动NO.64】AI芯片,从过去走向未来:《AI芯片:科技探索与AGI愿景》

    DeepSeek,大模型应用密集出现、频繁升级,这让作者意识到有必要撰写一本新的AI芯片图书,以紧跟时代步伐、介绍新兴领域和最新动向。 这就是《AI芯片:前沿技术与创新未来》的姊妹篇—
    发表于 07-28 13:54

    【「DeepSeek 核心技术揭秘」阅读体验】第三章:探索 DeepSeek - V3 技术架构的奥秘

    数据中挖掘有价值信息,这也让我意识到架构设计对模型性能起着根本性作用,是 AI 具备强大能力的 “骨骼” 支撑。 二、流水线并行 书中关于流水线并行的内容,展现了提升计算效率的巧妙思路。简单流水线并行虽
    发表于 07-20 15:07

    AI模型推动医疗行业智能化升级

    数据与智能算法,为医疗行业带来诊疗效率与精度的革命性升级。2025年,中国医疗AI市场规模将破千亿,占全球35%以上。AI医疗革命,已经拉开序幕......
    的头像 发表于 07-15 16:55 775次阅读

    DevEco Studio AI辅助开发工具两大升级功能 鸿蒙应用开发效率再提升

    带来了前所未有的智能问答体验。 RAG增强型与传统生成式AI的关键差异: 图2:DeepSeek模型增强RAG能力前后效果对比图 升级点2:新增代码解释功能,提升初学者开发效率 针对
    发表于 04-18 14:43

    首创开源架构,天玑AI开发套件让端侧AI模型接入得心应手

    应用开发不用“等平台”,彻底释放开发效率模型接入自由度。 自DeepSeek横空出世以来,这种更适合端侧部署,回答效率更高效的训练模式快速引爆了A
    发表于 04-13 19:52

    适用于数据中心和AI时代的800G网络

    100Gbps,整体速率高达800Gbps。这意味着在AI模型训练过程中,服务器之间的数据传输速率更快,显著提升训练效率。相比NRZ,PAM4在相同频谱范围内可以承载双倍数据量,从而提
    发表于 03-25 17:35

    启明智显集成DeepSeek、豆包、OpenAI等全球先进AI模型,助力传统产品AI智能升级

    启明智显借助豆包、Deepseek、OpenAI等全球先进AI模型,助力传统产品实现AI智能升级
    的头像 发表于 02-24 16:12 1377次阅读
    启明智显集成DeepSeek、豆包、OpenAI等全球先进<b class='flag-5'>AI</b>大<b class='flag-5'>模型</b>,助力传统产品<b class='flag-5'>AI</b>智能<b class='flag-5'>升级</b>

    企业AI模型部署攻略

    当下,越来越多的企业开始探索和实施AI模型,以提升业务效率和竞争力。然而,AI模型的部署并非易事
    的头像 发表于 12-23 10:31 1300次阅读