0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

科学家开发可提高3D感知能力的模型,实现四足机器人自由行走

天津机器人 来源:天津机器人 2023-09-11 17:11 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

借助机器人的本体感觉对足式运动进行研究已有数十年。在以往的研究手段中,研究人员往往采用基于模型的方法开发神经网络控制器。但是,这类方法无法在那些现实世界里没有见过的环境中得到应用。

近年来,为了获得更好的泛化性和鲁棒性,研究者们开始采用无模型强化学习,在模拟中训练控制器,然后将学习到的策略直接转移到真实的机器人上。

那么,如何在无需遥控器操控的条件下,让四足机器人实现在复杂地形上自由流畅地行走呢?

近期,来自美国加州大学圣地亚哥分校和麻省理工学院的研究团队,开发了一个可以提高机器人 3D 感知能力的模型,能够支配四足机器人在各种困难地形场景下完成自动化行走,比如爬楼梯、踩石头、在树林中走路等。

如视频所示,该四足机器人的额头上装有前置的深度摄像头,该摄像头向下倾斜的角度,可以帮助该机器人前面的两足,根据所看到的前方场景和脚下地形做出正确的行动决策。但其后面的两足必须先记住前面看过的内容,才能确保在经过时踩在正确的位置上。

所以,这中间存在一个重要的问题,即需要一个短期的 3D 环境记忆体,能够使得机器人的四足都对三维环境有良好的感知和模拟。

为此,该团队构建了一种神经体积记忆(Neural Volumetric Memory,NVM)架构,可以先借助自监督方法对视频帧中的三维特征进行学习,再用几何变换把这些三维特征投影到同一个空间下面,最后通过模型将所有的特征信息融合在一起,让机器人对它所处的 3D 环境建立起短期记忆。

其中,需要说明的是,将上述带有特征的全部视觉信息综合在一起,可以帮助四足机器人记住其看到的内容,以及足部之前做过的动作,并利用这些记忆指导它下一步行动。这也表明,NVM 能为机器人执行决策提供可靠的 3D 结构信息,并为足式机器人利用视觉进行观察开辟新的可能性。

2023 年 3 月,相关论文以《用于视觉运动控制的神经体积记忆》(Neural Volumetric Memory for Visual Locomotion Control)为题发表在CVPR上,并被选为Highlight论文[1]。

d50e95f0-4fec-11ee-a25d-92fbcf53809c.jpg

图丨相关论文(来源:arXiv)

据介绍,该研究始于 2022 年 1 月。在当时的条件下,该团队先在模拟器环境下进行训练,再转至机器人上进行部署和测试。NVM 模块可以令四足机器人在模拟环境和真实世界中穿越复杂地形,并获得更好的模拟-真实泛化结果。

但是,由于模拟器和机器人在物理和视觉方面都存在一些差距,因此需要克服许多有难度的工程问题。此外,从模拟器中制定任务,以及做强化学习训练所需的代码,也需要该团队自行开发。

d52f9732-4fec-11ee-a25d-92fbcf53809c.jpg

图丨实际部署(来源:arXiv)

据了解,这项成果建立在该团队之前的一项研究上,此前,该团队使用强化学习和基于 Transformer 的模型,将本体感受和视觉信息相结合,使得四足机器人能够避开障碍物,在不平整的地面上行走和奔跑 [2]。

“我们目前这项研究是在不同帧上抽取三维特征,把它们放到同一个三维空间下进行合并,而之前的那项研究仅仅将不同帧直接合并起来,当做一个视频放入卷积神经网络中,没有做太多三维理解。”谈及本项成果取得的进展,王小龙表示,“并且,之前机器人能完成的任务比较简单,不能实现爬楼梯或踩木桩这种比较困难的任务。”

不过,该团队也表示,他们目前开发的模型还存在一些局限性。首先,不能引导四足机器人到达指定的目的地;其次,完成部署后,机器人只能简单地走一条直线,如果看到障碍物,会通过另一条直线避开;此外,机器人还不能精确控制其去向。

从应用层面上看,相较于安装轮子才能走路的机器人,四足机器人的通用性更强。比如,其可以用于应急救援领域,执行受困人员搜救、废墟清理等任务;用于下水管道探测等。

后续,该团队不仅计划开发更多用于规划机器人的技术,还打算在四足机器人上增加机械臂,来执行抓取、开门等任务;同时,他们也想让机器人实现更多创意性的技能,诸如跳跃、踢球等。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 机器人
    +关注

    关注

    213

    文章

    30602

    浏览量

    219660
  • 模型
    +关注

    关注

    1

    文章

    3649

    浏览量

    51719
  • 3D感知
    +关注

    关注

    0

    文章

    21

    浏览量

    3899

原文标题:科学家开发可提高3D感知能力的模型,实现四足机器人自由行走

文章出处:【微信号:tjrobot,微信公众号:天津机器人】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    人形机器人 3D 视觉路线之争:激光雷达、双目和 3D - ToF 谁更胜一筹?

    电子发烧友网报道(文 / 吴子鹏)在人形机器人的设计方案中,3D 视觉技术是实现环境感知与智能化决策的核心支撑之一。它能够助力人形机器人完成
    的头像 发表于 04-15 00:14 3529次阅读

    深圳人形机器人行走视频震惊英伟达科学家,下一个划时代产品是AI机器人

    电子发烧友网报道(文/吴子鹏)日前,深圳特区报发布了一则国产人形机器人行走的视频,该视频引起了包括英伟达高级AI研究科学家Jim Fan在内的业内人士和网友的广泛关注。由于这款机器人步态非常接近
    的头像 发表于 01-14 00:53 3705次阅读
    深圳人形<b class='flag-5'>机器人行走</b>视频震惊英伟达<b class='flag-5'>科学家</b>,下一个划时代产品是AI<b class='flag-5'>机器人</b>?

    RK3576机器人核心:三屏异显+八路摄像头,重塑机器人交互与感知

    瑞芯微RK3576 AIoT处理器处理器凭借其卓越的多屏异显与8路摄像头接入能力,为机器人领域带来革新。米尔电子MYD-LR3576开发板实测数据显示,在高负载下CPU占用仅34%,完美实现
    发表于 10-29 16:41

    国际类脑计算科学家Yulia Sandamirskaya教授加盟时识科技

    近日,国际类脑计算与神经形态机器人领域知名科学家Yulia Sandamirskaya 教授,作为科学家顾问正式加入时识科技(SynSense)。
    的头像 发表于 10-13 13:50 453次阅读

    INDEMIND解锁陪伴机器人能力新边界

    从2D感知3D感知,从单一语音到多模态交互,解锁陪伴机器人能力新边界。
    的头像 发表于 10-09 14:25 375次阅读

    普渡科技推出3D感知AI扫地机器人PUDU MT1 Max

    在持续探索机器人技术与真实场景深度融合的进程中,普渡机器人以场景驱动创新,正式推出PUDU MT1 Max 3D感知AI扫地机器人。它在MT
    的头像 发表于 08-25 15:47 887次阅读

    机器人看点:越疆机器人正式发布六仿生机器狗 智元公布机器人运动控制模型专利

    ”具身机器人平台的企业。 此前越疆机器人发布的六仿生机器狗是集“认知、动作、机动”三大核心能力于一体的创新产品,而且六
    的头像 发表于 07-09 15:03 1756次阅读

    基于NVIDIA AI的3D机器人感知与地图构建系统设计

    机器人必须感知和理解其 3D 环境,才能安全高效地行动。这一点在非结构化或陌生空间中的自主导航、对象操作和远程操作等任务尤为重要。当前机器人感知
    的头像 发表于 07-04 14:31 824次阅读
    基于NVIDIA AI的<b class='flag-5'>3D</b><b class='flag-5'>机器人</b><b class='flag-5'>感知</b>与地图构建系统设计

    大象机器人携手进迭时空推出 RISC-V 全栈开源六轴机械臂产品

    末端执行器。 全栈开源 从RISC-V指令集、芯片SDK到机器人控制代码100%开放,开发自由定制算法与控制逻辑。 官方apt仓库提供deepseek-r1-distill-qwe
    发表于 04-25 17:59

    海伯森技术推动机器人感知能力迈向新高度

    的“感知神经元”,公司自主研发的六维力扭矩传感器已批量应用于20余家头部机器人企业,为人形机器人、协作机器人及高端工业场景提供克级力控精度,推动机器
    的头像 发表于 03-10 11:07 861次阅读

    开源项目!基于Arduino控制的六机器人

    代码前需根据实际机器人尺寸调整上述参数,校准流程详见步骤2。 步骤8:展示架 3D打印灰色金属质感PLA支架(模型文件),通过8颗螺丝组装。注意钻孔时避免材料开裂,安装时防止支架扭曲变形。 通过以上
    发表于 03-03 11:25

    机器人的结构、控制及运动控制

    一步提高四机器人的动态性能、环境适应性和载重能力仍然是当前研究面临的重大挑战。 本文系统回顾了
    的头像 发表于 01-20 10:15 3793次阅读
    <b class='flag-5'>四</b><b class='flag-5'>足</b><b class='flag-5'>机器人</b>的结构、控制及运动控制

    【「具身智能机器人系统」阅读体验】2.具身智能机器人模型

    引入GPT这样的大模型后,情况发生了根本性的变化。只需提供适当的提示词以及封装好的机器人函数库,大模型便能灵活地生成控制代码,极大地简化了开发过程,并
    发表于 12-29 23:04

    《具身智能机器人系统》第7-9章阅读心得之具身智能机器人与大模型

    设计专门的编码器处理视觉、触觉、位置等不同类型的传感器数据,再用cross-attention机制将它们对齐到同一语义空间。这种设计不仅提高模型感知能力,还增强了推理过程的可解释性。在实验中,RT-1
    发表于 12-24 15:03

    开源项目!OpenCat—— 一个全能的平价机器人

    以额外承载约 1 千克的重量(但行走速度会变慢)。它面向 STEM教育和创客社区。价格将与一些机器人汽车套件相似。 完整版使用树莓派来实现更多人工智能增强的感知功能,并指挥一个升级版的
    发表于 12-16 11:44