0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

机器人也能纯视觉控制?MIT华人博士团队登上Nature主刊

Hobby观察 来源:电子发烧友 作者:梁浩斌 2025-07-16 00:48 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

电子发烧友网报道(文/梁浩斌)“纯视觉”的概念在近几年的智能驾驶领域被提到的次数不少,特斯拉、小鹏、以及传闻准备重组的极越,都早已全面押注到“纯视觉”的智能驾驶技术。一些智驾方案商为了推动产品落地,也正在加速推出纯视觉的方案,以降低系统成本。

而在机器人领域,传感器的应用一直都是业界研究的核心,包括3D ToF相机、激光雷达、毫米波雷达、触觉传感器、各种力矩传感器等,在目前主流的机器人领域都有广泛应用。

然而最近刊登在Nature主刊上的一篇论文,展示了一个机器人“纯视觉”方案。

传统机器人控制方案

传统机器人是由高刚度材料精密加工部件构成,在结构上,通过低公差关节连接,可以简化为理想化的刚性连杆运动学链。而为了让系统了解目前机器人的状态,就需要使用多种传感器进行监测,比如在每个关节配备高精度的传感器,像角度编码器等,实时测量关节的状态变化,这些数据可以用于完整重建机器人的3D位姿,再通过基于动力学模型设计控制算法(如PID、MPC),将期望运动轨迹转换为执行器指令。

论文中提到,传统的机器人控制方案存在局限性。首先是依赖机器人预设的结构和传感器,要求机器人必须具有离散关节和嵌入式传感器,无法适用于缺乏传感器的软体或混合材料机器人。

其次,在使用柔性结构的机器人中,需要解决大变形、粘弹性、材料疲劳等复杂问题,传统的基于连续介质力学的模型计算成本过高,很难实现实时控制。同时,传统的模型无法处理关节间隙或者制造公差导致的非线性动态。

另外,因为模型对于机器人公差的要求非常高,依赖精密制造和高性能材料,成本过高,开发周期长,不利于机器人的普及。

“纯视觉”机器人控制方案有什么优势?

该论文由麻省理工学院(MIT)的多位研究人员合作完成,其中论文前三作分别是李思哲、张安南和陈博远,均于MIT计算机科学与人工智能实验室(CSAIL)攻读博士学位。

那为什么会想到用“纯视觉”来构建机器人控制系统?论文团队提到,这项工作的灵感是来自于人类感知,人类通过用游戏控制器来控制机器人,可以在几分钟内就学会拾取和放置物体,而我们唯一用到的传感器就是眼睛。

在论文中,该“纯视觉”机器人控制方案是使用了名为Visuomotor Jacobian Field(视觉运动雅可比场)的技术。这是一种机器学习方法,可以使用单个视频摄像头获得的数据来控制机器人。

首先,团队使用12个消费级RGB-D视频摄像头捕获的、执行随机生成命令的多视图视频训练了框架,无需人工注释或专家定制即可学习控制新机器人。在进行训练后,这个方法仅使用单个视频摄像头就能控制机器人执行期望的动作。
wKgZPGh2JD6ABLASAAM6m-vNGPg749.png
其中,视觉运动雅可比场的框架主要包含两个关键部分,首先是一个基于深度学习的状态评估模型,这个模型可以仅通过单一视频流就可以推断出机器人的三维状态,编码了它的三维几何形状和微分运动学,即可以确认在任何可能得指令下,机器人在三维空间中任何点的移动方式。

其次是一个逆动力学控制器,在二维图像空间或三维空间中一密集的方式将期望的运动参数化,实时计算并输出机器人控制指令。研究团队发现,将演示轨迹参数化为密集的点运动是控制各种类型机器人系统的关键,因为可变形和灵巧机器人的运动不能被单个三维框架上指定的刚性变换很好地约束,参数化使得广泛的系统可以模仿基于视频的演示。
wKgZPGh2JEeAbLylAAW7QFugYIc135.png
最终,通过该方法获得了跨平台的机器人控制能力。团队在使用16自由度的商用Allegro灵巧手进行测试时,关节角度误差可以小于3°,指尖位置误差小于4mm;使用3D打印的15气动通道软体手时,可以实现精准抓取工具,并具备抗遮挡能力;在采用剪切拉胀材料的HSA柔性腕平台上应用时,附加350g负重后仍实现7.3 mm精度;采用3D打印的Poppy教育机械臂,零部件公差较大的情况下,误差可以小于6 mm。

另外该方案能够实现无专家干预以及机器人的泛化能力,可以自动发现机器人的运动学结构,无需标注执行器与部件的对应关系。同时训练数据虽然仅包含随机的命令,但可以泛化到未被训练的运动。

采用该方案进行机器人控制,可以显著降低机器人自动化的门槛,降低机器人控制成本。其中关键创新在于将传统机器人控制的建模问题转化为基于视觉的自监督学习问题,为生物启发式机器人的实际部署开辟了新路径。




声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 机器人
    +关注

    关注

    214

    文章

    31633

    浏览量

    224474
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    为什么说关节扭矩传感器是高端机器人的“触觉神经”?

    如果把高端机器人比作一个“”,那么关节扭矩传感器就是遍布全身的“触觉神经”。没有它,机器人就像得了末梢神经麻痹——按程序动,却感受不到外界的力量,动作僵硬、笨拙,甚至危险。 核心原
    发表于 04-17 17:27

    广州团队研制出机器人“触觉皮肤”

    机器人的发展日新月异,广州团队研制出机器人“触觉皮肤”!广州团队研制的亚毫米级双模态触觉传感器阵列,是机器人触觉技术发展的重要里程碑,它不仅
    的头像 发表于 03-11 15:43 3438次阅读

    江智机器人技术核心团队

    ‌江智机器人技术核心团队是基于江智原有15年以上车辆产品研发团队基础上,以美国卡耐基梅隆大学CMU留学回国的赵国江为核心,汇聚了一批来自人工智能、机器人研发等领域的国内外高端人才,形成
    的头像 发表于 03-05 22:57 632次阅读
    江智<b class='flag-5'>机器人</b>技术核心<b class='flag-5'>团队</b>

    再谈低温烧结银的应用:从春晚四家机器人出镜的幕后推手说起

    科技:《武 BOT》:H2机器人31个高精度关节、单臂7自由度,完成醉拳、双截棍、舞剑,同步误差**< 0.1秒;核心是高功率密度伺服电机+高速控制+**强散热。 **魔法原子:《智造
    发表于 02-17 14:07

    Nature传感器新子第一篇论文出炉,中国青年学者联手撰写

        近期,知名学术期刊《Nature》(《自然》)旗下专注于传感器研究领域的子Nature Sensors》,刊发了创刊以来的第一篇论文。     《Nature Sensor
    的头像 发表于 11-27 15:04 1145次阅读
    <b class='flag-5'>Nature</b>传感器新子<b class='flag-5'>刊</b>第一篇论文出炉,中国青年学者联手撰写

    高精度机器人控制的核心——基于 MYD-LT536 开发板的精密运动控制方案

    处理器,支持 1.8 GHz 主频,并集成2Tops NPU、G2D、VPU 4K高清视频编解码器,为复杂控制算法与视觉融合计算提供充足算力。米尔MYD-LT536开发板 在“高精度机器人
    发表于 11-14 15:48

    变焦、高速、高清:索尼FCB-ER9500机芯如何重塑机器人视觉

    ”,其性能直接影响着机器人的作业精度和效率。索尼FCB-ER9500机芯的出现,为工业机器人带来了全新的视觉解决方案,推动工业检测向更高水平迈进。 01 视觉技术,赋
    的头像 发表于 11-13 09:39 907次阅读

    ALVA视觉系统赋具身智能机器人发展

    未来,智能机器人将突破工具属性,进化为自主决策、学习与进化的“类生命体”。
    的头像 发表于 10-30 14:03 881次阅读

    RK3576机器人核心:三屏异显+八路摄像头,重塑机器人交互与感知

    瑞芯微RK3576 AIoT处理器处理器凭借其卓越的多屏异显与8路摄像头接入能力,为机器人领域带来革新。米尔电子MYD-LR3576开发板实测数据显示,在高负载下CPU占用仅34%,完美实现多路视觉
    发表于 10-29 16:41

    巡检机器人落地攻略:RK3576驱动12路低延迟视觉

    解 RTSP/SRT/WebRTC 端到端 120~150ms 6TOPS NPU 边缘AI 弱网稳定回传 02|为什么选择 RK3576 做巡检机器人的“视觉底座”?多路并发与同步3×4-lane
    发表于 10-24 16:53

    机器人竞技幕后:磁传感器芯片激活 “精准感知力”

    推动着机器人应用场景变革。昆泰芯 KTH71 系列传感器芯片工作温度范围扩展至 - 40℃~125℃,让机器人首次能在 “极寒救援模拟”“高温焊接挑战” 等极端项目中稳定运作,某团队
    发表于 08-26 10:02

    机器人视觉企业环视智能完成千万级天使轮融资,推动通用智能机器人感知技术的产业化落地

    ,是一家专注于机器人视觉与AI感知技术的高科技企业。致力于为机器人及无人系统提供创新的视觉感知解决方案。 信息显示,环视智能创始团队由天津大
    的头像 发表于 08-05 18:12 2089次阅读
    <b class='flag-5'>机器人</b><b class='flag-5'>视觉</b>企业环视智能完成千万级天使轮融资,推动通用智能<b class='flag-5'>机器人</b>感知技术的产业化落地

    工业机器人的特点

    单调、繁琐的重复性操作,因此既可以避免由于工作本身的单调性给工人带来的工作效率下降,又可以因为机器的不间断操作提高单纯性输出。正是因为机器人可胜任重复性工作,避免了工人的职业病,同
    发表于 07-26 11:22

    《电子发烧友电子设计周报》聚焦硬科技领域核心价值 第20期:2025.07.14--2025.07.18

    Manipulator优化机器人机械臂、Cosmos模型增强机器人学习 2、机器人
    发表于 07-18 21:36

    广和通视觉技术在智能割草机器人领域的应用

    。这份来自市场的权威肯定,印证了视觉技术路线在智能割草机器人领域的巨大潜力,以及其赋终端产品的卓越表现,成为消费者高复杂专业工具的购买核心依据。
    的头像 发表于 07-11 11:21 1355次阅读