0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

生成式AI如何变革机器人工作流程

MATLAB 来源:MATLAB 2025-12-02 15:06 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

本文来自 MathWorks 博客,Autonomous System 自主系统栏目。

作者:YJ Lim,MathWorks 机器人产品经理

翻译:叶女士(人机版)

非常激动地和大家分享我们最近的一些酷炫成果:我们正在利用生成式 AI,让机器人变得更加灵活,使用起来也更加便捷!

生成式 AI 已成为近年来最具影响力的技术趋势之一,推动了像 deepseek,ChatGPT 这样的工具,改变了我们的生活和工作方式。除此之外,生成式 AI 也正在重塑各行各业,机器人领域也不例外。在 MathWorks,我们非常期待探索这项技术如何简化和提升机器人运行的方式,让先进的机器人技术变得更加易用和多样化。

该领域的一个典型例子是 Google’s Robotics Transformer 2 (RT-2) [1]。RT-2 展示了生成式AI的巨大潜力,使机器人具备了前所未有的感知、规划和行动的适应能力。这些模型利用大规模网络数据,帮助机器人泛化知识、在非结构化环境中执行任务,并且只需极少的针对性训练。虽然前景令人振奋,但仍然面临一些挑战,比如如何将这些模型集成到现实世界的工作流程中——而这,正是 MathWorks 的用武之地。

从传统到生成式 AI 方法的转变

传统上,自主系统通常由感知、规划和控制等独立模块组成。虽然这些模块能够实现预期功能,但在集成和适应新环境时往往需要投入大量精力。

61218bd4-cab0-11f0-8c8f-92fbcf53809c.png

图示:现有的机器人任务实现方式——在传统机器人系统中,任务通常被分解为若干子任务,如目标检测、抓取和运动规划。感知模块负责检测并估算物体的姿态,而运动规划模块则计算任务执行所需的轨迹。在动态环境下,这些步骤往往需要多次重复执行,对于像放置多个物体这样的多步骤任务,会导致系统变得复杂且效率低下。

以传统的感知流程为例:

目标检测:可以使用 YOLOv4 检测器对图像中的物体进行识别(示例[2])。

姿态估算:通过多步流程估算被检测物体的三维位置和朝向(示例[3])。

训练与部署:每添加一个新物体或更换环境,都需要重新训练和配置系统,这不仅耗时,而且难以大规模推广。

6177e240-cab0-11f0-8c8f-92fbcf53809c.png

图示:现有的姿态估算方法实现机器人任务(参见此示例[4])。在现有的感知流程中,主要目标是检测图像中的物体并估算其三维姿态,通常会用到 YOLOv4 检测器。尽管这种方法有效,但需要大量的训练和姿态估算步骤,因此在面对新物体或新环境时,扩展和应用起来既繁琐又具有挑战性。

生成式 AI 则改变了这一传统做法,将感知、规划和控制集成到一个端到端的系统中。VLA(视觉-语言-动作)模型能够处理文本指令和摄像头图像,预测机器人动作,并根据反馈不断优化这些动作。这类模型具备以下特点:

基于 transformer 架构——与 ChatGPT 等模型采用相同的技术基础;

能够结合视觉和语言输入进行推理并生成相应动作;

作为“具身智能”系统,将抽象理解与实际物理动作相连接。

这种端到端的方法大大简化了开发流程,使机器人更容易适应新的任务和环境。

61d1ef74-cab0-11f0-8c8f-92fbcf53809c.png

图示:基于 transformer 架构的机器人 VLA(视觉-语言-动作)模型能够根据文本指令和摄像头图像,在一个简化的步骤中预测机器人动作,这与传统系统中任务分解、感知和运动规划等多个独立阶段不同。这些模型通过视觉反馈不断迭代优化动作,从而提升准确性,但在实际执行时仍需依赖底层控制器,并且在真实应用中需要安全层来保障可靠性。与 ChatGPT 和 DALL-E 等模型不同,VLA 模型通过将决策过程融入物理机器人系统,实现了“具身智能”。

生成式 AI 与机器人技术在 MathWorks 的结合

在 MathWorks,我们致力于将生成式 AI 领域的前沿研究与机器人实际应用之间的鸿沟弥合。我们 MATLABSimulink 中的工具为机器人基础模型提供了有力补充,例如:

即插即用:可直接在 MATLAB 和 Simulink 中访问和部署此类模型。

测试验证:利用生成式模型的输出,仿真机器人动力学、优化运动规划和轨迹控制(通过 Robotics System Toolbox)。

三维可视化:逼真的3D动画将机器人行为生动展现,便于在仿真环境中评估性能。

安全保障:为机器人系统的现实应用提供验证和确认工具,确保安全关键型场景的可靠性。

真实部署:支持从仿真无缝过渡到实际部署,包括在资源受限设备上的测试或利用云端推理。

例如,我们开发了一个名为“RobotPolicy”的 Simulink 模块,可与基础模型集成,在闭环系统中展示其能力。该模块能够接收任务指令和视觉观测,输出机器人动作,并支持如 RT1-X 和 Octo 等预训练的小型模型。

622e99b8-cab0-11f0-8c8f-92fbcf53809c.png

图示:在 Simulink 中仿真和测试机器人基础模型。Simulink 中的“RobotPolicy”模块可以集成来自 HuggingFace 等平台的基于 Python 的基础模型。它能够处理任务指令和观测图像,生成机器人动作,明确指定末端执行器的位置和姿态。整个工作流程包括自然运动的位姿控制、具有真实感的 3D 仿真环境,以及动作的迭代生成直至完成任务,从而实现生成式 AI 在机器人领域的无缝测试与部署。

现实应用与未来展望

结合 MATLAB 和 Simulink 的生成式 AI 为各类机器人应用领域带来了令人兴奋的新可能,例如:

零样本部署:得益于基础模型在多样化数据集上的广泛训练,机器人能够在从未见过的环境中执行任务。

涌现能力:不仅能执行基础指令,机器人还可完成需要推理的复杂任务,比如挑选健康饮品或理解符号化指令。

仿真驱动开发:高保真仿真有助于优化模型和加速测试,缩小仿真与现实部署之间的差距。

针对特定任务的微调:借助基础模型中学到的先验知识,机器人仅需极少的数据就能适应新任务或新环境。例如,只需少量样本,便可在数小时内完成对高精度操作或长时序任务的模型微调。

亲自体验

我们非常乐意帮助您探索生成式 AI 如何变革机器人工作流程。目前,我们准备在 GitHub 上发布示例,同时您也可以直接联系我们,申请试用代码的访问权限。

这个示例将展示:

机器人基础模型与 Simulink 的集成

机器人任务的仿真与可视化

如何将这些模型适配到具体应用中

欢迎联系我们获取试用代码,亲自体验生成式 AI 带来的各种可能。我们期待您的反馈和宝贵见解!

加入讨论

生成式 AI 仍在不断发展,提升成功率和实现可扩展性等问题仍需攻克。随着更多数据和高保真仿真的出现,我们相信该领域将会快速进步。在 MathWorks,我们很高兴能够参与这一进程,并期待听到您对生成式 AI 在机器人领域创造新机遇的看法。

欢迎分享您的想法,并亲自试用 GitHub 上的示例,体验这些创新应用的可能性:

您目前是否在探索生成式 AI 在机器人领域的应用?在您看来,生成式AI在哪些机器人应用中能够产生重大影响?

机器人VLA基础模型(如 Google 的 RT-X 和 Covariant 的 RFM-01)可以实现端到端的任务处理(涵盖感知、规划和执行)。您认为这些模型有可能取代传统算法吗?

机器人基础模型在实际部署中仍需底层控制器、额外的安全机制和大量测试。您认为基于模型的设计(Model-Based Design)能否在保障这些模型功能安全方面发挥关键作用?

MATLAB/Simulink 为基础模型的连接、仿真、测试和部署提供了便捷工具。您是否有兴趣将 MATLAB/Simulink 用于这些用途?

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • matlab
    +关注

    关注

    189

    文章

    3018

    浏览量

    237618
  • 机器人
    +关注

    关注

    213

    文章

    30600

    浏览量

    219655
  • MathWorks
    +关注

    关注

    16

    文章

    85

    浏览量

    62067
  • AI
    AI
    +关注

    关注

    89

    文章

    38153

    浏览量

    296815

原文标题:生成式 AI + 机器人 = 强!

文章出处:【微信号:MATLAB,微信公众号:MATLAB】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    ADI Power Studio工作流程与工具概述

    、直观的工作流程,利用准确的模型来仿真实际性能,并自动生成关键的物料清单和报告等内容,帮助工程团队更早做出更优决策。
    的头像 发表于 10-22 09:38 652次阅读

    NVIDIA RTX AI PC为AnythingLLM加速本地AI工作流

    大语言模型(LLM)基于包含数十亿个 Token 的数据集训练而来,能够生成高质量的内容。它们是众多最热门 AI 应用的核心支撑技术,包括聊天机器人、智能助手、代码生成工具等。
    的头像 发表于 07-04 15:05 797次阅读

    明远智睿SSD2351开发板:语音机器人领域的变革力量

    人工智能快速发展的今天,语音机器人逐渐成为人们生活和工作中的得力助手。明远智睿SSD2351开发板凭借强大性能与丰富功能,为语音机器人的发展注入新动力,成为该领域的
    发表于 05-28 11:36

    生成人工智能认证:重构AI时代的人才培养与职业跃迁路径

    当人类站在生成人工智能(Generative AI)的技术奇点上回望,会发现这场革命早已超越了工具迭代的范畴——它正在重新定义人类与技术的协作模式,重塑职业世界的运行逻辑。
    的头像 发表于 05-23 09:29 612次阅读

    生成人工智能认证:重塑AI时代职业版图的钥匙

    在科技浪潮席卷全球的今天,人工智能(AI)已从科幻概念进化为驱动社会变革的核心力量。其中,生成人工
    的头像 发表于 05-23 09:18 531次阅读

    工业机器人工作站的建设意义

    其他辅助设备的配合,形成了一套完整的自动化生产流程。桐尔作为专业的自动化解决方案提供商,致力于通过工业机器人工作站的建设,为企业带来显著的经济效益和生产效率提升。 工业机器人工作站的建立首先能够显著
    发表于 03-17 14:49

    AI Agent 应用与项目实战》阅读心得2——客服机器人、AutoGen框架 、生成代理

    继续分享第2篇阅读心得。 传统客服系统在知识库更新和多轮对话管理方面存在诸多技术瓶颈,本书第3章中提出的AI课程客服机器人架构巧妙地解决了这些问题。该架构采用Replit作为开发环境
    发表于 02-25 21:59

    NX CAD软件:数字化工作流程解决方案(CAD工作流程)

    NXCAD——数字化工作流程解决方案(CAD工作流程)使用西门子领先的产品设计软件NXCAD加速执行基于工作流程的解决方案。我们在了解行业需求方面累积了多年的经验,并据此针对各个行业的具体需求提供
    的头像 发表于 02-06 18:15 748次阅读
    NX CAD软件:数字化<b class='flag-5'>工作流程</b>解决方案(CAD<b class='flag-5'>工作流程</b>)

    NVIDIA推出AI零售购物助手蓝图

    NVIDIA 于近日发布了用于零售购物助手的 NVIDIA AI Blueprint,这个生成 AI 参考工作流旨在
    的头像 发表于 01-14 11:17 1020次阅读

    NVIDIA推出多个生成AI模型和蓝图

    NVIDIA 宣布推出多个生成 AI 模型和蓝图,将 NVIDIA Omniverse 一体化进一步扩展至物理 AI 应用,如机器人、自动
    的头像 发表于 01-08 10:48 1033次阅读

    AI工作流自动化是做什么的

    AI工作流自动化是指利用人工智能技术,对工作流程中的重复性、规则明确的任务进行自动化处理的过程。那么,AI
    的头像 发表于 01-06 17:57 1433次阅读

    【「具身智能机器人系统」阅读体验】2.具身智能机器人大模型

    近年来,人工智能领域的大模型技术在多个方向上取得了突破性的进展,特别是在机器人控制领域展现出了巨大的潜力。在“具身智能机器人大模型”部分,作者研究并探讨了大模型如何提升机器人的能力,大
    发表于 12-29 23:04

    【「具身智能机器人系统」阅读体验】+数据在具身人工智能中的价值

    嵌入人工智能(EAI)将人工智能集成到机器人等物理实体中,使它们能够感知、学习环境并与之动态交互。这种能力使此类机器人能够在人类社会中有效
    发表于 12-24 00:33

    《具身智能机器人系统》第1-6章阅读心得之具身智能机器人系统背景知识与基础模块

    要给AI这个聪明的“头脑”装上一副“身体”。这个“身体”可以是一部手机,可以是一台自动驾驶汽车。而人形机器人则是集各类核心尖端技术于一体的载体,是具身智能的代表产品。与传统的软件智能体不同,具身智能
    发表于 12-19 22:26

    Cadence如何运用人工智能改变验证流程

    目前,生成人工智能浪潮正席卷全球各行各业,重新定义全球的工作方式。通过利用 AI 自动化处理重复性工作
    的头像 发表于 12-19 09:33 1273次阅读
    Cadence如何运用<b class='flag-5'>人工</b>智能改变验证<b class='flag-5'>流程</b>