0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

商汤科技发布悟能具身智能平台

商汤科技SenseTime 来源:商汤科技SenseTime 2025-07-31 16:35 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

随着互联网自然语言数据逐渐耗尽,AI想要获得进一步的突破性成长,需要走出数字世界,迈向物理世界。

如同人类的进化轨迹——当机器能够在现实物理世界中自主探索,便能完成自我迭代与持续进化。

近日,由全国工商联人工智能委员会倾力主办,商汤科技承办的“大爱无疆·模塑未来” WAIC 2025大模型论坛上,商汤科技正式发布「悟能」具身智能平台,从开悟世界模型到明晰智能、开悟智能,旨在为具身智能打造一个能够在现实世界中自由探索成长的强大“训练场”。

基于方舟视觉感知、大装置、日日新大模型等多种技术的长期积累,商汤「悟能」具身智能平台以商汤“开悟”世界模型为核心引擎,依托商汤大装置提供强大的端侧和云侧算力支持,能够为机器人、智能设备赋予强大的感知、视觉导航及多模态交互能力,推动智能终端向更高层次的自主化与智能化演进。

商汤科技董事长兼首席执行官徐立表示,“世界模型和具身AI的结合,将开启AI发展的下一个阶段,完成由‘工具’向‘人’的跃迁,加速迈向AGI时代。商汤希望「悟能」具身智能平台能够帮助各类具身智能企业,帮助他们完成和现实世界交互的梦想。”

感知全能、导航精准、交互灵活

为具身智能打造“三大核心引擎”

感知、导航和交互,是具身智能的三大核心能力。

商汤科技在这三大方面均拥有深厚的技术积淀,如今这些积累转化成了「悟能」具身智能的能力。

首先,感知是机器探索现实世界的基础。

凭借商汤方舟在视觉AI领域十余年的深耕积累,从机器狗到机器人,「悟能」具身智能平台能为各类终端硬件赋予对万物的识别与理解能力,同时具有强大的场景适配性,可完全嵌入端侧芯片实现端侧推理,让感知更高效、响应更敏捷。

无论是机器狗的视角(上方视频)还是机器人的视角(下方视频),都能对外界有整体的天然感知识别,对物体形成自然划分切割。

导航是机器在现实世界中行动的“骨架”。

商汤绝影在纯视觉端到端智能辅助驾驶方案上的技术积累,可泛化适配至机器人、机器狗等硬件设备,让机器人在更多样的环境中实现精准路径规划与导航。

同样,无论是在绿化小路中四足奔走的、体型较小的机器狗(上方视频)还是行驶在城区正常车道的自动驾驶车辆(下方视频)都在实现精准路径规划与导航的同时,准确地进行了自动避障。

交互是机器与现实世界连接的桥梁。

基于“日日新”大模型的技术积累与不断迭代,“悟能”具身智能平台可以赋能机器人具备和现实世界的交互能力,具备有温度、有深度、长记忆、超稳定等能力亮点。

以AI生成的《长安的荔枝》电影介绍PPT为例,由“悟能”具身智能平台赋能的人形机器人,能够以各种风趣幽默、严谨务实等各种语言风格进行生动讲解。

同时,它还可以自动翻页,实时响应用户提问,敏锐捕捉用户意图,期间用户打断提问,它完成提问后还能回归继续讲解。

它还能结合长记忆能力进行阶段性回顾历史用户提问,作出小结,即便遇到嘈杂环境也能轻松应对。

商汤“悟能”具身智能平台可广泛适配包括汽车、机器人在内的各类终端,实现空间层面的现实世界互动。

构建4D真实世界

为机器进化提供高质量现实世界数据

基于强大的多模态深度理解能力,商汤“开悟”世界模型具备合理的空间一致性和时间一致性,可生成高质量数据,有效提升具身智能等终端设备的智能水平。

“开悟”世界模型能够仅凭自然语言描述,即可生成逼真的七路摄像头视角模拟数据,且不同视角下的几何位置高度对应,完全符合物理世界的规律。

“开悟”世界模型还能够编辑真实世界,可对现实世界中的车辆等场景元素进行替换、删除、增补,创造更加多样的现实场景。

基于强大的生成和编辑能力,“开悟”世界模型可以精准模拟方向盘、刹车和油门控制,带来如同在真实的街道场景中玩“极品飞车”的效果,让机器在现实世界中自由探索。

“极品飞车”啥效果,来这里看看:商汤董事长兼CEO徐立:人工智能的十年演进 | WAIC 2025主论坛

到了具身世界,发挥空间则更大。

相较于智能汽车,机器人适用和覆盖的场景更加广泛,能够通过主动探索生成更多高质量的现实世界数据,在具身智能数据匮乏的当前环境下,可通过构建面向人、物、场的4D真实世界,突破模型泛化能力的边界。

具身世界模型让用户仅需要输入简单的提示词,就能自主进行位姿、动作骨架和指令的生成,让机器人动作更合理。

给出“在厨房区域的架子上找东西”指令,具身世界模型可以准确生成相应的场景视频和机器人的连续位姿,从上图变成下面连续的动态视频

再来一组,还是只给出初始视角。

给出“进入娱乐室、向右转,然后打开通往院子的门”指令,具身世界模型不仅可以进行连续位姿生成,还支持多角度查看,并保持高度的时空一致性

给出“生成一段切黄瓜的机器人视频”指令,具身世界模型可准确生成动作骨架,随后输出具身第一视角、第三视角4D世界视角等多种视角的视频。

给出“生成一段白天公园里机器人跳跃的视频”指令,具身世界模型同样可以模拟生成符合3D关系的4D世界的真实视频。

即便是不同相机位姿视角的视频生成,具身世界模型也能轻松拿捏,来看下具身世界模型生成的多视角视频

商汤“悟能”具身智能平台正在实质性打破虚实界限,构建AI与物理世界交互的高效通路。

未来,商汤科技希望助力赋能具身智能企业实现感知、理解与生成能力的跃迁,将具身交互的不确定性挑战转化为产业升级的确定性路径,推动AI向下一个十年加速进化。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • AI
    AI
    +关注

    关注

    91

    文章

    41101

    浏览量

    302577
  • 商汤科技
    +关注

    关注

    8

    文章

    619

    浏览量

    37676
  • 具身智能
    +关注

    关注

    0

    文章

    472

    浏览量

    907

原文标题:商汤发布“悟能”具身智能平台,AI在物理世界中实现自我进化

文章出处:【微信号:SenseTime2017,微信公众号:商汤科技SenseTime】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    广和通正式发布新一代桌面级双臂智能开发平台Fibot

    2026年4月,广和通正式发布新一代桌面级双臂智能开发平台Fibot。该平台率先支持全球顶尖
    的头像 发表于 04-16 14:28 1077次阅读

    瑞为技术参编起草的智能领域首个行业标准正式发布

    近日,由中国信息通信研究院牵头、瑞为技术等40多家单位联合参编起草的智能领域首个行业标准正式发布,将于6月1日正式实施,标志着
    的头像 发表于 04-01 11:34 380次阅读

    智能发展报告(2025年)》

    智能发展报告(2025年)》由中国信息通信研究院与清华大学电子工程系联合发布,是我国首部系统梳理
    的头像 发表于 02-03 11:17 1238次阅读
    《<b class='flag-5'>具</b><b class='flag-5'>身</b><b class='flag-5'>智能</b>发展报告(2025年)》

    智能交流会

    2026****深圳(国际)智能创新展览会 同期联动展会 :第 29 届华南国际工业自动化展、华南国际机器视觉及工业应用展、华南国际工业博览会 时间: 2026 年 6 月 10-12 日 地点
    发表于 01-22 09:55

    构建生态新范式!开源大脑+小脑,地平线发布两款智能模型

    在2025地平线技术生态大会上,地平线创始人兼CEO余凯正式发布两大智能开源模型——
    的头像 发表于 12-16 15:01 1.3w次阅读
    构建生态新范式!开源大脑+小脑,地平线<b class='flag-5'>发布</b>两款<b class='flag-5'>具</b><b class='flag-5'>身</b><b class='flag-5'>智能</b>模型

    全脑智能时代来临,黑芝麻智能SesameX多维智能计算平台发布即商业化落地

    体系,正是智能最需要的技术基础。我们的目标非常明确,作为智能驾驶领域的技术推动者,我们也将以创新的产品和技术推动机器人产业发展。”在“多维进化,智赋新生”2025年黑芝麻
    的头像 发表于 11-22 07:02 8465次阅读

    什么样的智能体才能称为智能

    [首发于智驾最前沿微信公众号]2025年,是科幻照进现实的一年。当小鹏汽车发布的“IRON”人形机器人以高度拟人的步态与流畅的运动控制进入大众视野时,着实惊呆众人。 还记得年初的智能
    的头像 发表于 11-19 09:29 926次阅读
    什么样的<b class='flag-5'>智能</b>体才能称为<b class='flag-5'>具</b><b class='flag-5'>身</b><b class='flag-5'>智能</b>?

    成都华微与科技开启四川智能产业新篇章

    人形机器人整机平台“天行者2号”,更迎来产业链多方战略合作的重大突破,成都华微电子科技股份有限公司(以下简称成都华微)作为核心硬件合作伙伴参与签约,共同开启四川智能产业新篇章。
    的头像 发表于 09-30 11:48 1418次阅读

    【「AI芯片:科技探索与AGI愿景」阅读体验】+智能芯片

    智能芯片:说白了就是能够感知、思考推理以及决策的一体式可达人类智能水平的智能体-----就跟电影里的一样。 一、
    发表于 09-18 11:45

    智瀚星途多款智能新品重磅发布

    近日,在创新涌动、活力迸发的钱塘江畔,智瀚星途杭州总部落成暨智能新品发布会盛大启幕!
    的头像 发表于 09-08 12:31 1931次阅读

    广和通发布新一代智能开发平台Fibot

    8月27日,全球领先的无线通信与AI解决方案提供商广和通发布新一代智能开发平台 Fibot。Fibot已成功应用于Physical In
    的头像 发表于 08-29 11:14 1517次阅读

    写给小白的“智能”入门科普

    最近智能这个概念很火。那么,究竟什么是智能?它包括哪些类别和关键技术?通过这篇文章,我们
    的头像 发表于 08-21 14:15 2940次阅读
    写给小白的“<b class='flag-5'>具</b><b class='flag-5'>身</b><b class='flag-5'>智能</b>”入门科普

    东风汽车加速智能领域技术攻关

    近日,湖北卫视“湖北新闻”和“湖北发布”接连报道东风汽车加速智能领域技术攻关,牵头成立汽车
    的头像 发表于 07-21 14:19 1028次阅读

    中国智能的机遇与挑战

    近期,来自智能学界与产业界的重量级嘉宾——上海交通大学副教授、上海人工智能研究院首席科学家闫维新,库帕思 CEO黄海清,松应科技创始人CEO聂凯旋,银河通用合伙人、大模型负责人张直
    的头像 发表于 04-28 14:49 1329次阅读