0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

智元斩获WorldArena世界模型总分冠军

智汇工业 来源:智元AGIBOT 2026-06-03 11:20 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

近日,具身领域热门榜单 WorldArena Track1(世界模型感知与动作响应赛道)最新评测结果揭晓。智元自研的世界模型 Genie Envisioner-Sim 2.0(以下简称GE 2.0)凭借优异的综合表现,登顶榜单榜首。

Project page:

https://ge-sim-v2.github.io/

Arxiv:

https://arxiv.org/abs/2605.27491

Github:

https://github.com/AgibotTech/GE-Sim-V2

“世界模型感知与动作响应”赛道聚焦具身智能最本质的“认知与行动”能力,是评判通用人形机器人智能化水平的核心标尺。在该赛道评测中,智元团队使用了原生的世界模型GE 2.0,并未针对赛题进行特殊设计优化,仅基于榜单数据进行了基础微调(Finetune)。“轻装上阵”依然拔得头筹,充分印证了GE 2.0强大的通用适配性。面对近期世界模型方向的火热关注和创业浪潮,智元始终保持自己的节奏,从长远第一性原理出发 ,专注于打磨具身世界模型的坚实技术底座。此次登顶,是智元坚持长期技术演进的实力见证。

aeae823e-5e0e-11f1-90a1-92fbcf53809c.jpg

在GE 2.0技术报告中,智元团队对模型进行了全面的能力剖析。相比上一代模型,GE 2.0不仅在单点性能上实现了跃升,更真正演进为一个全功能、高可用的世界模拟器,可构建可试错、可迭代、可进化的虚拟仿真环境,让机器人策略在虚拟场景中自主积累经验、完成动态试错,规避真实场景的试错成本,最终高效迁移至真实物理世界稳定落地,真正实现从“感知预测”到“仿真进化、自主决策”的闭环升级。

功能矩阵全面补齐:GE 2.0在功能上首次全面覆盖了长时序生成、多视角生成、本体状态生成、近实时推理以及奖励判别等核心环节,构建了世界模拟器完整的技术能力闭环。

af023d3e-5e0e-11f1-90a1-92fbcf53809c.png

长时序推演能力突破: 在长时序推理任务中,GE 2.0表现出极强的稳定性,画面质量随推理时长的衰减显著弱于行业基线方案。即使在连续推演 40-50 秒的长视频片段时,其生成质量依然超越了基线模型前 10 秒内的表现。

af5bb490-5e0e-11f1-90a1-92fbcf53809c.png

高可靠的闭环评测:作为世界模拟器,核心在于能否真实反映物理世界。团队验证了大量闭环评测结果,证明GE 2.0在多项任务上均与真实世界保持着强相关性。这种相关性不止步于宏观统计意义上的“成功率一致”,团队还进行了逐案(Case-by-case)的 rollout 结果对比分析,并通过混淆矩阵(Confusion Matrix)提供了严谨的量化佐证,强有力地证明了GE 2.0作为策略评测器的可靠性。

afafc4f4-5e0e-11f1-90a1-92fbcf53809c.png

打通数据回流反哺机制:在奖励模型(Reward Model)的加持下,GE 2.0能够对闭环评测的 rollout 过程进行自动化筛选,将世界模型中产出的有效高质量数据精准回流给策略模型(Policy Model)。实验证明,这一机制在多项任务上均助力策略模型实现了显著的性能涨点。

b00ad916-5e0e-11f1-90a1-92fbcf53809c.png

2026年是具身智能“部署态”元年,机器人从实验室走向真实场景,规模化部署,真正发挥具身智能生产力,这也对算法提出了更高的要求。专注底层技术攻坚与产业价值落地,是智元一贯的技术理念。不论是WorldArena榜单上的优异表现还是技术报告中的性能论证,都彰显了Genie Envisioner技术路线的潜力。未来,智元将持续迭代世界模拟器技术体系,打通具身智能技术闭环,推动世界模型真正走进真实场景,为人形机器人规模化落地筑牢核心技术底座。

来源:智元AGIBOT

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 模型
    +关注

    关注

    1

    文章

    3893

    浏览量

    52397
  • 人形机器人
    +关注

    关注

    8

    文章

    1117

    浏览量

    18593
  • 智元机器人
    +关注

    关注

    1

    文章

    35

    浏览量

    1778

原文标题:全球第一!智元斩获WorldArena世界模型总分冠军!

文章出处:【微信号:ilinki,微信公众号:智汇工业】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    小马智行发布PonyWorld世界模型2.0

    4月10日,小马智行正式发布其在物理AI领域的最新技术成果——PonyWorld世界模型2.0。
    的头像 发表于 04-10 17:21 1251次阅读

    中科创达荣膺第九批国家级制造业单项冠军企业

    今日,中科创达正式获颁工业和信息化部授予的制造业单项冠军企业荣誉证书。公司凭借行业领先的智能座舱一体化解决方案成功入选第九批制造业单项冠军企业名单,正式斩获这一国家级重磅荣誉。
    的头像 发表于 04-03 14:33 2812次阅读

    中软国际斩获华为2025亿俱乐部伙伴奖与优秀大模型合作伙伴奖

    3月19日,在“2026上海之夜——华为上海政企核心伙伴答谢会暨颁奖晚宴”上,中软国际凭借过去一年在金融AI领域的卓越贡献,一举斩获“2025亿俱乐部伙伴奖”与“2025优秀大模型合作伙伴奖”两项
    的头像 发表于 03-24 10:54 618次阅读

    如何构建适合自动驾驶的世界模型

    [首发于智驾最前沿微信公众号]世界模型经历了系统动力学阶段(1960年~2000年)、认知科学阶段(2001年~2017年)、深度学习阶段(2018年至今),但将其应用到自动驾驶汽车上,还是近几年才
    的头像 发表于 02-18 08:14 1.1w次阅读
    如何构建适合自动驾驶的<b class='flag-5'>世界</b><b class='flag-5'>模型</b>?

    奥拓电子斩获2025年广东省省级制造业单项冠军企业

    近日,广东省工业和信息化厅公示了《2025年广东省省级制造业单项冠军企业》名单,奥拓电子凭借在超高清LED影视屏领域的深耕细作、技术突破及市场引领地位,成功获评广东省省级制造业单项冠军企业,成为该细分赛道的标杆企业。
    的头像 发表于 01-20 11:03 542次阅读

    商汤科技日日新V6.5荣获2025年多模态大模型全国第一

    近日,权威大模型评测基准 SuperCLUE 发布《中文多模态视觉语言模型测评基准12月报告》,商汤日日新V6.5(SenseNova V6.5 Pro)以75.35的总分位列国内第一,斩获
    的头像 发表于 01-06 14:44 1093次阅读
    商汤科技日日新V6.5荣获2025年多模态大<b class='flag-5'>模型</b>全国第一

    自动驾驶中常提的世界模型是什么?

    在很多厂家的技术方案中,会提到世界模型的介绍。世界模型,就是自动驾驶系统内部用来表示外部世界并预测未来演变的一组
    的头像 发表于 01-05 16:23 1208次阅读

    VLA与世界模型有什么不同?

    Language Action,VLA),另一些则致力于构建并应用世界模型(World Model)。这两种路径有什么不同? 什么是VLA,什么是世界模型 先说说VLA。VLA是英文
    的头像 发表于 12-17 09:13 1010次阅读
    VLA与<b class='flag-5'>世界</b><b class='flag-5'>模型</b>有什么不同?

    世界模型是让自动驾驶汽车理解世界还是预测未来?

      [首发于智驾最前沿微信公众号]世界模型在自动驾驶技术中已有广泛应用。但当谈及它对自动驾驶的作用时,难免会出现分歧。它到底是让自动驾驶汽车得以理解世界,还是为其提供了预测未来的视角? 世界
    的头像 发表于 12-16 09:27 1125次阅读
    <b class='flag-5'>世界</b><b class='flag-5'>模型</b>是让自动驾驶汽车理解<b class='flag-5'>世界</b>还是预测未来?

    脉冲神经元模型的硬件实现

    会发生泄漏而降低。 以下公式 用来计算LIF模型的膜电势 其中表示神经的膜电势,vrest 代表神经复位电位,为时间常数。是权重和输入脉冲的乘累加,结果再与膜电势相加。当神经
    发表于 10-24 08:27

    地平线H-RDT模型斩获CVPR 2025大赛冠军

    近日,在计算机视觉与模式识别领域顶级会议CVPR 2025举办的RoboTwin双臂机器人竞赛中,地平线机器人实验室与清华大学计算机系朱军团队联合提出的H-RDT凭强大性能和领先成功率,一举斩获真机赛冠军(一等奖第一名),并在仿真赛中荣获亚军(一等奖第二名),为全球机器人
    的头像 发表于 08-21 10:02 864次阅读
    地平线H-RDT<b class='flag-5'>模型</b><b class='flag-5'>斩获</b>CVPR 2025大赛<b class='flag-5'>冠军</b>

    传音斩获WMT 2025国际机器翻译大赛四项冠军

    近日,在由国际计算语言学协会(ACL)主办的WMT 2025国际机器翻译大赛中,传音在低资源印度语言翻译任务(Low-Resource Indic Language Translation)中斩获
    的头像 发表于 08-06 18:21 1424次阅读

    自动驾驶中常提的世界模型是个啥?

    [首发于智驾最前沿微信公众号]随着自动驾驶技术的不断成熟,车辆需要在复杂多变的道路环境中安全地行驶,这就要求系统不仅能“看见”周围的世界,还要能“理解”和“推测”未来的变化。世界模型可以被看作一种
    的头像 发表于 06-24 08:53 1516次阅读
    自动驾驶中常提的<b class='flag-5'>世界</b><b class='flag-5'>模型</b>是个啥?

    中兴通讯星云大模型登顶SuperCLUE推理专项榜单

    近日,中文大模型权威测评基准SuperCLUE发布《中文大模型基准测评2025年5月报告》。报告显示,中兴通讯自主研发的星云大模型NebulaCoder-V6在推理专项榜单中斩获榜单金
    的头像 发表于 06-04 16:44 1687次阅读

    长城汽车环塔车队斩获2025环塔拉力赛多项冠军

    2025年中国环塔国际拉力赛落下帷幕,长城汽车哈弗、坦克、长城炮三大品牌参加T2量产组比赛,动力涵盖汽油、柴油、新能源。其中长城坦克Hi4车队斩获厂商队杯T2.E量产新能源组冠军,长城哈弗车队二代H9柴油版、猛龙燃油版、长城炮车队V6火炮,分别
    的头像 发表于 06-04 16:02 926次阅读