智元斩获WorldArena世界模型总分冠军-电子发烧友网

近日，具身领域热门榜单 WorldArena Track1（世界模型感知与动作响应赛道）最新评测结果揭晓。智元自研的世界模型 Genie Envisioner-Sim 2.0（以下简称GE 2.0）凭借优异的综合表现，登顶榜单榜首。

Project page：

https://ge-sim-v2.github.io/

Arxiv：

https://arxiv.org/abs/2605.27491

Github：

https://github.com/AgibotTech/GE-Sim-V2

“世界模型感知与动作响应”赛道聚焦具身智能最本质的“认知与行动”能力，是评判通用人形机器人智能化水平的核心标尺。在该赛道评测中，智元团队使用了原生的世界模型GE 2.0，并未针对赛题进行特殊设计优化，仅基于榜单数据进行了基础微调（Finetune）。“轻装上阵”依然拔得头筹，充分印证了GE 2.0强大的通用适配性。面对近期世界模型方向的火热关注和创业浪潮，智元始终保持自己的节奏，从长远第一性原理出发，专注于打磨具身世界模型的坚实技术底座。此次登顶，是智元坚持长期技术演进的实力见证。

在GE 2.0技术报告中，智元团队对模型进行了全面的能力剖析。相比上一代模型，GE 2.0不仅在单点性能上实现了跃升，更真正演进为一个全功能、高可用的世界模拟器，可构建可试错、可迭代、可进化的虚拟仿真环境，让机器人策略在虚拟场景中自主积累经验、完成动态试错，规避真实场景的试错成本，最终高效迁移至真实物理世界稳定落地，真正实现从“感知预测”到“仿真进化、自主决策”的闭环升级。

功能矩阵全面补齐：GE 2.0在功能上首次全面覆盖了长时序生成、多视角生成、本体状态生成、近实时推理以及奖励判别等核心环节，构建了世界模拟器完整的技术能力闭环。

长时序推演能力突破：在长时序推理任务中，GE 2.0表现出极强的稳定性，画面质量随推理时长的衰减显著弱于行业基线方案。即使在连续推演 40-50 秒的长视频片段时，其生成质量依然超越了基线模型前 10 秒内的表现。

高可靠的闭环评测：作为世界模拟器，核心在于能否真实反映物理世界。团队验证了大量闭环评测结果，证明GE 2.0在多项任务上均与真实世界保持着强相关性。这种相关性不止步于宏观统计意义上的“成功率一致”，团队还进行了逐案（Case-by-case）的 rollout 结果对比分析，并通过混淆矩阵（Confusion Matrix）提供了严谨的量化佐证，强有力地证明了GE 2.0作为策略评测器的可靠性。

打通数据回流反哺机制：在奖励模型（Reward Model）的加持下，GE 2.0能够对闭环评测的 rollout 过程进行自动化筛选，将世界模型中产出的有效高质量数据精准回流给策略模型（Policy Model）。实验证明，这一机制在多项任务上均助力策略模型实现了显著的性能涨点。

2026年是具身智能“部署态”元年，机器人从实验室走向真实场景，规模化部署，真正发挥具身智能生产力，这也对算法提出了更高的要求。专注底层技术攻坚与产业价值落地，是智元一贯的技术理念。不论是WorldArena榜单上的优异表现还是技术报告中的性能论证，都彰显了Genie Envisioner技术路线的潜力。未来，智元将持续迭代世界模拟器技术体系，打通具身智能技术闭环，推动世界模型真正走进真实场景，为人形机器人规模化落地筑牢核心技术底座。

来源：智元AGIBOT

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉