0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

“明牌”对局,自变量开源模型超越pi0

脑极体 来源:脑极体 作者:脑极体 2026-01-10 12:00 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

wKgZO2lhzsiAEccFAAeV4afBWd4650.jpg

近日,全球首个大规模多任务的真机基准测试平台RoboChallenge榜单更新,前三名依次为pi0.5、WALL-OSS和pi0。

科普时间到,pi0.5、pi0是出自美国公司 Physical Intelliqence的操作大模型,WALL-OSS是出自中国自变量机器人的全自研开源操作大模型,不仅能完成操作,而且能同时生成复杂推理过程。

这一结果释放出强烈的信号。很长一段时间内,中国具身智能产业陷入“大脑缺位”的争议:我们有较强的本体结构设计和运控算法,但很难让机器人真正“用脑思考”,自主与物理世界交互,进而带来创造生产力的可能。但现在,中国具身智能模型已经与海外顶级模型同台共舞。

更有意思的是,自变量和pi高度默契地选择将模型开源。看似偶然的战略趋同,实则是具身智能产业发展到关键阶段的必然选择。

wKgZPGlhzsmAP6CxAAGCvmmFN4U293.jpg

在RoboChallenge的最新测试中,自变量WALL-OSS展现了极强的竞技状态,总分位居第二,超越了明星模型pi0。在叠洗碗巾、按按钮、浇盆栽等多个任务中,WALL-OSS的得分摘得桂冠,排名第一。

wKgZO2lhzsqADa6OAACrKza8f84340.jpg

先来划个重点。

RoboChallenge的测试或许更像是一场“开卷考试”,因为数十个桌面任务与场景都是预知的。这就相当于提前布置考题。

而WALL-OSS作为开源模型,某种程度上相当于明牌上场,其每一步操作都真实可见为模型驱动,更多的意义在于给出解题思路,“进一步展示模型的真实性能”。

与用闭源模型参与测评的“黑箱”,不知任务究竟如何完成不同,WALL-OSS作为开源模型,其一举一动相当于“明牌”炸场,换句话说其核心能力均可通过公开的代码和参数得到完整解释和复现,其在榜单上的成绩完全是模型真实能力的直接体现,是无法掺水,难以被“操作”的硬核实力证明。

从技术细节来看,WALL-OSS取得优异成绩的核心在于对“端到端”架构的深度重构:

它依托创新的混合专家(MoE)架构及“共享注意力+专家分流”设计,有效解决了视觉语言模型向具身模型迁移时的“灾难性遗忘”与“模态解耦”难题;

通过“先离散、后连续、再联合”的三阶段训练范式,消除了“认知与动作脱节”的痛点,使模型能精准掌控如浇盆栽时的动作力度;

此外,其内化的跨层级思维链推理能力,实现了高层决策与底层执行的无缝切换,使其在面对各类突发状况时,仍能精准控制关节完成复杂任务。

有个小插曲,WALL-OSS去年9月开源,与Physical Intelligence开源pi0.5相错一天,这也侧面说明了自变量的技术步调一直与国际头部具身大脑公司同频。而今天自变量与Physical Intelligence的模型又在榜单前排聚首,更说明自变量已经站稳了全球第一梯队。

wKgZO2lhzsuAWROOAAFa96eznY4097.jpg

开源之所以重要,在于生态建设,其价值最终体现在生态的繁荣之上。

自变量认为,在具身智能这一软硬件深度耦合的前沿领域,构建一个高质量的开源基础模型底座,是加速整个行业生态繁荣的坚实“地基”,也是实现机器人在物理世界大规模、稳定交互的关键。

当前,机器人模型的验证链路冗长,行业里专用小模型、通用大模型质量参差不齐,基础模型、专用模型、微调模型混杂,且缺乏统一的评价标准。开源是拨开迷雾、推动行业标准化和成熟化的必由之路。

在《硅谷101播客》中,自变量联合创始人兼CTO王昊曾说:“我一直都觉得开源是非常重要的事情,开源意味着我们可以站在巨人的肩膀上继续前进。我们可以基于已有成果做更多的改进,社区开发者的反馈也会帮助到开源的公司,开源公司可以从中吸取到经验,然后把这个技术路线思考得更加深入。”

自变量开源的WALL-OSS正是秉承这种“提供肩膀”的开源理念,所以他们选择更为彻底的开放:不仅开放了预训练模型权重、完整训练代码和数据集接口,甚至还提供了详尽的部署文档。

除了构建行业繁荣生态之外,“站在巨人肩膀上”还在于避免行业陷入重复性研发的低效困境——无需每个企业、每个研究者都从零开始“一手手自建高楼”,而是可以基于开源的基础模型快速迭代创新,将更多精力投入到差异化技术研发与场景化应用落地中,大幅提升整个行业的创新效率。

黄仁勋也曾直白说过,“开源如此重要的原因,在于没有开源初创企业不能蓬勃发展,大学研究人员不能做研究,科学家不能使用人工智能。基本上,你的经济没有能力从根本上提升自己”。这不仅适用于AI,对于具身智能和任何技术来说都是如此。

事实上,技术革命的背后就是一场技术大规模应用并改变生产方式的过程。如果没有应用也就把技术困厄于象牙塔,无法激起涟漪。

如自变量所说“拥抱开源,以透明对抗虚假,以协作代替闭门造车”,具身行业这条厚雪长坡上,需要的是明灯而非迷雾,众人拾柴而非孤芳自赏。而开源,正是那盏能够照亮前路、汇聚众力的灯。

wKgZPGlhzsyAWw7NAAHbjLhDQDU632.jpg

审核编辑 黄宇

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • AI
    AI
    +关注

    关注

    91

    文章

    41115

    浏览量

    302606
  • 开源
    +关注

    关注

    3

    文章

    4346

    浏览量

    46442
  • 模型
    +关注

    关注

    1

    文章

    3818

    浏览量

    52269
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    天数智芯Day 0适配MiniMax最新开源M2.7大模型

      4月12 日,MiniMax 最新开源 M2.7 大模型正式发布,凭借自主迭代能力与优异的工程、办公性能引发行业关注。天数智芯与FlagOS 统一开源技术栈合作实现Day0落地,在
    的头像 发表于 04-15 15:42 782次阅读

    MiniMax M2.7全球开源,摩尔线程、沐曦等完成Day0适配

    厂商、推理平台已完成Day0适配,即在开源首日已经完成模型接入与推理适配工作。   MiniMax介绍,三周前MiniMax M2.7率先上线,开启了模型自我进化,是业界第一个AI深度
    的头像 发表于 04-14 11:05 1726次阅读

    天数智芯通用GPU产品Day 0适配GLM-5.1开源模型

    的重磅开源,不仅刷新了全球开源模型的智能上限,更与天数智芯Day 0原生适配能力深度联动,让这款“能独立工作8小时”的旗舰模型,在天数打造的
    的头像 发表于 04-08 17:14 692次阅读

    高德全量开源具身操作基座模型ABot-M0

    近日,高德宣布正式全量开源ABot-M0——全球首个基于统一架构的机器人具身操作基座模型,可实现一个“通用大脑”适配多种形态的具身机器人。
    的头像 发表于 04-01 16:00 686次阅读
    高德全量<b class='flag-5'>开源</b>具身操作基座<b class='flag-5'>模型</b>ABot-M<b class='flag-5'>0</b>

    Banana Pi开源社区开源产品系列规格(2026年产品画册)

    Banana Pi开源社区开源产品系列规格(2026年产品画册)
    的头像 发表于 03-31 09:10 732次阅读
    Banana <b class='flag-5'>Pi</b><b class='flag-5'>开源</b>社区<b class='flag-5'>开源</b>产品系列规格(2026年产品画册)

    NVIDIA Jetson模型赋能AI在边缘端落地

    开源生成式 AI 模型不再局限于数据中心,而是开始深入到现实世界的各种机器中。从 Orin 到 Thor,NVIDIA Jetson 系列正在成为运行 NVIDIA Nemotron、Cosmos
    的头像 发表于 03-16 16:27 645次阅读
    NVIDIA Jetson<b class='flag-5'>模型</b>赋能AI在边缘端落地

    大晓机器人开源空间智能通用模型ACE-Brain-0

    近日,大晓机器人联合上海交通大学、南洋理工大学、香港中文大学、香港大学等研究机构共同推出以空间智能为底层框架、跨不同具身本体的通用基础模型“ACE-Brain-0”,正式面向全行业开源
    的头像 发表于 03-11 13:45 363次阅读
    大晓机器人<b class='flag-5'>开源</b>空间智能通用<b class='flag-5'>模型</b>ACE-Brain-<b class='flag-5'>0</b>

    地平线正式开源HoloBrain VLA基座模型

    2月13日,地平线正式宣布其HoloBrain-0基座模型及框架全面开源。本次开源不仅包括HoloBrain-0核心算法,地平线同步开放完整
    的头像 发表于 02-26 10:05 475次阅读
    地平线正式<b class='flag-5'>开源</b>HoloBrain VLA基座<b class='flag-5'>模型</b>

    华为昇腾深度适配智谱AI全新开源模型GLM-5

    ,在真实编程场景的使用体验逼近Claude Opus 4.5,更擅长复杂系统工程与长程Agent任务。昇腾一直同步支持智谱GLM系列模型,此次GLM-5模型一经开源发布,昇腾AI基础软硬件即实现
    的头像 发表于 02-25 14:41 1344次阅读
    华为昇腾深度适配智谱AI全新<b class='flag-5'>开源</b><b class='flag-5'>模型</b>GLM-5

    商汤科技正式开源多模态自主推理模型SenseNova-MARS

    今日,商汤正式开源多模态自主推理模型 SenseNova-MARS(8B/32B 双版本),其在多模态搜索与推理的核心基准测试中以 69.74 分超越Gemini-3-Pro(69.06 分)、GPT-5.2(67.64 分)。
    的头像 发表于 01-30 10:13 786次阅读
    商汤科技正式<b class='flag-5'>开源</b>多模态自主推理<b class='flag-5'>模型</b>SenseNova-MARS

    NVIDIA开源Audio2Face模型及SDK

    NVIDIA 现已开源 Audio2Face 模型与 SDK,让所有游戏和 3D 应用开发者都可以构建并部署带有先进动画的高精度角色。NVIDIA 开源 Audio2Face 的训练框架,任何人都可以针对特定用例对现有
    的头像 发表于 10-21 11:11 1021次阅读
    NVIDIA<b class='flag-5'>开源</b>Audio2Face<b class='flag-5'>模型</b>及SDK

    开源模型算力革命下:电子谷连接技术的坚守与未来

    随着开源模型参数规模迈入万亿级时代,算力基础设施正面临前所未有的挑战。2025年以来,DeepSeekR1、Qwen2.5-72B等开源模型在核心任务上的表现已
    的头像 发表于 09-19 08:03 629次阅读
    <b class='flag-5'>开源</b>大<b class='flag-5'>模型</b>算力革命下:电子谷连接技术的坚守与未来

    硬件与应用同频共振,英特尔Day 0适配腾讯开源混元大模型

    今日,腾讯正式发布新一代混元开源大语言模型。英特尔凭借在人工智能领域的全栈技术布局,现已在英特尔® 酷睿™ Ultra 平台上完成针对该模型的第零日(Day 0)部署与性能优化。值得一
    的头像 发表于 08-07 14:42 1536次阅读
    硬件与应用同频共振,英特尔Day <b class='flag-5'>0</b>适配腾讯<b class='flag-5'>开源</b>混元大<b class='flag-5'>模型</b>

    华为正式开源盘古7B稠密和72B混合专家模型

    [中国,深圳,2025年6月30日] 今日,华为正式宣布开源盘古70亿参数的稠密模型、盘古Pro MoE 720亿参数的混合专家模型和基于昇腾的模型推理技术。 此举是华为践行昇腾生态战
    的头像 发表于 06-30 11:19 1444次阅读

    上新:小米首个推理大模型开源 马斯克:下周推出Grok 3.5

    开源新一代通义千问模型Qwen3。据悉,Qwen3模型参数量仅为DeepSeek - R1的1/3,能够大幅降低成本,而且性能全面超越R1、OpenAI - o1等全球顶尖
    的头像 发表于 04-30 16:08 1503次阅读