0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

面壁智能联合清华、OpenBMB开源BitCPM-CANN

科技绿洲 2026-05-26 10:57 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

近日,面壁智能正式宣布联合清华大学、OpenBMB开源社区,发布并开源其在低比特大模型训练方向的最新成果——BitCPM-CANN。这是中国首个完全基于国产算力平台华为昇腾实现端到端训练并开源的三值(1.58-bit)大模型,也是全球首个基于昇腾CANN架构完成训练的1.58-bit精度大模型。该模型于5月23日在华为鲲鹏昇腾开发者大会(KADC 2026)上完成首次技术亮相后,现已将全系列模型向全社会正式开放。

BitCPM-CANN的核心突破在于将模型权重从传统的BF16(16-bit浮点)精度压缩至1.58-bit三值精度。所谓三值,即模型参数仅取三个离散值,以极低的比特宽度承载原本需要16-bit才能表达的信息。这种极致压缩带来的直接收益是惊人的:在推理阶段,BitCPM-CANN相比传统BF16精度可释放约6倍的显存红利,而模型能力保留率依然维持在90%至97.2%的高水平。换句话说,同样的设备显存,现在可以承载远超以往的模型能力;或者反过来,同样的模型能力在同一款终端上运行,只需要过去六分之一的内存。

这一数字背后的产业意义不言而喻。当前端侧大模型的最大瓶颈之一就是内存。手机SoC的内存资源有限,想要在端侧运行大参数模型,要么牺牲模型能力,要么依赖云端推理。BitCPM-CANN的出现,直接将这道 wall 推倒了。面壁智能透露,基于1.58-bit的极致压缩,未来有望在手机上运行60B参数量级的大模型,这意味着手机的端侧智能将迎来一次质的飞跃,复杂的推理、长文本理解、多轮对话等能力都可以在本地完成,无需联网,隐私更安全,响应更迅速。

值得特别强调的是,BitCPM-CANN并非在英伟达GPU上训练后再迁移至昇腾平台的"移植方案",而是从训练到推理全链路基于华为昇腾CANN架构原生完成。训练阶段即在昇腾算力上以1.58-bit精度进行端到端优化,这确保了模型与国产硬件的深度耦合,避免了跨平台迁移带来的精度损失和性能退化。在当前中美科技博弈持续深化、国产算力自主可控需求日益迫切的大背景下,这一"全栈国产"的技术路径具有极强的战略示范意义。

在开源生态方面,BitCPM-CANN由面壁智能、清华大学与OpenBMB开源社区三方联合推出。OpenBMB作为国内最具影响力的大模型开源社区之一,此前已开源了CPM系列等多款广受欢迎的模型。此次三方合作,不仅将模型权重和训练代码全面开放,还提供了基于CANN的完整推理部署方案,开发者可以直接在昇腾硬件上进行模型加载、微调与部署,大幅降低了国产算力上运行低比特大模型的技术门槛。

从技术路线来看,BitCPM-CANN所代表的1.58-bit三值化方向,正成为大模型压缩领域最前沿的探索之一。相比业界常见的INT8或INT4量化方案,三值精度在压缩比与能力保留率之间取得了更优的平衡。面壁智能此前已在模型小型化和端侧部署方面积累了深厚的技术底蕴,其CPM系列模型长期位居开源榜单前列。BitCPM-CANN的发布,标志着面壁智能在低比特训练这一前沿方向上再次迈出了关键一步,也为整个国产大模型生态在端侧落地提供了一条清晰可行的技术路径。

AI终端爆发的当下,端侧大模型的竞争力正在从"能不能跑"转向"能跑多大、跑多快、跑多省"。BitCPM-CANN以1.58-bit的极致压缩和全栈国产的技术底座,给出了一个极具说服力的答案。当60B大模型有望在手机上本地运行的那一天真正到来,端侧AI的想象力将被彻底改写。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • gpu
    gpu
    +关注

    关注

    28

    文章

    5328

    浏览量

    136219
  • 内存
    +关注

    关注

    9

    文章

    3259

    浏览量

    76600
  • 昇腾
    +关注

    关注

    1

    文章

    191

    浏览量

    7572
  • 开源社区
    +关注

    关注

    1

    文章

    97

    浏览量

    829
  • 大模型
    +关注

    关注

    2

    文章

    3867

    浏览量

    5299
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    面壁智能发布MiniCPM-V 4.6:1.3B参数登顶全球同尺寸榜首

    近日,面壁智能联合清华大学、OpenBMB开源社区正式发布并
    的头像 发表于 05-14 10:11 615次阅读

    面壁智能与安波福达成战略合作,端侧AI座舱方案走向全球市场

    第十九届北京国际汽车展览会期间,北京面壁智能科技有限责任公司(以下简称"面壁智能")与安波福(中国)科技研发有限公司(以下简称"安波福")正式签署战略合作框架协议。双方将围绕端侧大模型
    的头像 发表于 04-30 11:55 156次阅读
    <b class='flag-5'>面壁</b><b class='flag-5'>智能</b>与安波福达成战略合作,端侧AI座舱方案走向全球市场

    沐曦股份联合清华大学发布磁性材料AI原子基座模型

    2月27日,沐曦股份联合清华大学等多家研究机构联合发布了磁性材料AI原子基座模型。该模型是首个覆盖宽温压域的磁性材料AI原子模型,经权威专家鉴定,整体技术水平达到国际领先。
    的头像 发表于 03-03 15:25 680次阅读
    沐曦股份<b class='flag-5'>联合</b><b class='flag-5'>清华</b>大学发布磁性材料AI原子基座模型

    清华学子走进拓维,零距离感受“AI×鸿蒙”前沿创新!

    IT科技领域的战略布局、产品技术创新与行业实践,近距离感受人工智能开源鸿蒙等前沿技术驱动发展跃迁的澎湃动力。活动期间,清华大学学子一行深度探访拓维数字化体验中心
    的头像 发表于 02-12 15:33 2660次阅读
    <b class='flag-5'>清华</b>学子走进拓维,零距离感受“AI×鸿蒙”前沿创新!

    众智FlagOS适配面壁智能开源全模态大模型MiniCPM-o 4.5

    2月3日,面壁智能正式发布并开源了集语言、视觉、语音于一体的全模态大模型 MiniCPM-o 4.5。作为首个全双工全模态大模型,MiniCPM-o 4.5 首次实现“类人”感知交互,从“一问一答”变为“即时自由对话”。
    的头像 发表于 02-09 14:45 1102次阅读
    众智FlagOS适配<b class='flag-5'>面壁</b><b class='flag-5'>智能开源</b>全模态大模型MiniCPM-o 4.5

    中兴通讯联合发布供应链智能技术应用白皮书

    近日,中兴通讯联合清华大学、德勤共同编写的《供应链智能技术应用白皮书》(以下简称《白皮书》)正式发布。
    的头像 发表于 12-09 11:31 964次阅读

    悟空图像与华为CANN正式落地PC端AI闪绘功能

    近日,基于华为CANN(Compute Architecture for Neural Networks)端云协同架构打造的华为PC端AI闪绘功能正式落地,标志着端侧AI大模型应用迈入新阶段。
    的头像 发表于 11-10 14:43 1123次阅读

    【置顶公告】视美泰开源鸿蒙系列产品业务咨询与商务合作通道正式开启!

    尊敬的电子发烧友社区成员、合作伙伴及行业同仁: 视美泰作为开源鸿蒙(OpenHarmony)生态的积极推动者,始终致力于为行业提供高性能、高可靠性的智能硬件解决方案及生态赋能服务。为进一步深化
    发表于 10-20 16:23

    华为宣布CANN全面开源开放

    今天,昇腾计算产业发展峰会在北京召开。来自AI领军企业、伙伴、高校与科研机构的代表共同探讨了如何更好地构建开源开放的昇腾生态,加速AI创新和发展。
    的头像 发表于 08-11 11:04 1264次阅读

    华为CANN与智谱GLM端侧模型完成适配

    2025年8月5日,在昇腾计算产业发展峰会上,华为宣布CANN(Compute Architecture for Neural Networks)技术体系及Mind系列工具链全面开源开放。此前,智谱
    的头像 发表于 08-11 11:00 2869次阅读

    正面迎战英伟达CUDA,华为宣布CANN全面开源

    8月5日,在北京举行的昇腾计算产业发展峰会上,华为轮值董事长徐直军宣布,升腾 AI 核心软件平台 CANN 将全面开源,同时还将Mind 系列应用软件及工具链同步开放,包括Mindstudio
    的头像 发表于 08-06 14:34 1w次阅读
    正面迎战英伟达CUDA,华为宣布<b class='flag-5'>CANN</b>全面<b class='flag-5'>开源</b>

    开源欧拉社区AI联合工作组正式成立

    智能设备及云边端协同等前沿实践。现场还详细解读了开源欧拉24.03 LTS SP2的技术特性并分享实践案例,同时正式宣布成立开源欧拉社区AI联合工作组,旨在推动构建基于
    的头像 发表于 07-28 17:20 1503次阅读

    清华经管学院PE产业投资家莅临谷东智能参观交流

    近日,清华大学经济管理学院私募股权(PE)产业投资家项目师生一行20余人,在清华经管学院教授、清华私募股权研究院院长肖星带领下,莅临谷东智能进行深度参观交流。谷东
    的头像 发表于 06-26 16:58 1220次阅读

    开源智联·具身同行:机智云推出基于豆包的 OpenEmbodied AI技术、产品及开源方案

    6月11日机智云携手火山引擎、扣子发起,联合CSDN、GitCode、广和通、奕斯伟、爱湾学院举办的“开源智联·具身同行”字节豆包AIoT开源生态沙龙圆满成功,正式推出基于豆包
    的头像 发表于 06-13 19:19 1406次阅读
    <b class='flag-5'>开源</b>智联·具身同行:机智云推出基于豆包的 OpenEmbodied AI技术、产品及<b class='flag-5'>开源</b>方案

    面壁小钢炮模型MiniCPM4.0发布,端侧智能更进一步

      电子发烧友网报道(文/李弯弯)2025年6月6日,面壁智能CEO李大海在北京智源大会上发布有史以来最具想象力的面壁小钢炮模型MiniCPM4.0,代号“前进四”,开源两个版本,8B
    的头像 发表于 06-08 08:18 7599次阅读
    <b class='flag-5'>面壁</b>小钢炮模型MiniCPM4.0发布,端侧<b class='flag-5'>智能</b>更进一步