0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

面壁小钢炮模型MiniCPM4.0发布,端侧智能更进一步

Carol Li 来源:电子发烧友 作者:李弯弯 2025-06-08 08:18 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群



电子发烧友网报道(文/李弯弯)2025年6月6日,面壁智能CEO李大海在北京智源大会上发布有史以来最具想象力的面壁小钢炮模型MiniCPM4.0,代号“前进四”,开源两个版本,8B闪电稀疏版和0.5B最强小小钢炮。





李大海表示,面壁智能是第一个把全模态模型带到端侧的公司。面壁智能小钢炮,旨在把大模型放到离用户最近的地方,做高效的端侧智能。

MiniCPM4.0最大的特点——快

2019年面壁智能超前入局大模型,发布世界首个知识增强大模型ERNE,2020年发布国内首个中文大模型CPM-1,2021年发布持续学习发模型CPM-2,2022年发布可控生成大模型CPM-3;2023年,面壁智能又发布CPM-Bee多语言百亿大模型,之后还发布了第三代千亿参数多模态大模型CPM-Cricket,评分超越GPT-3.5,逻辑能力比肩GPT-4。

2024年面壁智能领先走向端侧智能。2月发布MiniCPM-2B旗舰级端侧模型;4月发布MiniCPM 2.0;9月发布MiniCPM-V 2.6,在端侧性能实现全面对标 GPT-4V;12月发布MiniCPM 3.0,在包括自然语言理解、知识、代码、数学等多项能力上超越OpenAI的 GPT-3.5;2025年1月,面壁智能发布MiniCPM-o 2.6端侧全模态模型,性能比肩GPT-4o;2025年3月发布cpmGO,首个纯端侧智能体助手。



李大海介绍,面壁智能端侧大模型面壁小钢炮包括基座模型MiniCPM、旗舰多模态模型MiniCPM-V、旗舰全模态模型MiniCPM-o。截至目前,面壁小钢炮旗舰端侧大模型有超过1000万下载量。李大海表示:“这是千千万万开发者对我们的认可,未来还会持续发布更好的端侧大模型,赋能智能硬件的创新和开发。”



“这次发布的面壁小钢炮模型MiniCPM4.0版本,最大的特点就是快。”李大海谈到,“相比其他模型,MiniCPM4.0-8B仅22%训练开销,在同等参数下,性能更强,可对标Qwen3-8B,超越Gemma3-12B。”

MiniCPM4-MCP支持15个主流应用,包括Airbnb、Github mcp、Slack、PPTs、PowerPoint、office-Word-Mcp-Server、Computer Use、Desktop-commander、File_system、OpenAI Whisper等;MiniCPM4-Survey端侧版表现比肩DeepResearch。



面壁小钢炮正在进行广泛的生态适配,适配主流芯片与开源框架部署,芯片如括华为、英特尔联发科高通;开源框架如LLM、LlamaFactory、AutoGPT、SGland等。李大海强调,依托分块稀疏注意力机制,MiniCPM4.0在英特尔平台上推理深度优化实现两倍加速。

多维度技术创新——架构高效、推理高效

MiniCPM4.0之所以能够做到又快又好,源于系统级层层效率优化,包括四个层面:架构高效、推理高效、学习高效、数据高效。



架构高效方面,MiniCPM4.0采用InfLLM升级版InfLLM 2.0稀疏注意力结构。李大海介绍说,稀疏度越高,计算量越小,速度越快。传统Transformer模型每token需和序列中所有token进行相关性计算逐字重复计算,效率低下。InfLLM 稀疏注意力机制,对文本分块分区域处理,只对最具相关性重点区城进行注意力计算“抽查”,更高效。

而且MiniCPM4.0采用高效双频换挡,即长文本用稀疏,短文本用稠密。



推理高效方面,面壁智能自研全套端侧高性能推理框架。CPM.cu自研极速端侧推理框架,稀疏、投机和量化的高效结合,FR-Spec轻量化投机采样,并给小模型减负加速,使得速度提升5倍;BitCPM极致低位宽量化,端侧极致内存容量友好,4-bit量化达业界SOTA等级,瘦身90%;Arklnfer自研跨平台部署框架,面向多平台端侧芯片极致优化,跨平台高效投机采样和限制解码,端侧多平台 ModelZoo丝滑使用,速度提升2倍。

李大海表示,与云端不同,云端多采用英伟达、昇腾的芯片,而端侧较为复杂,这种跨平台部署框架对于大模型端侧部署来说就极为重要。在他看来,面壁智能新带来的面壁小钢炮模型MiniCPM4.0,在多项技术的加持下,使用更少的数据,需要更少的训练、更少的算力,因而成本也会下降,这有助于大模型能在更多场景实现落地。


声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 模型
    +关注

    关注

    1

    文章

    3882

    浏览量

    52374
  • 云模型
    +关注

    关注

    0

    文章

    10

    浏览量

    7132
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    AI的大模型时代,从面壁智能开始

    模型落地难,面壁智能开源了个答案
    的头像 发表于 05-26 10:34 1437次阅读
    <b class='flag-5'>端</b><b class='flag-5'>侧</b>AI的大<b class='flag-5'>模型</b>时代,从<b class='flag-5'>面壁</b><b class='flag-5'>智能</b>开始

    面壁智能发布MiniCPM-V 4.6:1.3B参数登顶全球同尺寸榜首

    近日,面壁智能联合清华大学、OpenBMB开源社区正式发布并开源新多模态大
    的头像 发表于 05-14 10:11 713次阅读

    面壁智能与安波福达成战略合作,AI座舱方案走向全球市场

    第十九届北京国际汽车展览会期间,北京面壁智能科技有限责任公司(以下简称"面壁智能")与安波福(中国)科技研发有限公司(以下简称"安波福")正式签署战略合作框架协议。双方将围绕
    的头像 发表于 04-30 11:55 178次阅读
    <b class='flag-5'>面壁</b><b class='flag-5'>智能</b>与安波福达成战略合作,<b class='flag-5'>端</b><b class='flag-5'>侧</b>AI座舱方案走向全球市场

    如何进一步从SPI NOR闪存启动电路板?

    稳定性。 根据 T2080 快速入门指南文档,DIP 设置设置为 JTAG 的硬编码 RCW,并且能够使用 CCS 读取硬编码的 RCW 值。 如何进一步从 SPI NOR 闪存启动电路板
    发表于 04-16 08:51

    炬芯科技AI音频芯片ATS362X荣获2026中国IC设计成就奖

    “2026中国IC设计成就奖-年度SoC/ASIC”。这不仅彰显了炬芯科技强劲的技术创新力,更进一步夯实了其在专业音频芯片领域的全球领先地位。
    的头像 发表于 04-03 17:42 1315次阅读

    中科曙光组合拳让AI落地快人一步

    全球首款无线缆箱式超节点scaleX40发布后,中科曙光进一步推出SothisAI 3.1全链路AI开发平台与高端计算OpenClaw智能体解决方案。三者形成合力:scaleX40筑牢算力基石,SothisAI承担开发与调度中枢
    的头像 发表于 03-31 14:44 580次阅读
    中科曙光组合拳让AI落地快人<b class='flag-5'>一步</b>

    百度萝卜快跑与Uber进一步深化战略合作

    今天,萝卜快跑与全球最大的移动出行服务平台Uber共同宣布,双方将进一步深化战略合作,计划于2026年第季度在阿联酋迪拜正式推出全无人驾驶出行服务,这也是迪拜首次迎来全无人驾驶出行服务。
    的头像 发表于 02-11 16:50 1475次阅读

    众智FlagOS适配面壁智能开源全模态大模型MiniCPM-o 4.5

    2月3日,面壁智能正式发布并开源了集语言、视觉、语音于体的全模态大模型 MiniCPM-o 4
    的头像 发表于 02-09 14:45 1115次阅读
    众智FlagOS适配<b class='flag-5'>面壁</b><b class='flag-5'>智能</b>开源全模态大<b class='flag-5'>模型</b><b class='flag-5'>MiniCPM</b>-o 4.5

    马斯克官宣干电极工艺量产,固态电池更进一步

    行业芯事行业资讯
    电子发烧友网官方
    发布于 :2026年02月03日 11:51:36

    BlackBerry QNX与众森软件进一步深化战略合作

    今日,深圳市众森软件有限公司(以下简称"众森软件")正式宣布与全球领先的实时操作系统与嵌入式软件供应商 QNX(BlackBerry有限公司旗下部门QNX)进一步深化战略合作。此次合作将进一步推动下
    的头像 发表于 12-04 16:40 2201次阅读

    上汽奥迪与创维汽车智能合作进一步深化升级

    近日,创维汽车智能迎来重要突破:上汽奥迪客户将当前公司开发的显示屏项目沿用至上汽奥迪其他主力车型。这决定不仅体现了客户对创维汽车智能技术实力与服务品质的高度认可,更标志着双方合作进一步
    的头像 发表于 11-25 10:32 968次阅读

    广和通发布情感对话大模型FiboEmo-LLM

    9月,广和通正式发布自主研发的情感对话大模型FiboEmo-LLM。该模型专注于情感计算与自然语言交互融合,致力于为AI玩具、
    的头像 发表于 09-26 13:37 2134次阅读

    蔚来进一步拓展其全球业务

    8月18日,蔚来公司宣布将于2025年至2026年期间陆续进入新加坡、乌兹别克斯坦和哥斯达黎加三个市场,进一步拓展其全球业务,为当地用户带来创新、可持续、高品质的智能电动出行体验。
    的头像 发表于 08-20 17:00 1578次阅读

    Nordic PMIC全家桶,让电源管理和节能更进一步

    使用 nPM2100 开始设计和开发应用。此外,nPM2100 评估套件 (EK) 也已全面上市,多家分销商在发布当天提供库存套件并进行销售。 nPM2100 是款电源管理集成电路 (PMIC),旨在
    发表于 06-29 17:19

    恩智浦技术赋能下代家庭能源管理系统

    2024年11月发布了Matter 1.4版本,其中大亮点是它极大地扩展了对家庭能源管理系统 (HEMS) 的支持。Matter 1.3引入了能源报告功能,实现大型家电和供电设备能源管理用例,而Matter 1.4则更进一步
    的头像 发表于 06-10 09:34 1516次阅读