电子发烧友网报道(文/李弯弯)2025年6月6日,面壁智能CEO李大海在北京智源大会上发布有史以来最具想象力的面壁小钢炮模型MiniCPM4.0,代号“前进四”,开源两个版本,8B闪电稀疏版和0.5B最强小小钢炮。

李大海表示,面壁智能是第一个把全模态模型带到端侧的公司。面壁智能小钢炮,旨在把大模型放到离用户最近的地方,做高效的端侧智能。
MiniCPM4.0最大的特点——快
2019年面壁智能超前入局大模型,发布世界首个知识增强大模型ERNE,2020年发布国内首个中文大模型CPM-1,2021年发布持续学习发模型CPM-2,2022年发布可控生成大模型CPM-3;2023年,面壁智能又发布CPM-Bee多语言百亿大模型,之后还发布了第三代千亿参数多模态大模型CPM-Cricket,评分超越GPT-3.5,逻辑能力比肩GPT-4。
2024年面壁智能领先走向端侧智能。2月发布MiniCPM-2B旗舰级端侧模型;4月发布MiniCPM 2.0;9月发布MiniCPM-V 2.6,在端侧性能实现全面对标 GPT-4V;12月发布MiniCPM 3.0,在包括自然语言理解、知识、代码、数学等多项能力上超越OpenAI的 GPT-3.5;2025年1月,面壁智能发布MiniCPM-o 2.6端侧全模态模型,性能比肩GPT-4o;2025年3月发布cpmGO,首个纯端侧智能体助手。

李大海介绍,面壁智能端侧大模型面壁小钢炮包括基座模型MiniCPM、旗舰多模态模型MiniCPM-V、旗舰全模态模型MiniCPM-o。截至目前,面壁小钢炮旗舰端侧大模型有超过1000万下载量。李大海表示:“这是千千万万开发者对我们的认可,未来还会持续发布更好的端侧大模型,赋能智能硬件的创新和开发。”

“这次发布的面壁小钢炮模型MiniCPM4.0版本,最大的特点就是快。”李大海谈到,“相比其他模型,MiniCPM4.0-8B仅22%训练开销,在同等参数下,性能更强,可对标Qwen3-8B,超越Gemma3-12B。”
MiniCPM4-MCP支持15个主流应用,包括Airbnb、Github mcp、Slack、PPTs、PowerPoint、office-Word-Mcp-Server、Computer Use、Desktop-commander、File_system、OpenAI Whisper等;MiniCPM4-Survey端侧版表现比肩DeepResearch。

面壁小钢炮正在进行广泛的生态适配,适配主流芯片与开源框架部署,芯片如括华为、英特尔、联发科、高通;开源框架如LLM、LlamaFactory、AutoGPT、SGland等。李大海强调,依托分块稀疏注意力机制,MiniCPM4.0在英特尔平台上推理深度优化实现两倍加速。
多维度技术创新——架构高效、推理高效
MiniCPM4.0之所以能够做到又快又好,源于系统级层层效率优化,包括四个层面:架构高效、推理高效、学习高效、数据高效。

架构高效方面,MiniCPM4.0采用InfLLM升级版InfLLM 2.0稀疏注意力结构。李大海介绍说,稀疏度越高,计算量越小,速度越快。传统Transformer模型每token需和序列中所有token进行相关性计算逐字重复计算,效率低下。InfLLM 稀疏注意力机制,对文本分块分区域处理,只对最具相关性重点区城进行注意力计算“抽查”,更高效。
而且MiniCPM4.0采用高效双频换挡,即长文本用稀疏,短文本用稠密。

推理高效方面,面壁智能自研全套端侧高性能推理框架。CPM.cu自研极速端侧推理框架,稀疏、投机和量化的高效结合,FR-Spec轻量化投机采样,并给小模型减负加速,使得速度提升5倍;BitCPM极致低位宽量化,端侧极致内存容量友好,4-bit量化达业界SOTA等级,瘦身90%;Arklnfer自研跨平台部署框架,面向多平台端侧芯片极致优化,跨平台高效投机采样和限制解码,端侧多平台 ModelZoo丝滑使用,速度提升2倍。
李大海表示,与云端不同,云端多采用英伟达、昇腾的芯片,而端侧较为复杂,这种跨平台部署框架对于大模型端侧部署来说就极为重要。在他看来,面壁智能新带来的面壁小钢炮模型MiniCPM4.0,在多项技术的加持下,使用更少的数据,需要更少的训练、更少的算力,因而成本也会下降,这有助于大模型能在更多场景实现落地。
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。
举报投诉
-
模型
+关注
关注
1文章
3648浏览量
51692 -
云模型
+关注
关注
0文章
10浏览量
7117
发布评论请先 登录
相关推荐
热点推荐
BlackBerry QNX与众森软件进一步深化战略合作
今日,深圳市众森软件有限公司(以下简称"众森软件")正式宣布与全球领先的实时操作系统与嵌入式软件供应商 QNX(BlackBerry有限公司旗下部门QNX)进一步深化战略合作。此次合作将进一步推动下一代
上汽奥迪与创维汽车智能合作进一步深化升级
近日,创维汽车智能迎来重要突破:上汽奥迪客户将当前公司开发的显示屏项目沿用至上汽奥迪其他主力车型。这一决定不仅体现了客户对创维汽车智能技术实力与服务品质的高度认可,更标志着双方合作进一步
广和通发布端侧情感对话大模型FiboEmo-LLM
9月,广和通正式发布自主研发的端侧情感对话大模型FiboEmo-LLM。该模型专注于情感计算与自然语言交互融合,致力于为AI玩具、
蔚来进一步拓展其全球业务
8月18日,蔚来公司宣布将于2025年至2026年期间陆续进入新加坡、乌兹别克斯坦和哥斯达黎加三个市场,进一步拓展其全球业务,为当地用户带来创新、可持续、高品质的智能电动出行体验。
端侧大模型迎来“轻”革命!移远通信 × RWKV 打造“轻量AI大脑”
(WAIC)首次亮相,标志着端侧大模型解决方案向更高性能、更广场景的应用迈出关键一步。RWKV(ReceptanceWeightedKeyValue)是全球领先的RN
Nordic PMIC全家桶,让电源管理和节能更进一步!
使用 nPM2100 开始设计和开发应用。此外,nPM2100 评估套件 (EK) 也已全面上市,多家分销商在发布当天提供库存套件并进行销售。
nPM2100 是一款电源管理集成电路 (PMIC),旨在
发表于 06-29 17:19
恩智浦技术赋能下一代家庭能源管理系统
2024年11月发布了Matter 1.4版本,其中一大亮点是它极大地扩展了对家庭能源管理系统 (HEMS) 的支持。Matter 1.3引入了能源报告功能,实现大型家电和供电设备能源管理用例,而Matter 1.4则更进一步,
CoT 数据集如何让大模型学会一步一步思考?
目前,大模型的回答路径基本遵循 input-output 的方式,在面对复杂任务时表现不佳。反之,人类会遵循一套有条理的思维流程,逐步推理得出正确答案。这种差异促使人们深入思考:如何才能让大模型“
英特尔与面壁智能宣布建立战略合作伙伴关系,共同研发端侧原生智能座舱,定义下一代车载AI
今日,英特尔与面壁智能签署合作备忘录。双方宣布达成战略级合作伙伴关系,旨在打造端侧原生智能座舱,定义下一代车载AI。目前,双方已合作推出“英
诚迈科技、智达诚远隆重推出ArraymoAIOS 2.0 端侧AI操作系统,开启智能体协作新时代
随着生成式AI技术的日益成熟,目前大模型正在从云侧向端云协同迁移。2025年,AI进一步加速向终端侧下沉,AI大模型将直接部署在各类终端设备
首创开源架构,天玑AI开发套件让端侧AI模型接入得心应手
AI巨头强强联手,势必为智能体化AI体验时代按下超级加速键。
AI终端的下一步是“普适智能”,而不是“极限性能”。联发科凭借天玑9400+强悍的端
发表于 04-13 19:52
广和通CES 2025发布Fibocom AI Stack,赋能千行百业端侧应用
近日盛大举行的国际消费电子产品展览会(CES 2025)上,广和通隆重发布了其创新的Fibocom AI Stack解决方案。这一方案的发布,标志着广和通在推动端

面壁小钢炮模型MiniCPM4.0发布,端侧智能更进一步
评论