0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

0.7元/百万token碾压竞品! 小米新开源大模型,卷出AI普惠关键密码

章鹰观察 来源:电子发烧友网 作者:章鹰 2025-12-21 07:52 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

(电子发烧友网报道 文/ 章鹰)12月17日,2025小米人车家全生态合作伙伴大会举行,小米MiMo大模型负责人罗福莉首次登场,她解读小米最新开源大模型MiMo-V2-Flash,抛出“全球开源模型Top2”“推理成本仅为标杆模型2.5%”等重磅信息。

wKgZO2lFIKmAfaFdAAa2E25RUaY801.png

截至2025年12月19日,小米发布的 MiMo-V2-Flash、深度求索(DeepSeek)的 DeepSeek-V3.2,以及阿里巴巴的 Qwen-3均为当前国产大模型中的代表性产品。在与DeepSeek V3.2、千问Qwen-3对比当中,小米开源大模型到底有哪些优势和应用价值?本文进行详细分析。

全球开源模型Top2,主打超绝性价比

MiMo-V2-Flash是小米全新一代面向Agent的基座模型,总参数309B,激活参数15B,支持256k上下文窗口,整体针对推理、编码和Agent场景构建,支持混合思维模式,允许用户切换“思考”和即时回答模式。

目前,MiMo-V2-Flash推理吞吐速度为每秒150个token,成本定价0.7元/每百万输入token,2.1元/每百万输出token,主打超绝性价比。

在架构设计上,小米MiMo-V2-Flash采用了混合注意力机制。其混合模块设计包含8个混合块,其中每5个滑动窗口注意力(SWA)层对应1个全局注意力层。在上下文支持能力上,该模型原生支持32K的训练,并且能够扩展到256K的上下文支持。

从性能表现来看,小米MiMo-V2-Flash在通用基准测试中,与DeepSeek-V3.2不相上下,同时延迟大幅降低。在SWE-Bench验证和多语言集中分别取得了73.4%和71.7%的成绩。尤为突出的是其速度优势,在Day-0时,输出速度高达每秒150个token,这一速度在同类模型中处于领先地位。

图来自小米官方微信

在多个Agent测评基准上,MiMo-V2-Flash进入全球开源模型Top 2;编码能力超过所有开源模型,比肩标杆闭源模型Claude 4.5 Sonnet,但推理成本仅为其2.5%,生成速度提升2倍。

小米MiMo-V2-Flash推理效率高,来源两大创新

罗福莉指出,我们要围绕极致的推理效率去重新设计模型结构。模型结构主要源自两大创新:一、模型注意力机制采用了Hybrid Sliding Window Attention(Hybrid SWA/混合滑动窗口注意力机制),其中SWA与Full Attention(全局注意力机制)的比例是5:1,滑动窗口只看 128 个 token。相较于一些复杂的Linear Attention(线性注意力机制),SWA在兼顾长短文的推理、知识检索等方面更胜一筹。

二是在于MTP(Multi-Token Prediction)。罗福莉表示,团队在训练时加入了一层MTP层以提高基座模型能力,并在微调时也加入了更多MTP层,最终在推理时加入了3层MTP,以加速并行token验证的方式实现了2-2.6倍推理速度的提升。

还有,为了提高强化学习训练的稳定性,MiMo团队提出了一种叫做Multi-Teacher On-Policy Distillation(MOPD)的后训练范式。相较于传统SFT+RL(微调+强化学习)的后训练方式,它可以提供稠密的token level监督学习信号,以简单快速的方式获得各个专家模型的能力。

此外,小米并推出线上AI聊天服务“Xiaomi MiMO Studio”,用户可在其中体验“MiMo-V2-Flash”。

罗福莉在社交平台上透露了更多信息,MiMo-V2-Flash 已正式上线。这只是我们 AGI 路线图上的第二步。

小米发布MiMo-V2-Flash,不仅仅是一次大模型领域的技术创新,更是其“人车家全生态”战略的关键支点。该模型通过多项架构创新与成本优化,为 AI智能体(AI Agent)在终端设备上的落地提供了前所未有的赋能能力。

我们认为,MiMo-V2-Flash 不只是“一个更快的大模型”,而是小米打造 “终端原生智能体操作系统” 的基石。它有机会让每一台小米设备都可能成为一个 有记忆、会思考、能行动的智能体节点,最终助力实现雷军所说的“AI for All Devices, All the Time”。

本文由电子发烧友原创,转载请注明以上来源。微信号zy1052625525。需入群交流,请添加微信elecfans999,投稿爆料采访需求,请发邮箱zhangying@huaqiu.com。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 小米
    +关注

    关注

    70

    文章

    14559

    浏览量

    152749
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    运营商铺路,Token工厂造血:Token经济产业链迎来大爆发

    电子发烧友网综合报道 在人工智能飞速发展的今天,Token这个词正以前所未有的速度闯入大众视野。2026年3月,国家数据局正式将Token定名为词。   通俗来说,Token
    的头像 发表于 05-20 09:09 2036次阅读

    燧弘华创HonMaaS平台深度适配DeepSeek-V4大模型

    近日,DeepSeek 正式发布全新一代系列模型——DeepSeek-V4 预览版并全面开源,标志着大模型行业正式迈入百万级上下文
    的头像 发表于 05-06 14:55 416次阅读
    燧弘华创HonMaaS平台深度适配DeepSeek-V4大<b class='flag-5'>模型</b>

    华为云首发适配DeepSeek-V4模型

    4月24日,DeepSeek-V4模型正式发布并开源,华为云首发适配。DeepSeek-V4拥有百万Token超长上下文,在Agent能力、世界知识和推理性能上均实现国内与
    的头像 发表于 04-28 17:01 675次阅读

    天数智芯Day 0适配MiniMax最新开源M2.7大模型

      4月12 日,MiniMax 最新开源 M2.7 大模型正式发布,凭借自主迭代能力与优异的工程、办公性能引发行业关注。天数智芯与FlagOS 统一开源技术栈合作实现Day0落地,在模型
    的头像 发表于 04-15 15:42 1008次阅读

    Token中文新译名:「符」——一文七个维度讲清Token的本质定义

    拒绝“智”走私语义,七维拆解 Token 物理本质,定义 AI 时代唯一真名:「符」。
    的头像 发表于 03-27 15:23 847次阅读
    <b class='flag-5'>Token</b>中文新译名:「符<b class='flag-5'>元</b>」——一文七个维度讲清<b class='flag-5'>Token</b>的本质定义

    基于国科微 GK7206V1 芯片:视美泰“ AOV + 黑光 + AI模型”IPC 产品矩阵解决方案发布

    黑光AOV视觉处理芯片,重磅推出全新一代以AOV+黑光+全栈AI模型为核心的智能IPC解决方案。方案以芯片为底层算力底座,打造多规格PCBA模组矩阵,核心实
    的头像 发表于 03-20 17:03 1.5w次阅读
    基于国科微 GK7206V1 芯片:视美泰“ AOV + <b class='flag-5'>普</b><b class='flag-5'>惠</b>黑光 + <b class='flag-5'>AI</b>大<b class='flag-5'>模型</b>”IPC 产品矩阵解决方案发布

    NVIDIA推出代理式AI蓝图与电信推理模型

    借助全新开源大型电信模型与 NVIDIA Blueprint,电信运营商能够利用自有数据训练 AI 智能体,构建自主网络。
    的头像 发表于 03-06 17:37 3160次阅读

    数字电力帝国崛起:Token成为中国能源出口新载体

    成本碾压下的突围:Token出海改写全球AI服务格局
    的头像 发表于 03-06 16:30 1417次阅读
    数字电力帝国崛起:<b class='flag-5'>Token</b>成为中国能源出口新载体

    OrangePi RV2 深度技术评测:RISC-V AI融合架构的先行者

    推荐场景 RISC-V 架构研究与教学 :学习RISC-V 指令集、操作系统移植、编译器开发 轻量级AI 原型验证 :在端侧运行小模型(如关键词唤醒、简单图像分类) NAS/软路由 :利用双M.2 插槽
    发表于 03-03 20:19

    华为昇腾深度适配智谱AI新开源模型GLM-5

    2026年2月12日,智谱AI发布Agentic Engineering时代最好的开源模型GLM-5,从“写代码”到“写工程”的能力进一步演进。在Coding与Agent能力上取得开源
    的头像 发表于 02-25 14:41 1547次阅读
    华为昇腾深度适配智谱<b class='flag-5'>AI</b>全<b class='flag-5'>新开源</b><b class='flag-5'>模型</b>GLM-5

    使用NORDIC AI的好处

    CPU 快 15× 能效最高可比最近的 NPU 好 8×,推理速度快 7×。[Axon NPU 技术页] 开发门槛低、工具链完整 Nordic Edge AI Lab :只需准备好数据集,无需
    发表于 01-31 23:16

    月之暗面全新开源旗舰模型Kimi K2.5上线模力方舟

    模力方舟平台现已上线来自月之暗面(Moonshot AI)发布的全新开源旗舰模型Kimi K2.5。
    的头像 发表于 01-29 10:20 1371次阅读
    月之暗面全<b class='flag-5'>新开源</b>旗舰<b class='flag-5'>模型</b>Kimi K2.5上线模力方舟

    NVIDIA推出面向语言、机器人和生物学的全新开源AI技术

    NVIDIA 秉持对开源的长期承诺,推出了面向语言、机器人和生物学的全新开源 AI 技术,为构建开源生态系统做出贡献,扩展 AI 的普及并推
    的头像 发表于 11-06 11:49 1389次阅读

    澎峰科技完成OpenAI最新开源推理模型适配

    澎峰科技现已完成 OpenAI 最新开源推理模型 gpt-oss-20b 在 DeepFusion 大模型一体机上的原生适配与优化,用户可一键启用这颗“小而强悍”的新引擎,在本地享受企业级 A
    的头像 发表于 08-14 11:34 1652次阅读

    Arm率先适配腾讯混开源模型,助力端侧AI新开

    本周初,腾讯混宣布开源四款小尺寸模型(参数分别为 0.5B、1.8B、4B、7B),可无缝运行于消费级显卡上。作为全球应用范围最为广泛的计算平台,Arm 在开源首日就已率先实现适配,
    的头像 发表于 08-08 09:16 1642次阅读
    Arm率先适配腾讯混<b class='flag-5'>元</b><b class='flag-5'>开源</b><b class='flag-5'>模型</b>,助力端侧<b class='flag-5'>AI</b>创<b class='flag-5'>新开</b>发