0.7元/百万token碾压竞品! 小米新开源大模型，卷出AI普惠关键密码-电子发烧友网

（电子发烧友网报道文/ 章鹰）12月17日，2025小米人车家全生态合作伙伴大会举行，小米MiMo大模型负责人罗福莉首次登场，她解读小米最新开源大模型MiMo-V2-Flash，抛出“全球开源模型Top2”“推理成本仅为标杆模型2.5%”等重磅信息。

截至2025年12月19日，小米发布的 MiMo-V2-Flash、深度求索（DeepSeek）的 DeepSeek-V3.2，以及阿里巴巴的 Qwen-3均为当前国产大模型中的代表性产品。在与DeepSeek V3.2、千问Qwen-3对比当中，小米开源大模型到底有哪些优势和应用价值？本文进行详细分析。

全球开源模型Top2，主打超绝性价比

MiMo-V2-Flash是小米全新一代面向Agent的基座模型，总参数309B，激活参数15B，支持256k上下文窗口，整体针对推理、编码和Agent场景构建，支持混合思维模式，允许用户切换“思考”和即时回答模式。

目前，MiMo-V2-Flash推理吞吐速度为每秒150个token，成本定价0.7元/每百万输入token，2.1元/每百万输出token，主打超绝性价比。

在架构设计上，小米MiMo-V2-Flash采用了混合注意力机制。其混合模块设计包含8个混合块，其中每5个滑动窗口注意力（SWA）层对应1个全局注意力层。在上下文支持能力上，该模型原生支持32K的训练，并且能够扩展到256K的上下文支持。

从性能表现来看，小米MiMo-V2-Flash在通用基准测试中，与DeepSeek-V3.2不相上下，同时延迟大幅降低。在SWE-Bench验证和多语言集中分别取得了73.4%和71.7%的成绩。尤为突出的是其速度优势，在Day-0时，输出速度高达每秒150个token，这一速度在同类模型中处于领先地位。

图来自小米官方微信

在多个Agent测评基准上，MiMo-V2-Flash进入全球开源模型Top 2；编码能力超过所有开源模型，比肩标杆闭源模型Claude 4.5 Sonnet，但推理成本仅为其2.5%，生成速度提升2倍。

小米MiMo-V2-Flash推理效率高，来源两大创新

罗福莉指出，我们要围绕极致的推理效率去重新设计模型结构。模型结构主要源自两大创新：一、模型注意力机制采用了Hybrid Sliding Window Attention（Hybrid SWA/混合滑动窗口注意力机制），其中SWA与Full Attention（全局注意力机制）的比例是5:1，滑动窗口只看 128 个 token。相较于一些复杂的Linear Attention（线性注意力机制），SWA在兼顾长短文的推理、知识检索等方面更胜一筹。

二是在于MTP（Multi-Token Prediction）。罗福莉表示，团队在训练时加入了一层MTP层以提高基座模型能力，并在微调时也加入了更多MTP层，最终在推理时加入了3层MTP，以加速并行token验证的方式实现了2-2.6倍推理速度的提升。

还有，为了提高强化学习训练的稳定性，MiMo团队提出了一种叫做Multi-Teacher On-Policy Distillation（MOPD）的后训练范式。相较于传统SFT+RL（微调+强化学习）的后训练方式，它可以提供稠密的token level监督学习信号，以简单快速的方式获得各个专家模型的能力。

此外，小米并推出线上AI聊天服务“Xiaomi MiMO Studio”，用户可在其中体验“MiMo-V2-Flash”。

罗福莉在社交平台上透露了更多信息，MiMo-V2-Flash 已正式上线。这只是我们 AGI 路线图上的第二步。

小米发布MiMo-V2-Flash，不仅仅是一次大模型领域的技术创新，更是其“人车家全生态”战略的关键支点。该模型通过多项架构创新与成本优化，为 AI智能体（AI Agent）在终端设备上的落地提供了前所未有的赋能能力。

我们认为，MiMo-V2-Flash 不只是“一个更快的大模型”，而是小米打造 “终端原生智能体操作系统” 的基石。它有机会让每一台小米设备都可能成为一个有记忆、会思考、能行动的智能体节点，最终助力实现雷军所说的“AI for All Devices, All the Time”。

本文由电子发烧友原创，转载请注明以上来源。微信号zy1052625525。需入群交流，请添加微信elecfans999，投稿爆料采访需求，请发邮箱zhangying@huaqiu.com。

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

小米

小米

+关注

关注
70

文章
14560

浏览量
152749

搜索历史

0.7元/百万token碾压竞品! 小米新开源大模型，卷出AI普惠关键密码

评论