0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

MiniMax M3重磅发布

科技绿洲 2026-06-03 09:28 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

2026年6月1日,稀宇科技正式发布新一代旗舰大模型MiniMax M3。这款模型一次性点满"前沿Coding能力、1M超长上下文、原生多模态"三条科技树,成为目前全球唯一同时具备这三项核心能力的开源模型。在SWE-Bench Pro编程评测中,M3以59.0%的得分超过GPT-5.5和Gemini 3.1 Pro,逼近Claude Opus 4.7;在面向自主Agent的端到端评测Claw-Eval中更是拿下最高分。

长上下文的难点从来不是把参数写成1M,而是在1M token下仍然算得动、跑得快、找得准。传统Transformer的全注意力机制让每个query关注所有key,序列长度增长时计算量近似平方级上升。窗口从128K扩到1M,不是多买几张卡就能解决的问题。

MiniMax给出的答案是自研稀疏注意力架构MSA(MiniMax Sparse Attention)。其核心思路是:先快速扫描一遍,筛选出最重要的KV区块,只在这些区块上做精细计算,而非全量token两两交互。配合KV outer gather Q算子,使每块KV只读一次、访存更连续。

官方数据显示,在100万上下文下,M3单token计算量仅为上代模型的约1/20,prefilling阶段加速超过9倍,decoding阶段加速超过15倍,底层推理算子性能较主流开源方案提升4倍以上。这意味着百万上下文不再只是窗口参数,而是Agent可以真实使用的工作记忆。

M3不是"文本大模型+外接视觉编码器"的缝合方案,而是从训练第一步就采用文本、图片、视频多模态混合训练的原生模型。MiniMax特别强调了交错数据(Interleaved Data)的价值——文本与图像在序列中自然交替排列,对模型性能的提升比一般认为的更加关键。

重构整套数据管线后,M3的训练数据Token规模已推至100万亿量级。模型不仅支持图片与视频理解,还具备Computer Use能力,可在复杂跨应用环境中执行桌面操作。在多模态测试集OmniDocBench上,M3得分超过Gemini 3.1 Pro;在SVG-Bench图形生成评测中甚至超越了Opus 4.7。

M3在编程能力上的突破最具说服力。在SWE-Bench Pro上得分59.0%,超过GPT-5.5和Gemini 3.1 Pro,接近Opus 4.7。在BrowseComp智能体评测中以83.5分超越Opus 4.7的79.3分。

更值得关注的是两个极端实测。第一个:M3独立复现一篇ICLR 2025杰出论文,连续运行近12小时,自主产出18次commit与23张实验图表,成功跑通核心实验——这同时考验了1M长上下文、编程Agent能力与原生多模态三项核心能力。第二个:M3在约24小时内自主完成147次Benchmark提交、近2000次工具调用,将NVIDIA Hopper FP8硬件峰值利用率从7.6%提升至71.3%,实现9.4倍加速。在第145次尝试才找到最优解,经历了多个平台期仍未放弃。

M3同步推出配套Agent产品MiniMax Code,可将大型任务拆解为多阶段、可并发、可动态调整的工作流,由Agent集群协作推进。

商业化方面,Token Plan订阅方案分为Plus(49元/月,6亿Token)、Max(119元/月,18亿Token)、Ultra(469元/月,55亿Token)三档。API层面,512K上下文版本上线7天限时五折,输入2.1元/百万token,输出8.4元/百万token。模型权重与技术报告将于10天内开源。

值得注意的是,MiniMax已于5月29日向上海证监局提交A股上市辅导备案,正式开启A股上市进程,冲刺"A股大模型第一股"。

从长上下文到智能体,从多模态到真实执行,M3证明了一件事:开源模型不必在单项能力上妥协,三项全能可以同时实现。MiniMax正以"开源+多能力合一"的差异化定位,在全球AI竞赛中占据一个越来越清晰的身位。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 编码器
    +关注

    关注

    45

    文章

    4029

    浏览量

    143887
  • 编程
    +关注

    关注

    90

    文章

    3732

    浏览量

    97581
  • GPT
    GPT
    +关注

    关注

    0

    文章

    378

    浏览量

    17051
  • 大模型
    +关注

    关注

    2

    文章

    3895

    浏览量

    5327
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    MiniMax发布新一代旗舰M3

    近日,MiniMax稀宇科技正式发布新一代旗舰大模型MiniMax M3。这是国内首个同时具备"前沿Coding能力、1M超长上下文、原生多
    的头像 发表于 06-02 10:13 243次阅读

    MiniMax M3正式发布:自研MSA稀疏注意力架构

    国产AI大模型公司MiniMax于2026年6月1日正式推出了新一代通用模型MiniMax M3。据官方介绍,该模型在编程与智能体能力、超长上下文处理以及原生多模态理解等关键维度上均实现了代际性突破
    的头像 发表于 06-01 11:42 544次阅读

    开源鸿蒙机器人操作系统M-Robots OS 2.0重磅发布

    2026年5月22日,开源鸿蒙智能物联网生态大会在深圳龙岗举行。会上,深开鸿重磅发布全国首个基于 开源鸿蒙打造的机器人操作系统——M-Robots OS 2.0开源新版本。 此次迭代升级标志着我国
    的头像 发表于 05-25 09:59 364次阅读
    开源鸿蒙机器人操作系统<b class='flag-5'>M</b>-Robots OS 2.0<b class='flag-5'>重磅</b><b class='flag-5'>发布</b>

    开源鸿蒙机器人操作系统M-Robots OS 2.0重磅发布

    2026年5月22日,开源鸿蒙智能物联网生态大会在深圳龙岗举行。会上,深开鸿重磅发布全国首个基于开源鸿蒙打造的机器人操作系统——M-RobotsOS2.0版本。此次迭代升级标志着我国开源鸿蒙技术在
    的头像 发表于 05-23 10:17 564次阅读
    开源鸿蒙机器人操作系统<b class='flag-5'>M</b>-Robots OS 2.0<b class='flag-5'>重磅</b><b class='flag-5'>发布</b>

    Momenta助力智己LS8重磅上市

    4月16日,跨时代科技旗舰SUV——智己LS8重磅上市。新车搭载基于Momenta强化学习大模型打造的IM AD智能辅助驾驶系统,为用户带来“更像人”的智能辅助驾驶体验。凭借跨时代硬核科技,智己LS8以“起步即旗舰,标配即满配”的绝对实力,成就“30万内唯一大满配的跨时代旗舰SUV”。
    的头像 发表于 04-17 17:01 966次阅读

    天数智芯Day 0适配MiniMax最新开源M2.7大模型

      4月12 日,MiniMax 最新开源 M2.7 大模型正式发布,凭借自主迭代能力与优异的工程、办公性能引发行业关注。天数智芯与FlagOS 统一开源技术栈合作实现Day0落地,在模型发布
    的头像 发表于 04-15 15:42 1046次阅读

    MiniMax M2.7全球开源,摩尔线程、沐曦等完成Day0适配

    电子发烧友网综合报道 4月12日,MiniMax M2.7在全球正式开源。华为昇腾、摩尔线程、沐曦股份、昆仑芯、NVIDIA,以及TogetherAI、Fireworks、Ollama等海内外芯片
    的头像 发表于 04-14 11:05 2072次阅读

    昆仑芯科技完成MiniMax M2.7模型极速适配

    今日,MiniMax正式开源MiniMax M2.7模型。昆仑芯同步完成对该模型的Day 0适配与深度优化,成为首批实现适配的国产算力厂商之一,再次验证其在主流大模型生态中的敏捷响应能力与广泛兼容能力。
    的头像 发表于 04-13 17:07 629次阅读

    登临科技KS系列GPU产品全面适配MiniMax M2.5模型

    近日,苏州登临科技股份有限公司(以下简称“登临科技”)自主研发的KS系列高性能通用GPU已全面完成对最新一代大模型MiniMax M2.5的深度适配与优化。通过创新的GPU+架构,登临科技不仅实现了
    的头像 发表于 03-04 17:49 2962次阅读
    登临科技KS系列GPU产品全面适配<b class='flag-5'>MiniMax</b> <b class='flag-5'>M</b>2.5模型

    高压、大电流、超低噪声负压LDO GM1301重磅发布

    共模重磅发布-40V/1A 超低噪声负压LDO GM1301!Pin-to-Pin替代TI(TPS7A33)负压LDO,搭配GM1415组成低噪正负压电源黄金组合,为高精度场景提供全国产电源解决方案。
    的头像 发表于 03-04 10:58 825次阅读
    高压、大电流、超低噪声负压LDO GM1301<b class='flag-5'>重磅</b><b class='flag-5'>发布</b>

    沐曦曦云C500/C550 GPU产品深度适配MiniMax M2.5模型

    2月13日晚间,MiniMax正式开源MiniMax M2.5模型。沐曦技术团队依托MXMACA软件栈,在24小时内完成曦云C500/C550 对该模型的深度适配。
    的头像 发表于 02-26 14:19 1371次阅读

    云知声山海知音大模型2.0重磅发布

    随着智能体时代到来,云知声在“山海·Atlas”通用智算基座持续演进基础上,年前实现了“山海·知医”5.0医疗大模型升级,今天迎来了“山海·知音”2.0的重磅发布,正在完成“一基两翼”技术战略升级的能力拼图。
    的头像 发表于 01-27 14:08 414次阅读
    云知声山海知音大模型2.0<b class='flag-5'>重磅</b><b class='flag-5'>发布</b>

    亚马逊云科技Amazon S3重磅更新 引领企业云存储未来方向

    北京2025年12月12日 /美通社/ -- 亚马逊云科技在2025 re:Invent全球大会上推出了云存储服务Amazon S3的一系列重磅更新,包括Amazon S3 Vectors正式可用并
    的头像 发表于 12-13 16:43 771次阅读

    OpenTenBase 5.0和TXSQL 8.0.30重磅发布

    内核,助力社区拥有了兼容PostgreSQL和MySQL的双内核引擎。如今,OpenTenBase和TXSQL双双迎来重磅升级。
    的头像 发表于 09-18 10:12 1114次阅读

    开源鸿蒙共建地图4.0重磅发布

    近日,在2025开放原子开源生态大会开源鸿蒙主题演讲活动上,《开源鸿蒙共建地图4.0》重磅发布,标志着开源鸿蒙在技术体系、系统能力和生态共建方面迈入全新阶段。活动现场,开放原子开源基金会秘书长助理兼
    的头像 发表于 07-28 17:45 1050次阅读