0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

登临科技KS系列高性能通用GPU产品Day 0适配小米MiMo-V2.5模型

登临科技 DenglinAI 来源:登临科技 DenglinAI 2026-04-29 16:09 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

2026年4月,随着小米MiMo-V2.5这一开源原生全模态智能体模型的正式发布,AI领域迎来了又一次重要的技术演进。该模型在统一架构下支持文本、图像、视频和音频的理解,并具备强大的智能体(agentic)能力,为开发者和企业带来了全新的应用可能。而在这一前沿模型发布的第一时间,苏州登临科技股份有限公司自主研发的KS系列高性能通用GPU便已完成深度适配与优化,实现了Day0级别的支持。这不仅是登临科技在大模型生态领域快速响应能力的体现,更是其创新GPU+架构强大通用性与高效能的直接验证。

01 MiMo-V2.5模型:

原生全模态智能体的全面革新

MiMo-V2.5的开源之前已经取得亮眼的成绩单:

全球开源大模型综合智能指数并列第一

Agent专项指数开源第一

全球所有大模型总榜前五(含闭源)

OpenRouter周调用量4.82万亿Token,市占率30%+

推理成本仅为国际闭源旗舰的2.5%,API定价约为国际竞品的1/5

其模型架构的核心亮点主要体现在以下几个方面:

原生全模态理解 :MiMo-V2.5是一个真正的原生全模态模型,在统一架构下支持文本、图像、视频和音频的理解。它基于MiMo-V2-Flash主干网络构建,并扩展了专用的视觉和音频编码器,从而实现高质量的多模态感知。

创新的混合注意力架构 :该模型继承自MiMo-V2-Flash的混合设计,以5:1的比例交错使用滑动窗口注意力(SWA)和全局注意力(GA),滑动窗口大小为128。通过可学习的注意力汇点偏置(attention sink bias),在保持长上下文性能的同时,将KV缓存存储减少近6倍,显著提升了推理效率。

强大的智能体能力 :在模型的后训练阶段,结合了监督微调(SFT)、大规模智能体强化学习(agentic RL)以及多教师在线策略蒸馏(Multi-Teacher On-Policy Distillation, MOPD),使其在智能体任务和多模态理解基准测试中均取得优异表现,能够胜任复杂的自主任务编排。

高效的推理与训练机制 :MiMo-V2.5配备了三个轻量级多Token预测(MTP)模块,采用密集前馈网络(FFN),通过推测解码(speculative decoding)加速推理。同时,模型使用FP8混合精度在总计约48T tokens的数据上进行训练,上下文窗口最大支持1M tokens,兼顾了训练效率与长文本处理能力。

02 Day0适配的背后:

技术实力与生态响应

登临KS系列能够实现对MiMo-V2.5的Day0适配,绝非偶然。这背后是登临科技在大模型生态领域的持续投入和快速响应机制。

成熟的软件栈与优化经验 :登临科技的软件栈已在Day0适配了DeepSeek、MiniMax、Kimi、GPT-OSS等国内外主流大模型,积累了丰富的模型优化和部署经验。这种经验使得团队能够迅速理解MiMo-V2.5的新特性,并进行针对性的优化。根据内部测试反馈,在MiMo-V2.5发布后,登临团队立即进行了验证,并确认当前的vLLM版本可以直接运行该模型,体现了极高的技术响应速度。

架构优势的天然契合 :MiMo-V2.5对推理效率、长上下文处理和多模态并行能力的提升,与GPU+架构追求的 高效能、大显存、高并发 特性高度契合。KS系列提供的强大算力和超大显存,为充分发挥MiMo-V2.5的“原生全模态理解”、“智能体工作流”等功能提供了硬件基础,确保模型在处理复杂任务时的流畅性和准确性。

赋能开发者与企业级应用 :通过KS系列与MiMo-V2.5的深度结合,登临科技为开发者提供了一个高性能、低门槛的本地部署方案。这不仅能帮助开发者充分利用MiMo-V2.5的新功能进行创新,也为企业级AI应用的规模化落地提供了可靠的算力支撑,推动AI技术从概念验证走向实际生产。

03 GPU+架构:

效率与通用的完美融合

登临科技定位为国产高性能通用GPU领军者,其核心技术优势在于创新的GPU+架构——它巧妙地融合了传统GPU的通用性与ASIC的高效率,为AI应用提供了从算力到能效的全面解决方案。这一架构的核心优势可概括为以下四个维度:

卓越能效比,降本增效的关键 :通过创新的可扩展、软件定义的片内异构体系结构,登临GPU+架构在典型AI场景的性能领先国际主流旗舰产品1.5-4.5倍,而能效比达到竞品的3-5倍。这意味着在同等算力下,登临方案能显著降低功耗,减少散热需求,特别适用于高密度数据中心和边缘侧部署。GPU+架构的核心技术优势如图所示,其架构图完美诠释了如何在保证通用性的同时,实现极致的计算效率。

高度生态兼容,降低迁移门槛 :登临硬件兼容CUDA/OpenCL 等现有软件生态,算法模型可平滑迁移,极大节约了企业的移植成本和开发周期。这一特性确保了客户现有的AI模型、开发工具链和人才储备能够无缝适配,加速了AI技术在各行业场景的落地进程。登临科技的产业生态涵盖了从底层硬件到上层应用的全链条,为大模型应用提供了坚实的生态基础。

强大算力与大显存支持,应对复杂任务 :登临纳适II系列工业加速卡提供了从70 TOPS到560 TOPS的有效AI算力,以及8GB至128GB的大显存配置。这为处理高分辨率图像、复杂缺陷分类、3D点云分析等计算密集型任务提供了坚实基础,能够实现像素级的精准检测和毫秒级实时推理。对于MiMo-V2.5而言,强大的算力支撑其复杂的多模态推理逻辑,而大显存则保证了其在处理长上下文和多任务并行时的流畅性,确保了“原生全模态理解”和“智能体工作流”等核心功能的完美呈现。

全栈国产化与自主可控,保障供应链安全 :登临坚持全链路自主创新,架构、微架构、运算单元等核心IP全自研,已申请国内外知识产权200余项。产品支持Windows、Linux、麒麟等操作系统,兼容各类国产CPU,实现从硬件到软件的全国产化,为客户提供安全、稳定、可持续的算力底座。这对于在AI领域追求核心技术自主可控的企业和国家而言,具有不可估量的战略价值。

登临KS系列对MiMo-V2.5的Day0适配,不仅是一次技术层面的精准契合,更是国产AI生态协同发展的生动缩影。它展示了登临科技GPU+架构在效率、通用、生态兼容和国产化方面的综合优势,以及其在大模型领域的快速响应能力。随着AI技术的不断演进,登临科技将持续深化GPU+架构在各行业的应用创新,致力于推动AI视觉与大模型的深度融合,优化AI模型部署与优化门槛,为中国产业的高质量发展与现代化转型持续赋能,让高性能、高效率、高可靠的国产算力真正服务于产业升级,催生新质生产力。

关于登临科技

苏州登临科技股份有限公司是国内首个实现规模商业落地的 GPU 企业,专注于高性能通用 GPU 研发与应用。以 “GPU+” 为技术核心,为智算中心、工业视觉、大模型、AIPC、智慧农业等领域提供高效、通用、安全的算力解决方案,致力于成为 AI 产业化落地的关键算力基础设施提供者。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 开源
    +关注

    关注

    3

    文章

    4362

    浏览量

    46449
  • 登临科技
    +关注

    关注

    0

    文章

    35

    浏览量

    884
  • 大模型
    +关注

    关注

    2

    文章

    3793

    浏览量

    5275

原文标题:全球开源大模型综合智能指数并列第一MiMo-V2.5正式开源,登临KS系列Day0适配

文章出处:【微信号:gh_313558c425fe,微信公众号:登临科技 DenglinAI】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    登临科技GPU+架构深度适配DeepSeek-V4大模型

    的DeepSeek-V4-Flash,全系标配百万token长上下文能力,开启大模型长文本普惠新时代。同日,开源社区已提交适配DeepSeek-V4的代码。 作为国产
    的头像 发表于 04-29 16:07 378次阅读

    沐曦股份曦云C系列GPU产品Day 0适配小米MiMo-V2.5-Pro模型

    4月23日,小米开启 MiMo-V2.5系列模型的公测,并于4月28日正式发布及开源。沐曦股份已同步完成对 MiMo-V2.5-Pro 的
    的头像 发表于 04-28 15:59 138次阅读
    沐曦股份曦云C<b class='flag-5'>系列</b><b class='flag-5'>GPU</b><b class='flag-5'>产品</b><b class='flag-5'>Day</b> <b class='flag-5'>0</b><b class='flag-5'>适配</b><b class='flag-5'>小米</b><b class='flag-5'>MiMo-V2.5</b>-Pro<b class='flag-5'>模型</b>

    沐曦股份Day 0适配DeepSeek-V4-Flash模型

    4月24日,沐曦股份携手FlagOS,已完对DeepSeek最新开源的DeepSeek-V4-Flash模型Day 0适配。同日,沐曦股份
    的头像 发表于 04-28 15:53 179次阅读

    沐曦股份曦云C系列GPU产品Day 0适配腾讯混元Hy3 preview语言模型

    4月23日,腾讯混元团队正式发布并开源Hy3 preview语言模型。沐曦股份旗下曦云 C 系列 GPU已完成Day 0
    的头像 发表于 04-28 15:51 355次阅读
    沐曦股份曦云C<b class='flag-5'>系列</b><b class='flag-5'>GPU</b><b class='flag-5'>产品</b><b class='flag-5'>Day</b> <b class='flag-5'>0</b><b class='flag-5'>适配</b>腾讯混元Hy3 preview语言<b class='flag-5'>模型</b>

    燧原科技L600极速适配小米MiMo-V2.5-Pro系列模型

    2026年4月28日,小米正式发布 MiMo-V2.5-Pro 系列模型,并于同日正式开源。燧原科技已同步完成对 MiMo-V2.5-Pro
    的头像 发表于 04-28 15:21 152次阅读
    燧原科技L600极速<b class='flag-5'>适配</b><b class='flag-5'>小米</b><b class='flag-5'>MiMo-V2.5</b>-Pro<b class='flag-5'>系列</b><b class='flag-5'>模型</b>

    登临科技KS系列GPU产品Day 0适配Kimi-K2.6模型

    2026年4月,随着Kimi-K2.6这一开源原生多模态智能体模型的正式发布,AI领域迎来了又一次重要的技术演进。该模型在长周期编程、编程驱动设计、智能体集群任务编排及主动自主执行等核心能力上取得了显著进展,为开发者和企业带来了全新的应用可能。
    的头像 发表于 04-23 16:59 1648次阅读
    <b class='flag-5'>登临</b>科技<b class='flag-5'>KS</b><b class='flag-5'>系列</b><b class='flag-5'>GPU</b><b class='flag-5'>产品</b><b class='flag-5'>Day</b> <b class='flag-5'>0</b><b class='flag-5'>适配</b>Kimi-K2.6<b class='flag-5'>模型</b>

    登临科技KS系列GPU产品深度适配阿里千问Qwen3.6大模型

    体验。而在这一前沿模型发布的第一时间,苏州登临科技股份有限公司自主研发的 KS系列高性能通用
    的头像 发表于 04-21 16:50 1344次阅读
    <b class='flag-5'>登临</b>科技<b class='flag-5'>KS</b><b class='flag-5'>系列</b><b class='flag-5'>GPU</b><b class='flag-5'>产品</b>深度<b class='flag-5'>适配</b>阿里千问Qwen3.6大<b class='flag-5'>模型</b>

    沐曦股份曦云C系列GPU产品Day 0适配百度文心ERNIE-Image文生图模型

    4月15日,百度文心大模型团队重磅推出ERNIE‑Image文生图模型,沐曦股份曦云 C 系列 GPU 已完成对 ERNIE‑Image 的Day
    的头像 发表于 04-15 17:39 478次阅读

    天数智芯Day 0适配MiniMax最新开源M2.7大模型

      4月12 日,MiniMax 最新开源 M2.7 大模型正式发布,凭借自主迭代能力与优异的工程、办公性能引发行业关注。天数智芯与FlagOS 统一开源技术栈合作实现Day0落地,在模型
    的头像 发表于 04-15 15:42 837次阅读

    沐曦股份曦云C系列GPU产品Day 0适配MiniMax M2.7模型

    4月12日,MiniMax新一代Agent旗舰大模型M2.7开源。沐曦股份曦云C系列GPU已完成对 M2.7的Day 0深度
    的头像 发表于 04-13 17:08 831次阅读
    沐曦股份曦云C<b class='flag-5'>系列</b><b class='flag-5'>GPU</b><b class='flag-5'>产品</b><b class='flag-5'>Day</b> <b class='flag-5'>0</b><b class='flag-5'>适配</b>MiniMax M2.7<b class='flag-5'>模型</b>

    沐曦股份曦云C系列GPU产品Day 0适配智谱GLM-5.1旗舰模型

    4月8日,智谱新一代旗舰模型GLM-5.1实现开源。目前,沐曦股份曦云 C 系列 GPU已完成该系列模型
    的头像 发表于 04-09 11:25 398次阅读

    登临科技KS系列GPU产品全面适配MiniMax M2.5模型

    近日,苏州登临科技股份有限公司(以下简称“登临科技”)自主研发的KS系列高性能通用
    的头像 发表于 03-04 17:49 2619次阅读
    <b class='flag-5'>登临</b>科技<b class='flag-5'>KS</b><b class='flag-5'>系列</b><b class='flag-5'>GPU</b><b class='flag-5'>产品</b>全面<b class='flag-5'>适配</b>MiniMax M<b class='flag-5'>2.5</b><b class='flag-5'>模型</b>

    Day-0支持|摩尔线程完成MiniMax M2.5模型极速适配

    2月14日,摩尔线程在其旗舰级AI训推一体全功能GPU MTT S5000上,成功实现了对MiniMax新一代大模型MiniMax M2.5Day-0极速
    发表于 02-15 08:01 1587次阅读

    曦云C系列GPU Day 0 适配智谱全新一代大模型GLM-5

    智谱AI正式上线并开源全新一代大模型 GLM-5,沐曦股份实现 Day 0 深度适配。 GLM-5目前可于曦云 C 系列(C500/C550
    的头像 发表于 02-12 10:53 1107次阅读
    曦云C<b class='flag-5'>系列</b><b class='flag-5'>GPU</b> <b class='flag-5'>Day</b> <b class='flag-5'>0</b> <b class='flag-5'>适配</b>智谱全新一代大<b class='flag-5'>模型</b>GLM-5

    沐曦股份曦云C系列GPU Day 0适配智谱GLM-4.6V多模态大模型

    12月8日智谱AI发布并开源 GLM-4.6V 系列多模态大模型,沐曦股份曦云C系列GPU完成Day
    的头像 发表于 12-17 14:28 841次阅读
    沐曦股份曦云C<b class='flag-5'>系列</b><b class='flag-5'>GPU</b> <b class='flag-5'>Day</b> <b class='flag-5'>0</b><b class='flag-5'>适配</b>智谱GLM-4.6<b class='flag-5'>V</b>多模态大<b class='flag-5'>模型</b>