0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

登临科技KS系列GPU产品全面适配MiniMax M2.5模型

登临科技 DenglinAI 来源:登临科技 DenglinAI 2026-03-04 17:49 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

近日,苏州登临科技股份有限公司(以下简称“登临科技”)自主研发的KS系列高性能通用GPU已全面完成对最新一代大模型MiniMax M2.5的深度适配与优化。通过创新的GPU+架构,登临科技不仅实现了对MiniMax M2.5模型的高效支持,更依托KS38/ KS58云端推理卡——单卡最高配备128GB显存,推出仅需2卡即可部署MiniMax M2.5的突破性方案,大幅降低整体部署成本。将大模型部署的硬件门槛与成本降至行业新低,为企业级AI应用的规模化落地注入强劲动力。

MiniMax M2.5 深度适配

提供超低成本部署方案

MiniMax M2.5作为MiniMax M2.x系列发布的最新版本模型,在代码编写、智能体工具使用与搜索、办公任务以及一系列其他具有经济价值的任务上达到当前最先进(SOTA)水平,在 SWE-Bench Verified、Multi-SWE-Bench 和 BrowseComp(含上下文管理)等评测中分别取得了 80.2%、51.3% 和 76.3% 的高分。随着OpenClaw的爆火,全球API调用token数量暴增,据全球最大LLM API聚合平台OpenRouter 2月24日数据,中国AI模型Token消耗量占平台前十总量的61%,前三名全部来自中国实验室。MiniMax M2.5以单周2.45万亿Token登顶榜首,环比暴涨197%。

目前登临的KS38/ KS58云端推理卡,单卡最高配备128GB显存,2卡即可部署MiniMax M2.5,极大降低综合部署成本。并提供单服务器内模型全上下文长度推理,释放MiniMax M2.5完整能力。

03281b50-175f-11f1-90a1-92fbcf53809c.png

GPU+架构:效率与通用的完美融合

重新定义算力效能

登临科技的GPU+架构是其核心技术优势所在,它巧妙地融合了传统 GPU 的通用性与 ASIC 的高效率,为大模型推理等 AI 应用提供了从算力到能效的全面解决方案。

卓越能效比,降本增效的关键登临 GPU+架构通过创新的可扩展、软件定义的片内异构体系结构,实现了能效比的大幅提升,在算力需求暴涨的今天,能源消耗成为算力扩展瓶颈的趋势愈发明显,GPU+架构正是解决这一困境的钥匙。

高度生态兼容性,降低迁移门槛登临硬件兼容 CUDA/OpenCL 等现有软件生态,算法模型可平滑迁移,极大节约了企业的移植成本和开发周期。在大模型领域,登临软件栈更是在Day0适配了DeepSeek、GLM、MiniMax、Kimi、GPT-OSS等国内外主流大模型。

强大算力与内存支持,超长上下文处理登临纳适II 系列加速卡提供了高达560 TOPS 的云端有效AI算力,以及 128GB 的大显存配置,为大模型推理和超长上下文提供基础支撑。

全栈国产化与自主可控,保障供应链安全登临坚持自主创新,核心IP(架构/微架构/算术单元等)全自研,已申请国内外各类知识产权 200 余项。其产品支持 Windows10、Linux、麒麟等系统,并兼容各类国产 CPU,确保了从硬件到软件的全国产化能力,为客户提供了安全可靠的算力底座。

行业价值与未来展望

登临科技 KS 系列对 MiniMax M2.5 的支持,以及 KS38/KS58 两卡部署方案的推出,不仅为企业提供了高性能、低成本的大模型运行平台,更在多个层面创造了显著的行业价值:

降低 AI 应用门槛 :使更多中小企业能够负担得起先进的大模型技术,加速 AI 技术的普及和应用。

提升业务处理效率 :在内容审核、智能客服、数据分析等场景中,提供更快、更准确的处理能力,提升业务效率和用户体验。

推动国产算力发展 :作为国产高性能通用 GPU 的领先企业,登临科技通过实际应用验证了国产算力的可靠性和先进性,为构建自主可控的 AI 算力生态贡献力量。

展望未来,登临科技将持续深化在大模型领域的技术创新与行业应用,致力于推动 AI 视觉与大模型的深度融合,优化 AI 模型部署与优化门槛,拓展全场景 AI 应用,为各行业的智能化升级提供更高效、更智能、更安全的算力解决方案。

关于登临

苏州登临科技股份有限公司是一家专注于高性能通用 GPU 设计与研发的创新型企业,致力于为 AI 计算、图形渲染、高性能计算等领域提供自主可控、高效能的算力解决方案。公司以“技术赋能行业革新”为理念,通过自主研发的GPU+架构,在多个行业实现了规模化商业落地,成为推动国产算力发展的关键力量。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • gpu
    gpu
    +关注

    关注

    28

    文章

    5259

    浏览量

    136039
  • 登临科技
    +关注

    关注

    0

    文章

    29

    浏览量

    876

原文标题:登临科技KS系列全面适配MiniMax M2.5,GPU+架构驱动大模型部署成本革命

文章出处:【微信号:gh_313558c425fe,微信公众号:登临科技 DenglinAI】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    天数智芯Day 0适配MiniMax最新开源M2.7大模型

      4月12 日,MiniMax 最新开源 M2.7 大模型正式发布,凭借自主迭代能力与优异的工程、办公性能引发行业关注。天数智芯与FlagOS 统一开源技术栈合作实现Day0落地,在模型
    的头像 发表于 04-15 15:42 639次阅读

    MiniMax M2.7全球开源,摩尔线程、沐曦等完成Day0适配

    厂商、推理平台已完成Day0适配,即在开源首日已经完成模型接入与推理适配工作。   MiniMax介绍,三周前MiniMax
    的头像 发表于 04-14 11:05 1607次阅读

    沐曦股份曦云C系列GPU产品Day 0适配MiniMax M2.7模型

    4月12日,MiniMax新一代Agent旗舰大模型M2.7开源。沐曦股份曦云C系列GPU已完成对 M
    的头像 发表于 04-13 17:08 414次阅读
    沐曦股份曦云C<b class='flag-5'>系列</b><b class='flag-5'>GPU</b><b class='flag-5'>产品</b>Day 0<b class='flag-5'>适配</b><b class='flag-5'>MiniMax</b> <b class='flag-5'>M</b>2.7<b class='flag-5'>模型</b>

    昆仑芯科技完成MiniMax M2.7模型极速适配

    今日,MiniMax正式开源MiniMax M2.7模型。昆仑芯同步完成对该模型的Day 0适配
    的头像 发表于 04-13 17:07 448次阅读

    Day-0支持|摩尔线程率先完成MiniMax M2.7大模型适配

    4月12日,摩尔线程旗舰级AI训推一体全功能GPU MTT S5000已完成对新一代大模型MiniMax M2.7的Day-0极速适配,再次
    发表于 04-13 07:57 1073次阅读
    Day-0支持|摩尔线程率先完成<b class='flag-5'>MiniMax</b> <b class='flag-5'>M</b>2.7大<b class='flag-5'>模型</b><b class='flag-5'>适配</b>

    沐曦股份曦云C系列GPU产品Day 0适配智谱GLM-5.1旗舰模型

    4月8日,智谱新一代旗舰模型GLM-5.1实现开源。目前,沐曦股份曦云 C 系列 GPU已完成该系列模型Day 0 全量
    的头像 发表于 04-09 11:25 330次阅读

    登临科技GPU本地部署OpenClaw全攻略

    “养”在本地,不仅可以大幅度节省token消耗量,而且可以实现数据隐私、低延迟等诸多优势。 登临KS20 GPU 凭借其强大的端侧算力和CUDA兼容优势,成为解锁本地OpenClaw全新玩法的理想硬件选择。
    的头像 发表于 03-17 14:19 1801次阅读
    <b class='flag-5'>登临</b>科技<b class='flag-5'>GPU</b>本地部署OpenClaw全攻略

    中科曙光scaleX万卡超集赋能中国大模型出海新篇章

    近日,海外大模型API聚合平台OpenRouter的一份周度数据击穿行业认知:全球前十模型总Token量达8.7万亿,中国模型独占5.3万亿,市占率61%,MiniMax
    的头像 发表于 03-09 11:42 542次阅读

    沐曦股份曦云C系列GPU全面适配通义千问Qwen3.5三款新模型

    今日,通义千问团队正式开源发布Qwen3.5系列中等规模模型,推出包括Qwen3.5-35B-A3B、Qwen3.5-122B-A10B、Qwen3.5-27B三个版本。沐曦股份旗下曦云C系列
    的头像 发表于 02-28 10:05 677次阅读
    沐曦股份曦云C<b class='flag-5'>系列</b><b class='flag-5'>GPU</b><b class='flag-5'>全面</b><b class='flag-5'>适配</b>通义千问Qwen3.5三款新<b class='flag-5'>模型</b>

    壁仞科技壁砺166系列产品深度适配MiniMax M2.5和智谱GLM-5模型

    2月13日晚,MiniMax正式开源了最新旗舰模型M2.5。壁仞科技(06082.HK)旗舰产品壁砺166系列率先完成
    的头像 发表于 02-26 14:31 720次阅读
    壁仞科技壁砺166<b class='flag-5'>系列产品</b>深度<b class='flag-5'>适配</b><b class='flag-5'>MiniMax</b> <b class='flag-5'>M2.5</b>和智谱GLM-5<b class='flag-5'>模型</b>

    沐曦曦云C500/C550 GPU产品深度适配MiniMax M2.5模型

    2月13日晚间,MiniMax正式开源MiniMax M2.5模型。沐曦技术团队依托MXMACA软件栈,在24小时内完成曦云C500/C550 对该
    的头像 发表于 02-26 14:19 1094次阅读

    模型 ai coding 比较

    > MiniMax M2.5 > DeepSeek V2备注 :✅为实测数据,其余为公开第三方权威测评数据(MMLU/CMMLU/SuperCLUE) 模型名称 综合能力
    发表于 02-19 13:43

    Day-0支持|摩尔线程完成MiniMax M2.5模型极速适配

    2月14日,摩尔线程在其旗舰级AI训推一体全功能GPU MTT S5000上,成功实现了对MiniMax新一代大模型MiniMax M2.5
    发表于 02-15 08:01 1582次阅读

    塔力科技与登临科技达成战略合作

    近日,塔力科技与国内通用GPU领军企业登临科技展开合作,双方依托塔力科技自主研发的智能辅助决策系统SIDSS,基于登临新一代国产化GPU ,共同打造 AI 软硬协同
    的头像 发表于 01-28 14:11 743次阅读

    沐曦股份曦云C系列GPU Day 0适配智谱GLM-4.6V多模态大模型

    12月8日智谱AI发布并开源 GLM-4.6V 系列多模态大模型,沐曦股份曦云C系列GPU完成Day 0适配
    的头像 发表于 12-17 14:28 812次阅读
    沐曦股份曦云C<b class='flag-5'>系列</b><b class='flag-5'>GPU</b> Day 0<b class='flag-5'>适配</b>智谱GLM-4.6V多模态大<b class='flag-5'>模型</b>