0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

壁仞科技壁砺166系列产品深度适配MiniMax M2.5和智谱GLM-5模型

壁仞科技Birentech 来源:壁仞科技Birentech 2026-02-26 14:31 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

2月13日晚,MiniMax正式开源了最新旗舰模型M2.5。壁仞科技(06082.HK)旗舰产品壁砺166系列率先完成M2.5的本地化部署,成为首批完成适配的国产算力厂商。

c3deb4c8-0989-11f1-90a1-92fbcf53809c.gif

M2.5在BR166服务器上基于vLLM壁仞平台插件完成推理补全任务

近日,国产大模型生态迎来密集重磅升级。依托壁砺166系列产品的高通用性与全自研BIRENSUPA软件栈的成熟度,壁仞科技此前已极速完成对GLM-5、Step 3.5 Flash等多款SOTA顶级大模型的适配支持,大幅降低开发者的模型部署与应用门槛,有力推动Agent智能体技术的商业化落地与规模化拓展。

对SOTA模型的极速适配,进一步验证了vLLM壁仞科技平台插件的成熟度。通过深度集成BIRENSUPA高性能算子库,壁仞科技可针对混合专家模型及核心注意力机制实现指令级深度优化,充分释放壁砺系列产品算力潜能,打造兼具性能与成本优势的极致推理方案。

此外,面向大型MoE模型稀疏激活、DSA稀疏注意力、MTP多Token预测等关键特性,以及超长文本的实际应用需求,壁砺166系列产品与BIRENSUPA软件栈实现前瞻性协同设计。产品充分发挥Cwarp、TDA等自研架构优势,深度打磨高性能算子与推理框架,真正实现对该类复杂模型的即刻适配。

关于MiniMax M2.5

作为定位“原生Agent(智能体)生产级模型”的产品,MiniMax M2.5在编程、工具调用和搜索、办公等生产力场景都达到或者刷新了行业的SOTA,比如 SWE-Bench Verified(80.2%),Multi-SWE-Bench(51.3%),BrowseComp(76.3%)。

c4a484c8-0989-11f1-90a1-92fbcf53809c.png

MiniMax M2.5在Agentic Engineering benchmark中取得多项SOTA成绩

M2.5优化了模型对复杂任务的拆解能力和思考过程中token的消耗,使其能更快地完成复杂的Agentic任务,比如在SWE-Bench Verified的测试中,比上一个版本M2.1完成任务的速度快了37%。

M2.5是第一个不需要考虑使用成本可以无限使用的前沿模型。在每秒输出100个token的情况下,M2.5连续工作一小时只需花费1美金;而在每秒输出50个token的情况下,只需要0.3美金。

关于GLM-5

GLM-5是智谱新一代的旗舰基座模型,面向Agentic Engineering打造,能够在复杂系统工程与长程Agent任务中提供可靠生产力。在Coding与Agent能力上,GLM-5取得开源SOTA表现,在真实编程场景的使用体感逼近Claude Opus 4.5,擅长复杂系统工程与长程Agent任务,是通用Agent助手的理想基座。GLM-5模型参数规模达到744B(其中激活40B),采用28.5T数据预训练,并集成DeepSeek Sparse Attention,在部署成本和效率上进一步提升。

c504f7cc-0989-11f1-90a1-92fbcf53809c.jpg

c55ebf50-0989-11f1-90a1-92fbcf53809c.gif

GLM-5在BR166服务器上基于vLLM壁仞平台插件完成推理补全任务

壁仞科技此前已经完成对MiniMaxM2.1、智谱GLM-4.7等系列旗舰大模型的适配,并持续深度优化,在模型精度和稳定性方面表现优异,充分验证了壁砺系列产品对国产SOTA大模型的卓越适配性。未来,壁仞科技将持续加强对包括MiniMax、智谱、阶跃星辰在内的国产大模型厂商的生态适配支持,并与生态伙伴在高级智能体、项目级编程等Agentic Engineering领域共同打造“国模国芯”解决方案和示范性业务场景,助力中国AI产业向世界最先进水平持续迈进。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 开源
    +关注

    关注

    3

    文章

    4421

    浏览量

    46576
  • 模型
    +关注

    关注

    1

    文章

    3873

    浏览量

    52337
  • 算力
    +关注

    关注

    2

    文章

    1772

    浏览量

    16857
  • 壁仞科技
    +关注

    关注

    1

    文章

    94

    浏览量

    4245

原文标题:“国模国芯”新标杆!壁仞科技完成MiniMax M2.5、智谱GLM-5等多款SOTA模型高效适配

文章出处:【微信号:Birentech,微信公众号:壁仞科技Birentech】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    科技完成商汤日日新SenseNova U1系列模型极速适配

    近日,商汤科技正式发布并开源日日新SenseNova U1系列原生理解生成统一模型科技基于SGLang推理框架,在旗舰通用GPU产品
    的头像 发表于 05-07 15:47 230次阅读
    <b class='flag-5'>壁</b><b class='flag-5'>仞</b>科技完成商汤日日新SenseNova U1<b class='flag-5'>系列</b>大<b class='flag-5'>模型</b>极速<b class='flag-5'>适配</b>

    科技166系列GPU产品率先支持DeepSeek-V4模型

    完成DeepSeek-V4在旗舰通用GPU166系列产品适配验证与优化,充分释放产品算力密
    的头像 发表于 04-28 14:04 1866次阅读
    <b class='flag-5'>壁</b><b class='flag-5'>仞</b>科技<b class='flag-5'>壁</b><b class='flag-5'>砺</b><b class='flag-5'>166</b><b class='flag-5'>系列</b>GPU<b class='flag-5'>产品</b>率先支持DeepSeek-V4<b class='flag-5'>模型</b>

    科技166系列GPU产品率先支持腾讯混元Hy3 preview语言模型

    166系列GPU产品的“国模+国芯”联合,将充分释放大模型落地效能,全面赋能多元真实业务场景,为开发者和行业用户带来更高效、更稳定的部署体
    的头像 发表于 04-28 14:01 1832次阅读
    <b class='flag-5'>壁</b><b class='flag-5'>仞</b>科技<b class='flag-5'>壁</b><b class='flag-5'>砺</b><b class='flag-5'>166</b><b class='flag-5'>系列</b>GPU<b class='flag-5'>产品</b>率先支持腾讯混元Hy3 preview语言<b class='flag-5'>模型</b>

    科技166系列GPU产品率先支持Kimi K2.6模型

    166系列在Kimi K2.6模型开源后率先完成模型接入与推理适配,为开发者及行业客户提供国产
    的头像 发表于 04-23 16:30 2503次阅读
    <b class='flag-5'>壁</b><b class='flag-5'>仞</b>科技<b class='flag-5'>壁</b><b class='flag-5'>砺</b><b class='flag-5'>166</b><b class='flag-5'>系列</b>GPU<b class='flag-5'>产品</b>率先支持Kimi K2.6<b class='flag-5'>模型</b>

    科技光速支持阿里Qwen3.6-35B-A3B大模型

    强大的通用性以及全自研BIRENSUPA软件栈的成熟度,旗下 166系列产品完成Qwen3.6-35B-A3B模型的光速
    的头像 发表于 04-20 17:50 1692次阅读

    科技166系列产品Day 0适配GLM-5.1旗舰模型

    科技(06082.HK)166系列产品模型发布当日率先完成适配,成为国内首批
    的头像 发表于 04-09 11:23 523次阅读

    登临科技KS系列GPU产品全面适配MiniMax M2.5模型

    近日,苏州登临科技股份有限公司(以下简称“登临科技”)自主研发的KS系列高性能通用GPU已全面完成对最新一代大模型MiniMax M2.5深度
    的头像 发表于 03-04 17:49 2856次阅读
    登临科技KS<b class='flag-5'>系列</b>GPU<b class='flag-5'>产品</b>全面<b class='flag-5'>适配</b><b class='flag-5'>MiniMax</b> <b class='flag-5'>M2.5</b><b class='flag-5'>模型</b>

    沐曦曦云C500/C550 GPU产品深度适配MiniMax M2.5模型

    2月13日晚间,MiniMax正式开源MiniMax M2.5模型。沐曦技术团队依托MXMACA软件栈,在24小时内完成曦云C500/C550 对该
    的头像 发表于 02-26 14:19 1306次阅读

    华为昇腾深度适配AI全新开源模型GLM-5

    ,在真实编程场景的使用体验逼近Claude Opus 4.5,更擅长复杂系统工程与长程Agent任务。昇腾一直同步支持智GLM系列模型,此次GLM
    的头像 发表于 02-25 14:41 1547次阅读
    华为昇腾<b class='flag-5'>深度</b><b class='flag-5'>适配</b>智<b class='flag-5'>谱</b>AI全新开源<b class='flag-5'>模型</b><b class='flag-5'>GLM-5</b>

    寒武纪实现对GLM-5的Day 0适配

    2026年2月11日,寒武纪已基于 vLLM 推理框架同步实现对智最新开源旗舰模型  GLM-5适配。寒武纪一直高度重视大模型软件生态
    的头像 发表于 02-12 15:07 1027次阅读

    AI正式上线并开源全新一代大模型GLM-5

    逼近Claude Opus 4.5。当前,昆仑芯完成Day 0深度推理适配。通过底层算子优化与硬件加速能力,GLM-5已在昆仑芯产品上实现高吞吐、低延迟的稳定运行。 Day 0
    的头像 发表于 02-12 14:40 1098次阅读

    曦云C系列GPU Day 0 适配全新一代大模型GLM-5

    AI正式上线并开源全新一代大模型 GLM-5,沐曦股份实现 Day 0 深度适配GLM-5
    的头像 发表于 02-12 10:53 1240次阅读
    曦云C<b class='flag-5'>系列</b>GPU Day 0 <b class='flag-5'>适配</b>智<b class='flag-5'>谱</b>全新一代大<b class='flag-5'>模型</b><b class='flag-5'>GLM-5</b>

    科技166M产品适配模思智能MOSS-TTS Family模型

    2月10日,由上海创智学院孵化的模思智能及OpenMOSS团队正式发布并开源了MOSS-TTS Family。模型发布后,科技(06082.HK)旗舰产品
    的头像 发表于 02-11 16:54 1520次阅读

    科技166系列产品适配阶跃星辰基座模型Step 3.5 Flash

    NEWS 2月2日,阶跃星辰发布并开源最新旗舰基座模型Step 3.5 Flash。科技(06082.HK)作为国产GPGPU领域的先进技术领导者,
    的头像 发表于 02-02 17:48 1550次阅读
    <b class='flag-5'>壁</b><b class='flag-5'>仞</b>科技<b class='flag-5'>壁</b><b class='flag-5'>砺</b><b class='flag-5'>166</b><b class='flag-5'>系列产品</b><b class='flag-5'>适配</b>阶跃星辰基座<b class='flag-5'>模型</b>Step 3.5 Flash

    科技166M产品适配腾讯混元开源翻译模型1.5版本

    中文、英语、日语等常见语种,也包含捷克语、马拉地语、爱沙尼亚语、冰岛语等小语种。目前两个模型均已在腾讯混元官网上线,在Github和Huggingface等开源社区也可直接下载使用。科技
    的头像 发表于 01-05 15:39 528次阅读
    <b class='flag-5'>壁</b><b class='flag-5'>仞</b>科技<b class='flag-5'>壁</b><b class='flag-5'>砺</b><b class='flag-5'>166M</b><b class='flag-5'>产品</b><b class='flag-5'>适配</b>腾讯混元开源翻译<b class='flag-5'>模型</b>1.5版本