0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

壁仞科技壁砺166系列GPU产品率先支持Kimi K2.6模型

壁仞科技Birentech 来源:壁仞科技Birentech 2026-04-23 16:30 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

4月20日晚,月之暗面正式发布并开源Kimi K2.6模型,带来行业领先(state-of-the-art)的代码、长程任务执行和Agent集群能力。壁仞科技(06082.HK)旗舰通用GPU产品壁砺166系列在Kimi K2.6模型开源后率先完成模型接入与推理适配,为开发者及行业客户提供国产算力平台下的SOTA模型“首发体验”。

根据官方介绍,Kimi K2.6的通用Agent、代码、视觉理解等综合能力得到全面提升,其中在完整版人类最后的考试(Humanity's Last Exam)、在考察模型真实软件工程能力的SWE-Bench Pro、评估Agent深度检索能力的DeepSearchQA等基准测试中均取得行业领先的成绩,持平或优于GPT-5.4、Claude Opus 4.6和Gemini 3.1 Pro等闭源模型。

Kimi K2.6长程编码能力也得到显著提升,在测试中可以不间断编码13小时,编写或修改超过4000行代码,完成复杂系统的开发和优化。Kimi K2.6大幅增强Agent自主化执行能力。由K2.6模型驱动的Agent集群架构支持300个子Agent并行完成4000个协作步骤,实现更大规模的并行化。针对Open Claw、Hermes Agent等主动式Agent框架,K2.6支持长达5天的持续自主运行。

a3c92e28-3d93-11f1-90a1-92fbcf53809c.gif

Kimi K2.6基于壁砺166系列产品完成推理任务

针对本次Kimi K2.6模型的1T MoE架构、256K长上下文、MLA多头潜在注意力等核心特性,壁仞科技基于主流开源框架vLLM开展全栈深度优化,精准适配32B激活参数,率先实现256K上下文无损推理。

为进一步提升推理性能,团队同步采用MoE专家调度优化、稀疏计算、Tensor Parallel与Context Parallel多级并行以及int4量化推理等多项技术,使模型在壁仞科技平台上实现低时延、高吞吐的高效运行。在此过程中,壁仞科技对Kimi K2.6的关键算子进行深度性能优化,通过自动化的算子调优策略显著提升了模型推理效率。

作为国产大模型生态的重要算力支撑,壁仞科技持续领跑国产GPU生态建设。依托壁砺166系列产品的高通用性与全自研BIRENSUPA软件栈的成熟度,壁仞科技近期已完成对月之暗面Kimi系列、阿里巴巴千问Qwen系列、MiniMax M2系列、智谱GLM系列、阶跃星辰Step系列、腾讯混元系列、OpenMOSS MOVA系列等领先大模型的Day0级适配支持,覆盖语言、多模态、AIGC全品类矩阵。

壁仞科技将持续助力国产SOTA大模型规模化落地,大幅降低开发者的模型部署与应用门槛,通过加速AI应用普惠化进程,成为智能经济新形态的关键引擎。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 开源
    +关注

    关注

    3

    文章

    4343

    浏览量

    46435
  • 模型
    +关注

    关注

    1

    文章

    3816

    浏览量

    52265
  • 壁仞科技
    +关注

    关注

    1

    文章

    88

    浏览量

    4198

原文标题:Day0适配 | 壁仞科技率先支持Kimi K2.6模型,高效赋能AI编程

文章出处:【微信号:Birentech,微信公众号:壁仞科技Birentech】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    登临科技KS系列GPU产品Day 0适配Kimi-K2.6模型

    2026年4月,随着Kimi-K2.6这一开源原生多模态智能体模型的正式发布,AI领域迎来了又一次重要的技术演进。该模型在长周期编程、编程驱动设计、智能体集群任务编排及主动自主执行等核心能力上取得了显著进展,为开发者和企业带来了
    的头像 发表于 04-23 16:59 166次阅读
    登临科技KS<b class='flag-5'>系列</b><b class='flag-5'>GPU</b><b class='flag-5'>产品</b>Day 0适配<b class='flag-5'>Kimi-K2.6</b><b class='flag-5'>模型</b>

    Kimi K2.6模型发布当天上线华为云

    4月20日, Kimi K2.6模型正式发布并开源,带来行业领先的代码、长程任务执行和Agent集群能力。当前,华为云完成适配并实现针对性优化。华为云MaaS模型即服务平台已为开发者提
    的头像 发表于 04-23 15:10 200次阅读
    <b class='flag-5'>Kimi</b> <b class='flag-5'>K2.6</b><b class='flag-5'>模型</b>发布当天上线华为云

    科技光速支持阿里Qwen3.6-35B-A3B大模型

    强大的通用性以及全自研BIRENSUPA软件栈的成熟度,旗下 166系列产品完成Qwen3.6-35B-A3B模型的光速适配。
    的头像 发表于 04-20 17:50 1477次阅读

    科技166系列产品Day 0适配智谱GLM-5.1旗舰模型

    科技(06082.HK)166系列产品模型发布当日率先完成适配,成为国内首批适配GLM-5
    的头像 发表于 04-09 11:23 382次阅读

    科技全面入驻国家教育开源平台启悟学习社区

    近日,为响应“十五五”规划、落实教育强国战略,在教育部科技司指导下,国家教育开源平台“启悟学习社区”(https://qiwoo.edu.cn)正式上线。作为首批入驻的国产通用GPU领军企业,
    的头像 发表于 04-07 15:52 280次阅读

    科技166系列产品深度适配MiniMax M2.5和智谱GLM-5模型

    2月13日晚,MiniMax正式开源了最新旗舰模型M2.5。科技(06082.HK)旗舰产品
    的头像 发表于 02-26 14:31 736次阅读
    <b class='flag-5'>壁</b><b class='flag-5'>仞</b>科技<b class='flag-5'>壁</b><b class='flag-5'>砺</b><b class='flag-5'>166</b><b class='flag-5'>系列产品</b>深度适配MiniMax M2.5和智谱GLM-5<b class='flag-5'>模型</b>

    科技166M产品适配模思智能MOSS-TTS Family模型

    2月10日,由上海创智学院孵化的模思智能及OpenMOSS团队正式发布并开源了MOSS-TTS Family。模型发布后,科技(06082.HK)旗舰产品
    的头像 发表于 02-11 16:54 1418次阅读

    科技166系列产品适配阶跃星辰基座模型Step 3.5 Flash

    NEWS 2月2日,阶跃星辰发布并开源最新旗舰基座模型Step 3.5 Flash。科技(06082.HK)作为国产GPGPU领域的先进技术领导者,
    的头像 发表于 02-02 17:48 1402次阅读
    <b class='flag-5'>壁</b><b class='flag-5'>仞</b>科技<b class='flag-5'>壁</b><b class='flag-5'>砺</b><b class='flag-5'>166</b><b class='flag-5'>系列产品</b>适配阶跃星辰基座<b class='flag-5'>模型</b>Step 3.5 Flash

    上海市闵行区领导走访调研科技

    1月22日,上海市闵行区委书记陆方舟走访调研科技,对公司成功上市表示祝贺,并与科技创始人、董事长兼CEO张文展开深入交流,全面了解企业研发实力、国产算力生态建设以及未来机遇与挑
    的头像 发表于 01-26 09:33 548次阅读

    科技在香港联合交易所挂牌上市

    1月2日,科技在香港联合交易所挂牌上市,股票代码为06082.HK。作为港股2026年首只上市新股,科技发行价19.60港元,募资规模55.83亿港元。此次成功登陆港交所,
    的头像 发表于 01-05 15:45 2316次阅读

    科技166M产品适配腾讯混元开源翻译模型1.5版本

    中文、英语、日语等常见语种,也包含捷克语、马拉地语、爱沙尼亚语、冰岛语等小语种。目前两个模型均已在腾讯混元官网上线,在Github和Huggingface等开源社区也可直接下载使用。科技
    的头像 发表于 01-05 15:39 437次阅读
    <b class='flag-5'>壁</b><b class='flag-5'>仞</b>科技<b class='flag-5'>壁</b><b class='flag-5'>砺</b><b class='flag-5'>166</b>M<b class='flag-5'>产品</b>适配腾讯混元开源翻译<b class='flag-5'>模型</b>1.5版本

    科技助力湖南移动国产算力资源池成功点亮

    12月15日,由湖南移动、科技、中兴通讯三方联合打造的湖南移动国产算力资源池全面建成并成功点亮。
    的头像 发表于 12-25 09:57 518次阅读

    科技完成Qwen3旗舰模型适配

    近日,在高效适配Qwen3系列模型推理后,科技宣布完成旗舰版Qwen3-235B-A22B模型的训练适配和优化。由此,
    的头像 发表于 05-16 16:23 1154次阅读

    科技完成阿里巴巴通义千问Qwen3全系列模型支持

    4月29日,阿里巴巴通义千问发布并开源8款新版Qwen3系列“混合推理模型”(简称“Qwen3”)。Qwen3发布后数小时内,科技完成全系列支持
    的头像 发表于 04-30 15:19 1710次阅读

    科技入选工信部2024年未来产业创新发展优秀典型案例

    工业和信息化部高新技术司近日公布2024年未来产业创新发展优秀典型案例申报成果,科技作为牵头单位,联合上海仪电、中兴通讯申报的 “软硬一体异构协同的国产GPU智算集群解决方案”,成功入选工信部
    的头像 发表于 04-24 12:55 1776次阅读