0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

壁仞科技壁砺166系列GPU产品率先支持腾讯混元Hy3 preview语言模型

壁仞科技Birentech 来源:壁仞科技Birentech 2026-04-28 14:01 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

4月23日,腾讯混元Hy3 preview语言模型发布并开源。依托全栈自研技术优势,壁仞科技基于vLLM主流开源框架实现Hy3 preview模型的Day0适配及推理验证。Hy3 preview与壁砺166系列GPU产品的“国模+国芯”联合,将充分释放大模型落地效能,全面赋能多元真实业务场景,为开发者和行业用户带来更高效、更稳定的部署体验。

Hy3 preview的官方介绍

Hy3 preview是一个快慢思考融合的混合专家模型,总参数295B,激活参数21B,最大支持256K上下文长度。这是混元重建后训练的第一个模型,在复杂推理、指令遵循、上下文学习、代码、智能体等能力及推理性能上实现了大幅的提升。

Hy3 preview可以视为混元快速探索实用性大模型、解决真实世界问题的一个开端。目前,Hy3 preview已在腾讯云、元宝、ima、CodeBuddy、WorkBuddy、QQ等首发上线,微信公众号、和平精英、腾讯新闻等多个主线产品也在陆续上线。另外,Hy3 preview支持接入流行的开源智能体产品,如OpenClaw、OpenCode、KiloCode等,并已上架腾讯云大模型服务平台TokenHub。

全栈技术优势实现Day0适配

得益于成熟的BIRENSUPA软件生态以及软硬协同能力,壁仞科技实现Hy3 preview模型Day0适配,快速贯通推理全链路。一方面,壁仞科技自研底层算子库覆盖全面、框架兼容性优异,可高效支撑Hy3 preview在注意力计算、MoE专家路由、长序列推理等关键链路上快速完成迁移与优化;另一方面,壁仞科技多机多卡推理部署能力出色,可稳定支持Tensor Parallel与Pipeline Parallel等并行方案,保障Hy3 preview在大参数、多卡协同场景下的运行效率。

2903989a-3f14-11f1-90a1-92fbcf53809c.gif

Hy3 preview基于壁砺166系列产品完成推理任务

针对Hy3 preview的192 Expert稀疏激活、Shared Expert共享专家、QK Norm注意力机制、GQA以及128K长上下文等核心特性,壁仞科技围绕专家调度、算子融合、KV Cache管理和执行链路开展深度优化,充分释放模型推理性能;通过自动化分析、算子调优和关键路径优化,显著缩短模型适配与性能优化周期,进一步提升Hy3 preview的推理效率与部署可用性。

“Day0 适配”阵营持续扩容

作为国产大模型生态的重要算力支撑,壁仞科技持续扩容“Day0 适配”阵营,领跑国产GPU生态建设。

近期,依托壁砺166系列产品的高通用性与全自研BIRENSUPA软件栈的成熟度,壁仞科技已完成腾讯混元系列、月之暗面Kimi系列、阿里巴巴千问Qwen系列、MiniMax M2系列、智谱GLM系列、阶跃星辰Step系列、OpenMOSS MOVA系列等领先大模型的全面适配,覆盖语言、多模态、AIGC全品类矩阵。未来,壁仞科技将以全栈化能力助力国产SOTA大模型规模化落地,降低开发者的模型部署与应用门槛,全面加速AI应用普惠进程。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • gpu
    gpu
    +关注

    关注

    28

    文章

    5278

    浏览量

    136077
  • 壁仞科技
    +关注

    关注

    1

    文章

    91

    浏览量

    4203
  • 大模型
    +关注

    关注

    2

    文章

    3787

    浏览量

    5273

原文标题:Day0适配 | 壁仞科技x腾讯混元,率先支持Hy3 preview语言模型

文章出处:【微信号:Birentech,微信公众号:壁仞科技Birentech】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    沐曦股份曦云C系列GPU产品Day 0适配腾讯Hy3 preview语言模型

    4月23日,腾讯团队正式发布并开源Hy3 preview语言
    的头像 发表于 04-28 15:51 143次阅读
    沐曦股份曦云C<b class='flag-5'>系列</b><b class='flag-5'>GPU</b><b class='flag-5'>产品</b>Day 0适配<b class='flag-5'>腾讯</b><b class='flag-5'>混</b><b class='flag-5'>元</b><b class='flag-5'>Hy3</b> <b class='flag-5'>preview</b><b class='flag-5'>语言</b><b class='flag-5'>模型</b>

    燧原科技L600适配腾讯Hy3 preview语言模型

    2026年4月23日,腾讯 Hy3 preview 语言
    的头像 发表于 04-28 15:13 62次阅读
    燧原科技L600适配<b class='flag-5'>腾讯</b><b class='flag-5'>混</b><b class='flag-5'>元</b><b class='flag-5'>Hy3</b> <b class='flag-5'>preview</b><b class='flag-5'>语言</b><b class='flag-5'>模型</b>

    科技率先完成中国移动九天35B大模型预适配

    伙伴,科技基于旗舰通用GPU产品166
    的头像 发表于 04-28 14:06 198次阅读
    <b class='flag-5'>壁</b><b class='flag-5'>仞</b>科技<b class='flag-5'>率先</b>完成中国移动九天35B大<b class='flag-5'>模型</b>预适配

    科技166系列GPU产品率先支持DeepSeek-V4模型

    完成DeepSeek-V4在旗舰通用GPU166系列产品的适配验证与优化,充分释放产品算力密
    的头像 发表于 04-28 14:04 186次阅读
    <b class='flag-5'>壁</b><b class='flag-5'>仞</b>科技<b class='flag-5'>壁</b><b class='flag-5'>砺</b><b class='flag-5'>166</b><b class='flag-5'>系列</b><b class='flag-5'>GPU</b><b class='flag-5'>产品</b><b class='flag-5'>率先</b><b class='flag-5'>支持</b>DeepSeek-V4<b class='flag-5'>模型</b>

    天数智芯深度适配腾讯开源Hy3 preview模型

    4 月 23 日,腾讯正式发布并开源 Hy3 preview模型,作为
    的头像 发表于 04-24 17:56 1625次阅读
    天数智芯深度适配<b class='flag-5'>腾讯</b><b class='flag-5'>混</b><b class='flag-5'>元</b>开源<b class='flag-5'>Hy3</b> <b class='flag-5'>preview</b>大<b class='flag-5'>模型</b>

    腾讯Hy3 preview开源:重构AI大模型技术范式,开启智能计算新纪元

    2026年4月23日,腾讯正式开源其最新语言模型Hy3
    的头像 发表于 04-24 09:07 781次阅读

    科技166系列GPU产品率先支持Kimi K2.6模型

    4月20日晚,月之暗面正式发布并开源Kimi K2.6模型,带来行业领先(state-of-the-art)的代码、长程任务执行和Agent集群能力。科技(06082.HK)旗舰通用GPU
    的头像 发表于 04-23 16:30 1038次阅读
    <b class='flag-5'>壁</b><b class='flag-5'>仞</b>科技<b class='flag-5'>壁</b><b class='flag-5'>砺</b><b class='flag-5'>166</b><b class='flag-5'>系列</b><b class='flag-5'>GPU</b><b class='flag-5'>产品</b><b class='flag-5'>率先</b><b class='flag-5'>支持</b>Kimi K2.6<b class='flag-5'>模型</b>

    科技光速支持阿里Qwen3.6-35B-A3B大模型

    强大的通用性以及全自研BIRENSUPA软件栈的成熟度,旗下 166系列产品完成Qwen3.6-35B-A3B
    的头像 发表于 04-20 17:50 1531次阅读

    科技166系列产品Day 0适配智谱GLM-5.1旗舰模型

    科技(06082.HK)166系列产品模型发布当日率先完成适配,成为国内首批适配GLM-5
    的头像 发表于 04-09 11:23 407次阅读

    科技166系列产品深度适配MiniMax M2.5和智谱GLM-5模型

    2月13日晚,MiniMax正式开源了最新旗舰模型M2.5。科技(06082.HK)旗舰产品
    的头像 发表于 02-26 14:31 756次阅读
    <b class='flag-5'>壁</b><b class='flag-5'>仞</b>科技<b class='flag-5'>壁</b><b class='flag-5'>砺</b><b class='flag-5'>166</b><b class='flag-5'>系列产品</b>深度适配MiniMax M2.5和智谱GLM-5<b class='flag-5'>模型</b>

    科技166M产品适配模思智能MOSS-TTS Family模型

    2月10日,由上海创智学院孵化的模思智能及OpenMOSS团队正式发布并开源了MOSS-TTS Family。模型发布后,科技(06082.HK)旗舰产品
    的头像 发表于 02-11 16:54 1436次阅读

    科技166系列产品适配阶跃星辰基座模型Step 3.5 Flash

    NEWS 2月2日,阶跃星辰发布并开源最新旗舰基座模型Step 3.5 Flash。科技(06082.HK)作为国产GPGPU领域的先进技术领导者,
    的头像 发表于 02-02 17:48 1437次阅读
    <b class='flag-5'>壁</b><b class='flag-5'>仞</b>科技<b class='flag-5'>壁</b><b class='flag-5'>砺</b><b class='flag-5'>166</b><b class='flag-5'>系列产品</b>适配阶跃星辰基座<b class='flag-5'>模型</b>Step 3.5 Flash

    科技166M产品适配腾讯开源翻译模型1.5版本

    中文、英语、日语等常见语种,也包含捷克语、马拉地语、爱沙尼亚语、冰岛语等小语种。目前两个模型均已在腾讯官网上线,在Github和Huggingface等开源社区也可直接下载使用。
    的头像 发表于 01-05 15:39 456次阅读
    <b class='flag-5'>壁</b><b class='flag-5'>仞</b>科技<b class='flag-5'>壁</b><b class='flag-5'>砺</b><b class='flag-5'>166</b>M<b class='flag-5'>产品</b>适配<b class='flag-5'>腾讯</b><b class='flag-5'>混</b><b class='flag-5'>元</b>开源翻译<b class='flag-5'>模型</b>1.5版本

    科技完成Qwen3旗舰模型适配

    近日,在高效适配Qwen3系列模型推理后,科技宣布完成旗舰版Qwen3-235B-A22B
    的头像 发表于 05-16 16:23 1173次阅读

    科技完成阿里巴巴通义千问Qwen3系列模型支持

    4月29日,阿里巴巴通义千问发布并开源8款新版Qwen3系列“混合推理模型”(简称“Qwen3”)。Qwen3发布后数小时内,
    的头像 发表于 04-30 15:19 1714次阅读