4月23日,腾讯混元Hy3 preview语言模型发布并开源。依托全栈自研技术优势,壁仞科技基于vLLM主流开源框架实现Hy3 preview模型的Day0适配及推理验证。Hy3 preview与壁砺166系列GPU产品的“国模+国芯”联合,将充分释放大模型落地效能,全面赋能多元真实业务场景,为开发者和行业用户带来更高效、更稳定的部署体验。
Hy3 preview的官方介绍
Hy3 preview是一个快慢思考融合的混合专家模型,总参数295B,激活参数21B,最大支持256K上下文长度。这是混元重建后训练的第一个模型,在复杂推理、指令遵循、上下文学习、代码、智能体等能力及推理性能上实现了大幅的提升。
Hy3 preview可以视为混元快速探索实用性大模型、解决真实世界问题的一个开端。目前,Hy3 preview已在腾讯云、元宝、ima、CodeBuddy、WorkBuddy、QQ等首发上线,微信公众号、和平精英、腾讯新闻等多个主线产品也在陆续上线。另外,Hy3 preview支持接入流行的开源智能体产品,如OpenClaw、OpenCode、KiloCode等,并已上架腾讯云大模型服务平台TokenHub。
全栈技术优势实现Day0适配
得益于成熟的BIRENSUPA软件生态以及软硬协同能力,壁仞科技实现Hy3 preview模型Day0适配,快速贯通推理全链路。一方面,壁仞科技自研底层算子库覆盖全面、框架兼容性优异,可高效支撑Hy3 preview在注意力计算、MoE专家路由、长序列推理等关键链路上快速完成迁移与优化;另一方面,壁仞科技多机多卡推理部署能力出色,可稳定支持Tensor Parallel与Pipeline Parallel等并行方案,保障Hy3 preview在大参数、多卡协同场景下的运行效率。

Hy3 preview基于壁砺166系列产品完成推理任务
针对Hy3 preview的192 Expert稀疏激活、Shared Expert共享专家、QK Norm注意力机制、GQA以及128K长上下文等核心特性,壁仞科技围绕专家调度、算子融合、KV Cache管理和执行链路开展深度优化,充分释放模型推理性能;通过自动化分析、算子调优和关键路径优化,显著缩短模型适配与性能优化周期,进一步提升Hy3 preview的推理效率与部署可用性。
“Day0 适配”阵营持续扩容
作为国产大模型生态的重要算力支撑,壁仞科技持续扩容“Day0 适配”阵营,领跑国产GPU生态建设。
近期,依托壁砺166系列产品的高通用性与全自研BIRENSUPA软件栈的成熟度,壁仞科技已完成腾讯混元系列、月之暗面Kimi系列、阿里巴巴千问Qwen系列、MiniMax M2系列、智谱GLM系列、阶跃星辰Step系列、OpenMOSS MOVA系列等领先大模型的全面适配,覆盖语言、多模态、AIGC全品类矩阵。未来,壁仞科技将以全栈化能力助力国产SOTA大模型规模化落地,降低开发者的模型部署与应用门槛,全面加速AI应用普惠进程。
-
gpu
+关注
关注
28文章
5278浏览量
136077 -
壁仞科技
+关注
关注
1文章
91浏览量
4203 -
大模型
+关注
关注
2文章
3787浏览量
5273
原文标题:Day0适配 | 壁仞科技x腾讯混元,率先支持Hy3 preview语言模型
文章出处:【微信号:Birentech,微信公众号:壁仞科技Birentech】欢迎添加关注!文章转载请注明出处。
发布评论请先 登录
壁仞科技壁砺166系列GPU产品率先支持Kimi K2.6模型
壁仞科技光速支持阿里Qwen3.6-35B-A3B大模型
壁仞科技壁砺166系列产品Day 0适配智谱GLM-5.1旗舰模型
壁仞科技壁砺166M产品适配模思智能MOSS-TTS Family模型
壁仞科技壁砺166系列产品适配阶跃星辰基座模型Step 3.5 Flash
壁仞科技壁砺166M产品适配腾讯混元开源翻译模型1.5版本
壁仞科技壁砺166系列GPU产品率先支持腾讯混元Hy3 preview语言模型
评论