4月24日,深度求索团队宣布全新系列模型 DeepSeek-V4 的预览版本正式上线并同步开源。依托成熟的BIRENSUPA软件栈与自研GPU全栈智能体“AIModelMaster”,壁仞科技快速完成DeepSeek-V4在旗舰通用GPU壁砺166系列产品的适配验证与优化,充分释放产品算力密度与带宽优势,全面赋能GenAI推理加速。

实证:DeepSeek-V4基于BR166芯片完成推理任务
DeepSeek-V4
迈入百万上下文普惠时代
根据官方介绍,DeepSeek-V4拥有百万字超长上下文,在Agent能力、世界知识和推理性能上均实现国内与开源领域的领先。
其中,DeepSeek-V4-Pro性能比肩顶级闭源模型。在Agentic Coding评测中达到开源最佳水平;在数学、STEM 及竞赛代码测评中,超越所有公开评测的开源模型,展现出世界顶级的推理性能。DeepSeek-V4-Flash则更快捷高效;在简单任务的推理能力和 Agent 表现上与 Pro 版旗鼓相当,能提供更快捷、经济的 API 服务。随着1M(一百万)上下文成为DeepSeek所有官方服务的标配后,大模型将迈入百万长文本普惠新时代。

DeepSeek-V4系列模型
自研AIModelMaster
支撑模型“越跑越快越优”
壁仞科技本次适配聚焦DeepSeek-V4核心技术特性,围绕MoE架构、稀疏注意力、FP8混合精度等关键模块展开深度优化,依托BIRENSUPA软件栈与AIModelMaster,完成模型验证跑通、定制化算子开发及端到端性能调优,实现“当天适配、次日优化”的极速交付。
AIModelMaster是壁仞科技推出的面向自研GPU全栈、贯通“部署-适配-深度优化”全链路的智能体系统,基于AI Agent接收AI模型(支持HuggingFace、ModelScope或本地checkpoint),通过br_pytorch+BIRENSUPA栈完成向壁砺系列硬件的适配。


壁仞科技自研GPU全栈智能体
AIModelMaster三大核心能力
一,Day0极速适配,可实现主流大模型发布当日即可在壁仞科技算力平台快速跑通,将原本数周的适配周期压缩至小时级,并已通过多轮真实大模型落地验证;
二,全自动深度优化,不止保障模型和算子顺利运行,更通过自动化硬门控机制精准攻克性能瓶颈,集成AIOpMaster自动生成和优化算子的能力,全方位优化性能,实现端到端数倍性能加速;
三,自演进能力,系统会沉淀每一轮优化经验至专属知识库,让同类型模型后续适配优化实现高位起步,真正做到长期迭代进化,有效降本提效,达成部署越久、人力更省、周期更短、硬件利用率更高的落地价值。
全栈自研技术能力
助力国产SOTA大模型规模化落地
壁仞科技坚定走全栈自主研发路线,从微架构、指令集到软件栈全面实现核心技术自主可控;BIRENSUPA软件栈深度兼容PyTorch、vLLM、SGLang、Diffusers等主流AI框架生态,支持500+ AI模型开箱即用;凭借卓越的技术成熟度,壁砺166系列可显著降低开发者的模型部署与应用门槛,以全栈化能力助力国产SOTA大模型规模化落地。
近期,壁仞科技已完成Deepseek V/R系列、腾讯混元系列、月之暗面Kimi系列、阿里巴巴千问Qwen系列、MiniMax M2系列、智谱GLM系列、阶跃星辰Step系列、OpenMOSS MOVA系列等领先大模型的全面适配,覆盖语言、多模态、AIGC全品类矩阵。
-
gpu
+关注
关注
28文章
5278浏览量
136076 -
壁仞科技
+关注
关注
1文章
91浏览量
4203 -
DeepSeek
+关注
关注
2文章
847浏览量
3406
原文标题:壁仞科技壁砺™166系列完成DeepSeek-V4适配验证与优化
文章出处:【微信号:Birentech,微信公众号:壁仞科技Birentech】欢迎添加关注!文章转载请注明出处。
发布评论请先 登录
华为云首发适配DeepSeek-V4模型
OpenClaw 全面接入DeepSeek-V4系列模型
荣耀YOYO首搭DeepSeek-V4大模型 重塑安卓端侧AI新标杆
壁仞科技壁砺166系列GPU产品率先支持Kimi K2.6模型
壁仞科技光速支持阿里Qwen3.6-35B-A3B大模型
壁仞科技壁砺166系列产品Day 0适配智谱GLM-5.1旗舰模型
壁仞科技壁砺166M产品适配模思智能MOSS-TTS Family模型
壁仞科技壁砺166系列产品适配阶跃星辰基座模型Step 3.5 Flash
壁仞科技在香港联合交易所挂牌上市
壁仞科技壁砺166M产品适配腾讯混元开源翻译模型1.5版本
壁仞科技壁砺166系列GPU产品率先支持DeepSeek-V4模型
评论