0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

壁仞科技壁砺166系列GPU产品率先支持DeepSeek-V4模型

壁仞科技Birentech 来源:壁仞科技Birentech 2026-04-28 14:04 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

4月24日,深度求索团队宣布全新系列模型 DeepSeek-V4 的预览版本正式上线并同步开源。依托成熟的BIRENSUPA软件栈与自研GPU全栈智能体“AIModelMaster”,壁仞科技快速完成DeepSeek-V4在旗舰通用GPU壁砺166系列产品的适配验证与优化,充分释放产品算力密度与带宽优势,全面赋能GenAI推理加速。

fbe13d12-40bd-11f1-90a1-92fbcf53809c.gif

实证:DeepSeek-V4基于BR166芯片完成推理任务

DeepSeek-V4

迈入百万上下文普惠时代

根据官方介绍,DeepSeek-V4拥有百万字超长上下文,在Agent能力、世界知识和推理性能上均实现国内与开源领域的领先。

其中,DeepSeek-V4-Pro性能比肩顶级闭源模型。在Agentic Coding评测中达到开源最佳水平;在数学、STEM 及竞赛代码测评中,超越所有公开评测的开源模型,展现出世界顶级的推理性能。DeepSeek-V4-Flash则更快捷高效;在简单任务的推理能力和 Agent 表现上与 Pro 版旗鼓相当,能提供更快捷、经济的 API 服务。随着1M(一百万)上下文成为DeepSeek所有官方服务的标配后,大模型将迈入百万长文本普惠新时代。

fc427bfe-40bd-11f1-90a1-92fbcf53809c.png

DeepSeek-V4系列模型

自研AIModelMaster

支撑模型“越跑越快越优”

壁仞科技本次适配聚焦DeepSeek-V4核心技术特性,围绕MoE架构、稀疏注意力、FP8混合精度等关键模块展开深度优化,依托BIRENSUPA软件栈与AIModelMaster,完成模型验证跑通、定制化算子开发及端到端性能调优,实现“当天适配、次日优化”的极速交付。

AIModelMaster是壁仞科技推出的面向自研GPU全栈、贯通“部署-适配-深度优化”全链路的智能体系统,基于AI Agent接收AI模型(支持HuggingFace、ModelScope或本地checkpoint),通过br_pytorch+BIRENSUPA栈完成向壁砺系列硬件的适配。

fce5fbc6-40bd-11f1-90a1-92fbcf53809c.pngfd40e3b0-40bd-11f1-90a1-92fbcf53809c.png

壁仞科技自研GPU全栈智能体

AIModelMaster三大核心能力

一,Day0极速适配,可实现主流大模型发布当日即可在壁仞科技算力平台快速跑通,将原本数周的适配周期压缩至小时级,并已通过多轮真实大模型落地验证;

二,全自动深度优化,不止保障模型和算子顺利运行,更通过自动化硬门控机制精准攻克性能瓶颈,集成AIOpMaster自动生成和优化算子的能力,全方位优化性能,实现端到端数倍性能加速;

三,自演进能力,系统会沉淀每一轮优化经验至专属知识库,让同类型模型后续适配优化实现高位起步,真正做到长期迭代进化,有效降本提效,达成部署越久、人力更省、周期更短、硬件利用率更高的落地价值。

全栈自研技术能力

助力国产SOTA大模型规模化落地

壁仞科技坚定走全栈自主研发路线,从微架构、指令集到软件栈全面实现核心技术自主可控;BIRENSUPA软件栈深度兼容PyTorch、vLLM、SGLang、Diffusers等主流AI框架生态,支持500+ AI模型开箱即用;凭借卓越的技术成熟度,壁砺166系列可显著降低开发者的模型部署与应用门槛,以全栈化能力助力国产SOTA大模型规模化落地。

近期,壁仞科技已完成Deepseek V/R系列、腾讯混元系列、月之暗面Kimi系列、阿里巴巴千问Qwen系列、MiniMax M2系列、智谱GLM系列、阶跃星辰Step系列、OpenMOSS MOVA系列等领先大模型的全面适配,覆盖语言、多模态、AIGC全品类矩阵。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • gpu
    gpu
    +关注

    关注

    28

    文章

    5278

    浏览量

    136076
  • 壁仞科技
    +关注

    关注

    1

    文章

    91

    浏览量

    4203
  • DeepSeek
    +关注

    关注

    2

    文章

    847

    浏览量

    3406

原文标题:壁仞科技壁砺™166系列完成DeepSeek-V4适配验证与优化

文章出处:【微信号:Birentech,微信公众号:壁仞科技Birentech】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    华为云首发适配DeepSeek-V4模型

    4月24日,DeepSeek-V4模型正式发布并开源,华为云首发适配。DeepSeek-V4拥有百万Token超长上下文,在Agent能力、世界知识和推理性能上均实现国内与开源领域的领
    的头像 发表于 04-28 17:01 12次阅读

    科技率先完成中国移动九天35B大模型预适配

    伙伴,科技基于旗舰通用GPU产品166
    的头像 发表于 04-28 14:06 148次阅读
    <b class='flag-5'>壁</b><b class='flag-5'>仞</b>科技<b class='flag-5'>率先</b>完成中国移动九天35B大<b class='flag-5'>模型</b>预适配

    科技166系列GPU产品率先支持腾讯混元Hy3 preview语言模型

    166系列GPU产品的“国模+国芯”联合,将充分释放大模型落地效能,全面赋能多元真实业务场景,
    的头像 发表于 04-28 14:01 118次阅读
    <b class='flag-5'>壁</b><b class='flag-5'>仞</b>科技<b class='flag-5'>壁</b><b class='flag-5'>砺</b><b class='flag-5'>166</b><b class='flag-5'>系列</b><b class='flag-5'>GPU</b><b class='flag-5'>产品</b><b class='flag-5'>率先</b><b class='flag-5'>支持</b>腾讯混元Hy3 preview语言<b class='flag-5'>模型</b>

    OpenClaw 全面接入DeepSeek-V4系列模型

    近期,OpenClaw 2026.4.24版本全面接入DeepSeek-V4系列模型,以V4-Flash为默认大脑,V4-Pro同步上线,构
    的头像 发表于 04-28 09:29 405次阅读

    荣耀YOYO首搭DeepSeek-V4模型 重塑安卓端侧AI新标杆

    近日,荣耀YOYO接入DeepSeek-V4模型,标志着安卓阵营在AI智能助理领域实现重大突破
    的头像 发表于 04-28 09:17 362次阅读

    科技166系列GPU产品率先支持Kimi K2.6模型

    4月20日晚,月之暗面正式发布并开源Kimi K2.6模型,带来行业领先(state-of-the-art)的代码、长程任务执行和Agent集群能力。科技(06082.HK)旗舰通
    的头像 发表于 04-23 16:30 1027次阅读
    <b class='flag-5'>壁</b><b class='flag-5'>仞</b>科技<b class='flag-5'>壁</b><b class='flag-5'>砺</b><b class='flag-5'>166</b><b class='flag-5'>系列</b><b class='flag-5'>GPU</b><b class='flag-5'>产品</b><b class='flag-5'>率先</b><b class='flag-5'>支持</b>Kimi K2.6<b class='flag-5'>模型</b>

    科技光速支持阿里Qwen3.6-35B-A3B大模型

    强大的通用性以及全自研BIRENSUPA软件栈的成熟度,旗下 166系列产品完成Qwen3.6-35B-A3B模型的光速适配。
    的头像 发表于 04-20 17:50 1529次阅读

    科技166系列产品Day 0适配智谱GLM-5.1旗舰模型

    科技(06082.HK)166系列产品模型发布当日率先完成适配,成为国内首批适配GLM-5
    的头像 发表于 04-09 11:23 407次阅读

    科技166系列产品深度适配MiniMax M2.5和智谱GLM-5模型

    2月13日晚,MiniMax正式开源了最新旗舰模型M2.5。科技(06082.HK)旗舰产品
    的头像 发表于 02-26 14:31 756次阅读
    <b class='flag-5'>壁</b><b class='flag-5'>仞</b>科技<b class='flag-5'>壁</b><b class='flag-5'>砺</b><b class='flag-5'>166</b><b class='flag-5'>系列产品</b>深度适配MiniMax M2.5和智谱GLM-5<b class='flag-5'>模型</b>

    科技166M产品适配模思智能MOSS-TTS Family模型

    2月10日,由上海创智学院孵化的模思智能及OpenMOSS团队正式发布并开源了MOSS-TTS Family。模型发布后,科技(06082.HK)旗舰产品
    的头像 发表于 02-11 16:54 1436次阅读

    科技166系列产品适配阶跃星辰基座模型Step 3.5 Flash

    NEWS 2月2日,阶跃星辰发布并开源最新旗舰基座模型Step 3.5 Flash。科技(06082.HK)作为国产GPGPU领域的先进技术领导者,
    的头像 发表于 02-02 17:48 1433次阅读
    <b class='flag-5'>壁</b><b class='flag-5'>仞</b>科技<b class='flag-5'>壁</b><b class='flag-5'>砺</b><b class='flag-5'>166</b><b class='flag-5'>系列产品</b>适配阶跃星辰基座<b class='flag-5'>模型</b>Step 3.5 Flash

    科技在香港联合交易所挂牌上市

    1月2日,科技在香港联合交易所挂牌上市,股票代码为06082.HK。作为港股2026年首只上市新股,科技发行价19.60港元,募资规模55.83亿港元。此次成功登陆港交所,
    的头像 发表于 01-05 15:45 2326次阅读

    科技166M产品适配腾讯混元开源翻译模型1.5版本

    中文、英语、日语等常见语种,也包含捷克语、马拉地语、爱沙尼亚语、冰岛语等小语种。目前两个模型均已在腾讯混元官网上线,在Github和Huggingface等开源社区也可直接下载使用。科技
    的头像 发表于 01-05 15:39 456次阅读
    <b class='flag-5'>壁</b><b class='flag-5'>仞</b>科技<b class='flag-5'>壁</b><b class='flag-5'>砺</b><b class='flag-5'>166</b>M<b class='flag-5'>产品</b>适配腾讯混元开源翻译<b class='flag-5'>模型</b>1.5版本

    科技完成Qwen3旗舰模型适配

    近日,在高效适配Qwen3系列模型推理后,科技宣布完成旗舰版Qwen3-235B-A22B模型的训练适配和优化。由此,
    的头像 发表于 05-16 16:23 1173次阅读

    科技完成阿里巴巴通义千问Qwen3全系列模型支持

    4月29日,阿里巴巴通义千问发布并开源8款新版Qwen3系列“混合推理模型”(简称“Qwen3”)。Qwen3发布后数小时内,科技完成全
    的头像 发表于 04-30 15:19 1714次阅读