4月24日,DeepSeek-V4模型正式发布并开源,华为云首发适配。DeepSeek-V4拥有百万Token超长上下文,在Agent能力、世界知识和推理性能上均实现国内与开源领域的领先。其中,DeepSeek-V4-Flash模型参数下降至284B,推理成本进一步降低,模型参数和激活更小,V4-Flash能够提供更加快捷、经济的API服务,实现百万上下文普惠。当前,华为云MaaS模型即服务平台已为开发者提供免部署、一键调用DeepSeek-V4-Flash API的Tokens服务。
在此次新模型适配过程中,华为云在系统层、算子层和集群层的关键能力上协同,分别从调度效率、计算效率和数据流转效率三个维度保障新模型快速适配与高性能落地。
针对DeepSeek-V4,华为云首发适配模型分层注意力压缩机制,实现V4注意力机制下 KVCache的高效分配管理,提供TopK、SWA、CFA等10+昇腾高性能融合算子,搭配框架异步调度、MTP多步投机等框架优化,支持原生1M长上下文的高性能推理。
华为云以高效的AI基础设施为核心打造“硅基黑土地”,开放接纳自研和第三方主流大模型和众多智能体,为企业解难题,提升生产效率!
-
模型
+关注
关注
1文章
3826浏览量
52276 -
华为云
+关注
关注
3文章
2837浏览量
19373 -
DeepSeek
+关注
关注
2文章
847浏览量
3406
原文标题:DeepSeek-V4发布,华为云首发适配
文章出处:【微信号:huaweicorp,微信公众号:华为】欢迎添加关注!文章转载请注明出处。
发布评论请先 登录
华为昇腾超节点系列产品全面支持DeepSeek V4模型
软通华方超节点服务器产品全面适配DeepSeek V4模型
沐曦股份Day 0适配DeepSeek-V4-Flash模型
燧原科技L600 FP8原生适配DeepSeek-V4-Pro/Flash模型
国产AI换芯提速!DeepSeek V4和小米MiMo-2.5上线,主流国产芯片适配
壁仞科技壁砺166系列GPU产品率先支持DeepSeek-V4模型
OpenClaw 全面接入DeepSeek-V4系列模型
荣耀YOYO首搭DeepSeek-V4大模型 重塑安卓端侧AI新标杆
长江计算G940K V2超节点服务器完成对DeepSeek V4模型极速适配
海光信息DCU平台完成对DeepSeek V4模型极速适配
摩尔线程S5000 + 智源FlagOS:基于原生FP8引擎,Day-0适配DeepSeek-V4
中科曙光AI超集群系统和scaleX640超节点等产品全面适配DeepSeek V3.2
DeepSeek模型如何在云服务器上部署?
寒武纪成功适配DeepSeek-V3.2-Exp模型
华为云首发适配DeepSeek-V4模型
评论