4月24日,深度求索正式发布并开源DeepSeek V4。海光DCU同步完成对DeepSeek V4的Day0适配,以“模型发布—芯片适配—产业落地”的高效闭环,为全球开发者、企业客户提供即取即用的部署方案。
海光DCU团队一直重视“国产大模型+国产算力”的联合创新,致力于以软硬协同的方式促进AI模型部署降本增效。本次适配过程中,海光DCU对DeepSeek V4模型实现深度调优,再次达成业界领先的计算效率。
全栈生态,支持更快迁移
依托海光DCU通用架构与全精度优势,DTK(异构计算平台)以完整成熟的计算库覆盖训练、推理、AI4S等全场景,为DeepSeek V4提供完整的软件生态支撑。
多重优化,实现更高性能
DAS(人工智能基础软件系统)集成超2000个算子,支持Pytorch、TensorFlow、vLLM、SGLang等100+主流AI框架组件,通过算子调优、编译优化、通算融合等多重技术,极致释放海光DCU算力,大幅提高DeepSeek V4微调与推理性能。
应用落地,激发创新潜力
DAP(人工智能应用平台)内置知识库引擎、智能体编排引擎等高阶模块,搭配OpenDAS开源拓展套件与光源模型仓库,面向OEM、伙伴、客户深度开放,可将DeepSeek V4便捷集成到主流AI平台。
依托自研AI软件栈+开放生态协同优势,海光DCU现已完成400+国内外主流大模型联合优化,覆盖全球99%非闭源大模型。包括DeepSeek、Qwen、智谱GLM等模型在内,均已实现“发布即适配、上线即可用”的高度同频。
在AI技术迭代与算力底座的协同步调下,海光正深度参与到超大规模计算基础设施建设:由数万张DCU组成的算力集群为多个万亿参数大模型训练提供可靠支撑,在技术成熟度、生态开放性与工程化能力方面均处于业内领先水平。
目前,基于海光计算平台的开放者生态越发壮大,光合开发者社区已汇聚超50万开发者,覆盖1200多所高校及企业。得益于国家级赛事、实战训练营、实习招募等多重资源赋能,海光DCU开发者正迎来从入门到进阶、从学习到实战的全周期成长路径。
-
模型
+关注
关注
1文章
3818浏览量
52265 -
海光信息
+关注
关注
0文章
57浏览量
2738 -
DeepSeek
+关注
关注
2文章
839浏览量
3397
发布评论请先 登录
长江计算G940K V2超节点服务器完成对DeepSeek V4模型极速适配
摩尔线程S5000 + 智源FlagOS:基于原生FP8引擎,Day-0适配DeepSeek-V4
海光信息DCU平台适配阿里通义Qwen3.6-35B-A3B大模型
海光信息CPU与DCU双芯亮相2026香港国际创科展
海光信息全面适配统信桌面操作系统V25
海光DCU Day0适配百度文心ERNIE-Image文生图模型
昆仑芯科技完成MiniMax M2.7模型极速适配
海光DCU完成阶跃星辰基座模型Step 3.5 Flash推理适配
海光DCU完成Qwen3.5多模态MoE模型全量适配
中科曙光AI超集群系统和scaleX640超节点等产品全面适配DeepSeek V3.2
寒武纪成功适配DeepSeek-V3.2-Exp模型
海光信息DCU平台完成对DeepSeek V4模型极速适配
评论