0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

海光信息DCU平台完成对DeepSeek V4模型极速适配

CHANBAEK 来源:海光信息 2026-04-24 17:32 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

4月24日,深度求索正式发布并开源DeepSeek V4。海光DCU同步完成对DeepSeek V4的Day0适配,以“模型发布—芯片适配—产业落地”的高效闭环,为全球开发者、企业客户提供即取即用的部署方案。

海光DCU团队一直重视“国产大模型+国产算力”的联合创新,致力于以软硬协同的方式促进AI模型部署降本增效。本次适配过程中,海光DCU对DeepSeek V4模型实现深度调优,再次达成业界领先的计算效率。

全栈生态,支持更快迁移

依托海光DCU通用架构与全精度优势,DTK(异构计算平台)以完整成熟的计算库覆盖训练、推理、AI4S等全场景,为DeepSeek V4提供完整的软件生态支撑。

多重优化,实现更高性能

DAS(人工智能基础软件系统)集成超2000个算子,支持Pytorch、TensorFlow、vLLM、SGLang等100+主流AI框架组件,通过算子调优、编译优化、通算融合等多重技术,极致释放海光DCU算力,大幅提高DeepSeek V4微调与推理性能。

应用落地,激发创新潜力

DAP(人工智能应用平台)内置知识库引擎、智能体编排引擎等高阶模块,搭配OpenDAS开源拓展套件与光源模型仓库,面向OEM、伙伴、客户深度开放,可将DeepSeek V4便捷集成到主流AI平台。

依托自研AI软件栈+开放生态协同优势,海光DCU现已完成400+国内外主流大模型联合优化,覆盖全球99%非闭源大模型。包括DeepSeek、Qwen、智谱GLM等模型在内,均已实现“发布即适配、上线即可用”的高度同频。

AI技术迭代与算力底座的协同步调下,海光正深度参与到超大规模计算基础设施建设:由数万张DCU组成的算力集群为多个万亿参数大模型训练提供可靠支撑,在技术成熟度、生态开放性与工程化能力方面均处于业内领先水平。

目前,基于海光计算平台的开放者生态越发壮大,光合开发者社区已汇聚超50万开发者,覆盖1200多所高校及企业。得益于国家级赛事、实战训练营、实习招募等多重资源赋能,海光DCU开发者正迎来从入门到进阶、从学习到实战的全周期成长路径。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 模型
    +关注

    关注

    1

    文章

    3907

    浏览量

    52421
  • 海光信息
    +关注

    关注

    0

    文章

    67

    浏览量

    2768
  • DeepSeek
    +关注

    关注

    2

    文章

    864

    浏览量

    3536
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    智源FlagOS携手信息完成DeepSeek V4 Flash全量适配

    近日,北京智源研究院众智FlagOS社区宣布,已完成DeepSeekV4Flash 284B大模型等多款AI芯片上的Day0全量
    的头像 发表于 05-14 17:34 938次阅读

    信息DCU产品深度适配商汤科技SenseNova U1系列大模型

    近日,商汤科技推出并开源新一代原生多模态大模型SenseNova U1,DCU率先完成适配
    的头像 发表于 05-14 17:32 803次阅读

    信息深算3号DCU深度适配腾讯混元Hy3 preview大模型

    近日,信息自主研发的深算3号DCU完成与腾讯最新开源大模型 —— 混元Hy3 previe
    的头像 发表于 05-12 17:49 1617次阅读

    燧弘华创HonMaaS平台深度适配DeepSeek-V4模型

    第一时间完成DeepSeek-V4全系列模型深度适配与无缝集成。目前,基于DeepSeek-V4的高性能Token服务已正式面向企业客户开放
    的头像 发表于 05-06 14:55 457次阅读
    燧弘华创HonMaaS<b class='flag-5'>平台</b>深度<b class='flag-5'>适配</b><b class='flag-5'>DeepSeek-V4</b>大<b class='flag-5'>模型</b>

    昆仑芯科技完成小米MiMo-V2.5-Pro大模型极速适配

    小米正式发布并开源MiMo-V2.5-Pro模型。昆仑芯在发布当日即完成对MiMo-V2.5-Pro的极速
    的头像 发表于 05-06 10:53 812次阅读

    云天励飞完成DeepSeek-V4系列模型关键机制适配验证

    4月24日,DeepSeek-V4 系列模型发布。围绕该模型 CSA/HCA 混合注意力机制带来的新型计算需求,云天励飞依托自研 GPNPU 架构及 IFWA 智能融合软件栈,通过 P
    的头像 发表于 04-30 17:09 5308次阅读

    开放原子AtomGit平台首发适配DeepSeek-V4系列模型

    2026年4月24日,DeepSeek-V4系列模型正式发布并同步开源。AtomGit平台DeepSeek-V4昇腾
    的头像 发表于 04-29 16:12 981次阅读

    软通华方超节点服务器产品全面适配DeepSeek V4模型

    超节点服务器,率先完成了对DeepSeek V4的全栈适配与验证工作。这一举措不仅展现了公司在国产算力领域的深厚技术积淀,更为广大企业用户提供了稳定、高效的算力底座,加速
    的头像 发表于 04-28 16:34 520次阅读

    燧原科技L600 FP8原生适配DeepSeek-V4-Pro/Flash模型

    2026年4月24日,深度求索(DeepSeek)正式发布并开源新一代旗舰大模型DeepSeekV4,同步推出1.6T
    的头像 发表于 04-28 15:19 728次阅读

    长江计算G940K V2超节点服务器完成对DeepSeek V4模型极速适配

      4月24日,备受行业关注的大模型产品DeepSeek V4正式发布。烽火通信旗下长江计算凭借深厚的技术积累与前瞻布局,以G940K V2
    的头像 发表于 04-24 17:40 2123次阅读

    信息DCU平台适配阿里通义Qwen3.6-35B-A3B大模型

      近日,阿里通义正式开源多模态智能体大模型Qwen3.6-35B-A3B,发布不到24小时,信息联合众智FlagOS社区完成
    的头像 发表于 04-21 17:40 2190次阅读

    DCU Day0适配百度文心ERNIE-Image文生图模型

      今天,百度文心大模型团队发布ERNIE-Image文生图模型DCU同步完成Day0
    的头像 发表于 04-15 15:47 461次阅读

    DCU完成阶跃星辰基座模型Step 3.5 Flash推理适配

    近日,DCU正式完成对阶跃星辰旗舰开源基座模型Step 3.5 Flash的全流程适配与深度
    的头像 发表于 03-26 09:48 833次阅读

    DCU完成Qwen3.5多模态MoE模型全量适配

    近日,DCU完成Qwen3.5-397B MoE旗舰多模态模型、Qwen3.5-35B-A3B MoE多模态
    的头像 发表于 03-26 09:35 978次阅读

    DCU率先展开文心系列模型的深度技术合作 FLOPs利用率(MFU)达47%

    DCU实现文心4.5模型高效适配; FLOPs利用率突破47%。 2025年6月30日,在百度文心4.5系列大
    的头像 发表于 07-01 14:35 2753次阅读