0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

中科曙光发布国内首个开放架构AI超集群系统

中科曙光 来源:中科曙光 2025-09-06 09:11 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

9月5日,在2025重庆世界智能产业博览会上,中科曙光发布了国内首个基于AI计算开放架构设计的产品——曙光AI超集群系统。该系统以GPU为核心,实现了“算、存、网、电、冷、管、软”一体化紧耦合设计,具备“超高性能、超高效率、超高可靠、全面开放”四大特点,可为万亿参数大模型训练推理、行业大模型微调、多模态大模型开发、AI4S等场景提供高效算力底座。

相比封闭系统,曙光AI超集群系统除了通过紧耦合设计像一台计算机般高效工作外,还支持多品牌AI加速卡以及兼容CUDA等主流软件生态,为用户提供更多开放性选择,并大幅降低硬件成本和软件开发适配成本,保护前期投资。

当前,伴随AI大模型快速演进以及全球IT产业生态体系调整,国内AI算力领域面临高端算力供给不足、国产加速卡性能差距大、算力成本高、自主软硬件生态不成熟等严峻挑战。

而发展更大规模、更高效智算集群来弥补国产单卡算力差距以突破算力瓶颈,打造开放式、标准化、高效率的算力集群,以实现智算集群的易用与可控成本,已经成为产业界共识。

“中科曙光拥有30年高性能计算技术积累,可携手产业伙伴一起突破当下算力瓶颈,共建开放、普惠的智算产业生态。”中科曙光总裁助理、智能计算产品事业部总经理杜夏威表示,克服国内AI算力多维挑战,需汇聚芯片、计算系统、大模型等产业链多方力量,构建开放AI计算架构并拉通产业间跨层协作,以打破“技术墙”与“生态墙”。

而作为开放式、标准化、高效率算力集群的样板,曙光AI超集群系统具有如下技术特点:

超高性能:单机柜可搭载96张GPU卡、算力规模达百P级、访存总带宽超180TB/s;支持多精度、混合精度运算;支持百万卡超大集群扩展。

超高效率:千卡集群大模型训练推理性能达到业界主流水平2.3倍、开发效率提升4倍、人天投入减少70%;存算传协同,提升GPU计算效率55%;先进冷板液冷,394项节能设计PUE低于1.12。

超高可靠:121项设备和链路RAS可靠性设计;平均无故障时间(MTBF)提高2.1倍;平均故障修复时间(MTTR)降低47%;超30天长稳运行集群可靠性测试;实现百万级部件故障自动分析与秒级隔离。

全面开放:基于AI计算开放架构设计;硬件适配多品牌AI加速卡;软件兼容主流AI计算生态;多项技术能力开放与共享。

杜夏威介绍,曙光AI超集群系统不仅是产品,更是面向产业界的开放创新平台。依托AI超集群系统,中科曙光将开放AI存储优化能力、液冷基础设施设计规范、DeepAI基础软件栈等三项技术能力,助力合作伙伴、重点用户在AI应用存储性能加速、液冷超节点系统设计、GPU开发统一开发框架等方面获得高级别技术共享、深度定制优化与专业技术支持。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • AI
    AI
    +关注

    关注

    89

    文章

    38103

    浏览量

    296626
  • 中科曙光
    +关注

    关注

    5

    文章

    458

    浏览量

    18832
  • 大模型
    +关注

    关注

    2

    文章

    3440

    浏览量

    4967

原文标题:可支持百万卡扩展!中科曙光发布国内首个开放架构AI超集群系统

文章出处:【微信号:sugoncn,微信公众号:中科曙光】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    中科曙光智融合技术革新汽车研发仿真

    近日,由中科曙光承建的汽车高性能计算平台项目投入运营。作为国内领先汽车制造商,在曙光承建的计算平台投入运营之前,该车企正面临日益复杂的产品研发需求激增,尤其是在多车型并行开发背景下,仿
    的头像 发表于 12-05 14:40 252次阅读

    中科曙光AI集群系统和scaleX640节点等产品全面适配DeepSeek V3.2

    层实现“跨层协同”,曙光AI集群系统、scaleX640节点等产品0day完成对DeepSeek新版本的深度适配与调优,支持各行各业客户
    的头像 发表于 12-05 14:32 260次阅读

    中科曙光scaleX640节点亮相2025世界计算大会

    11月20日,在以“计算万物,湘约未来——智算驱动新质生产力”为主题的长沙世界计算大会上,中科曙光携scaleX640节点重磅亮相,引发各界广泛关注。作为全球首个单机柜级640卡
    的头像 发表于 11-21 17:30 828次阅读

    中科曙光亮相2025中国超级算力大会

    11月8日,第七届中国超级算力大会在北京召开。中科曙光作为常务理事成员单位加入“九源智能计算系统生态联合体”,并携手中国信通院重磅发布《2025中国算力发展研究报告之
    的头像 发表于 11-08 16:57 3329次阅读

    中科曙光亮相2025世界互联网大会乌镇峰会

    11月6日,2025世界互联网大会乌镇峰会期间,中科曙光正式发布全球首个单机柜级640卡节点scaleX640,它基于全球领先的
    的头像 发表于 11-07 15:49 304次阅读

    中科曙光推出科学大模型一站式开发平台OneScience

    近日,在2025年中国计算机大会上,中科曙光发布国内首个科学大模型一站式开发平台OneScience。该平台遵循
    的头像 发表于 10-28 17:29 721次阅读

    中科曙光助力首个地质大模型“坤枢”上线

    近日,首个地质领域专用大语言模型“坤枢”在河南郑州正式上线,该大模型的部署将有助于夯实地质产业数字化基础,在保障国家能源资源信息安全前提下,完成多项地质相关任务。而在该模型诞生过程中,中科曙光
    的头像 发表于 10-14 16:12 509次阅读

    曙光AI集群系统全面支持DeepSeek-V3.2-Exp

    9月29日,DeepSeek-V3.2-Exp正式发布并开源,引入创新的稀疏Attention架构。基于中国首个AI计算开放
    的头像 发表于 09-30 16:18 1473次阅读

    中科曙光助力紫东太初4.0大模型重磅发布

    近日,全球首个“深度推理+多模态”大模型——“紫东太初”4.0在2025东湖国际人工智能高峰论坛上正式发布中科曙光作为核心生态伙伴,依托中国首个
    的头像 发表于 09-24 09:33 437次阅读

    中科曙光发布国内首个行业标准化智融合算力平台:Nebula800

    8月15日,2025CCF全国高性能计算学术大会(HPC China2025)期间,中科曙光发布国内首个行业标准化
    的头像 发表于 08-16 10:51 2802次阅读

    中科曙光智融合解决方案加速量子材料研发

    近期,国内某985高校量子材料实验室成功部署了中科曙光智融合” 解决方案,为长期困扰科研人员的算力不足和操作复杂等难题,找到了解决途径。
    的头像 发表于 04-24 09:20 1009次阅读

    中科曙光联合成立行业AI智能体开放生态联盟

    近日,行业AI智能体开放生态联盟在北京正式成立。该联盟由中科曙光发起,联合百度、立思辰、高教社、中科天玑、中教云等多家企业创立。
    的头像 发表于 04-17 09:28 1127次阅读

    中科曙光参与编写智融合集群能力要求行业标准

    近日,由中国信息通信研究院、中国智能计算产业联盟和中科曙光共同牵头的《智融合集群能力要求》行业标准,在北京启动编写。
    的头像 发表于 04-10 14:58 828次阅读

    中科曙光发布DeepAI深算智能引擎

    今天,在2025全球开发者先锋大会上,中科曙光正式发布DeepAI深算智能引擎,通过打造端到端全栈AI加速套件,助力各行各业AI应用开发与落
    的头像 发表于 02-24 17:03 1848次阅读

    中科曙光AI加速智能计算服务千行万业

    近年来,中科曙光AI为中心,全面重构底层芯片、液冷、计算、存储、智算集群、基础软件栈、管理平台,并与AI场景有机适配、融合,加速智能计算服
    的头像 发表于 02-10 17:45 1553次阅读