0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

面向万亿级参数大模型,“超节点”涌现

Hobby观察 来源:电子发烧友网 作者:梁浩斌 2025-08-03 02:37 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

电子发烧友网综合报道 近年来,随着人工智能技术的迅猛发展,尤其是大模型的兴起,对算力的需求呈现出爆发式增长。在这一背景下,紫光股份旗下新华三集团以“算力×联接”为技术基石,重磅发布了全新的H3C UniPoD系列超节点产品,旨在为万亿级参数大模型的训练与推理提供更强劲、更智能且更绿色的算力支持。

H3C UniPoD系列超节点产品基于领先的Scale-up南向互联技术,可实现单机柜最高64卡GPU间的高速互联互通,有效突破了单卡计算性能瓶颈,为AI技术在百行百业的落地应用提供了坚实的算力基础。

当前,以DeepSeek为代表的MoE大模型持续火爆,推动了AI领域的“军备竞赛”,大模型已迈入“万亿级”时代。然而,传统的计算架构和“摩尔定律”已不再适用,单卡计算性能接近天花板,单机GPU互联及机间Scale-out横向扩展也难以满足高带宽、低时延与高可靠的集群网络联接需求。新华三凭借在网络联接领域的深厚积累,结合不同品牌GPU的性能与架构特点,开发出基于以太协议和PCIe协议的双技术路线超节点产品,可实现单机柜最高64卡的全互联互通,大幅提升单节点计算效能,打造了万亿级参数大模型训推的强劲算力引擎。

本次发布的H3C UniPoD超节点产品以算力芯片多元化、互联协议标准化、基础设施集成化为核心设计理念,主要涵盖H3C UniPoD S80000和H3C UniPoD F80000两个子产品系列,能够为不同规模参数的模型训练、推理和精调提供有针对性的算力支撑。

H3C UniPoD S80000面向万亿级参数模型训推场景,实现了更高性能、更高密度、更高效率的三重进化。它以网强算,全面释放算力矩阵动能,柜内卡间全互联通信,互联带宽提升8倍,单机柜训练性能相较于单节点最高可提升10倍,单卡推理效率提升13倍。

在密度方面,H3C UniPoD S80000单柜支持部署64卡,采用液冷方式散热,整柜功率可支持到120KW,同时兼容下一代高性能AI加速卡。此外,三总线全盲插、全面的漏液检测等设计,简化了运维流程、提升了能效产出。

值得关注的创新点是,H3C UniPoD F80000依托全国产算力平台,采用创新的PCIe光互联技术,突破单机板内走线限制,实现了64张AI加速卡的高速互联,卡间带宽大幅提升至576GB/s,模型训练性能提升35%以上。基于灵活开放的产品理念,H3C UniPoD F80000支持基于不同形态的AI服务器及AI加速卡灵活构建超节点产品,支持按需定义产品拓扑16/32/64卡,实现灵活按需交付。

近年来随着算力需求的增长,市场上出现越来越多的超节点产品。比如,NVIDIA NVL72系统配备72个NVIDIA Blackwell GPU,单个GPU显存为192T;配置36个NVIDIA Grace CPU,每个CPU搭配480GB内存,总内存为17TB DDR5X;采用第五代NVLink技术,单GPU连接带宽达1.8TB/s,整个系统内的72个GPU通过NVLink全互联,总带宽达130TB/s;采用全液冷机架方案,相比传统风冷基础设施,同等功耗下性能提升25倍。

华为昇腾 384 超节点由 12 个计算柜和 4 个总线柜组成,支持 384 张昇腾 910C NPU 全互联,通信时延降低至 0.2μs(较传统方案下降 10 倍),带宽提升 15 倍。采用液冷设计,PUE<1.2,性能对标英伟达 NVL72 超节点。
燧原科技云燧ESL超节点系统单节点最高64卡全带宽互联,采用液冷方案,实现高性价比、高密度、高能效,可实现9216GB单节点存储容量、230TB/s单节点存储带宽、51.2TB/s单节点聚合带宽、单节点可支持PD分离优化。

展望未来,AI行业对算力的需求将持续增长。随着大模型的不断发展,算力基础设施的性能、效率和灵活性将变得至关重要。新华三将持续深化“算力×联接”能力,实现关键技术突破和工程化创新,全面构建多元开放、持续进化、AI就绪、强劲稳定的算力基础设施,加速百行百业的智慧跃迁。多元算力架构的融合、高速互联技术创新、绿色节能发展、智能化运维管理以及算力云服务的普及将成为未来行业发展的主要趋势。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    中科曙光AI集群系统和scaleX640节点等产品全面适配DeepSeek V3.2

    层实现“跨层协同”,曙光AI集群系统、scaleX640节点等产品0day完成对DeepSeek新版本的深度适配与调优,支持各行各业客户进行全量落地部署。
    的头像 发表于 12-05 14:32 95次阅读

    从炫技到务实,节点的祛魅时刻

    规模与业务相适配,才是节点的最优解
    的头像 发表于 12-03 16:55 4294次阅读
    从炫技到务实,<b class='flag-5'>超</b><b class='flag-5'>节点</b>的祛魅时刻

    中科曙光scaleX640节点亮相2025世界计算大会

    11月20日,在以“计算万物,湘约未来——智算驱动新质生产力”为主题的长沙世界计算大会上,中科曙光携scaleX640节点重磅亮相,引发各界广泛关注。作为全球首个单机柜640卡
    的头像 发表于 11-21 17:30 825次阅读

    昆仑芯节点亮相,单卡性能提升95%

    ;天池512节点将于 2026下半年上市,最高支持512卡互联、卡间互联总带宽提升1倍、单节点即可完成万亿参数模型训练。     早在今年
    的头像 发表于 11-16 07:32 9741次阅读
    昆仑芯<b class='flag-5'>超</b><b class='flag-5'>节点</b>亮相,单卡性能提升95%

    节点+集群”:华为撞出来的算力之路

    节点+集群”,成为彻底解决AI算力困局的契机
    的头像 发表于 09-24 10:55 797次阅读
    “<b class='flag-5'>超</b><b class='flag-5'>节点</b>+集群”:华为撞出来的算力之路

    华为节点互联技术引领AI基础设施新范式

    今日,华为全联接大会2025在上海启幕,华为副董事长、轮值董事长徐直军发表题为“以开创的节点互联技术,引领AI基础设施新范式”的主题演讲,正式发布全球最强算力节点和集群。
    的头像 发表于 09-20 16:15 1701次阅读

    开源大模型算力革命下:电子谷连接技术的坚守与未来

    推动算力系统向节点架构转型。"元脑SD200"等新一代服务器通过开放总线技术实现万亿参数模型的实时运行,而这一突破的背后,离不开连接器、线束等核心部件的技术支撑
    的头像 发表于 09-19 08:03 382次阅读
    开源大<b class='flag-5'>模型</b>算力革命下:电子谷连接技术的坚守与未来

    浪潮信息发布&quot;元脑SD200&quot;节点面向万亿参数模型创新设计

    北京2025年8月8日 /美通社/ -- 8月7日,浪潮信息发布面向万亿参数模型节点AI服
    的头像 发表于 08-08 22:17 526次阅读
    浪潮信息发布&quot;元脑SD200&quot;<b class='flag-5'>超</b><b class='flag-5'>节点</b>,<b class='flag-5'>面向</b><b class='flag-5'>万亿</b><b class='flag-5'>参数</b>大<b class='flag-5'>模型</b>创新设计

    ‌Groq LPU 如何让万亿参数模型「飞」起来?揭秘 Kimi K2 40 倍提速背后的黑科技

    Groq LPU 如何让万亿参数模型「飞」起来?揭秘 Kimi K2 40 倍提速背后的黑科技‌ 最近,Moonshot AI 的千亿参数模型 ‌Kimi K2‌ 在 ‌GroqCl
    的头像 发表于 08-07 10:01 644次阅读

    重磅!华为昇腾384节点真机登场,中兴携厂商首秀GPU节点实力

    作为中国自主的算力核弹,华为昇腾384节点真机首次亮相。中兴通讯、上海仪电、曦智科技、壁仞科技联合打造的光互联芯片及节点应用创新方案荣获2025年世界人工智能大会最高奖。本文将对这
    的头像 发表于 07-29 00:45 1.1w次阅读
    重磅!华为昇腾384<b class='flag-5'>超</b><b class='flag-5'>节点</b>真机登场,中兴携厂商首秀GPU<b class='flag-5'>超</b><b class='flag-5'>节点</b>实力

    万亿参数!元脑企智一体机率先支持Kimi K2大模型

    北京2025年7月21日 /美通社/ -- 浪潮信息宣布元脑企智一体机已率先完成对Kimi K2 万亿参数模型的适配支持,并实现单用户70 tokens/s的流畅输出速度,为企业客户高效部署
    的头像 发表于 07-22 09:27 401次阅读
    <b class='flag-5'>万亿</b><b class='flag-5'>参数</b>!元脑企智一体机率先支持Kimi K2大<b class='flag-5'>模型</b>

    奇异摩尔亮相2025中国AI算力大会

    技术驱动下,节点已成为国内外构建大规模HBD域应用的关键趋势。随着千亿到万亿参数MoE大模型并行训练(尤其是专家并行和张量并行)对GPU间
    的头像 发表于 07-03 11:40 1168次阅读

    昆仑芯节点产品推出,大模型训推任务性能跨越式提升

    AI开发者大会上,昆仑芯作为底层算力核心被高频提及,三万卡集群点亮振奋人心,昆仑芯节点也在大会上正式发布。     自ChatGPT问世,大模型参数快速增长,单卡显存无法容纳越来越大
    的头像 发表于 04-25 19:29 1887次阅读

    Kaggle知识点:7种参数搜索方法

    数据科学参数搜索确实是机器学习生命周期中不可或缺的一步,特别是在模型性能方面。正确的参数选择可以显著提高
    的头像 发表于 02-08 14:28 1693次阅读
    Kaggle知识点:7种<b class='flag-5'>超</b><b class='flag-5'>参数</b>搜索方法

    xgboost参数调优技巧 xgboost在图像分类中的应用

    的成绩。然而,XGBoost模型涉及众多参数,这些参数的组合和调优对于模型性能至关重要。以下是一些XGBoost
    的头像 发表于 01-31 15:16 2140次阅读