0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

重磅!华为昇腾384超节点真机登场,中兴携厂商首秀GPU超节点实力

章鹰观察 来源:电子发烧友原创 作者:章鹰 2025-07-29 00:45 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

(电子发烧友报道 文/章鹰)GPU超节点对国产算力具有提升算力性能、突破物理限制、优化算力利用率、推动生态建设等重要作用。中国工程院院士刘韵洁接受媒体采访时曾表示,短时间内国内端点GPU仍无法与国外竞争,弥补短板的有效办法是建设算力网络“把整个算力练起来”,发挥GPU集群效果。

7月27日, 2025年世界人工智能大会在上海世博中心开幕,来自深圳两家ICT公司华为、中兴通讯分别展示了自身独创的,或者联合其他厂商打造的算力底座的旗舰产品。

作为中国自主的算力核弹,华为昇腾384超节点真机首次亮相。中兴通讯、上海仪电、曦智科技、壁仞科技联合打造的光互联芯片及超节点应用创新方案荣获2025年世界人工智能大会最高奖。本文将对这两款重点产品进行分析。

超越英伟达GB200 NVL72系统,华为昇腾384超节点整机首次亮相

在WAIC大会现场,这款号称镇馆之宝的华为昇腾384超节点整机前,聚集了来自全国各地,海外的参观者和工程师,这款整机算力高达300 PFLOPs,内存带宽1229TB/秒,网络带宽269TB/秒,算力是英伟达GB200 NVL72系统的2倍,内存带宽暴涨113%,组网速度快107%,引领算力新基建。

英伟达CEO黄仁勋曾表示,从技术参数看,华为的CloudMatrix 384超节点,性能上甚至超越了英伟达,比英伟达的尖端技术更具优势,因此我们必须高度重视这家实力雄厚的公司,全力以赴应对挑战。半导体研究公司 Semi Analysis 称,CloudMatrix 384 在几个关键领域的表现优于 Nvidia 的 GB200 NVL72,特别是在训练海量人工智能模型或运行要求苛刻的推理工作负载方面。

图片来自华为中国官方微信

早在HDC2025大会上,华为云CEO张平安就宣布了,基于华为云CloudMatrix384超节点的新一代昇腾云服务已经在芜湖、贵安、乌兰察布和林格尔全面上线。张平安说,华为云致力于为大家提供澎湃的AI算力,让大家不再有AI算力短缺的焦虑。

华为云CloudMatrix384超节点整机的原理,按照张平安的说法是,数学补物理,空间换算力,能源助性能,打破传统AI服务器的边界,通过系统级的创新,将384颗昇腾NPU和192颗鲲鹏CPU通过全新的高速网络MatrixLink对等互联,形成一台超级AI服务器。

华为首次线下展出昇腾384超节点,即Atlas 900 A3 SuperPoD,该产品基于超节点架构,通过总线技术实现384个NPU之间的大带宽低时延互联,解决集群内计算、存储等各资源之间的通信瓶颈。通过系统工程的优化,实现资源的高效调度,让超节点像一台超级计算机一样工作。算力规模300 PFlops,单卡的推理量,从每秒600Token跃升到现在每秒2300Token,提升4倍,成功打破跨机通信带宽性能瓶颈,实现从服务器级到矩阵级的资源供给模式转变。

这款整机具备四大技术特点:一、吞吐突破性能强,可以实现软硬件协同优化,单卡Decoding吞吐达到2300Tokens;其次,主流模型覆盖多,沉淀了行业主流160+模型,可以高效支撑模型迁移;三、专家并行效率高,国内首创的大规模专家并行方案,可以实现系统级优化支撑更大吞吐、更低decode时延;四、规模灵活,初始投资小,每年迭代发布新版本,可以实现弹性灵活按需使用。据悉,目前华为云CloudMatrix384超节点已经在行业中得到应用,包括支撑新浪“智慧小浪”推理交付效率50%以上,支撑硅基流动每天为600万用户提供推理服务,支持中科院自研大模型,推动面壁智能“小钢炮”模型推理业务性能提升,助力讯飞大模型实现推理性能等。

借助 CloudMatrix 384,华为现在提供了一种可靠、可扩展且本地制造的替代方案。作为中国最大的科技公司,华为尽管受到美国出口限制,但仍在迅速取得进展。专家表示,这可能会重塑人工智能基础设施和硬件的未来。

SAIL项目在上海落地!中兴+曦智科技+壁仞发布国内首个光互联GPU超节点

在本次大会上,曦智科技联合壁仞科技、中兴通讯共同推出的光跃LightSphere X——全球首个分布式光互连光交换GPU超节点解决方案获得2025 SAIL奖(卓越人工智能引领者奖)。

7月27日,曦智科技创始仁、首席执行官沈亦晨表示,算力发展类比电力革命,正如电力提升生活舒适度,算力飞跃将释放思维与精力潜能,而光子芯片正以创新技术开辟新赛道,成为算力突破的核心引擎。

该超节点基于曦智科技全球首创的分布式光交换技术,采用硅光技术的光互连光交换芯片和壁仞科技自主原创架构的大算力通用GPU液冷模组与全新载板互连,并搭载中兴通讯高性能AI国产服务器及仪电智算云平台软件,构建起高带宽、低延迟、灵活可扩展的自主可控智算集群新范式,即将于上海仪电智算中心落地。

图:光跃LightSphere X展示,来自中兴通讯官方微信

据悉,当前业界一种常见方案是通过提升单机柜功耗来部署更多GPU,但受限于数据中心单机柜的功耗天花板,单机柜GPU密度提升存在瓶颈。对此,光跃LightSphere X采用光互连技术,通过增加机柜数量构建超节点,突破传统互连方式下超节点的物理限制。

光跃LightSphere X全球首创的分布式光交换(dOCS)技术则进一步提升了超节点的灵活度和系统可扩展性,从而达到提升系统性价比的目的,还能按模型算力需求动态调整超节点规模,光跃LightSphere X将实现2千卡规模部署。

据悉,光跃LightSphere X依托上海仪电算力底座,集合国内智算领域头部企业,共建了“光芯片-GPU-服务器-算力集群-智算云平台”闭环,打造了开放共享的光电融合算力生态体系。上海仪电(集团)有限公司是上海市国资委所属的产业发展类集团、上海市公共算力服务平台核心建设单位和智算自主可控国产软硬件生态“链主”企业。

值得关注的是,曦智科技创新分布式光交换模组,可以支持集群内GPU互联拓扑的灵活切换,并在特殊情况下,可以利用冗余迅速重组超节点网络,显著提升大模型训推能力,极大的拓展了集群的应用场景。此外,曦智科技与沐曦合作的光互连电交换超节点方案也首次公开亮相。该方案采用线性直驱光互连技术,具有低延时、高带宽、低功耗的特点,并支持长距离传输,突破跨机柜连接的限制,支持8台标准服务器共64张xPU卡的高速互连,为大模型训练及推理提供更灵活、更高效的并行策略支持,从而提升集群性能。

中兴通讯表示,公司将坚持智算战略主航道持续深化AI领域投入,基于自主创新实力和全栈智算解决方案,助力全球运营商和合作伙伴构建开放、互利的AI新生态。

本文由电子发烧友原创,转载请注明以上来源。微信号zy1052625525。需入群交流,请添加微信elecfans999,投稿爆料采访需求,请发邮箱zhangying@huaqiu.com。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • NVIDIA
    +关注

    关注

    14

    文章

    5496

    浏览量

    109091
  • gpu
    gpu
    +关注

    关注

    28

    文章

    5099

    浏览量

    134459
  • 中兴通讯
    +关注

    关注

    7

    文章

    2121

    浏览量

    57975
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    最全!一文看懂华为芯片和节点最新演进路线

    ,尤其是对中国人工智能发展而言。此次大会上,徐直军公布了未来三年芯片演进路线(Ascend 950、Ascend 960、Ascend 970将陆续推出)、鲲鹏处理器升级规划,并同时发布了多款
    的头像 发表于 09-20 07:22 1w次阅读
    最全!一文看懂<b class='flag-5'>华为</b><b class='flag-5'>昇</b><b class='flag-5'>腾</b>芯片和<b class='flag-5'>超</b><b class='flag-5'>节点</b>最新演进路线

    从炫技到务实,节点的祛魅时刻

    规模与业务相适配,才是节点的最优解
    的头像 发表于 12-03 16:55 7382次阅读
    从炫技到务实,<b class='flag-5'>超</b><b class='flag-5'>节点</b>的祛魅时刻

    中科曙光scaleX640节点亮相2025世界计算大会

    11月20日,在以“计算万物,湘约未来——智算驱动新质生产力”为主题的长沙世界计算大会上,中科曙光scaleX640节点重磅亮相,引发各界广泛关注。作为全球首个单机柜级640卡
    的头像 发表于 11-21 17:30 828次阅读

    昆仑芯节点亮相,单卡性能提升95%

    ;天池512节点将于 2026下半年上市,最高支持512卡互联、卡间互联总带宽提升1倍、单节点即可完成万亿参数模型训练。     早在今年4月次亮相之后,昆仑芯
    的头像 发表于 11-16 07:32 9753次阅读
    昆仑芯<b class='flag-5'>超</b><b class='flag-5'>节点</b>亮相,单卡性能提升95%

    华为发布全球最强算力节点和集群

    华为全联接大会2025(HUAWEI CONNECT 2025)上,华为发布最强算力节点和集群,并表示将发展生态作为公司核心战略,提升到前所未有的战略高度。在计算领域,鲲鹏
    的头像 发表于 10-10 17:29 1861次阅读

    节点+集群”:华为撞出来的算力之路

    节点+集群”,成为彻底解决AI算力困局的契机
    的头像 发表于 09-24 10:55 810次阅读
    “<b class='flag-5'>超</b><b class='flag-5'>节点</b>+集群”:<b class='flag-5'>华为</b>撞出来的算力之路

    华为节点互联技术引领AI基础设施新范式

    今日,华为全联接大会2025在上海启幕,华为副董事长、轮值董事长徐直军发表题为“以开创的节点互联技术,引领AI基础设施新范式”的主题演讲,正式发布全球最强算力
    的头像 发表于 09-20 16:15 1733次阅读

    商汤科技联合华为实现节点适配多项创新

    近日,商汤大装置SenseCore与384节点率先完成全面适配。
    的头像 发表于 09-05 15:22 692次阅读

    面向万亿级参数大模型,“节点”涌现

    UniPoD系列节点产品,旨在为万亿级参数大模型的训练与推理提供更强劲、更智能且更绿色的算力支持。   H3C UniPoD系列节点产品基于领先的Scale-up南向互联技术,可
    的头像 发表于 08-03 02:37 8341次阅读
    面向万亿级参数大模型,“<b class='flag-5'>超</b><b class='flag-5'>节点</b>”涌现

    中国条&quot;算力光轨&quot;通车!国内首个分布式光互连光交换节点发布

    扩展到了机柜,甚至跨机柜层面。   在 2025 世界人工智能大会(WAIC)期间,上海仪电联合曦智科技、壁仞科技、中兴通讯,正式发布国内首个光互连光交换 GPU 节点 —— 光跃
    发表于 08-01 08:59 6103次阅读
    中国<b class='flag-5'>首</b>条&quot;算力光轨&quot;通车!国内首个分布式光互连光交换<b class='flag-5'>超</b><b class='flag-5'>节点</b>发布

    上海仪电联合曦智科技、壁仞科技、中兴通讯发布国内首个光互连光交换GPU节点——光跃LightSphere X

    智科技”)、上海壁仞科技股份有限公司(以下简称“壁仞科技”)、中兴通讯股份有限公司(以下简称“中兴通讯”),正式发布 国内首个光互连光交换GPU
    发表于 07-28 21:26 1499次阅读
    上海仪电联合曦智科技、壁仞科技、<b class='flag-5'>中兴</b>通讯发布国内首个光互连光交换<b class='flag-5'>GPU</b><b class='flag-5'>超</b><b class='flag-5'>节点</b>——光跃LightSphere X

    华为开发者大会2025(HDC 2025)亮点:华为云发布盘古大模型5.5 宣布新一代AI云服务上线

    HarmonyOS、AI云服务、盘古大模型等最新科技创新成果。 在主题演讲中,华为常务董事、华为云计算CEO张平安宣布基于CloudMatrix
    的头像 发表于 06-20 20:19 3912次阅读
    <b class='flag-5'>华为</b>开发者大会2025(HDC 2025)亮点:<b class='flag-5'>华为</b>云发布盘古大模型5.5 宣布新一代<b class='flag-5'>昇</b><b class='flag-5'>腾</b>AI云服务上线

    有关 AI 算力,华为刷新行业记录

    电子发烧友网报道(文 / 吴子鹏)近日,GitCode 网站上更新了一份题为《 AI 算力集群基础设施高可用技术系列报告》的文件。报告显示,华为团队通过构建极致可靠性的 CloudMatrix
    的头像 发表于 06-16 01:08 5773次阅读
    有关 AI 算力,<b class='flag-5'>华为</b><b class='flag-5'>昇</b><b class='flag-5'>腾</b>刷新行业记录

    华为云黄瑾:腾云CloudMatrix 384节点六大科技创新,定义下一代AI基础设施

    近日,华为云 AI 峰会在北京召开,华为云副总裁黄瑾发表主题演讲,介绍了更多 CloudMatrix 384 节点技术优势与细节。他指出,
    的头像 发表于 05-17 10:31 3489次阅读

    华为节点创新算力基础设施,推动千行万业AI应用开发落地

    近日,“逐光向新·智领未来”华为云 AI 峰会于北京成功举办。大会期间,华为云面向客户伙伴详细介绍了 CloudMartix 384 节点
    的头像 发表于 05-17 10:30 2916次阅读