0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

浪潮信息发布"元脑SD200"超节点,面向万亿参数大模型创新设计

全球TMT 来源:全球TMT 作者:全球TMT 2025-08-08 22:17 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群


北京2025年8月8日 /美通社/ -- 8月7日,浪潮信息发布面向万亿参数大模型的超节点AI服务器"元脑SD200"。该产品基于浪潮信息创新研发的多主机低延迟内存语义通信架构,以开放系统设计向上扩展支持64路本土GPU芯片。元脑SD200可实现单机内运行超万亿参数大模型,并支持多个领先大模型机内同时运行及多智能体实时协作与按需调用,目前已率先实现商用。在实际评测中,元脑SD200运行DeepSeek R1和Kimi K2等全参模型的64卡整机推理性能实现超线性扩展。

wKgZO2iWBvSAWSl0AAD6jZAs1Wk311.jpg


当前,混合专家模型(MoE)的高效架构正在驱动大模型参数规模持续扩展,国内外前沿大模型的参数量快速突破万亿规模,这给算力系统架构提出新的挑战。一方面,模型参数量增加和序列长度增加带来的键值缓存(KV cache)激增,需要智能计算系统具有超大显存空间承载,依靠单芯片或节点的性能提升已难以为继;且其推理过程作为通信敏感型计算,对分布式计算通信延时要求极高,需要构建更大向上扩展(Scale up)高速互连域。另一方面,智能体AI开启多模型协作的新范式,其推理过程需要生成比传统模型多近百倍的数据词元(token),导致计算量激增。

元脑SD200超节点AI服务器是浪潮信息面向万亿参数大模型AI时代而设计,创新研发多主机低延迟内存语义通信架构,基于开放总线交换技术构建,在单机内实现了64路GPU芯片的高速统一互连,成功解决万亿大模型对超大显存空间和超低通信延时的核心需求。在开放架构之上,元脑SD200通过智能总线管理和开放的预填充-解码(Prefill-Decoder)分离推理框架实现软硬件深度协同,智能化管理复杂AI计算任务。

- 在架构层面,元脑SD200基于自主研发的开放总线交换技术首创多主机三维网格系统架构,实现64路本土GPU芯片高速互连;通过创新远端GPU虚拟映射技术,突破多主机交换域统一编址难题,实现显存统一地址空间扩增8倍,单机可以提供最大4TB显存和64TB内存,为万亿参数、超长序列大模型提供充足键值缓存空间。同时,依托百纳秒级超低延迟链路,构建64卡大高速互连域统一原生内存语义通信,实测结果表明,在推理过程常见的小数据包通信场景中,全规约(All Reduce)性能表现优异,显著提升计算与通信效率。

- 在系统层面,根据万亿参数大模型计算、通信需求特征,浪潮信息开发智能总线管理系统,实现超节点64卡全局最优路由的自动创建,支持不同拓扑切换,资源按需切分。对于全规约、全聚集(All Gather)等典型通信算子,开展不同数据量大小的细粒度通信策略设计,如多层级通信机制等,实现通信延时进一步降低。同时依托开放的PD分离框架,支持异步KV Cache高效传输与差异化并行策略,在提升业务服务级别目标的同时保持对多元算力的兼容性,实现计算与通信架构的深度协同优化。

元脑SD200超节点AI服务器通过软硬协同系统创新,成功向上扩展突破芯片性能边界,在大模型场景中展示出优异的性能表现。结合优化的PD分离框架,SD200超节点满机运行DeepSeek R1全参模型推理性能超线性提升比为3.7倍,满机运行Kimi K2全参模型推理性能超线性提升比为1.7倍。

wKgZPGiWBvWAcd4gAADlyNPyP2o769.jpg


当前,开源模型的飞跃式进步正在加速智能时代的到来,推动研发范式从封闭走向开放协作。同时,随着大模型参数量的持续提升,对算力基础设施的建设提出了更高要求。浪潮信息通过开放系统架构创新,为开源大模型的规模化落地和应用创新提供关键支撑。

审核编辑 黄宇

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 半导体
    +关注

    关注

    339

    文章

    31542

    浏览量

    267820
  • 大模型
    +关注

    关注

    2

    文章

    3877

    浏览量

    5300
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    Type-C浪潮席卷小家电:SINK芯片如何成为快充高压的"心脏"

    DC接口,但需搭配PDSINK芯片实现电压适配。这类芯片能识别快充协议、请求目标电压并确保安全供电,使各类小家电兼容USB-C快充。升级方案可降低15%成本,实现"一充多用&
    的头像 发表于 05-25 08:58 201次阅读
    Type-C<b class='flag-5'>浪潮</b>席卷小家电:SINK芯片如何成为快充高压的&<b class='flag-5'>amp</b>;<b class='flag-5'>quot</b>;心脏&<b class='flag-5'>amp</b>;<b class='flag-5'>quot</b>;

    AR-1106 技术深探:打破声源定位 &amp;quot;不可能三角&amp;quot; 的工程化创新 摘要

    声源定位技术作为人机交互的核心感知能力,长期以来陷入 **&amp;quot;高精度 - 低成本 - 易开发&amp;quot;** 的不可能三角困境。高端多麦阵列方案精度高但成本昂贵
    的头像 发表于 05-23 10:25 49次阅读

    亚马逊正在公司内部大规模部署其自研AI产品&amp;quot;MeshClaw&amp;quot;

    提升工作效率的工具,却被部分员工玩出了&quot;新花样&quot;——他们利用MeshClaw把一些本无必要的工作也实现了自动化,目的只有一个:让自己的AI词(token)消耗量看起来更高,从而向管理层证明自己&
    的头像 发表于 05-15 10:25 2141次阅读

    IBM发布&amp;quot;AI运营模式&amp;quot;蓝图

    近期,在年度Think大会上,IBM正式发布了迄今为止其企业级AI和混合云管理能力的最全面扩展,重磅推出&quot;AI运营模式&quot;(AI Operating Model)蓝图。此次
    的头像 发表于 05-12 09:50 654次阅读

    从&amp;amp;quot;替代人力&amp;amp;quot;到&amp;amp;quot;智能协同&amp;amp;quot;:履带式巡检机器人的产业跃迁

    2026年的工业智能化转型浪潮中,一个显著的趋势正在形成——工业巡检机器人正从单纯的&quot;人力替代工具&quot;升级为具备感知、决策与协同能力的&quot;智能体&
    的头像 发表于 02-05 10:42 535次阅读

    选EtherCAT模块,别只看价格,先看&amp;amp;quot;体检报告&amp;amp;quot;

    ±8kV静电、±2kV浪涌、-42℃极寒、1500V高压—这不是极限运动,而是DPort-ECT模块的出厂&quot;必修课&quot;。本文详解工业级EtherCAT从站如何通过严苛测试关
    的头像 发表于 02-04 11:46 632次阅读
    选EtherCAT模块,别只看价格,先看&<b class='flag-5'>amp</b>;<b class='flag-5'>amp</b>;<b class='flag-5'>quot</b>;体检报告&<b class='flag-5'>amp</b>;<b class='flag-5'>amp</b>;<b class='flag-5'>quot</b>;

    中国信通院:SD200首个通过《节点测试大纲》评测,Token速度快至8.73ms!

    当前,面对千亿乃至万亿参数模型训练与推理日益增长的应用需求,传统一机八卡服务器已难以满足性能要求,节点新型计算产品应运而生。中国
    的头像 发表于 01-15 17:19 835次阅读

    L3试点落地,和芯星通如何成为车企突围的&amp;amp;quot;隐形守护者&amp;amp;quot;?

    当长安汽车与北汽极狐拿到中国首批L3级自动驾驶准入许可的那一刻,整个产业链等待多年的&quot;靴子&quot;终于落地。在这个责任主体从驾驶员转向车企的关键转折下,系统可靠性成为真正的&quot
    的头像 发表于 01-04 12:03 871次阅读
    L3试点落地,和芯星通如何成为车企突围的&<b class='flag-5'>amp</b>;<b class='flag-5'>amp</b>;<b class='flag-5'>quot</b>;隐形守护者&<b class='flag-5'>amp</b>;<b class='flag-5'>amp</b>;<b class='flag-5'>quot</b>;?

    &amp;quot;Access violation&amp;quot; 错误,复位位置,重新打印

    &quot;Access violation&quot; 错误
    的头像 发表于 11-08 07:16 872次阅读

    开源大模型算力革命下:电子谷连接技术的坚守与未来

    推动算力系统向节点架构转型。&quot;SD200";等新一代服务器通过开放总线技
    的头像 发表于 09-19 08:03 679次阅读
    开源大<b class='flag-5'>模型</b>算力革命下:电子谷连接技术的坚守与未来

    面向万亿参数模型,“节点”涌现

    UniPoD系列节点产品,旨在为万亿参数模型的训练与推理提供更强劲、更智能且更绿色的算力支持。   H3C UniPoD系列
    的头像 发表于 08-03 02:37 9341次阅读
    <b class='flag-5'>面向</b><b class='flag-5'>万亿</b>级<b class='flag-5'>参数</b>大<b class='flag-5'>模型</b>,“<b class='flag-5'>超</b><b class='flag-5'>节点</b>”涌现

    万亿参数企智一体机率先支持Kimi K2大模型

    北京2025年7月21日 /美通社/ -- 浪潮信息宣布企智一体机已率先完成对Kimi K2 万亿参数
    的头像 发表于 07-22 09:27 767次阅读
    <b class='flag-5'>万亿</b><b class='flag-5'>参数</b>!<b class='flag-5'>元</b><b class='flag-5'>脑</b>企智一体机率先支持Kimi K2大<b class='flag-5'>模型</b>

    地热发电环网柜局放监测设备:清洁能源电网的&amp;amp;quot;安全卫士&amp;amp;quot;

    文章由山东华科信息技术有限公司提供在&quot;双碳&quot;目标驱动下,地热发电作为稳定基荷电源,其电网接入设备的可靠性至关重要。环网柜作为地热电站与主网连接的关键节点,其内部绝缘
    的头像 发表于 07-16 10:15 792次阅读
    地热发电环网柜局放监测设备:清洁能源电网的&<b class='flag-5'>amp</b>;<b class='flag-5'>amp</b>;<b class='flag-5'>quot</b>;安全卫士&<b class='flag-5'>amp</b>;<b class='flag-5'>amp</b>;<b class='flag-5'>quot</b>;

    为什么GNSS/INS组合被誉为导航界的&amp;amp;quot;黄金搭档&amp;amp;quot;?

    在导航技术领域,GNSS(全球导航卫星系统)和INS(惯性导航系统)的结合,一直被业界誉为&quot;黄金搭档&quot;。它们优势互补,克服了单一系统的局限性,为高精度、高可靠性的导航提供了完美
    的头像 发表于 07-09 17:12 1293次阅读
    为什么GNSS/INS组合被誉为导航界的&<b class='flag-5'>amp</b>;<b class='flag-5'>amp</b>;<b class='flag-5'>quot</b>;黄金搭档&<b class='flag-5'>amp</b>;<b class='flag-5'>amp</b>;<b class='flag-5'>quot</b>;?

    人形机器人为什么要定制? ——揭秘工业场景的&amp;quot;千面需求&amp;quot;

    核心洞察:标准化机器人难以破解工业场景的&quot;需求碎片化&quot;困局。富唯智能通过 &quot;五大模块柔性架构+零代码中枢&quot; ,为 人形机器人为什么要定制 提供了
    的头像 发表于 06-10 17:19 1667次阅读
    人形机器人为什么要定制? ——揭秘工业场景的&<b class='flag-5'>amp</b>;<b class='flag-5'>quot</b>;千面需求&<b class='flag-5'>amp</b>;<b class='flag-5'>quot</b>;