0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

从北美颠覆性创新看AI网络互联技术的演进

奇异摩尔 来源:奇异摩尔 2026-03-19 15:27 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

本周GTC 2026正在上演,英伟达CEO黄仁勋再次强调了AI工厂的概念,表明核心为构建覆盖云、边缘乃至太空的全栈AI基础设施,并提出到2027年相关营收将达1万亿美元的预测。从云端来看,本次GTC聚焦Vera Rubin AI工厂平台。它是一个由Vera CPU、Rubin GPU、NVLink 6及CPO共封装光学交换机等七种芯片构成的完整系统,旨在将整个数据中心整合为一台巨型计算机。为应对推理成本的挑战,英伟达还引入了与Groq合作的LPU推理架构,通过让GPU负责“预填充”、LPU专攻“解码”的协同模式,将推理的每瓦特Token生成效率提升了35倍。

从Scale-out和Scale-up互联角度来看,英伟达过去2年并没有在架构上做过多的革新,而是着重强调Scale-up的大规模HBD扩展,通过革新NVLink 与 NVSwitch整体性能构建Scale-up网络,并通过 Spectrum 以太网交换机与 ConnectX 网卡的持续升级构建 Scale-out 网络。英伟达代表的是一个整体的AI交付解决方案,也是一种以英伟达计算芯片及其互联体系所衍生的封闭生态。

大家还沉浸在英伟达AI全栈的狂欢中,整个北美的AI网络正在以不同的形态演进。近期,OCP正式发布ESUN(Ethernet for Scale-up Networking,面向纵向扩展网络的以太网)1.0规范,旨在解决传统以太网在大规模AI集群场景下的多维度瓶颈——包括小数据包传输开销过高、多供应商设备互操作性缺失、无损传输能力不足等长期痛点,最终目标是将标准以太网打造为支撑EB级AI工作负载。

eb8418a4-22a9-11f1-90a1-92fbcf53809c.png

(图:ESUN 协议栈)

而在北美云厂商巨头一侧,打破Scale-out与Scale-up互联生态区隔的新形态正在逐步上演。Scale-up、Scale-across 和 Scale-out 之间的界限在硬件最强势的北美正在逐步模糊化。

ebe167fc-22a9-11f1-90a1-92fbcf53809c.png

(图源:semiengineering.com)

北美互联架构创新案例:Maia 200

On Die NIC 网卡(NIC)集成进主芯片

Maia 200 是微软第一颗为 AI 推理场景深度定制的系统级芯片,于 2026 年 1 月正式发布。它基于 TSMC N3(3nm)工艺制造,集成超过 1400 亿晶体管,TDP 功耗包络为 750W,在算力密度、内存容量与互联带宽三个维度上均实现了跨代跃升。

Maia 200 最具革命性的架构决策,是将高性能以太网 NIC 直接集成到主芯片 Die 上(On-Die NIC),通过这种方式实现了Scale-out和Scale-up网络的融合,这一设计具体实现如下:

eca06a12-22a9-11f1-90a1-92fbcf53809c.png

(参考第一代Maia 100其构建的Scale-up组网形态)

1片间带宽

提供单向带宽 1.4 TB/s ,双向带宽2.8 TB/s 。

2互联形态

在机架内部,四颗Maia 200通过直接链路全连接,形成计算域;跨机架基于自研ATL(AI传输层)协议,基于标准以太网物理层进行大规模扩展,从而实现低延迟、无损的集合通信。比上一代Maia 100有所升级的是,ATL 网络用于硬件级的包喷洒,多路径路由、拥塞感知流量控制等高性能RDMA技术,可覆盖更大的集群域。

3互联规模

多个节点内计算单元(4颗一组)通过工业标准高密度以太网交换机 ASIC 互联,形成可扩展至 6,144 台加速器的统一Scale-up 域,覆盖 MoE 模型的全局 All-to-All 专家路由流量。

总结,Maia 200 架构虽然相对激进,但用同一物理层的以太网,同时承载 Scale-up 和 Scale-out 流量,通过 ATL 协议层差异化处理两类通信语义从而实现了统一的 Scale-up 与 Scale-out 网络栈,大幅降低了部署和运维复杂度。

北美互联架构创新案例:Meta MTIA系列

Meta 的高速迭代策略并非试图“预测”模型走向,而是通过缩短反馈闭环来“紧跟”模型演变。AI 模型的迭代速度,快于传统芯片的研发周期。芯片设计基于对未来工作负载的预测,但等硬件量产上线时(通常需要两年时间),这些工作负载可能已发生巨大变化。Meta没有孤注一掷、长期等待,而是刻意采用迭代式研发思路:每一代 MTIA 都基于上一代优化,采用模块化小芯片(芯粒,将大芯片拆分为多个独立小模块拼接,降低研发难度、提升复用性)设计,融入最新的 AI 工作负载洞察与硬件技术,并以更短的周期完成部署。这种更紧凑的迭代闭环,让Meta的硬件能更好地适配不断演变的模型,同时加速新技术的落地应用。这一技术创新和奇异摩尔的Kiwi Fabric 计算与芯粒解耦技术路线不谋而合。

Meta 芯片MTIA的快速迭代

Meta发布的这四款AI芯片分别为MTIA 300、MTIA 400、MTIA 450和MTIA 500,由Meta与博通公司合作开发,基于开源的RISC-V架构并由TSMC生产。目前,MTIA 300已经开始生产,预计其他3款芯片将在2027年初至年底之间出货。

ed005f08-22a9-11f1-90a1-92fbcf53809c.png

ed5d7cc4-22a9-11f1-90a1-92fbcf53809c.png

edb86c38-22a9-11f1-90a1-92fbcf53809c.png

(图源:微软)

摩尔定律的放缓并未束缚定制硅片的步伐。从MTIA 300到MTIA 500,Meta在不到两年的时间里,完成了内存带宽4.5倍、计算性能25倍的跨越式增长。同时,Scale-Up互联能力从初代奠基走向成熟,已实现对72卡的全连接支持,并以1.2 TB/s的聚合带宽,将多颗芯片无缝整合为统一的算力节点——这正是系统级协同设计的威力所在。

网络接口芯粒创新

从MTIA 300开始,其显著特点包括内置网卡芯片、用于卸载通信任务的专用消息引擎、用于归约任务的近内存计算。这些低延迟、高带宽的通信组件为后续MTIA芯片中高效的GenAI推理和训练奠定了基础。在之后的迭代中,每代 MTIA 均内置 2个网络芯粒,相当于将 NIC 集成进封装内部。这个技术路径与上述微软Maia 200 的设计趋同。

1专用消息引擎

负责卸载AllReduce、AllGather等集合通信操作,使计算芯粒得以从繁重的同步任务中彻底解放,专注执行矩阵运算。

2近内存计算

在数据不离开芯片存储层次的前提下完成Reduce类集合操作,大幅降低跨芯粒通信的延迟与能耗。

3内置网络芯粒

将NIC功能从独立板卡“溶解”进芯片封装,实现通信路径的物理级缩短,为构建低开销、高密度的Scale-up互连提供硬件基础。

现有需求与未来演进的灵活组合

从 DeepSeek V3 问世至今不足 15 个月,AI 的进化速度已彻底超越人类的认知象限。纵观海外, 北美市场 AI 用户习惯已深度成型,中国出海军团正在奋起直追。MiniMax 2025 年全年营收达 7903.8 万美元(同比增长 158.9%),其中海外收入 5766 万美元,占比 73%,覆盖全球超 200 个国家和地区、累计服务 2.36 亿用户。Kimi 旗下 K2.5 大模型发布不足 20 天,累计收入便超越 2025 年全年总额,海外收入首次超越国内。

聚焦国内:AI 正以前所未有的速度贴近每一位普通用户。字节Seedance 2.0 作为首款落地春晚级超高清直播场景的 AI 视频大模型,在央视春晚直播中实现实时渲染,引发全球瞩目。与此同时,开源 AI 智能体 OpenClaw("养龙虾")在发布两周内席卷全网热搜,引发广大普通消费者关注。

而互联,作为支撑AI Workload的重要硬件一环,其技术演进不可忽视。就现有广泛部署的基础设施而言,面向 Scale-out 的网络仍占重要席位,成熟的 RDMA over Ethernet 生态已在数据中心大规模落地。以 CX-7 系列为代表的高性能 RDMA 网卡,将端到端延迟压缩至 800 ns 以内,相比传统标准网卡实现 延迟降低 79%、消息率提升 345%,也是当前国内主流应用网卡。下一代支持高性能RDMA技术的AI NIC 在国产化替代政策的明确支持下成为重点突破方向并迎来从验证到规模部署应用的关键窗口期。

AI Workload 的快速进阶——从 Dense Transformer 到 MoE、从短上下文到超长推理链、从训练主导到推理主导——正在为 Scale-up 与 Scale-out 的全局架构带来巨大的不确定性。如今的超节点网络演进对于未来的硬件所需的性能及架构提出了挑战。正如北美市场2大云巨头的布局,网络功能正在从"GPU 附属品"演变为独立的、可单独迭代的核心计算基础设施单元。本质上都是在回答同一个问题:如何在AI快速演进迭代下让互联能力与计算能力以不同的速度独立进化,同时最大化整个超节点的系统效率。

奇异摩尔的答案:以芯粒为形态, 构建覆盖现在与未来的双轨互联产品线

SoC 单一路径的本质矛盾:它是为稳定时代设计的产品形态,却要服务于一个激进迭代的时代。以芯粒为形态构成的AI NIC、基于以太网并支持内存语义的G2G IOD互联芯粒可分别对应现有和未来AI 网络演进的产品解决方案,更符合应对未来AI Model的快速迭代。

一方面,未来无论是Scale-out还是Scale-up网络,对于网络传输都需要具备不同层级的重传和流控机制,例如Link Level Retry链路层重传、Credit based flow control基于信用的流量控制机制等技术。另一方面,Scale-up相对Scale-out的传输速率要求更高、要求时延更低,但规模较小。Scale-up 网络面向千卡万卡,需要更简洁高效的传输协议,和基于包的无损多径网络的控制算法。

奇异摩尔基于自己独创的HPDE引擎,在统一的微架构下,根据网络的不同需求,最大程度复用公共基础IP,将不同层次的网络传输功能分别集成在AI SNIC和GPU互联芯粒G2G IOD产品中,实现研发平台的可复用性和具灵活性, 从容面对未来Scale-out和Scale-up网络的融合。

开放共创AI Infra未来,奇异摩尔

受邀出席2026 Open AI Infra Summit

4月9-10日,奇异摩尔受邀出席2026 Open AI Infra Summit大会。会上奇异摩尔网络架构 VP 叶栋将在其《AI 原生时代:基于 Scale Out 及 Scale Up 网络的智算互联解决方案》的演讲中,分享奇异摩尔对 AI 智算场景的深度理解,逐一拆解当前 Scale-out 与 Scale-up 网络面临的需求与挑战,并分享奇异摩尔在 AI 原生超级网卡与超节点互联芯粒技术上的最新解决方案,探讨如何通过开放、高效的互联技术,为 AI 高性能计算提供更坚实、更强劲的支撑。

综上而言,技术终将更迭,架构总会重塑,但商业的底层逻辑从未改变——趋势洞察决定方向,风险规避决定存活,而交付能力,决定了一家企业能否在AI的牌桌上坐到最后。 当大潮退去,裸泳者消失,留下来的人将证明:看清本质是智慧,灵活转身是勇气,而持续交付,才是一家企业最深沉的护城河。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 网络
    +关注

    关注

    14

    文章

    8382

    浏览量

    95706
  • AI
    AI
    +关注

    关注

    91

    文章

    42023

    浏览量

    303097
  • 英伟达
    +关注

    关注

    23

    文章

    4128

    浏览量

    99783

原文标题:现在还是未来?从北美颠覆性创新看AI网络互联技术的演进

文章出处:【微信号:奇异摩尔,微信公众号:奇异摩尔】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    直播预告|玄铁 x Canonical:本地推理到 AI 工厂,基于 RISC-V 的 AI 基础设施创新路径探讨

    系列】专题直播第三期—— 「本地推理到 AI 工厂,基于 RISC-V 的 AI 基础设施创新路径探讨」 即将开播! 本期特邀无剑联盟伙伴成员 Canonical 团队与玄铁的
    发表于 05-15 12:15

    [完结15章]Java转 AI高薪领域必备-0到1打通生产级AI Agent开发

    拒绝原地踏步:Java工程师AI转型的底层技术破局之道 在软件工程范式被大语言模型(LLM)彻底颠覆的今天,传统的“Java CRUD boy”正面临着前所未有的生存危机。当业务逻辑的生成可以被
    发表于 04-30 13:46

    远程协作新范式:工业场景下的专家支持技术演进

    限制的智能支持方案。 工业AR远程协作的技术演进 “人指挥”到“人+AI协同” 早期的远程协助主要依赖简单的视频通话,专家只能通过二维画面了解现场情况,指导精度有限。随着
    发表于 04-30 09:54

    新思科技以技术深度融合重构AI时代的未来工程创新

    多股颠覆性力量正在加速汇聚,其影响正跨越行业边界,重塑工程创新的每一个维度。
    的头像 发表于 04-28 11:32 566次阅读

    无线通信技术核心定位 “速度竞赛” 转向超高可靠

    “可用”升级为“可信”。 二、核心技术:筑牢超高可靠底层支撑 Wi-Fi 8的超高可靠,依托物理层与MAC层的关键创新四大维度实现升级: 增强型LDPC编码 :编码块长度翻倍,大
    发表于 04-23 17:31

    安克创新发布Thus™芯片:存算一体架构重塑AI音频新生态

    2026年4月22日,安克创新在深圳举办技术沟通会,正式推出全球首款基于NOR Flash技术的神经网络存算一体(CIM)AI音频芯片Thu
    的头像 发表于 04-23 09:59 4335次阅读

    AI算法能给电源管理带来哪些颠覆性改变

    Gartner对2026年十大战略技术趋势的研判揭示了技术战场正在发生根本性转移,更是对所有技术决策者发出的明确信号:我们正步入一个由人工智能(AI)彻底重塑的高度
    的头像 发表于 03-25 15:55 965次阅读

    工业制造颠覆性挑战

    关于工业制造颠覆性挑战及可能的战略选择。1.AI领域:生成式AI估值修正,泡沫不会全面破裂,工业AI需依托专业数据、流程与基础设施,行业将迎来炒作退潮、价值回归与应
    的头像 发表于 12-17 22:09 640次阅读
    工业制造<b class='flag-5'>颠覆性</b>挑战

    恭贺!同星智能TSMaster项目荣获2025全国颠覆性技术创新大赛优胜奖

    近日,同星智能凭借“软硬件解耦、快速迭代、可不断被软件定义的汽车电子基础工具链”项目,荣膺2025全国颠覆性技术创新大赛优胜奖。这是同星智能在获得金辑奖、AITX领航创新技术奖、测量与标定技术
    的头像 发表于 11-07 20:05 821次阅读
    恭贺!同星智能TSMaster项目荣获2025全国<b class='flag-5'>颠覆性</b><b class='flag-5'>技术创新</b>大赛优胜奖

    倾佳电子Hydrogen Rectifier制氢电源拓扑、技术演进与SiC功率模块的颠覆性作用

    倾佳电子Hydrogen Rectifier制氢电源拓扑、技术演进与SiC功率模块的颠覆性作用 倾佳电子(Changer Tech)是一家专注于功率半导体和新能源汽车连接器的分销商。主要服务于中国
    的头像 发表于 09-05 10:37 839次阅读
    倾佳电子Hydrogen Rectifier制氢电源拓扑、<b class='flag-5'>技术</b><b class='flag-5'>演进</b>与SiC功率模块的<b class='flag-5'>颠覆性</b>作用

    生成式AI到代理式AI:半导体技术赋能下一波创新浪潮

    AI领域始终在不断演进,我们正见证一场“生成式AI”时代到“代理式AI”时代的深刻变革。这场变革有望重塑各行各业,并释放前所未有的发展机遇
    的头像 发表于 08-21 17:59 1761次阅读
    <b class='flag-5'>从</b>生成式<b class='flag-5'>AI</b>到代理式<b class='flag-5'>AI</b>:半导体<b class='flag-5'>技术</b>赋能下一波<b class='flag-5'>创新</b>浪潮

    研华科技荣膺2025智能制造行业荣格技术创新

    在工业AI浪潮持续席卷的时代风口下,研华再传捷报!在被誉为“工业技术奥斯卡”的2025荣格技术创新奖评选中,研华自主研发的Agent Builder智能体平台凭借在智能制造场景的颠覆性
    的头像 发表于 07-28 15:23 1188次阅读

    【书籍评测活动NO.64】AI芯片,过去走向未来:《AI芯片:科技探索与AGI愿景》

    :科技探索与 AGI 愿景》。 这本新书针对大模型技术浪潮,详细讲解了AI芯片的主流技术、挑战与创新解决方案,并介绍了下一代芯片工艺和颠覆性
    发表于 07-28 13:54

    信而泰×DeepSeek:AI推理引擎驱动网络智能诊断迈向 “自愈”时代

    ,以“全流量采集 + AI根因诊断 + 预测运维”为核心支柱,推动企业网络运维模式传统的“被动响应”向“主动防御”和“故障自愈”的智能化方向跃迁。 三大核心能力:
    发表于 07-16 15:29

    紫光展锐推出UNISOC端侧AI平台化解决方案

    当前,人工智能技术正以前所未有的速度加速演进,不断突破传统终端形态边界。手机、电脑、汽车、智能家居到工业智能、机器人等更多创新形态,都将与AI
    的头像 发表于 06-20 11:44 1355次阅读