0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

单通道400G已就绪!全栈互联公司揭开800G AI超级网卡序幕

jf_78421104 来源:jf_78421104 作者:jf_78421104 2026-04-17 14:52 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

摘要:国产AI SNIC从“可用”迈向“高性能”

行业领先的AI网络全栈式互联产品及解决方案提供商奇异摩尔今日宣布,已成功构建800G AI超级网卡(SNIC)平台架构,除了800Gb/s的高带宽,亚微秒级的超低时延,其关键技术还涵盖面向AI网络的增强型RoCE v2机制,包括包喷洒、多路径传输、高效重传、先进的可编程拥塞控制等。基于该自研平台架构设计的AI SNIC ASIC,已于近期完成回片,并顺利通过核心RDMA架构的硅验证,单通道吞吐量稳定在400Gbps,关键时延约1微秒。在当前国产高性能网卡公开产品与产业叙事仍多集中于100/200G RDMA ASIC引擎阶段的背景下,奇异摩尔正以单通道400G RDMA ASIC引擎这一实质性突破,为国产AI超级网卡快速迈向800G ASIC揭开序幕。

wKgZPGnh2GeAaQ8AAAPGp4r-qXA154.png

【图1】800G AI SNIC平台架构设计的ASIC已顺利通过RDMA架构的硅验证,单通道吞吐量稳定在400Gbps

为什么是基于以太网的RDMA AI原生网卡

在AI网络兴起之前,行业对智能网卡(SmartNIC)的主流划分,并非围绕AI训练与推理场景,而是依据芯片架构与卸载能力深度进行区分。核心关注点在于其能够为CPU分担多少基础设施工作,包括虚拟机间网络交换、存储、加解密、安全与遥测、压缩与解压缩等硬件卸载功能,典型产品如数据处理单元(DPU)网卡,并非针对大模型集群通信进行专项定制优化。

进入大模型时代,随着AI训练从千卡向万卡规模扩展、推理从单机部署走向大规模分布式服务,Scale-out网络正在成为决定GPU利用率、集合通信效率和单位Token成本的关键基础设施。无论是All-Reduce、Reduce-Scatter,还是All-to-All等典型集合通信,都要求网络具备更高带宽密度、更低时延、更低尾时延,以及更快的拥塞响应能力。在此背景下,基于以太网的高性能RDMA路线愈发清晰:它既继承了以太网生态开放、部署成熟、成本可控的优势,又通过面向AI网络的RoCE/RDMA专项优化,逐步具备支撑大规模AI集群的能力。

这一技术趋势在国内头部云服务提供商(CSP)的技术需求规范,以及国外超以太网联盟(UEC)的诞生中体现得尤为明显。其核心就是交付一套面向AI与HPC场景的开放、高性能以太网架构,重点解决传统以太网在大规模训练环境下面临的多路径传输、快速拥塞响应、尾时延控制、易配置与可扩展性等问题。换句话说,以太网不再只是“通用网络”的代表,而是在AI时代被重新定义为承载大规模集群互联的主航道之一。

“奇异摩尔AI超级网卡技术路线,与头部云服务提供商(CSP)的需求完全一致,与UEC的规范也高度趋同。我们已构建的800G平台架构能力,能有效支持最高800Gb/s RDMA吞吐,数百万级消息处理能力与数百万级队列(QP),大大增强了RoCE v2协议栈,增加了包喷洒、乱序重组、高效重传,高级可编程拥塞控制等AI网络急需的增强特性。以太网的技术路线确保了产品的开放互操作性与生态兼容性,为进入头部云服务供应商以及未来平滑融入超以太网生态、实现跨厂商协同奠定了基础。”奇异摩尔网络技术VP叶栋表示。

叶栋拥有超过20年的网络互联系统架构设计经验,在AI网络协议、RDMA、虚拟化、软件协议栈等方面拥有丰富的专业知识。其在英特尔(中国)工作多年,曾任英特尔网络互联产品事业部技术总监,负责英特尔以太网、智能网卡,P4可编程交换芯片、英特尔/Google IPU相关系统架构产品的本地化研发和部署。启动和主导了多家大型云服务提供商大规模部署的技术方案的底座。

针对网络密集型大规模并行计算对高带宽、低延迟数据传输的严苛需求,NVIDIA不仅推出基于IB网络的超级网卡(SNIC),也推出了面向以太网的SNIC,旨在为AI工厂与云数据中心提供强大的网络支撑。NVIDIA对AI超级网卡的定义十分清晰:这是一类“专为网络密集型、海量分布式AI计算工作负载打造的新型网络加速器”。其价值远不止于完成数据包的传输,更在于让多GPU、多节点环境下的通信真正成为释放算力的加速引擎。

对标NVIDIA ConnectX-8/9的领先性,800G AI网卡从“接口”走向“中枢”

NVIDIA公开表示,ConnectX-8是业界首个把PCIe Gen6级交换能力与超高速网络处理能力集成到单一器件中的超级网卡(SNIC)。它不仅服务于AI、HPC和超大规模云数据中心场景,还通过集成48 lanes的PCIe Gen6 Switch,把原本需要独立PCIe Switch和独立NIC共同完成的任务,整合到一个高集成度器件中,这是一项绝无仅有的创新技术路径。

传统1机8卡PCIe GPU服务器普遍采用以CPU为根节点、PCIe Switch向下连接GPU的树形拓扑。这种架构在通用计算时代较为成熟,但在大模型训练场景下,其结构性性能瓶颈日益突出:GPU间通信往往需要经过PCIe Switch,跨Socket路径还可能受到主机链路约束,导致时延升高、带宽利用率下降,难以满足All-Reduce、Reduce-Scatter、All-to-All等高频集合通信对低时延和高吞吐的要求。因此ConnectX-8将PCIe Gen6交换能力与高速网络能力整合到单一器件中,可替代传统离散PCIe Switch,既优化GPU到GPU、GPU到NIC的数据路径,也降低系统复杂度、功耗和总体拥有成本。

wKgZPGnh2JKAK-0fAAIM0neC9yg923.png

端口形态上,ConnectX-8也已经明确迈入800G时代。NVIDIA官方显示,ConnectX-8以太网版本具备2×400GbE的产品形态,其不仅拥有800G级总带宽能力,也具备更灵活的双端口组网方式,更适合未来大规模AI集群对冗余、分流、弹性扩展和复杂拓扑部署的需求。从出货形态来说,ConnectX-8已将高速网络能力与PCIe Gen6 Switch能力整合至单一器件之中,并以一体化集成设计形态面向平台出货。

奇异摩尔创造里程碑:国产AI SNIC从“可用”迈向“高性能”

正是在这样的全球技术演进背景下,奇异摩尔基于自研800G AI SNIC ASIC架构构建的单通道400G引擎完成了核心RDMA ASIC流片验证,才显得意义格外突出。与FPGA方案更适合早期验证、快速迭代不同,ASIC路线决定了一款产品是否真正具备面向大规模AI训推集群的性能上限、功耗效率、板卡集成度和量产一致性。奇异摩尔率先在国产阵营中实现单通道400G RDMA ASIC引擎,吞吐量稳定在400Gbps,不仅填补了国内高带宽超级网卡芯片的空白,更充分证明了其已掌握2×400G乃至更高速率产品的核心设计能力,为下一代800G网卡奠定了坚实技术基础。

奇异摩尔最新800G SNIC全面对标英伟达ConnectX-8/9的架构方向,采用与国际先进方案相一致的“高速网络处理+PCIe Switch能力”一体化设计思路,在产品形态上支持2×400G端口以太网总带宽,在架构层面同时提供AI服务器内部互连优化与节点间高速通信能力。这意味着,该企业在800G产品布局上不只是带宽规格升级,更是对未来AI高性能集群互连形态的提前卡位:通过集成PCIe Switch能力,重构GPU到GPU、GPU到NIC的数据路径,提升集合通信效率、降低系统复杂度,并增强对整机平台和集群方案的定义能力。

奇异摩尔网络技术VP叶栋补充道,奇异摩尔最新800G超级网卡计划于年内量产,有望成为国产800G AI超级网络芯片、系统集成方案以及平台级架构能力上的重大突破,进一步增强中国厂商在未来AI高性能集群基础设施中的产品定义权、方案协同权和产业话语权。

国产化窗口已开,市场潜力加速释放

从产业空间与政策环境来看,奇异摩尔所切入的并非小众赛道,而是一个正在快速扩容的核心基础设施市场。公开研究显示,仅ConnectX-7级别的高性能AI网卡市场规模已超过百亿元,并仍在持续增长。这意味着,以ConnectX-7/ ConnectX-8为代表的高性能AI网卡赛道,背后对应的是一个数百亿元级、且仍在不断放大的市场机遇。

与此同时,国家对自主可控智算底座、高速互连及国产化集群的战略需求正持续加强。国家发展改革委等部门已明确提出,要加快部署智能无损网络、400G/800G等先进技术,建设高速泛在、安全可靠的全国一体化算力网,并强化自主创新技术供给能力。

奇异摩尔是一家深度聚焦AI互联多年的全栈式解决方案提供商,以网络+芯粒技术为底层特色,除面向Scale Out场景的AI网卡芯片,公司还提供面向Scale Up超节点的G2G IO互联芯粒,并已在业内实现落地应用。这一不同于其他芯片厂商的技术基因构筑了差异化的竞争壁垒,也赋予了其在下一代高性能集群互联中更强的灵活性、更广阔的发展空间以及更深的技术纵深。

审核编辑 黄宇

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 网卡
    +关注

    关注

    4

    文章

    345

    浏览量

    29062
  • AI
    AI
    +关注

    关注

    91

    文章

    40941

    浏览量

    302523
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    易飞扬推出800G HYBIRD绿色光互连产品,AI&DC互连迎品类创新

    设计创新为宗旨的易飞扬即日正式宣布推出800G OSFP HYBRID AI&DC光互连产品线。该产品线包括800G OSFP-PHO DR8 /2XDR4 PHO 异构光模块,800G
    的头像 发表于 12-26 17:41 2184次阅读
    易飞扬推出<b class='flag-5'>800G</b> HYBIRD绿色光互连产品,<b class='flag-5'>AI</b>&amp;DC互连迎品类创新

    800G光模块:SR8、DR8、FR4、LR4与ZR技术对比

    800G实现之路并非一蹴而就,而是建立在400G的坚实技术基础之上,并通过持续的创新来应对新的挑战。本文将从技术驱动、核心突破、部署挑战及未来展望等方面,勾勒出800G实现的技术演进路径。
    的头像 发表于 11-17 16:21 3345次阅读
    <b class='flag-5'>800G</b>光模块:SR8、DR8、FR4、LR4与ZR技术对比

    400G QSFP112 FR4光模块:数据中心高速互联的新基石

    本文深入解析400G QSFP112 FR4光模块的技术优势、与QSFP-DD的区别及其在AI集群、云计算等关键场景的应用。探讨2025年高速光模块市场能效优先与大规模部署趋势,展望800G/1.6T未来。
    的头像 发表于 11-10 09:44 709次阅读

    400G光模块终极指南:从技术解析到应用选型,驱动智算时代高速互联

    本文深入解析400G光模块技术,涵盖OSFP SR4、DR4、FR4、ZR等关键变体。探讨其在智算中心、人工智能及5G网络中的应用,对比DR4与FR4等型号差异,并指导用户根据距离、成本及兼容性进行选择。文章还展望了向800G
    的头像 发表于 09-22 12:57 1102次阅读

    睿海光电:驱动400G高速互联,以效率与创新赋能全球智算

    在数据中心全面迈向400G时代的进程中,深圳市睿海光电科技有限公司(睿海光电)依托其深厚的技术底蕴、卓越的交付速度以及全球化的服务能力,确立了自身在400G高速互联解决方案领域的领先地
    的头像 发表于 09-18 18:23 917次阅读

    400G Optical Transceiver 全面解析:Cisco 400G 光模块与应用指南

    随着数据中心、云计算和人工智能的发展,网络带宽需求不断提升。400G optical transceiver(400G光模块) 已经成为新一代核心互联的主流选择。无论是 Cisco 400G
    的头像 发表于 09-15 14:20 1537次阅读

    深入解析400G DAC与400G AOC:技术特性与选型指南

    短距离互联400G直连线缆已实现规模化商用,其中400G DAC(直连铜缆)和400G AOC(有源光缆)成为主流选择。 一、封装类型与技术基础 当前市面上的
    的头像 发表于 08-20 11:11 1503次阅读

    睿海光电:400G光模块技术创新与AI数据中心变革

    模块凭借其革命性优势成为新一代网络基础设施的关键: 带宽革命 :单端口400Gbps速率满足AI集群高密度互联需求 能效突破 :相比100G方案,每比特传输功耗降低50%以上 经济优势
    的头像 发表于 08-18 13:52 1316次阅读

    睿海光电400G QSFP-DD SR4光模块:AI时代高速互联的核心引擎

    升级的关键选择。深圳市睿海光电科技有限公司,作为全球AI光模块领域的领军企业,凭借量产交付的400G QSFP-DD SR4光模块,为数据中心高速互联提供核心解决方案,同时前瞻性布局
    的头像 发表于 08-18 13:46 1012次阅读

    睿海光电800G光模块助力全球AI基建升级

    在全球数字化转型加速的背景下,超高速光模块作为数据中心与AI算力网络的核心部件,正经历从400G800G、1.6T的迭代浪潮。在这一赛道中,深圳市睿海光电科技有限公司(以下简称“睿海
    发表于 08-13 19:05

    睿海光电领航AI光模块:超快交付与全场景兼容赋能智算时代——以创新实力助力全球客户构建高效算力底座

    ,深圳市睿海睿海光电科技有限公司(以下简称“睿海光电”)凭借前瞻性技术布局和卓越的制造能力,推出了涵盖400G800G乃至1.6T的全场景光模块解决方案,持续为客户提供高性能、高可靠性的数据传输保障
    发表于 08-13 19:03

    睿海光电以高效交付与广泛兼容助力AI数据中心800G光模块升级

    400G/800G光模块已实现规模化量产,并基于AI工厂与AI云的核心需求进行深度优化: 速率突破:采用PAM4调制技术,单通道速率达100
    发表于 08-13 19:01

    加速AI未来,睿海光电800G OSFP光模块重构数据中心互联标准

    客户的共同选择 超算中心应用 :为某国家实验室提供800G OSFP SR8模块,构建E级超算互联网络 AI训练集群 :某自动驾驶企业采用我们的解决方案,GPU间通信延迟降低至1.2μs 云计算平台
    发表于 08-13 16:38

    400G 升级到 800G,到底能省多少钱?(洞察 TCO 真相)

     觉得800G光模块采购价高?本文揭示从400G升级800G的惊人TCO节省:硬件总成本降25%,每Gbps电费省30%,运维效率提30%,空间占用减半!3年总体拥有成本直降30%+,远超初期投入。算清这笔账,升级
    的头像 发表于 08-11 10:39 1103次阅读

    算力革命引爆光器件产业:解码400G/800G光模块的黄金时代

    AI技术革命正在重塑全球光通信产业格局。2024年全球光模块市场规模飙升至144亿美元,同比激增52%,创下数十年最高增速。400G/800G光模块出货量12个月暴增近四倍,1.6T技术研发加速推进
    的头像 发表于 05-06 14:12 1228次阅读