生成式AI带火的不止GPU，网络芯片迎来下一轮大战-电子发烧友网

电子发烧友网报道（文/周凯扬）在生成式AI的热度之下，横向扩展AI训练与推理性能成了每个云服务厂商、数据中心以及互联网厂商追求的目标，这点从前段时间的GPU抢购潮就能看出来，庞大的GPU基数在当下几乎可以和强大的AI算力画上等号。

然而，真正将这些GPU连接起来的，还是靠以太网交换机、路由这类网络芯片。随着数据中心解耦趋势愈发明显，相继认识到这一点的网络芯片厂商都开始新一轮的军备竞赛，诸如博通、美满和思科等厂商都已经加快了新品推出的节奏。

博通Tomahawk

作为在数据中心网络芯片耕耘了12年以上的博通，从640G的Trident系列到25.6T的Tomahawk4系列，已经完成了多次设计迭代，显著提高了网络芯片的带宽。今年三月，博通终于发布了Tomahawk 5系列网络芯片，也是市面上首个量产51.2Tbps交换带宽的芯片。

新的Tomahawk 5系列无疑是在暴涨的AI需求下诞生的，我们从其设计中也能看出。由于做到了更高的端口密度，Tomahawk 5可以实现256高性能AI/ML加速器之间的单跳连接，且每个都能做到200Gbps的网络带宽。这对于数据中心的AI训练和推理的负载来说，无疑提高了吞吐效率，尤其是日益流行且愈发复杂的生成式AI模型。

Trident和Tomahawk芯片路线图 / 博通

在物理设计上，Tomahawk 5采用了如今已经趋近成熟的共封装光学（CPO）方案，相较过去的光模块在前端面板插拔的方案，CPO选择将网络交换芯片和光模块封装在一起。这一封装方案结合5nm的芯片工艺，将功耗进一步降低了30%。

另外值得一提的是，博通的第三条网络芯片产品线，Jericho，也在近期迎来了新品Jericho3-AI。相比以高带宽为重心的Tomahawk产品线，和主打更多功能性的Trident产品线，Jericho往往以较低带宽、深度缓存和高可编程性著称。

而Jericho3-AI虽然确实是28.8T的以太网交换机芯片，却针对AI训练负载做了特殊的优化，更高的端口密度使得Jericho3-AI可以在单个集群中连接32000个GPU，并做到800Gbps的连接带宽表现。博通甚至将其与英伟达自己的InfiniBand方案对比，Jericho3-AI在完成时间上有着10%左右的优势。这也是Jericho系列独有的优势，实现标准以太网芯片无法实现却在AI或HPC应用上被看重的灵活功能。

思科Silicon One

其实早在2019年思科首次推出Silicon One网络芯片时，博通CEO霍克·谭就表示：“思科在该市场的参与，恰巧验证了我们推进的这一行业趋势，也就是数据中心的解耦。我们很高兴自己再次押对了，也欢迎更多的竞争。”要知道，之前的思科可是博通的优质客户之一，如今身份的转变已经对网络芯片的市场格局产生了不小的影响。

Silicon One芯片路线图 / 思科

在第一代自研芯片Silicon One发布三年半之后，思科在近日终于推出了该产品线的第四代产品，以太网交换机芯片G200和G202。其中G200专注于统一架构和基于以太网的AI/ML应用部署，这个采用 5nm工艺打造的芯片，基于512个112Gbps SerDes打造，同样可以做到51.2Tbps的交换带宽。

而G202则是针对想要继续使用50G SerDes的客户打造的，同样基于5nm的工艺，G202采用了512x56Gbps SerDes的配置，其特性与G200完全一致，只不过交换性能只有G200的一半。

根据思科的说法，由于单设备512个100GE以太网端口的超高端口密度，客户可以在一个双层网络上构建由32000个400G GPU组成的AI/ML集群。借助G200打造这样一个庞大的网络，却依然可以省去50%的光学组件、40%左右的交换机，极大减少这类集群的碳足迹，每年最高可以省下900万kWh的耗能。据了解，G200已经送样给六大云服务商中的五家进行测试了。

美满Teralynx

在收购由几位前博通高管打造的芯片初创公司Innovium后，美满也开始了他们的网络芯片逆袭。同样是在今年3月，美满也推出了自己的51.2Tbps交换机芯片，Teralynx 10。相比其他两家，美满为Teralynx 10选择的定位是超低延迟的可编程交换机芯片，这也是此前Innovium的设计目标。

不过直至目前为止，美满并没有将Teralynx并入自己的Prestera产品线内，看来Prestera应该还是主打企业与边缘数据中心市场，而面向云端数据中心的Teralynx系列继续沿用原来的产品线名称。

除了用到业界顶级的112G SerDes IP和先进的工艺实现低功耗的系统设计以外，美满电子宣称Teralynx 10可以提供1.7倍的延迟优势，这对于生成式AI这种看重完成时间和网络传输时间的应用来说至关重要。

企业与数据中心的交换芯片方案 / 美满

还有一点与其他两家不同的是，Teralynx 10可以驱动128个400Gbps端口、64个800Gbps端口和32个1.6Tbps端口，1.6Tbps的端口驱动能力可以说是放眼未来了，这也意味着Teralynx 10可以直接在1RU大小的机柜中实现51.2Tbps的性能。

为此，美满也推出了Nova这一业界首个做到1.6Tbps的PAM4电光平台，Nova基于美满的200Gbps/lambda光DSP打造，足以为1.6Tbps的可插拔光模块提供支持。由于DSP的带宽翻倍，基于Nova的光模块不仅减少了所需激光和相关光学组件的数量，相较其他的方案来说稳定性也同样加倍。虽然800Gbps的光模块仍在普及中，但要想在下一代数据中心交换网络中抢占先机，1.6Tbps的光模块也该尽快提上日程了。

写在最后

之所以这些厂商都能这么快推出下一代高性能网络芯片，其实还是靠EDA/IP和封装技术打好了第一波基础，厂商们先一步推出了完善的以太网IP和共封装光学方案。不过这也意味着过去数据中心交换硬件很可能迎来新一波的换代，从目前来看应该是只有大型云服务厂商有这个资本进行大规模替换。

但除了这些网络芯片公司之间的斗争之外，他们也需要提防英伟达这样既有GPU业务又有网络芯片业务的厂商。以上提到的这三家在推出的新品上都有剑指英伟达InfiniBand的意思，毕竟后者从一开始就是为了HPC和AI打造的通信标准，而它们则是刚从Web Scaling转向AI Scaling，从外部网络交换转为内部网络交换，仍需要不断提升产品性能才能在这个竞争激烈的市场上存活下去。

不过这也可以看出AI带来的热度，因为无论是从软件还是从硬件上，产品的迭代速度都有了成倍提升。800GbE时代的到来，也导致所有想在服务器市场创造增长的厂商纷纷趋之若鹜，好在这样的趋势恰恰是服务器市场急需的一剂强心剂。

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

gpu

gpu

+关注

关注
27

文章
4417

浏览量
126689
AI

AI

+关注

关注
87

文章
26443

浏览量
264044
生成式AI

生成式AI

+关注

关注
0

文章
349

浏览量
212

FPGA在深度学习应用中或将取代GPU

，也正积极的为其开发专用的 AI 硬件，用于自己的云产品和边缘计算产品环境中。神经形态芯片方面也有着一些发展，这是一种专门为神经网络设计

发表于 03-21 15:19

安霸发布全新N1系列生成式AI芯片

安霸在CES 2024上发布了全新的N1系列生成式AI芯片，这是一款专门为前端设备设计的芯片，支持本地运行大型语言模型（LLM）应用。其单颗SoC能够支持1至340亿参数的多模态大模型

发表于 01-09 15:32 •681次阅读

ASIC和GPU，谁才是AI计算的最优解？

电子发烧友网报道（文/周凯扬）随着AI计算开始有着风头盖过通用计算开始，不少芯片厂商都将其视为下一轮技术革新。CPU、GPU、FPGA和ASIC纷纷投入到这轮

发表于 12-03 08:31 •1416次阅读

ASIC和<b class='flag-5'>GPU</b>，谁才是<b class='flag-5'>AI</b>计算的最优解？

AI再进化丨透过Gartner十大战略技术趋势，看AI如何重塑IT行业

共识。面对不可阻挡的AI大潮，Gartner在新发布的 2024年十大战略技术趋势中，对AI的发展趋势、AI的风险和安全管理、AI的应用

发表于 11-09 17:55 •388次阅读

<b class='flag-5'>AI</b>再进化丨透过Gartner十<b class='flag-5'>大战</b>略技术趋势，看<b class='flag-5'>AI</b>如何重塑IT行业

硅谷：设计师利用生成式 AI 辅助芯片设计

芯片工程师展示了一个高度专业化的行业如何使用 NVIDIA NeMo 来定制大语言模型，以获得竞争优势。 10 月 31 日，NVIDIA 发布的一篇研究论文描述了生成式 AI 如何助力芯片

发表于 11-01 20:25 •259次阅读

硅谷：设计师利用生成式 AI 辅助芯片设计

芯片工程师展示了一个高度专业化的行业如何使用 NVIDIA NeMo 来定制大语言模型，以获得竞争优势。 10 月 31 日，NVIDIA 发布的一篇研究论文描述了生成式 AI

发表于 11-01 14:45 •164次阅读

生成式AI带动网络芯片需求增长

的30.74亿美元相比增长7%。博通总裁兼首席执行官陈福阳（Hock Tan）表示，随着超大规模客户在数据中心内扩展并建设他们的AI集群网络，博通的第三季度业绩受到对下一代网络技

发表于 09-05 00:14 •1076次阅读

英国加入全球AI芯片大战

GPU最初是为视频游戏设计的产品，现已成为英伟达成功的核心。ChatGPT等AI模型的动力就是由英伟达芯片提供的。目前英伟达的GPU是全球应用最为广泛的

发表于 08-26 14:50 •805次阅读

ai芯片和gpu芯片有什么区别？

，AI芯片是专门为人工智能而设计的，它在处理神经网络和深度学习方面更加高效。而GPU芯片则是为了更好地处理图像和视频等方面而略微弱于

发表于 08-08 18:02 •4101次阅读

AI芯片和GPU芯片的区别

人工智能（AI）芯片和图形处理单元（GPU）芯片都是现代计算机中使用的重要组件。虽然两者可以用于处理大规模数据，但它们的设计目的是不同的。在本文中，我们将深入探讨两种

发表于 08-07 17:42 •4230次阅读

ai芯片和传统芯片的区别 GPU与CPU的架构对比

AI芯片在处理大规模数据和复杂计算任务（例如深度学习算法）时具有更高的计算性能。它们通常集成了多个高性能的计算单元，如GPU（图形处理器）或专门的神经网络处理器（NPU）。

发表于 08-05 16:11 •4929次阅读

AMD甩出最强AI芯片单个GPU跑大模型

专为生成式AI设计的GPU：HBM密度是英伟达H100的2.4倍，带宽是英伟达H100的1.6倍。

发表于 06-20 10:47 •649次阅读

国产生成式AI，不能仅仅看向前方#生成式AI #信息无障碍

AI

脑极体
发布于 :2023年06月15日 19:06:36

下一代天玑旗舰移动芯片将采用 Arm 最新 CPU 与 GPU IP

MediaTek 下一代天玑旗舰移动芯片将采用 Arm 最新 CPU 与 GPU IP — Cortex-X4、Cortex-A720 以及Immortalis-G720 GPU，通过

发表于 05-29 22:30 •457次阅读

什么是生成式AI？生成式AI的四大优势

生成式AI是一种特定类型的AI，专注于生成新内容，如文本、图像和音乐。这些系统在大型数据集上进行训练，并使用机器学习算法生成与训练数据相似的

发表于 05-29 14:12 •2731次阅读

搜索历史

生成式AI带火的不止GPU，网络芯片迎来下一轮大战

评论

FPGA在深度学习应用中或将取代GPU

安霸发布全新N1系列生成式AI芯片

ASIC和GPU，谁才是AI计算的最优解？

AI再进化丨透过Gartner十大战略技术趋势，看AI如何重塑IT行业

硅谷：设计师利用生成式 AI 辅助芯片设计

硅谷：设计师利用生成式 AI 辅助芯片设计

生成式AI带动网络芯片需求增长

英国加入全球AI芯片大战

ai芯片和gpu芯片有什么区别？

AI芯片和GPU芯片的区别

ai芯片和传统芯片的区别 GPU与CPU的架构对比

AMD甩出最强AI芯片单个GPU跑大模型

国产生成式AI，不能仅仅看向前方#生成式AI #信息无障碍

下一代天玑旗舰移动芯片将采用 Arm 最新 CPU 与 GPU IP

什么是生成式AI？生成式AI的四大优势