0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

针对英特尔,博通、微软、谷歌他们做了什么

要长高 来源:半导体行业观察 作者:半导体行业观察 2023-04-23 09:24 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

凭借其GPU的领先优势,英伟达过去几年炙手可热,乘着ChatGPT热潮,公司的市值从今年年初至今更是大涨了93.6%,过去五年的涨幅更是达到惊人的385%。虽然GPU是英伟达的最重要倚仗,但这绝不是美国芯片“当红炸子鸡”的唯一武器。

通过过去几年的收购和自研,英伟达已经打造起了一个涵盖DPU、CPU和Switch,甚至硅光在内的多产品线巨头,其目的就是想在一个服务器甚至一个机架中做很多的生意。但和很多做GPGPU或者AI芯片的竞争对手想取替GPU一样,英伟达的“取替”计划似乎也不是不能一帆风顺。

近日,三巨头更是再次出手,想把英伟达拒之门外。

1/博通芯片,瞄准Infiniband

熟悉博通的读者应该知道,面向Switch市场,美国芯片巨头拥有三条高端产品线,分别是面向高带宽需求的Tomahawk、面向更多功能的 Trident,以及虽然带宽不高,但是却拥有更深的Buffer和更高可编程性的Jericho。

昨日,他们带来了Jericho系列最新的产品Jericho3-AI。在他们看来,这是比英伟达Infiniband更适合AI的一个新选择。

052a4dd4-e05c-11ed-bfe3-dac502259ad0.jpg

据博通所说,大公司(甚至 NVIDIA) 都认为 AI 工作负载会受到网络延迟和带宽的限制,而Jericho3-AI 的存在则旨在减少 AI 训练期间花在网络上的时间。其结构的主要特性是负载平衡以保持链路不拥塞、结构调度、零影响故障转移以及具有高以太网基数(radix)。

博通强调,AI 工作负载具有独特的特征,例如少量的大型、长期流,所有这些都在 AI 计算周期完成后同时开始。Jericho3-AI 结构为这些工作负载提供最高性能,具有专为 AI 工作负载设计的独特功能:

完美的负载均衡将流量均匀分布在结构的所有链路上,确保在最高网络负载下实现最大网络利用率。

端到端流量调度的无拥塞操作可确保无流量冲突和抖动。

超高基数独特地允许 Jericho3-AI 结构将连接扩展到单个集群中的 32,000 个 GPU,每个 800Gbps。

零影响故障转移功能可确保在 10 纳秒内自动收敛路径,从而不会影响作业完成时间。

利用这一独特的功能,与 All-to-All 等关键 AI 基准测试的替代网络解决方案相比,Jericho3-AI 结构的工作完成时间至少缩短了 10%。这种性能改进对降低运行 AI 工作负载的成本具有乘法效应,因为它意味着昂贵的 AI 加速器的使用效率提高了10%。此外,Jericho3-AI 结构提供每秒 26 PB 的以太网带宽,几乎是上一代带宽的四倍,同时每千兆比特的功耗降低 40%。

053d3890-e05c-11ed-bfe3-dac502259ad0.jpg

此外,Broadcom 表示,因为它可以处理 800Gbps 的端口速度(对于 PCIe Gen6 服务器)等等,所以它是一个更好的选择。对于将“AI”放在产品名称中,Broadcom 并没有做出过多解读,甚至关于网络 AI计算功能,他们也没涉及,这着实让人摸不着头脑,因为这是英伟达Infiniband 架构的主要卖点。

尽管如此,Broadcom 表示其 Jericho3-AI 以太网在 NCCL 性能方面比 NVIDIA 的 Infiniband 好大约 10%。

055e8324-e05c-11ed-bfe3-dac502259ad0.jpg

“Jericho3-AI 结构的一个独特之处在于它提供了最高的性能,同时还实现了最低的总拥有成本。这是通过长距离 SerDes、分布式缓冲和高级遥测等属性实现的,所有这些都使用行业标准以太网提供。这些因素为最大的硬件和软件提供商生态系统提供了网络架构和部署选项的高度灵活性。”博通强调。

2/微软,自研芯片再曝进展

因为ChatGPT大火的企业除了英伟达外,作为ChatGPT投资人的微软也备受关注。在半导体行业观察日前发布的文章《英伟达H100市面价格飙升!Elon Musk:每个人都在买GPU》中我们也披露,为了发展ChatGPT,微软已经抢购了不少GPU。随着算力需求的增加,微软在后续必须要更多的芯片支持。

如果一如既往地购买英伟达GPU,这对英伟达来说会是一笔昂贵的支出,他们也会为此不爽。于是,就恰如其分地,微软的自研芯片有了更多信息曝光。

据路透社引述The Information 的报道,微软公司正在开发自己的代号为“Athena”的人工智能芯片,该芯片将为 ChatGPT 等人工智能聊天机器人背后的技术提供支持。

根据该报告,这些芯片将用于训练大型语言模型和支持推理——这两者都是生成 AI 所需要的,例如 ChatGPT 中使用的 AI 来处理大量数据、识别模式并创建新的输出来模仿人类对话。报告称,微软希望该芯片的性能优于目前从其他供应商处购买的芯片,从而为其昂贵的 AI 工作节省时间和金钱。

虽然目前尚不清楚微软是否会向其 Azure 云客户提供这些芯片,但据报道,这家软件制造商计划最早于明年在微软和 OpenAI 内部更广泛地提供其 AI 芯片。据报道,该芯片的初始版本计划使用台积电 (TSMC) 的 5 纳米工艺,不过作为该项目的一部分,可能会有多代芯片,因为微软已经制定了包括多个后代芯片的路线图。

据报道,微软认为自己的 AI 芯片并不能直接替代 Nvidia 的芯片,但随着微软继续推动在Bing、Office 应用程序、GitHub和其他地方推出 AI 驱动的功能,内部的努力可能会大幅削减成本。研究公司 SemiAnalysis 的 Dylan Patel 也告诉The Information,“如果 Athena 具有竞争力,与 Nvidia 的产品相比,它可以将每芯片的成本降低三分之一。”

关于微软造芯,最早可以追溯到2020年。据彭博社在当时的报道,微软公司正在研究用于运行公司云服务的服务器计算机的内部处理器设计,以促进全行业减少对英特尔公司芯片技术依赖的努力。知情人士透露,这家全球最大的软件制造商正在使用Arm的设计来生产将用于其数据中心的处理器。它还在探索使用另一种芯片来为其部分 Surface 系列个人电脑提供动力。

近年来,微软加大了处理器工程师招聘力度,在英特尔、超微、英伟达等芯片制造商的后院招聘。2022年,他们甚至还从苹果公司挖走了一位经验丰富的芯片设计师,以扩大自身的服务器芯片业务。据报道,这位名为Mike Filippo 的资深专家将在由 Rani Borkar 运营的微软 Azure 集团内从事处理器方面的工作。微软发言人证实了 Filippo 的聘用,他也曾在 Arm和英特尔公司工作过。

今年年初,微软更是宣布收购了一家名为Fungible的DPU芯片公司。

微软 Azure 核心部门的 CVP Girish Bablani 在一篇博文中写道:“Fungible 的技术有助于实现具有可靠性和安全性的高性能、可扩展、分解、横向扩展的数据中心基础设施”。他进一步指出:“今天的公告进一步表明微软致力于数据中心基础设施进行长期差异化投资,这增强了公司的技术和产品范围,包括卸载、改善延迟、增加数据中心服务器密度、优化能源效率和降低成本。”Fungible 在其网站上的一份声明中写道。“我们很自豪能成为一家拥有 Fungible 愿景的公司的一员,并将利用 Fungible DPU 和软件来增强其存储和网络产品。”

由此我们可以看到微软在芯片上做更多的发布也不足为奇。

3/谷歌TPU,已经第四代

在取代英伟达的这条路上,谷歌无疑是其中最坚定,且走得最远的一个。

按照谷歌所说,公司谷歌早在 2006 年就考虑为神经网络构建专用集成电路 (ASIC),但到 2013 年情况变得紧迫。那时他们意识到神经网络快速增长的计算需求可能需要我们将数量 增加一倍我们运营的数据中心。从2015年开始,谷歌就将其TPU部署到了服务器中,并在后续的测试中获得了不邵的反馈,以迭代其产品。

058d619e-e05c-11ed-bfe3-dac502259ad0.jpg

近日,谷歌对其TPUv4及其基于这个芯片的打造的超级计算系统进行了深度披露。

据他们在一篇博客中介绍,得益于互连技术和领域特定加速器 (DSA) 方面的关键创新,谷歌云 TPU v4 在扩展 ML 系统性能方面比 TPU v3 有了近 10 倍的飞跃;与当代 ML DSA 相比,提高能源效率约 2-3 倍。在与Nvidia A100 相比时,谷歌表示,TPU v4比前者快 1.2-1.7 倍,功耗低 1.3-1.9 倍。在与Graphcore的IPU BOW相比,谷歌表示,其芯片也拥有领先的优势。

05c4ec40-e05c-11ed-bfe3-dac502259ad0.png

基于这个芯片,谷歌打造了一个拥有 4,096 个张量处理单元 (TPU)的TPU v4 超级计算机。谷歌表示,这些芯片由内部开发的行业领先的光电路开关 (OCS) 互连,OCS 互连硬件允许谷歌的 4K TPU 节点超级计算机与 1,000 个 CPU 主机一起运行,这些主机偶尔(0.1-1.0% 的时间)不可用而不会引起问题。

据谷歌介绍,OCS 动态重新配置其互连拓扑,以提高规模、可用性、利用率、模块化、部署、安全性、功率和性能。与 Infiniband 相比,OCS 和底层光学组件更便宜、功耗更低且速度更快,不到 TPU v4 系统成本的 5% 和系统功耗的 5% 以下。下图显示了 OCS 如何使用两个 MEM 阵列工作。不需要光到电到光的转换或耗电的网络分组交换机,从而节省了电力。

05d6d4fa-e05c-11ed-bfe3-dac502259ad0.png

值得一提的是,TPU v4 超级计算机包括 SparseCores,这是一种更接近高带宽内存的中间芯片,许多 AI 运算都发生在该芯片上。SparseCores 的概念支持 AMD、英特尔和高通等公司正在研究的新兴计算架构,该架构依赖于计算更接近数据,以及数据进出内存之间的协调。

此外,谷歌还在算法-芯片协同方面做了更大的投入。如半导体行业观察之前的文章《从谷歌TPU 看AI芯片的未来》中所说;“随着摩尔定律未来越来越接近物理极限,预计未来人工智能芯片性能进一步提升会越来越倚赖算法-芯片协同设计,而另一方面,由于有算法-芯片协同设计,我们预计未来人工智能芯片的性能仍然将保持类似摩尔定律的接近指数级提升,因此人工智能芯片仍然将会是半导体行业未来几年最为热门的方向之一,也将会成为半导体行业未来继续发展的重要引擎。”

写在最后

综合上述报道我们可以直言,对于英伟达而言,其面临的挑战是方方面面的,而不是仅仅局限于其GPU。其对手也不仅仅是芯片公司,因此如何在规模化优势的情况下,保证其高性价比,是安然度过未来潜在挑战的有效方法之一。

不过,可以肯定的是,围绕着数据中心的创新远未接近停止,甚至可以说因为大模型的流行,这场战斗才刚刚开始。


声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 英特尔
    +关注

    关注

    61

    文章

    10321

    浏览量

    181073
  • cpu
    cpu
    +关注

    关注

    68

    文章

    11326

    浏览量

    225874
  • 谷歌
    +关注

    关注

    27

    文章

    6259

    浏览量

    111963
  • 服务器
    +关注

    关注

    14

    文章

    10354

    浏览量

    91743
  • DPU
    DPU
    +关注

    关注

    0

    文章

    417

    浏览量

    27147
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    五家大厂盯上,英特尔EMIB成了?

    电子发烧友网综合报道 最近,英特尔EMIB封装火了,在苹果、高通、通的招聘信息中,都指出正在招募熟悉EMIB封装的工程师。近期还有消息称,由于台积电CoWoS 先进封装产能持续紧张,Marvell
    的头像 发表于 12-06 03:48 7683次阅读

    吉方工控亮相2025英特尔技术创新与产业生态大会

    2025年11月19日至20日,由英特尔公司主办的年度重磅盛会——2025英特尔技术创新与产业生态大会(Intel Connection)暨英特尔行业解决方案大会(Edge Industry Summit)在重庆悦来国际会议中心
    的头像 发表于 11-24 16:57 757次阅读

    英特尔举办行业解决方案大会,共同打造机器人“芯”动脉

    11月19日,在2025英特尔行业解决方案大会上,英特尔展示了基于英特尔® 酷睿™ Ultra平台的最新边缘AI产品及解决方案,并预览了针对边缘侧的
    的头像 发表于 11-19 21:51 7096次阅读
    <b class='flag-5'>英特尔</b>举办行业解决方案大会,共同打造机器人“芯”动脉

    18A工艺大单!英特尔将代工微软AI芯片Maia 2

    电子发烧友网综合报道 据科技媒体SemiAccurate报道,微软已正式向英特尔晶圆代工(Intel Foundry)下达订单,委托其使用先进的18A工艺节点生产下一代AI加速器Maia 2
    的头像 发表于 10-21 08:52 6090次阅读

    美国政府将入股英特尔

    据彭社报道称,特朗普政府正在与芯片制造商英特尔进行谈判,希望美国政府入股这家陷入困境的公司,随后该公司股价周四上涨 7% 。 英特尔是唯一一家有能力在美国本土生产最快芯片的美国公司,尽管包括台湾
    的头像 发表于 08-17 09:52 1247次阅读

    硬件与应用同频共振,英特尔Day 0适配腾讯开源混元大模型

    今日,腾讯正式发布新一代混元开源大语言模型。英特尔凭借在人工智能领域的全栈技术布局,现已在英特尔® 酷睿™ Ultra 平台上完成针对该模型的第零日(Day 0)部署与性能优化。值得一提的是, 依托
    的头像 发表于 08-07 14:42 1532次阅读
    硬件与应用同频共振,<b class='flag-5'>英特尔</b>Day 0适配腾讯开源混元大模型

    英特尔参加第三届链会,展示生态合作创新成果

    2025年7月16日,北京 ——英特尔今日亮相第三届中国国际供应链促进博览会(链会),集中展示了其与生态伙伴在AI PC等多个行业领域的合作成果。 英特尔凭借在半导体与计算领域的技术与生态积累,为
    的头像 发表于 07-17 15:22 611次阅读
    <b class='flag-5'>英特尔</b>参加第三届链<b class='flag-5'>博</b>会,展示生态合作创新成果

    英特尔参加第三届链会,链动生态共赢智慧未来

    2025年7月16日,北京——英特尔今日亮相第三届中国国际供应链促进博览会(链会),集中展示了其与生态伙伴在AI PC等多个行业领域的合作成果。   英特尔凭借在半导体与计算领域的技术与生态积累
    发表于 07-16 18:03 1797次阅读
    <b class='flag-5'>英特尔</b>参加第三届链<b class='flag-5'>博</b>会,链动生态共赢智慧未来

    使用英特尔® NPU 插件C++运行应用程序时出现错误:“std::Runtime_error at memory location”怎么解决?

    使用OpenVINO™工具套件版本 2024.4.0 构建C++应用程序 使用英特尔® NPU 插件运行了 C++ 应用程序 遇到的错误: Microsoft C++ exception: std::runtime_error at memory location
    发表于 06-25 08:01

    英特尔锐炫Pro B系列,边缘AI的“智能引擎”

    2025年6月19日,上海—— 在MWC 25上海期间,英特尔展示了一幅由英特尔锐炫™ Pro B系列GPU所驱动的“实时响应、安全高效、成本可控”的边缘AI图景。 英特尔客户端计算事业部边缘计算
    的头像 发表于 06-20 17:32 1047次阅读
    <b class='flag-5'>英特尔</b>锐炫Pro B系列,边缘AI的“智能引擎”

    英特尔先进封装,新突破

    在半导体行业的激烈竞争中,先进封装技术已成为各大厂商角逐的关键领域。英特尔作为行业的重要参与者,近日在电子元件技术大会(ECTC)上披露了多项芯片封装技术突破,再次吸引了业界的目光。这些创新不仅展现
    的头像 发表于 06-04 17:29 1406次阅读

    直击Computex 2025:英特尔重磅发布新一代GPU,图形和AI性能跃升3.4倍

    B60和英特尔锐炫Pro B50 GPU,AI加速器产品—英特尔Gaudi 3 AI加速器。 英特尔副总裁兼客户端显卡总经理Vivian Lien表示:“针对B系列的产品,我们推出了
    的头像 发表于 05-21 00:57 7741次阅读
    直击Computex 2025:<b class='flag-5'>英特尔</b>重磅发布新一代GPU,图形和AI性能跃升3.4倍

    直击Computex2025:英特尔重磅发布新一代GPU,图形和AI性能跃升3.4倍

    5月19日,在Computex 2025上,英特尔发布了最新全新图形处理器(GPU)和AI加速器产品系列。包括全新英特尔锐炫™ Pro B系列GPU——英特尔锐炫Pro B60和英特尔
    的头像 发表于 05-20 12:27 5649次阅读
    直击Computex2025:<b class='flag-5'>英特尔</b>重磅发布新一代GPU,图形和AI性能跃升3.4倍

    英特尔发布全新GPU,AI和工作站迎来新选择

    英特尔推出面向准专业用户和AI开发者的英特尔锐炫Pro GPU系列,发布英特尔® Gaudi 3 AI加速器机架级和PCIe部署方案   2025 年 5 月 19 日,北京 ——今日,在
    发表于 05-20 11:03 1912次阅读

    英特尔宣布裁员20% 或2万人失业

    据外媒彭社的报道,在当地时间4月24日,英特尔宣布裁员计划,比例超20%。按照截至2024年底英特尔在全球拥有108900名员工来计算的话,预计此次裁员将波及大约2.2万名员工。旨在精简管理,并重
    的头像 发表于 04-25 17:34 755次阅读