电子发烧友网报道(文/梁浩斌)当地时间本周一,英伟达官方确认将面向中国客户推出一款型号为A800的GPU,以替代此前受到出口管制的A100 GPU芯片。英伟达表示,A800符合美国政府的出口管制条例,不能通过编程超过限制的性能。
今年8月的最后一天,英伟达发布公告称,公司收到美国政府通知,要求对中国大陆以及中国香港、俄罗斯的客户出口的高端GPU芯片,需要申请出口许可证,其中覆盖到A100和H100等几款GPU,同时未来性能等于或高于A100的产品都会受到该政策影响。随后10月继续加码的出口限制,更是将申请出口许可证的产品类别覆盖到更大的范围,包括用于超级计算机、量子计算等的尖端芯片、技术、设备等。
值得一提的是,A800 GPU是美国半导体公司首次为中国市场推出符合美国贸易政策的先进芯片。在9月份,英伟达曾表示,新的出口管制规则可能会令公司损失数亿美元的收入。而A800作为应对贸易政策而“定制”的产品,可谓进展神速,英伟达透露在今年第三季度已经投产,目前已经有一些国内经销商已经拿到实物,并打出A800 GPU的广告。
A100性能和A800几乎一致,但互连带宽被“砍一刀”
相信大家最关心的是A800跟此前的A100性能有什么差别,A800会不会是特供中国的“低配版”。其实从英伟达已经公开的参数来看,A800单卡算力在参数上几乎是与A100是完全一致的。

唯一的不同在于NVLink互连桥的带宽缩水33%,从A100上的600GB/s砍至A800的400GB/s,这可能会影响到多卡服务器,比如数据中心、超级计算机的整体性能。
NVLink是英伟达在2014年发布的一种总线和通信协议,采用了点对点结构、串列传输,用于CPU和GPU之间,或是多个GPU之间的连接,相比通过PCIe总线互连的传统方式,NVLink可以大幅提高交互效率。简单来说,NVLink就是能在GPU和GPU、GPU和CPU之间实现高速大带宽直连通信的互连技术。

图源:英伟达
电子发烧友从英伟达官网上了解到,A100所支持的NVLink总带宽达到600GB/s,属于第三代产品。今年3月英伟达在GTC 2022上发布的第四代NVLink-C2C则可以实现高达900GB/s的总带宽,是PCIe 5.0带宽的七倍,并将互连技术扩展至芯片之间的互连,支持定制裸片与 NVIDIA GPU、CPU、DPU、NIC 和 SOC之间实现一致的互连。
而A800上的NVLink总带宽为400GB/s,介于第二代和第三代之间。在AI和HPC等领域中,GPU之间的互连带宽降低,对于动辄数千块GPU组成的计算集群而言显然会造成不小的性能损失。
国内自动驾驶行业首当其冲,谁能替代英伟达?
自动驾驶技术开发,是一项需要大量算力进行AI模型训练、计算的密集型工作。作为AI模型训练的核心之一,英伟达的GPU产品一直以来都是自动驾驶玩家的主要选择。英伟达推出的HGX A100平台就是专为AI场景设计的高性能服务器平台,包含比如驱动自动驾驶汽车的模型,以及大型数据集等,官方宣称可以将模型开发效率提高20倍。
对于自动驾驶项目而言,开发效率的提高意味着缩短自动驾驶汽车的上市周期,加速架构的迭代。在行业内,包括特斯拉目前也在大量应用英伟达GPU打造超算平台。去年6月,特斯拉公布了公司内部用于训练Autopilot与自动驾驶深度神经网络的超级计算机,这个集群使用了720个节点的8个A100 GPU(共5760个),实现高达1.8 exaflops的总算力。
国内方面,蔚来在去年年底就宣布采用英伟达A100 GPU以及Mellanox InfiniBand ConnectX-6网卡构建超级计算机集群。
小鹏汽车在今年8月2日宣布与阿里云合作在乌兰察布建成了中国最大的自动驾驶智算中心“扶摇”,采用阿里云智能计算平台,算力可达600PFLOPS。虽然官方没有公布该超算中心所用的硬件,但此前阿里云一直与英伟达有密切合作,今年3月阿里云和英伟达还合作推出了初创加速计划,为初创企业提供算力缓解计算压力。
另一方面小鹏汽车创始人何小鹏在9月份的朋友圈中评论了英伟达A100出口受限的事件,并表示“坏消息是这会对所有自动驾驶云端训练带来挑战,好消息是刚好我们已经把未来几年的需求提前买回来了。” 言下之意小鹏在自动驾驶AI模型训练上所采用的GPU同样来自英伟达。
因此,高端GPU的供应限制,给未来国内自动驾驶行业带来了很大的不确定性,未来算力受限有可能成为抑制自动驾驶技术发展的关键因素。
当然,英伟达也在努力赶在出口的缓冲期尽量向中国完成更多交付。此前英伟达更新的最新消息称,公司已经获得了授权,可以使得A100和H100在2023年9月1日之前通过英伟达在相关的公司履行订单和物流。
在9月份业内又传出英伟达向台积电下了“超级急件”订单,要求台积电提前生产原计划在明年出货的部分产品,交付期从原本的5-6个月缩短至2-3个月,总量约5000片晶圆。从时间上看,这批产品可能在11月前后可以向英伟达交货。
可以预见,在近一年的缓冲期内,在目前没有其他替代产品的情况下,国内厂商会加快采购相关产品,重点可能是相比A100性能提升高达450%的H100 GPU,这至少能保证在未来几年内对算力的需求。
另一方面,英伟达与多家车企的自动驾驶已经进行深度绑定,包括蔚来、小鹏、极氪、轻舟智航等都已经宣布选择英伟达下一代Thor自动驾驶芯片,但如今有了出口管制的先例,继续在终端采用英伟达芯片难免会存在供应风险。
而在车端的自动驾驶芯片上,国内已经有一些替代产品,比如地平线、黑芝麻、寒武纪、华为等都推出了自研自动驾驶芯片,比如华为MDC810平台采用了昇腾610芯片,可以支持最高400 TOPS算力;理想L8 首发的地平线征程5单芯算力也达到了196TOPS,据称下一代征程6算力将超过100TOPS。而随着国内自动驾驶芯片的发展,未来的供应风险,或许也会是国内车企转向本土芯片公司的契机。
目前的状况,对于英伟达以及国内自动驾驶行业来说显然都不是一件好事。但至少在车端自动驾驶芯片上,国内车企往往采用多供应商的策略,扶持国内芯片厂商,并已经有所起色。然而在自动驾驶AI云端训练上,国内供应商要走的路还很长。
今年8月的最后一天,英伟达发布公告称,公司收到美国政府通知,要求对中国大陆以及中国香港、俄罗斯的客户出口的高端GPU芯片,需要申请出口许可证,其中覆盖到A100和H100等几款GPU,同时未来性能等于或高于A100的产品都会受到该政策影响。随后10月继续加码的出口限制,更是将申请出口许可证的产品类别覆盖到更大的范围,包括用于超级计算机、量子计算等的尖端芯片、技术、设备等。
值得一提的是,A800 GPU是美国半导体公司首次为中国市场推出符合美国贸易政策的先进芯片。在9月份,英伟达曾表示,新的出口管制规则可能会令公司损失数亿美元的收入。而A800作为应对贸易政策而“定制”的产品,可谓进展神速,英伟达透露在今年第三季度已经投产,目前已经有一些国内经销商已经拿到实物,并打出A800 GPU的广告。
A100性能和A800几乎一致,但互连带宽被“砍一刀”
相信大家最关心的是A800跟此前的A100性能有什么差别,A800会不会是特供中国的“低配版”。其实从英伟达已经公开的参数来看,A800单卡算力在参数上几乎是与A100是完全一致的。

唯一的不同在于NVLink互连桥的带宽缩水33%,从A100上的600GB/s砍至A800的400GB/s,这可能会影响到多卡服务器,比如数据中心、超级计算机的整体性能。
NVLink是英伟达在2014年发布的一种总线和通信协议,采用了点对点结构、串列传输,用于CPU和GPU之间,或是多个GPU之间的连接,相比通过PCIe总线互连的传统方式,NVLink可以大幅提高交互效率。简单来说,NVLink就是能在GPU和GPU、GPU和CPU之间实现高速大带宽直连通信的互连技术。

图源:英伟达
电子发烧友从英伟达官网上了解到,A100所支持的NVLink总带宽达到600GB/s,属于第三代产品。今年3月英伟达在GTC 2022上发布的第四代NVLink-C2C则可以实现高达900GB/s的总带宽,是PCIe 5.0带宽的七倍,并将互连技术扩展至芯片之间的互连,支持定制裸片与 NVIDIA GPU、CPU、DPU、NIC 和 SOC之间实现一致的互连。
而A800上的NVLink总带宽为400GB/s,介于第二代和第三代之间。在AI和HPC等领域中,GPU之间的互连带宽降低,对于动辄数千块GPU组成的计算集群而言显然会造成不小的性能损失。
国内自动驾驶行业首当其冲,谁能替代英伟达?
自动驾驶技术开发,是一项需要大量算力进行AI模型训练、计算的密集型工作。作为AI模型训练的核心之一,英伟达的GPU产品一直以来都是自动驾驶玩家的主要选择。英伟达推出的HGX A100平台就是专为AI场景设计的高性能服务器平台,包含比如驱动自动驾驶汽车的模型,以及大型数据集等,官方宣称可以将模型开发效率提高20倍。
对于自动驾驶项目而言,开发效率的提高意味着缩短自动驾驶汽车的上市周期,加速架构的迭代。在行业内,包括特斯拉目前也在大量应用英伟达GPU打造超算平台。去年6月,特斯拉公布了公司内部用于训练Autopilot与自动驾驶深度神经网络的超级计算机,这个集群使用了720个节点的8个A100 GPU(共5760个),实现高达1.8 exaflops的总算力。
国内方面,蔚来在去年年底就宣布采用英伟达A100 GPU以及Mellanox InfiniBand ConnectX-6网卡构建超级计算机集群。
小鹏汽车在今年8月2日宣布与阿里云合作在乌兰察布建成了中国最大的自动驾驶智算中心“扶摇”,采用阿里云智能计算平台,算力可达600PFLOPS。虽然官方没有公布该超算中心所用的硬件,但此前阿里云一直与英伟达有密切合作,今年3月阿里云和英伟达还合作推出了初创加速计划,为初创企业提供算力缓解计算压力。
另一方面小鹏汽车创始人何小鹏在9月份的朋友圈中评论了英伟达A100出口受限的事件,并表示“坏消息是这会对所有自动驾驶云端训练带来挑战,好消息是刚好我们已经把未来几年的需求提前买回来了。” 言下之意小鹏在自动驾驶AI模型训练上所采用的GPU同样来自英伟达。
因此,高端GPU的供应限制,给未来国内自动驾驶行业带来了很大的不确定性,未来算力受限有可能成为抑制自动驾驶技术发展的关键因素。
当然,英伟达也在努力赶在出口的缓冲期尽量向中国完成更多交付。此前英伟达更新的最新消息称,公司已经获得了授权,可以使得A100和H100在2023年9月1日之前通过英伟达在相关的公司履行订单和物流。
在9月份业内又传出英伟达向台积电下了“超级急件”订单,要求台积电提前生产原计划在明年出货的部分产品,交付期从原本的5-6个月缩短至2-3个月,总量约5000片晶圆。从时间上看,这批产品可能在11月前后可以向英伟达交货。
可以预见,在近一年的缓冲期内,在目前没有其他替代产品的情况下,国内厂商会加快采购相关产品,重点可能是相比A100性能提升高达450%的H100 GPU,这至少能保证在未来几年内对算力的需求。
另一方面,英伟达与多家车企的自动驾驶已经进行深度绑定,包括蔚来、小鹏、极氪、轻舟智航等都已经宣布选择英伟达下一代Thor自动驾驶芯片,但如今有了出口管制的先例,继续在终端采用英伟达芯片难免会存在供应风险。
而在车端的自动驾驶芯片上,国内已经有一些替代产品,比如地平线、黑芝麻、寒武纪、华为等都推出了自研自动驾驶芯片,比如华为MDC810平台采用了昇腾610芯片,可以支持最高400 TOPS算力;理想L8 首发的地平线征程5单芯算力也达到了196TOPS,据称下一代征程6算力将超过100TOPS。而随着国内自动驾驶芯片的发展,未来的供应风险,或许也会是国内车企转向本土芯片公司的契机。
目前的状况,对于英伟达以及国内自动驾驶行业来说显然都不是一件好事。但至少在车端自动驾驶芯片上,国内车企往往采用多供应商的策略,扶持国内芯片厂商,并已经有所起色。然而在自动驾驶AI云端训练上,国内供应商要走的路还很长。
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。
举报投诉
-
gpu
+关注
关注
28文章
5099浏览量
134464 -
英伟达
+关注
关注
23文章
4040浏览量
97673 -
A800
+关注
关注
0文章
14浏览量
409
发布评论请先 登录
相关推荐
热点推荐
SiC+GaN成核心!一文汇总英伟达800V HVDC认证厂商解决方案
电子发烧友网报道(文/梁浩斌)AI芯片的功率在算力需求迭代的基础上,不断提高,短短几年间,英伟达的GPU从A100单个TDP 为300W(40GB)和400W(80GB),到目前GB3
HBM迎头赶上!国产AI芯片飞跃
电子发烧友网报道(文/黄晶晶)近日,阿里平头哥AI算力卡PPU在央视新闻被曝光,在“国产卡与NV卡重要参数对比”表格中显示,其PPU在显存、片间带宽等多项硬件参数均超越英伟达A800,介于英伟
阿里神秘AI芯片曝光:多项参数超越英伟达A800
,并交由中国大陆代工厂生产,已经进入测试阶段。 然而在9月16日晚,央视《新闻联播》节目中,阿里平头哥AI算力卡PPU在新闻背景画面里被曝光,在“国产卡与NV卡重要参数对比”表格中显示,PPU在显存、片间带宽等多项硬件参数均超越英伟
新手小白必看!关于A100云主机租用,你想知道的一切都在这!
最通俗易懂的语言,为你准备了一份超详细的A100云主机租用新手指南,帮你扫清所有障碍,轻松开启AI之旅。Q1:A100云主机到底是什么?我租了能得到什么?把它想象成
今日看点:苹果认证中国快充品牌遭美调查;英伟达拟向OpenAI投资最高1000亿美元
系统建设并部署至少10吉瓦的人工智能(AI)数据中心,用于训练和运行下一代模型。这一耗电量相当于800万户美国家庭的用电量。 英伟达CEO黄
发表于 09-23 10:09
•289次阅读
英伟达最新B30A芯片曝光:算力角逐中的新变数
在全球AI芯片市场风云变幻之际,英伟达再次成为焦点。据路透社8月19日报道,两位知情人士透露,英伟达正在为中国市场开发
aicube的n卡gpu索引该如何添加?
请问有人知道aicube怎样才能读取n卡的gpu索引呢,我已经安装了cuda和cudnn,在全局的py里添加了torch,能够调用gpu,当还是只能看到默认的gpu0,显示不了gpu1
发表于 07-25 08:18
英伟达获美批准恢复H20在华销售,同步推出全新兼容GPU
7月15日上午,央广财经记者从英伟达方面确认,英伟达已经获得美国批准,将恢复 H20 在中国的销售,并推
英伟达黄仁勋:将向中国市场销售H20芯片 中国市场至关重要
,英伟达CEO黄仁勋在北京访问期间发表声明称,将恢复在中国销售其H20 GPU芯片,并根据美国出口限制为中国市场
英伟达预计向中国客户交付 “第三代” 阉割芯片
电子发烧友网综合报道,消息人士称,英伟达计划于 7 月推出第三代 “阉割芯片”。此次推出的 B20 和 B40/B30 芯片将替代 H20 芯片,试图重新夺回市场份额。 B20 芯
英伟达拟再推中国特供GPU,今年6月量产!
电子发烧友网综合报道 近年来,美国政府对华半导体出口管制政策不断收紧,英伟达等半导体企业面临严峻挑战。为保持在中国市场的竞争力,英伟达
发表于 05-27 00:03
•4600次阅读
GPU 维修干货 | 英伟达 GPU H100 常见故障有哪些?
上涨,英伟达H100GPU凭借其强大的算力,成为AI训练、高性能计算领域的核心硬件。然而,随着使用场景的复杂化,H100服务器故障率也逐渐攀升,轻则影响业务进度,重

英伟达推出A800 GPU,为了能卖给中国客户,对A100“砍了一刀”...
评论