在AI和大数据时代到来之后,GPU单兵作战就变成了奢望,以现在的数据中心和超算为例,动辄就是成千上万张GPU,庞大的GPU网络在交换机和光模块的支持下代表了这个计算时代下最高的算力。但并非只有数据中心和超算里的GPU才需要这样的扩展性,嵌入式GPU和专业GPU同样如此。
物理限制的嵌入式GPU
随着各种传感器的性能持续走高,譬如多线激光雷达、高分辨率的图像传感器等,我们对边缘计算单元尤其是GPU的需求也在持续增加。但在实现的过程中,我们还有一些物理限制没法消除,像是尺寸、重量和功耗等。
为了解决这一系列问题,美国政府和行业方案提供商们成立了SOSA联盟,以求开发开放的标准和最好的方案来实现高性价比、互操作性强的传感器系统。如何克服这些负载计算工作量提升带来的挑战,又能不增加宝贵的物理资源呢?答案自然还是将GPU、DPU等技术集成到嵌入式结构中去。
这类嵌入式GPU并非用来单独售卖,而是交给合作伙伴整合到不同的边缘计算系统中,比如研华、凌华、EIZO、Mercury Systems等,然后交付给美国空军、洛克希德·马丁这类军事、航空、工业客户。

MXM嵌入式GPU模块 / 凌华科技
即便选择了嵌入式结构,也还有着不少的路线,比如GPU、FPGA和ASIC等等。SOSA联盟主席,来自美国空军的Ilya Lipkin表示,如果想要更快的运行速度,快速部署软件,自然是选择GPU最好。但他们也面临着空间的问题,因为嵌入式GPU往往会被塞到3U或者6U的服务器里,他们想要做到更小的体积,甚至是手掌大小,可这样一来就不得不牺牲带宽、容量。
所以,虽然嵌入式GPU仍然在这些嵌入式传感系统中可以保持领先地位,但他们并没有像获得数据中心那样不算严格的空间要求。目前的MXM嵌入式GPU可以做到PCIe GPU五分之一的尺寸,但这对于嵌入式GPU的扩展性来说还不算完美。在边缘计算上,反倒是一些FPGA和ASIC方案在能耗比和扩展性上占优,如果嵌入式GPU不能做到更强大的扩展性,很有可能会被后来者颠覆。
显卡交火时代的结束
不管是最新发布的RTX4090消费级显卡,还是RTX 6000这样的专业显卡,都象征了英伟达在新架构GPU上的又一次创新。在台积电4N工艺的加持下,无论是晶体管数目还是CUDA核心都做到了极致。
然而,原本变成了专属英伟达高端消费显卡和专业显卡的交火技术NVLink,在RTX4090和RTX 6000上却无处可寻,难不成英伟达彻底放弃显卡交火技术,也就此放弃NVLink了?根据英伟达CEO黄仁勋的说法,他们省下了NVLink连接器的空间,释放了更多的空间来处理更多的AI计算。
在上一代显卡的NVLink中,通过连接两块英伟达显卡,使用高端显卡和专业显卡的专业系统能够获得更高的带宽和双倍的显存容量。这样的提升对于个人或专业用户来说是极大的提升,那么为何英伟达会放弃NVLink呢?笔者也在英伟达GTC的一次分享会议上提出了这一问题。

RTX6000 / 英伟达
英伟达方面表示,就RTX 6000这类专业显卡而言,他们取消NVLink后省下了足够的空间,塞入了更多的计算单元来提升单卡的性能。与此同时,虽然这些专业显卡的NVLink支持被取消,不代表英伟达放弃了这一技术。英伟达决心将NVLink的重心放在数据中心产品上,比如Grace CPU、Hopper GPU,他们通过NVLink Die to Die和Chip to Chip的互联可以实现更好的扩展性。
但这确实象征着一个时代的结束,过去AMD的交火和英伟达的SLI也是两家竞争最火热的一项技术,可随着AMD放弃了交火支持,英伟达的SLI在换成NVLink后如今也迎来了终结。
但显卡交火的落幕也情有可原,且不说这种互联方式的受众群体一再变少,要想享受到显卡交火的性能也需要软件追加更新支持。或许专业显卡的目标还是追求单卡性能就好,多卡互联的支持还是让给数据中心吧。
物理限制的嵌入式GPU
随着各种传感器的性能持续走高,譬如多线激光雷达、高分辨率的图像传感器等,我们对边缘计算单元尤其是GPU的需求也在持续增加。但在实现的过程中,我们还有一些物理限制没法消除,像是尺寸、重量和功耗等。
为了解决这一系列问题,美国政府和行业方案提供商们成立了SOSA联盟,以求开发开放的标准和最好的方案来实现高性价比、互操作性强的传感器系统。如何克服这些负载计算工作量提升带来的挑战,又能不增加宝贵的物理资源呢?答案自然还是将GPU、DPU等技术集成到嵌入式结构中去。
这类嵌入式GPU并非用来单独售卖,而是交给合作伙伴整合到不同的边缘计算系统中,比如研华、凌华、EIZO、Mercury Systems等,然后交付给美国空军、洛克希德·马丁这类军事、航空、工业客户。

MXM嵌入式GPU模块 / 凌华科技
即便选择了嵌入式结构,也还有着不少的路线,比如GPU、FPGA和ASIC等等。SOSA联盟主席,来自美国空军的Ilya Lipkin表示,如果想要更快的运行速度,快速部署软件,自然是选择GPU最好。但他们也面临着空间的问题,因为嵌入式GPU往往会被塞到3U或者6U的服务器里,他们想要做到更小的体积,甚至是手掌大小,可这样一来就不得不牺牲带宽、容量。
所以,虽然嵌入式GPU仍然在这些嵌入式传感系统中可以保持领先地位,但他们并没有像获得数据中心那样不算严格的空间要求。目前的MXM嵌入式GPU可以做到PCIe GPU五分之一的尺寸,但这对于嵌入式GPU的扩展性来说还不算完美。在边缘计算上,反倒是一些FPGA和ASIC方案在能耗比和扩展性上占优,如果嵌入式GPU不能做到更强大的扩展性,很有可能会被后来者颠覆。
显卡交火时代的结束
不管是最新发布的RTX4090消费级显卡,还是RTX 6000这样的专业显卡,都象征了英伟达在新架构GPU上的又一次创新。在台积电4N工艺的加持下,无论是晶体管数目还是CUDA核心都做到了极致。
然而,原本变成了专属英伟达高端消费显卡和专业显卡的交火技术NVLink,在RTX4090和RTX 6000上却无处可寻,难不成英伟达彻底放弃显卡交火技术,也就此放弃NVLink了?根据英伟达CEO黄仁勋的说法,他们省下了NVLink连接器的空间,释放了更多的空间来处理更多的AI计算。
在上一代显卡的NVLink中,通过连接两块英伟达显卡,使用高端显卡和专业显卡的专业系统能够获得更高的带宽和双倍的显存容量。这样的提升对于个人或专业用户来说是极大的提升,那么为何英伟达会放弃NVLink呢?笔者也在英伟达GTC的一次分享会议上提出了这一问题。

RTX6000 / 英伟达
但这确实象征着一个时代的结束,过去AMD的交火和英伟达的SLI也是两家竞争最火热的一项技术,可随着AMD放弃了交火支持,英伟达的SLI在换成NVLink后如今也迎来了终结。
但显卡交火的落幕也情有可原,且不说这种互联方式的受众群体一再变少,要想享受到显卡交火的性能也需要软件追加更新支持。或许专业显卡的目标还是追求单卡性能就好,多卡互联的支持还是让给数据中心吧。
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。
举报投诉
-
gpu
+关注
关注
28文章
5099浏览量
134428
发布评论请先 登录
相关推荐
热点推荐
汽车中的GPU是如何使用的?
(HMI)的发展尤为迅猛。随着电子电气架构(EEA)的集中化,车辆对高性能计算能力的需求显著提升,GPU(图形处理单元)的灵活性、可扩展性以及高效并行计算能力,使其成为支持这些创新应用的核心组件
如何通过交替式几何处理实现更优的多核 GPU 扩展
在理论上,通过增加更多GPU核心来提升性能似乎很简单:核心越多,性能越强。但在实践中,这是图形架构领域最棘手的挑战之一。虽然某些工作负载因其独立特性能实现良好扩展,但另一些工作负载(尤其是几何
如何评估电能质量在线监测装置的扩展性?
评估电能质量在线监测装置的扩展性,需围绕 “ 硬件可扩展、软件可升级、协议可兼容、场景可适配 ” 四大核心维度展开,通过 “技术参数核查、厂商能力验证、实际场景测试” 三层验证,判断装置能否随电网
电能质量在线监测装置的兼容性和扩展性对其性能有何影响?
电能质量在线监测装置的兼容性和扩展性,是决定其 “能否融入现有系统、适应未来变化” 的核心属性,直接影响装置的 数据互通性、功能适配性、生命周期价值 ,进而间接作用于谐波源识别准确率、定位精度等核心
NVIDIA桌面GPU系列扩展新产品
NVIDIA 桌面 GPU 系列扩展,推出 NVIDIA RTX PRO 4000 SFF Edition GPU 和 RTX PRO 2000 Blackwell GPU,可提高工程
市场上的工控机改如何选择?接口与扩展性需求分析
在边缘计算时代,工控机的选择需紧密围绕实时性、可靠性、环境适应性三大工业核心需求,同时兼顾算力、接口与扩展性的平衡。以下是关键考量因素及选型策略: 一、算力需求分析:从场景出发分层选型 传感器数据
瑞萨电子RA系列微控制器的可扩展性强的配置软件包 (FSP)安装下载与使用指南
瑞萨电子RA系列微控制器的可扩展性强的配置软件包 (FSP)安装下载与使用指南
聚徽分享高性能工控机选购指南:稳定性、扩展性、抗干扰能力如何平衡?
协调的重任。而在选购高性能工控机时,稳定性、扩展性与抗干扰能力成为了至关重要的考量因素,如何在这三者之间找到完美的平衡,成为了众多企业面临的关键难题。 稳定性:工业运行的基石 1. 硬件质量与可靠性 工业级元器件的
瑞芯微RK3288解决方案:高性能、高扩展性的嵌入式系统设计理念与应用分析
。本文将深入剖析基于RK3288的处理方案,重点阐述其在硬件架构、软件平台、扩展性设计以及应用场景等方面的优势,并探讨其所蕴含的嵌入式系统设计理念。一、RK328
IAR推动嵌入式开发:云就绪、可扩展的CI/CD和可持续自动化
IAR正式发布全新云就绪平台,为嵌入式开发团队提供企业级的可扩展性、安全性和自动化能力。
从图形处理到AI加速,一文看懂Imagination D系列GPU
Imagination的D系列于2022年首次发布,见证了生成式AI从云端到智能手机等消费设备中普及。在云端,由于GPU的可编程性、可扩展性和快速处理AI工作负载的能力,GPU已成为高
[求职] RK3588核心板,寻找志同道合的电子发烧友!
。
灵活的扩展性: 支持多种操作系统,包括Android、Linux等,方便开发者进行二次开发。
项目经验
智能家居网关: 凭借强大的处理能力和丰富的接口,成功应用于智能家居网关项目,实现多种智能设备
发表于 02-11 10:49
FPGA+GPU+CPU国产化人工智能平台
平台采用国产化FPGA+GPU+CPU构建嵌入式多核异构智算终端,可形成FPGA+GPU、FPGA+CPU、CPU+FPGA等组合模式,形成低功耗、高可扩展性的硬件系统,结合使用场景灵活搭配,已有
在众核场景下EXT4该如何应对才能发挥性能
一、背景和问题 1. EXT4日志的问题 随着计算机系统加载数百个CPU内核,文件系统的可扩展性得到进一步强调。因此本文主要定位服务器中广泛使用的Ext4文件系统在做日志记录时的可扩展性问题

GPU在不同形态下的扩展性问题
评论