在AI和大数据时代到来之后,GPU单兵作战就变成了奢望,以现在的数据中心和超算为例,动辄就是成千上万张GPU,庞大的GPU网络在交换机和光模块的支持下代表了这个计算时代下最高的算力。但并非只有数据中心和超算里的GPU才需要这样的扩展性,嵌入式GPU和专业GPU同样如此。
物理限制的嵌入式GPU
随着各种传感器的性能持续走高,譬如多线激光雷达、高分辨率的图像传感器等,我们对边缘计算单元尤其是GPU的需求也在持续增加。但在实现的过程中,我们还有一些物理限制没法消除,像是尺寸、重量和功耗等。
为了解决这一系列问题,美国政府和行业方案提供商们成立了SOSA联盟,以求开发开放的标准和最好的方案来实现高性价比、互操作性强的传感器系统。如何克服这些负载计算工作量提升带来的挑战,又能不增加宝贵的物理资源呢?答案自然还是将GPU、DPU等技术集成到嵌入式结构中去。
这类嵌入式GPU并非用来单独售卖,而是交给合作伙伴整合到不同的边缘计算系统中,比如研华、凌华、EIZO、Mercury Systems等,然后交付给美国空军、洛克希德·马丁这类军事、航空、工业客户。

MXM嵌入式GPU模块 / 凌华科技
即便选择了嵌入式结构,也还有着不少的路线,比如GPU、FPGA和ASIC等等。SOSA联盟主席,来自美国空军的Ilya Lipkin表示,如果想要更快的运行速度,快速部署软件,自然是选择GPU最好。但他们也面临着空间的问题,因为嵌入式GPU往往会被塞到3U或者6U的服务器里,他们想要做到更小的体积,甚至是手掌大小,可这样一来就不得不牺牲带宽、容量。
所以,虽然嵌入式GPU仍然在这些嵌入式传感系统中可以保持领先地位,但他们并没有像获得数据中心那样不算严格的空间要求。目前的MXM嵌入式GPU可以做到PCIe GPU五分之一的尺寸,但这对于嵌入式GPU的扩展性来说还不算完美。在边缘计算上,反倒是一些FPGA和ASIC方案在能耗比和扩展性上占优,如果嵌入式GPU不能做到更强大的扩展性,很有可能会被后来者颠覆。
显卡交火时代的结束
不管是最新发布的RTX4090消费级显卡,还是RTX 6000这样的专业显卡,都象征了英伟达在新架构GPU上的又一次创新。在台积电4N工艺的加持下,无论是晶体管数目还是CUDA核心都做到了极致。
然而,原本变成了专属英伟达高端消费显卡和专业显卡的交火技术NVLink,在RTX4090和RTX 6000上却无处可寻,难不成英伟达彻底放弃显卡交火技术,也就此放弃NVLink了?根据英伟达CEO黄仁勋的说法,他们省下了NVLink连接器的空间,释放了更多的空间来处理更多的AI计算。
在上一代显卡的NVLink中,通过连接两块英伟达显卡,使用高端显卡和专业显卡的专业系统能够获得更高的带宽和双倍的显存容量。这样的提升对于个人或专业用户来说是极大的提升,那么为何英伟达会放弃NVLink呢?笔者也在英伟达GTC的一次分享会议上提出了这一问题。

RTX6000 / 英伟达
英伟达方面表示,就RTX 6000这类专业显卡而言,他们取消NVLink后省下了足够的空间,塞入了更多的计算单元来提升单卡的性能。与此同时,虽然这些专业显卡的NVLink支持被取消,不代表英伟达放弃了这一技术。英伟达决心将NVLink的重心放在数据中心产品上,比如Grace CPU、Hopper GPU,他们通过NVLink Die to Die和Chip to Chip的互联可以实现更好的扩展性。
但这确实象征着一个时代的结束,过去AMD的交火和英伟达的SLI也是两家竞争最火热的一项技术,可随着AMD放弃了交火支持,英伟达的SLI在换成NVLink后如今也迎来了终结。
但显卡交火的落幕也情有可原,且不说这种互联方式的受众群体一再变少,要想享受到显卡交火的性能也需要软件追加更新支持。或许专业显卡的目标还是追求单卡性能就好,多卡互联的支持还是让给数据中心吧。
物理限制的嵌入式GPU
随着各种传感器的性能持续走高,譬如多线激光雷达、高分辨率的图像传感器等,我们对边缘计算单元尤其是GPU的需求也在持续增加。但在实现的过程中,我们还有一些物理限制没法消除,像是尺寸、重量和功耗等。
为了解决这一系列问题,美国政府和行业方案提供商们成立了SOSA联盟,以求开发开放的标准和最好的方案来实现高性价比、互操作性强的传感器系统。如何克服这些负载计算工作量提升带来的挑战,又能不增加宝贵的物理资源呢?答案自然还是将GPU、DPU等技术集成到嵌入式结构中去。
这类嵌入式GPU并非用来单独售卖,而是交给合作伙伴整合到不同的边缘计算系统中,比如研华、凌华、EIZO、Mercury Systems等,然后交付给美国空军、洛克希德·马丁这类军事、航空、工业客户。

MXM嵌入式GPU模块 / 凌华科技
即便选择了嵌入式结构,也还有着不少的路线,比如GPU、FPGA和ASIC等等。SOSA联盟主席,来自美国空军的Ilya Lipkin表示,如果想要更快的运行速度,快速部署软件,自然是选择GPU最好。但他们也面临着空间的问题,因为嵌入式GPU往往会被塞到3U或者6U的服务器里,他们想要做到更小的体积,甚至是手掌大小,可这样一来就不得不牺牲带宽、容量。
所以,虽然嵌入式GPU仍然在这些嵌入式传感系统中可以保持领先地位,但他们并没有像获得数据中心那样不算严格的空间要求。目前的MXM嵌入式GPU可以做到PCIe GPU五分之一的尺寸,但这对于嵌入式GPU的扩展性来说还不算完美。在边缘计算上,反倒是一些FPGA和ASIC方案在能耗比和扩展性上占优,如果嵌入式GPU不能做到更强大的扩展性,很有可能会被后来者颠覆。
显卡交火时代的结束
不管是最新发布的RTX4090消费级显卡,还是RTX 6000这样的专业显卡,都象征了英伟达在新架构GPU上的又一次创新。在台积电4N工艺的加持下,无论是晶体管数目还是CUDA核心都做到了极致。
然而,原本变成了专属英伟达高端消费显卡和专业显卡的交火技术NVLink,在RTX4090和RTX 6000上却无处可寻,难不成英伟达彻底放弃显卡交火技术,也就此放弃NVLink了?根据英伟达CEO黄仁勋的说法,他们省下了NVLink连接器的空间,释放了更多的空间来处理更多的AI计算。
在上一代显卡的NVLink中,通过连接两块英伟达显卡,使用高端显卡和专业显卡的专业系统能够获得更高的带宽和双倍的显存容量。这样的提升对于个人或专业用户来说是极大的提升,那么为何英伟达会放弃NVLink呢?笔者也在英伟达GTC的一次分享会议上提出了这一问题。

RTX6000 / 英伟达
但这确实象征着一个时代的结束,过去AMD的交火和英伟达的SLI也是两家竞争最火热的一项技术,可随着AMD放弃了交火支持,英伟达的SLI在换成NVLink后如今也迎来了终结。
但显卡交火的落幕也情有可原,且不说这种互联方式的受众群体一再变少,要想享受到显卡交火的性能也需要软件追加更新支持。或许专业显卡的目标还是追求单卡性能就好,多卡互联的支持还是让给数据中心吧。
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。
举报投诉
-
gpu
+关注
关注
28文章
5321浏览量
136212
发布评论请先 登录
相关推荐
热点推荐
如何在Arm Neoverse N2平台上提升llama.cpp扩展性能
跨 NUMA 内存访问可能会限制 llama.cpp 在 Arm Neoverse 平台上的扩展能力。本文将为你详细分析这一问题,并通过引入原型验证补丁来加以解决。测试结果表明,在基于 Neoverse N2 平台的系统上运行
使用NVIDIA Isaac Lab-Arena简化通用机器人策略的仿真评估
通用机器人策略需要能够处理多种任务,适应不同形态的机器人,并在多样化的环境中运行。因此,仿真评估过程必须具有可扩展性且易于复现。目前,建立大规模的策略评估流程既繁琐又依赖人工。如果缺乏系统化的方法,开发者将不得不以高昂成本构建定制化基础设施,即便如此,任务库的复杂性和多样
飞腾D3000M工控主板:强性能、多扩展
在工业自动化、智能制造加速升级的今天,主板作为设备核心大脑,其性能、扩展性与稳定性直接决定了终端设备的运行效率。
如何扩展ODF配线架的容量?
扩展ODF(光纤配线架)的容量通常涉及硬件升级、结构优化和智能管理三个层面,旨在提升光纤端口数量、优化空间利用率并增强系统可扩展性。以下是具体方法及实施步骤: 一、硬件扩容:增加物理端口与模块 更换
汽车中的GPU是如何使用的?
(HMI)的发展尤为迅猛。随着电子电气架构(EEA)的集中化,车辆对高性能计算能力的需求显著提升,GPU(图形处理单元)的灵活性、可扩展性以及高效并行计算能力,使其成为支持这些创新应用的核心组件
如何通过交替式几何处理实现更优的多核 GPU 扩展
在理论上,通过增加更多GPU核心来提升性能似乎很简单:核心越多,性能越强。但在实践中,这是图形架构领域最棘手的挑战之一。虽然某些工作负载因其独立特性能实现良好扩展,但另一些工作负载(尤其是几何
局部放电在线监测装置在不同应用场景下的选择要点
针对不同应用环境,局部放电在线监测装置的选择也存在一定差异,技术适配性、核心性能、安装维护、系统兼容性、环境适应性及扩展性等维度都是需要进行综合考量的内容,在不同应用场景下针对性选择适配的技术方案
Vector S2S方案在汽车电子电气架构的落地实践
随着汽车电子电气(E/E)架构从传统的功能域逐步演进到区域化架构,系统复杂度急剧上升。在这种背景下,仅靠在开发阶段精确定义组件与应用间的固定连接,已难以满足现代车辆对灵活性与可扩展性的需求。
如何评估电能质量在线监测装置的扩展性?
评估电能质量在线监测装置的扩展性,需围绕 “ 硬件可扩展、软件可升级、协议可兼容、场景可适配 ” 四大核心维度展开,通过 “技术参数核查、厂商能力验证、实际场景测试” 三层验证,判断装置能否随电网
电能质量在线监测装置的兼容性和扩展性对其性能有何影响?
电能质量在线监测装置的兼容性和扩展性,是决定其 “能否融入现有系统、适应未来变化” 的核心属性,直接影响装置的 数据互通性、功能适配性、生命周期价值 ,进而间接作用于谐波源识别准确率、定位精度等核心
NVIDIA桌面GPU系列扩展新产品
NVIDIA 桌面 GPU 系列扩展,推出 NVIDIA RTX PRO 4000 SFF Edition GPU 和 RTX PRO 2000 Blackwell GPU,可提高工程
市场上的工控机改如何选择?接口与扩展性需求分析
在边缘计算时代,工控机的选择需紧密围绕实时性、可靠性、环境适应性三大工业核心需求,同时兼顾算力、接口与扩展性的平衡。以下是关键考量因素及选型策略: 一、算力需求分析:从场景出发分层选型 传感器数据
瑞萨电子RA系列微控制器的可扩展性强的配置软件包 (FSP)安装下载与使用指南
瑞萨电子RA系列微控制器的可扩展性强的配置软件包 (FSP)安装下载与使用指南
多功能+高扩展能力加持,Air8000开发板最新资料
开发者福利来袭!Air8000开发板兼具全面功能与强大扩展性的开发神器,将让物联网开发、原型设计等任务更高效,加速项目从概念到产品的转化。 工程师朋友们,Air8000开发板“多功能集成+高扩展性
聚徽分享高性能工控机选购指南:稳定性、扩展性、抗干扰能力如何平衡?
协调的重任。而在选购高性能工控机时,稳定性、扩展性与抗干扰能力成为了至关重要的考量因素,如何在这三者之间找到完美的平衡,成为了众多企业面临的关键难题。 稳定性:工业运行的基石 1. 硬件质量与可靠性 工业级元器件的
GPU在不同形态下的扩展性问题
评论