在AI和大数据时代到来之后,GPU单兵作战就变成了奢望,以现在的数据中心和超算为例,动辄就是成千上万张GPU,庞大的GPU网络在交换机和光模块的支持下代表了这个计算时代下最高的算力。但并非只有数据中心和超算里的GPU才需要这样的扩展性,嵌入式GPU和专业GPU同样如此。
物理限制的嵌入式GPU
随着各种传感器的性能持续走高,譬如多线激光雷达、高分辨率的图像传感器等,我们对边缘计算单元尤其是GPU的需求也在持续增加。但在实现的过程中,我们还有一些物理限制没法消除,像是尺寸、重量和功耗等。
为了解决这一系列问题,美国政府和行业方案提供商们成立了SOSA联盟,以求开发开放的标准和最好的方案来实现高性价比、互操作性强的传感器系统。如何克服这些负载计算工作量提升带来的挑战,又能不增加宝贵的物理资源呢?答案自然还是将GPU、DPU等技术集成到嵌入式结构中去。
这类嵌入式GPU并非用来单独售卖,而是交给合作伙伴整合到不同的边缘计算系统中,比如研华、凌华、EIZO、Mercury Systems等,然后交付给美国空军、洛克希德·马丁这类军事、航空、工业客户。
MXM嵌入式GPU模块 / 凌华科技
即便选择了嵌入式结构,也还有着不少的路线,比如GPU、FPGA和ASIC等等。SOSA联盟主席,来自美国空军的Ilya Lipkin表示,如果想要更快的运行速度,快速部署软件,自然是选择GPU最好。但他们也面临着空间的问题,因为嵌入式GPU往往会被塞到3U或者6U的服务器里,他们想要做到更小的体积,甚至是手掌大小,可这样一来就不得不牺牲带宽、容量。
所以,虽然嵌入式GPU仍然在这些嵌入式传感系统中可以保持领先地位,但他们并没有像获得数据中心那样不算严格的空间要求。目前的MXM嵌入式GPU可以做到PCIe GPU五分之一的尺寸,但这对于嵌入式GPU的扩展性来说还不算完美。在边缘计算上,反倒是一些FPGA和ASIC方案在能耗比和扩展性上占优,如果嵌入式GPU不能做到更强大的扩展性,很有可能会被后来者颠覆。
显卡交火时代的结束
不管是最新发布的RTX4090消费级显卡,还是RTX 6000这样的专业显卡,都象征了英伟达在新架构GPU上的又一次创新。在台积电4N工艺的加持下,无论是晶体管数目还是CUDA核心都做到了极致。
然而,原本变成了专属英伟达高端消费显卡和专业显卡的交火技术NVLink,在RTX4090和RTX 6000上却无处可寻,难不成英伟达彻底放弃显卡交火技术,也就此放弃NVLink了?根据英伟达CEO黄仁勋的说法,他们省下了NVLink连接器的空间,释放了更多的空间来处理更多的AI计算。
在上一代显卡的NVLink中,通过连接两块英伟达显卡,使用高端显卡和专业显卡的专业系统能够获得更高的带宽和双倍的显存容量。这样的提升对于个人或专业用户来说是极大的提升,那么为何英伟达会放弃NVLink呢?笔者也在英伟达GTC的一次分享会议上提出了这一问题。
RTX6000 / 英伟达
英伟达方面表示,就RTX 6000这类专业显卡而言,他们取消NVLink后省下了足够的空间,塞入了更多的计算单元来提升单卡的性能。与此同时,虽然这些专业显卡的NVLink支持被取消,不代表英伟达放弃了这一技术。英伟达决心将NVLink的重心放在数据中心产品上,比如Grace CPU、Hopper GPU,他们通过NVLink Die to Die和Chip to Chip的互联可以实现更好的扩展性。
但这确实象征着一个时代的结束,过去AMD的交火和英伟达的SLI也是两家竞争最火热的一项技术,可随着AMD放弃了交火支持,英伟达的SLI在换成NVLink后如今也迎来了终结。
但显卡交火的落幕也情有可原,且不说这种互联方式的受众群体一再变少,要想享受到显卡交火的性能也需要软件追加更新支持。或许专业显卡的目标还是追求单卡性能就好,多卡互联的支持还是让给数据中心吧。
物理限制的嵌入式GPU
随着各种传感器的性能持续走高,譬如多线激光雷达、高分辨率的图像传感器等,我们对边缘计算单元尤其是GPU的需求也在持续增加。但在实现的过程中,我们还有一些物理限制没法消除,像是尺寸、重量和功耗等。
为了解决这一系列问题,美国政府和行业方案提供商们成立了SOSA联盟,以求开发开放的标准和最好的方案来实现高性价比、互操作性强的传感器系统。如何克服这些负载计算工作量提升带来的挑战,又能不增加宝贵的物理资源呢?答案自然还是将GPU、DPU等技术集成到嵌入式结构中去。
这类嵌入式GPU并非用来单独售卖,而是交给合作伙伴整合到不同的边缘计算系统中,比如研华、凌华、EIZO、Mercury Systems等,然后交付给美国空军、洛克希德·马丁这类军事、航空、工业客户。
MXM嵌入式GPU模块 / 凌华科技
即便选择了嵌入式结构,也还有着不少的路线,比如GPU、FPGA和ASIC等等。SOSA联盟主席,来自美国空军的Ilya Lipkin表示,如果想要更快的运行速度,快速部署软件,自然是选择GPU最好。但他们也面临着空间的问题,因为嵌入式GPU往往会被塞到3U或者6U的服务器里,他们想要做到更小的体积,甚至是手掌大小,可这样一来就不得不牺牲带宽、容量。
所以,虽然嵌入式GPU仍然在这些嵌入式传感系统中可以保持领先地位,但他们并没有像获得数据中心那样不算严格的空间要求。目前的MXM嵌入式GPU可以做到PCIe GPU五分之一的尺寸,但这对于嵌入式GPU的扩展性来说还不算完美。在边缘计算上,反倒是一些FPGA和ASIC方案在能耗比和扩展性上占优,如果嵌入式GPU不能做到更强大的扩展性,很有可能会被后来者颠覆。
显卡交火时代的结束
不管是最新发布的RTX4090消费级显卡,还是RTX 6000这样的专业显卡,都象征了英伟达在新架构GPU上的又一次创新。在台积电4N工艺的加持下,无论是晶体管数目还是CUDA核心都做到了极致。
然而,原本变成了专属英伟达高端消费显卡和专业显卡的交火技术NVLink,在RTX4090和RTX 6000上却无处可寻,难不成英伟达彻底放弃显卡交火技术,也就此放弃NVLink了?根据英伟达CEO黄仁勋的说法,他们省下了NVLink连接器的空间,释放了更多的空间来处理更多的AI计算。
在上一代显卡的NVLink中,通过连接两块英伟达显卡,使用高端显卡和专业显卡的专业系统能够获得更高的带宽和双倍的显存容量。这样的提升对于个人或专业用户来说是极大的提升,那么为何英伟达会放弃NVLink呢?笔者也在英伟达GTC的一次分享会议上提出了这一问题。
RTX6000 / 英伟达
但这确实象征着一个时代的结束,过去AMD的交火和英伟达的SLI也是两家竞争最火热的一项技术,可随着AMD放弃了交火支持,英伟达的SLI在换成NVLink后如今也迎来了终结。
但显卡交火的落幕也情有可原,且不说这种互联方式的受众群体一再变少,要想享受到显卡交火的性能也需要软件追加更新支持。或许专业显卡的目标还是追求单卡性能就好,多卡互联的支持还是让给数据中心吧。
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。
举报投诉
-
gpu
+关注
关注
27文章
4415浏览量
126652
发布评论请先 登录
相关推荐
FPGA在深度学习应用中或将取代GPU
、运动和电力限制等环境因素。
Larzul 说:“在一些关键的应用场景中,比如智慧城市的视频监控,要求硬件暴露在对 GPU 有不利影响的环境因素 (比如太阳) 下。“ GPU 受晶体管
发表于 03-21 15:19
分布式大屏控制系统的可扩展性设计
分布式大屏控制系统的可扩展性设计是确保系统能够适应不断增长的需求和未来发展的关键因素。以下是可扩展性设计的几个方面: 模块化设计:将系统划分为多个模块,每个模块具有独立的功能和接口。这种设计方式使得
三星携手红帽在真实用户环境下验证CXL内存技术
CXL凭借其统一的接口标准,通过PCIe接口连接各类处理器如CPU、GPU及内存设备,有效解决了当前系统在速度、延迟和可扩展性上所面临的瓶颈。
基于第四代英特尔®至强®可扩展处理器的浪潮云海超融合压缩和纠删功能设计
浪潮云海InCloud Rail超融合一体机通过软件定义计算、存储和网络技术实现服务器的资源池化,为整个IT环境提供更高的可用性、安全性和扩展性,能够满足企业对于降低成本、简化管理、提高安全性和扩展性的需求,助力企业迁移核心业务上云,构建企业云数据中心。
可扩展性对物联网管理系统有哪些影响?
可扩展性对于物联网管理系统的设计和开发非常重要,它直接影响着系统的性能、可靠性和能耗等方面,是评估一个系统优劣的重要因素之一。可扩展性对物联网管理系统的影响主要体现在以下几个方面:
可扩展性对物联网管理系统有哪些影响?
可扩展性对于物联网管理系统的设计和开发非常重要,它直接影响着系统的性能、可靠性和能耗等方面,是评估一个系统优劣的重要因素之一。可扩展性对物联网管理系统的影响主要体现在以下几个方面: 设备兼容性
Brocade SAN针对Fabric OS 9.x的可扩展性指导原则
电子发烧友网站提供《Brocade SAN针对Fabric OS 9.x的可扩展性指导原则.pdf》资料免费下载
发表于 09-01 11:28
•0次下载
IO扩展模块有哪些特点
太网、串口等,使其能够与各种控制系统无缝集成。此外,IO扩展模块的配置也相对简单,工程师可以通过软件界面进行设定,从而快速适应不同的生产需求。 高度的可扩展性 IO扩展模块还表现出高度的可
发表于 08-31 18:14
适用于Brocade Fabric OS 8.X的Brocade SAN可扩展性指导原则
电子发烧友网站提供《适用于Brocade Fabric OS 8.X的Brocade SAN可扩展性指导原则.pdf》资料免费下载
发表于 08-29 15:21
•0次下载
SD-WAN组网的可扩展性怎么样?
SD-WAN组网具有很好的可扩展性,能够轻松满足企业网络不断扩张和增长的需求,同时保持网络的高效和可管理性,这使得SD-WAN组网能够随着企业的快速发展而快速调整规模,变更拓扑,采取不同的接入方式
什么是云计算的可扩展性?
不断增长的数据池需要巨额投资和劳动密集型管理,但云托管的全球采用已经彻底改变了我们所知的数据行业。除了成本效益和灵活性之外,选择云而不是本地架构的主要好处之一是能够轻松快速地扩展。那么什么是云计算的可扩展性?
IO扩展模块ET1010——新系列新形态,通信连接无障碍!
6月5日,纵横智控推出新一代的IO扩展模块——ET1010!这款模块融合了现今持有的技术和设计,旨在满足不断变化的市场需求和用户期望,为用户提供简单、快速和高效的IO扩展解决方案,以满足现代化工业环境对灵活性和可扩展性的需求。
HadaFS可扩展性和性能的优势
HadaFS 的新型 Burst Buffer 文件系统,实现了可扩展性和性能的优势与数据共享和部署成本的优势的良好结合。 相关文章: 收藏:多家Burst Buffer存储技术解析(附下载) Burst Buffer技术为何在HPC如此盛行 一、背景 高性能计算(HPC)正在经历计算规模和数据爆发式增
一款扩展性高的渗透测试框架渗透测试框架
MYExploit 简介 一款扩展性高的渗透测试框架渗透测试框架(完善中) 只支持部分EXP 利用 使用声明 本工具仅用于安全测试目的 用于非法用途与开发者、本公众号无关 工具下载地址 【进入下方名片回复关键词:504】 审核编辑:彭静
【RISC-V专题】昉·星光 2(VisionFive 2)RISC-V单板计算机免费试用
VisionFive 2是全球首款集成3D GPU的高性能量产RISC-V 单板计算机 。与上一代相比,VisionFive 2全面升级,在处理器工作频率、多媒体处理能力、可扩展性等方面都有显着提升
发表于 05-16 11:26
评论