0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

MLPerf V2.0推理结果放榜,NVIDIA表现抢眼

荷叶塘 来源:电子发烧友 作者:程文智 2022-04-15 22:12 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

(文/程文智)不久前,AI性能基准评测平台MLPerf公布了2022年首次推理(Inference v2.0)测试成绩,NVIDIA的AI平台表现依然抢眼。

据MLPerf官方介绍,它是由来自学术界、研究实验室和相关行业的 AI 领导者组成的联盟,旨在“构建公平和有用的基准测试”,在规定的条件下,针对硬件、软件和服务的训练和推理性能提供公平的评估。每年组织AI推理和AI训练测试各两次,以对迅速增长的AI计算需求与性能进行及时的跟踪测评。MLPerf比赛通常分为固定任务(Closed)和开放优化(Open)两类任务,开放优化能力着重考察参测厂商的AI技术创新力,固定任务则因更公平地考察参测厂商的硬件系统和软件优化的能力,成为更具参考价值的AI性能基准测试。因此,目前MLPerf被看作是AI领域的风向标,谁能够在这个测试中取得更多的领先,谁的AI能力就越突出。


在最新一期的榜单中,浪潮、NVIDIA、英特尔高通、阿里巴巴、戴尔、Deci.ai、Azure、富士通、技嘉、联想、宁畅、美超微、华硕、浙江实验室、及新华三等厂商参与了竞赛。评测以最新MLPerf Inference V2.0为基准,涵盖了图像分类、目标检测、医疗图像分割、自然语言处理、语音转文字和推荐系统6类AI应用场景,分为数据中心和边缘两类处理场景,每类场景都包含固定任务(Closed)和开放优化(Open)两类性能竞赛。其中,在最新的V2.0规范中,在边缘运算环境导入多资料流(Multi Stream)测试项目,测量边缘运算设备在多摄影机、多传感器场景的性能表现,以得到更贴近真实使用情况的数据。


据统计,本轮测试一共展示了超过3900 次性能测试和 2200 次功耗测试,分别是上一轮的2倍和6倍。根据公开的数据显示,本次测试中除了戴尔科技、富士通、技嘉、浪潮、联想、宁畅和美超微等外,华硕和新华三本次测试中首次使用了NVIDIA AI平台提交MLPerf结果。

Jetson AGX Orin提升边缘AI性能,取得不俗成绩

值得一提的是基于NVIDIA Ampere架构的低功耗系统级芯片NVIDIA Orin首次参加MLPerf基准测试,就取得了不俗的成绩。在边缘AI领域,NVIDIA Orin预生产版本在六项性能测试中的五项处于领先地位,其运行速度比上一代Jetson AGX Xavier快了5倍,能效平均提高了2倍。


根据NVIDIA官网的介绍,Jetson AGX Orin 系列有32GB和64GB两个版本,该系列具有高达275TOPS的AI性能,由 Ampere GPU深度学习加速器 (DLA) 提供支持。CPU配备了多达12个Arm Cortex A78AE内核。

Orin配备了其第三代Tensor Cores,可提高性能并支持稀疏矩阵。基于NVIDIA为 Xavier 所做的多处理器构建,它不仅具有 GPU 和CPU,还具有其他处理器,可以帮助从GPU和CPU卸载应用程序的某些部分。它包括一个专用于 AI 应用的深度学习加速器、一个用于计算机视觉应用和ISP的视觉加速器,以及一个视频解码和视频编码引擎。与 Xavier 相比,NVIDIA还为 Orin 带来了 LPDDR5 以提高带宽,传输速度可达204.8GB/s。 Orin 还具备丰富的IO连接,比如其具有多达22个PCIe4.0通道、4个千兆以太网、16个MIPI CSI通道,以及各种其他传感器接口等。


根据测试,Jetson AGX Orin提供了8倍于Jetson AGX Xavier的性能,Jetson AGX Orin是能够运行所有六项MLPerf基准测试的边缘加速器。凭借JetPack SDK,Orin可以运行整个NVIDIA AI平台,这个软件堆栈已经在数据中心和云端得到了验证,并且获得了NVIDIA Jetson平台100万名开发者的支持。


在应用方面,目前,Orin主要关注三大领域,分别为:工业、自动驾驶和医疗。Orin现已加入到用于机器人和自动化系统的NVIDIA Jetson AGX Orin开发者套件。包括亚马逊网络服务、约翰迪尔、小松、美敦力和微软Azure在内的6000多家客户使用NVIDIA Jetson平台进行AI推理或其他任务。

Orin也是NVIDIA Hyperion自动驾驶汽车平台的关键组成部分。据NVIDIA介绍,Orin可处理在自动驾驶汽车和机器人中同时运行的大量应用和深度神经网络,并且达到了ISO 26262 ASIL-D 等系统安全标准。而且,比亚迪近期已经宣布,他们将在其新一代自动驾驶电动汽车中使用内置Orin的DRIVE Hyperion架构。

Orin同样也是NVIDIA Clara Holoscan医疗设备平台的关键组成部分,且该平台可供系统制造商和研究人员用来开发新一代AI仪器。

NVIDIA其他AI成果

除了Orin之外,本轮MLPerf,验证了NVIDIA的多项成果,包括多实例GPU(MIG)、TensorRT等。比如MIG可提升每个 NVIDIA A100 Tensor 核心 GPU 的性能和价值。MIG可将 A100 GPU 划分为多达七个实例,每个实例均与各自的高带宽显存、缓存和计算核心完全隔离。管理员可以支持从大到小的各项工作负载,为每项工作提供规模适当的 GPU,而且服务质量 (QoS) 稳定可靠,从而优化利用率,让每位用户都能享用加速计算资源。


而根据实际测试结果,在使用7个实例时的性能为仅用一个实例的98%,这也意味着MIG可以充分利用GPU,避免了算力的浪费。


软件是性能提升的关键驱动因素,NVIDIA在AI推理方面的软件包括了用于优化 AI 模型的 NVIDIA TensorRT 和用于有效部署它们的 NVIDIA Triton开源推理服务软件。NVIDIA AI 推理和云高级产品经理David Salvator在媒体发布会上介绍了NVIDIA的Triton开源推理服务软件。


目前TensorRT广泛的优化GPU内核库已支持Jetson Orin,MLPerf中使用的插件已全部移植到Orin并添加到 TensorRT 8.4。Triton则Kubernetes紧密集成,可以管理GPU以及x86和Arm CPU上的AI推理工作,NVIDIA宣布,Triton现在可以只在CPU上运行,而无需GPU。

而也正是因为NVIDIA的跨平台管理能力,使A100在Arm和x86-64平台上的性能几乎相同。并且,通过NVIDIA的软件优化,AI性能在过去一年中就增长了高达50%。

结语

这几年,NVIDIA在AI领域一路狂奔,不仅仅在数据中心方面优势明显,在汽车、边缘计算方面也正推出优势产品,另外在他们还在准备推出工业级的AI产品,进入传统工业领域。AI正在不断渗透到人们生活的各个方面。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • NVIDIA
    +关注

    关注

    14

    文章

    5496

    浏览量

    109081
  • AI
    AI
    +关注

    关注

    89

    文章

    38090

    浏览量

    296521
  • 人工智能
    +关注

    关注

    1813

    文章

    49734

    浏览量

    261484
  • 推理
    +关注

    关注

    0

    文章

    9

    浏览量

    7403
  • MLPerf
    +关注

    关注

    0

    文章

    37

    浏览量

    940
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    智子科技发布数字营销策略大模型智小虎V2.0

    11月28日,2025(第十三届)数字营销峰会暨CAAC数字营销专业委员会十周年庆典及第17届虎啸奖启动仪式在北京举行。在本次大会上,由智子科技、南京大学、虎啸奖三方联合打造的“智小虎”V2.0正式发布。
    的头像 发表于 12-05 16:54 817次阅读

    项目效率翻倍!迅为RK3568 V2.0硬件接口升级,开发流程再提速

    项目效率翻倍!迅为RK3568 V2.0硬件接口升级,开发流程再提速
    的头像 发表于 10-29 10:53 217次阅读
    项目效率翻倍!迅为RK3568 <b class='flag-5'>V2.0</b>硬件接口升级,开发流程再提速

    嵌入式入门必看!迅为RK3568 V2.0升级,新手也能轻松玩转

    嵌入式入门必看!迅为RK3568 V2.0升级,新手也能轻松玩转
    的头像 发表于 10-28 13:26 186次阅读
    嵌入式入门必看!迅为RK3568 <b class='flag-5'>V2.0</b>升级,新手也能轻松玩转

    NVIDIA TensorRT LLM 1.0推理框架正式上线

    TensorRT LLM 作为 NVIDIA 为大规模 LLM 推理打造的推理框架,核心目标是突破 NVIDIA 平台上的推理性能瓶颈。为实
    的头像 发表于 10-21 11:04 753次阅读

    华为推出人工智能气象预报模型V2.0版本

    华为全联接大会2025期间,在气象海洋论坛上,华为联合重庆市气象局、云辑数科发布“天资·12h”人工智能气象预报模型(V2.0),助力成渝地区气象灾害精准防御、城市安全运行与高质量发展。
    的头像 发表于 09-20 14:34 1675次阅读

    使用env v2.0执行scons --dist产生缺失依赖报错怎么解决?

    使用env v2.0版本的工具到rt-thread &gt; v5.1.0版本的bsp中使用scons指令,会出现缺失packages依赖的报错,并提示更新pkgs,但是更新也会产生
    发表于 09-11 08:28

    NVIDIA Nemotron Nano 2推理模型发布

    NVIDIA 正式推出准确、高效的混合 Mamba-Transformer 推理模型系列 NVIDIA Nemotron Nano 2。
    的头像 发表于 08-27 12:45 1391次阅读
    <b class='flag-5'>NVIDIA</b> Nemotron Nano 2<b class='flag-5'>推理</b>模型发布

    请问是否可以将 Nu-Link2-Me V1.0 的固件升级到 V2.0

    可与 Crossworks for ARM IDE 配合使用。 以下是我在比较两块板以找出它不起作用的原因时发现的差异。NuMaker-M433 连接了 Nu-Link2-Me V2.0
    发表于 08-18 08:09

    登顶!华为OceanStor A系列存储再登MLPerf全球性能之巅

    2025年8月5日,全球权威AI性能评测组织公布最新MLPerf® Storage v2.0基准测试结果,华为OceanStor A系列存储联合济南超级计算技术研究院(简称“JNIST”)斩获佳绩
    的头像 发表于 08-07 14:02 595次阅读

    智嵌云V2.0获软件著作权登记,赋能行业数字化升级

    深圳智嵌物联网电子技术有限公司,自主研发的智嵌云V2.0,成功斩获国家版权局颁发的软件著作权登记证书。这一成果不仅是该公司在技术创新与知识产权保护领域的重大突破,更为相关行业的数字化转型注入了强劲动能,同时也标志着 “智嵌云” 从 V1.0 到
    的头像 发表于 06-27 15:32 442次阅读
    智嵌云<b class='flag-5'>V2.0</b>获软件著作权登记,赋能行业数字化升级

    使用MicroPython部署中的ocrrec_image.py推理得到的输出结果很差,如何解决呢?

    使用在线平台训练OCR识别任务,测试结果表现很好。 期待结果和实际结果 实际的推理结果很差,
    发表于 04-29 06:54

    1.9倍性能提升!英特尔至强6在MLPerf基准测试中表现卓越

    与第五代至强处理器相比,英特尔至强6性能核的性能平均提高了1.9倍。 今日,MLCommons公布了最新的MLPerf推理v5.0基准测试结果,其中,英特尔® 至强® 6性能核处理器在
    的头像 发表于 04-07 10:58 510次阅读

    英伟达GTC25亮点:NVIDIA Dynamo开源库加速并扩展AI推理模型

    NVIDIA Dynamo 提高了推理性能,同时降低了扩展测试时计算 (Scaling Test-Time Compute) 的成本;在 NVIDIA Blackwell 上的推理优化
    的头像 发表于 03-20 15:03 1075次阅读

    使用NVIDIA推理平台提高AI推理性能

    NVIDIA推理平台提高了 AI 推理性能,为零售、电信等行业节省了数百万美元。
    的头像 发表于 02-08 09:59 1313次阅读
    使用<b class='flag-5'>NVIDIA</b><b class='flag-5'>推理</b>平台提高AI<b class='flag-5'>推理</b>性能

    ANSVG-G-A混合动态滤波补偿装置使用说明书 V2.0

    电子发烧友网站提供《ANSVG-G-A混合动态滤波补偿装置使用说明书 V2.0 .pdf》资料免费下载
    发表于 12-16 14:08 0次下载