0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

NVIDIA 在 MLPerf 测试中将推理带到新高度

NVIDIA英伟达 来源:未知 2023-04-08 00:30 次阅读

最新 MLPerf 基准测试中,NVIDIA H100 和 L4 GPU 将生成式 AI 和所有其他工作负载带到了新的水平,Jetson AGX Orin 则在性能和效率方面都有所提升。

作为独立的第三方基准测试,MLPerf 仍是衡量 AI 性能的权威标准。自 MLPerf 诞生以来,NVIDIA 的 AI 平台在训练和推理这两个方面一直展现出领先优势,包括最新发布的 MLPerf Inference 3.0 基准测试。

NVIDIA 创始人兼首席执行官黄仁勋表示:“三年前我们推出 A100 时,AI 世界由计算机视觉主导。如今,生成式 AI 已经到来。”

“这正是我们打造 Hopper 的原因,其通过 Transformer 引擎专为 GPT 进行了优化。最新的 MLPerf 3.0 凸显了 Hopper 的性能比 A100 高出 4 倍。”

“下一阶段的生成式 AI 需要高能效的新的 AI 基础设施来训练大型语言模型。客户正在大规模采用 Hopper,以构建由数万颗通过 NVIDIA NVLink 和 InfiniBand 连接的 Hopper GPU 组成的 AI 基础设施。”

“业界正努力推动安全、可信的生成式 AI 取得新的进展。而 Hopper 正在推动这项重要的工作。”

最新 MLPerf 结果显示,NVIDIA 将从云到边缘的 AI 推理性能和效率带到了一个新的水平。

具体而言,在 DGX H100 系统中运行的 NVIDIA H100 Tensor Core GPU 在每项 AI 推理测试(即在生产中运行神经网络)中均展现出最高的性能。得益于软件优化,该 GPU 在 9 月首次亮相时就实现了高达 54%的性能提升。

针对医疗领域,H100 GPU 在 3D-UNet(MLPerf 医学影像基准测试)中的性能相比 9 月提高了 31%。

06856d9a-d561-11ed-bfe3-dac502259ad0.jpg

在 Transformer 引擎的加持下,基于 Hopper 架构的 H100 GPU 在 BERT 上的表现十分优异。BERT 是一个基于 transformer 的大型语言模型,它为如今已经得到广泛应用的生成式 AI 奠定了基础。

生成式 AI 使用户可以快速创建文本、图像、3D 模型等。从初创公司到云服务提供商,企业都在迅速采用这一能力,以实现新的业务模式和加速现有业务。

数亿人现在正在使用 ChatGPT(同样是一个 transformer 模型)等生成式 AI 工具,以期得到即时响应。

在这个 AI 的 iPhone 时刻,推理性能至关重要。深度学习的部署几乎无处不在,这推动了从工厂车间到在线推荐系统等对推理性能的无尽需求。

L4 GPU 精彩亮相

NVIDIA L4 Tensor Core GPU 在本次 MLPerf 测试中首次亮相,其速度是上一代 T4 GPU 的 3 倍以上。这些加速器具有扁平的外形,可在几乎所有的服务器中提供高吞吐量和低延迟。

L4 GPU 运行了所有 MLPerf 工作负载。凭借对关键的 FP8 格式的支持,其在对性能要求很高的 BERT 模型上取得了非常惊人的结果。

除了出色的 AI 性能外,L4 GPU 的图像解码速度快了 10 倍,视频处理速度快了 3.2 倍,同时图形和实时渲染性能提高了 4 倍以上。

这些加速器两周前在 GTC 上发布并已通过各大系统制造商和云服务提供商提供。L4 GPU 是 NVIDIA 在 GTC 上发布的 AI 推理平台产品组合中的最新成员。

069b91ce-d561-11ed-bfe3-dac502259ad0.jpg  

软件和网络在系统测试中大放异彩

NVIDIA 的全栈式 AI 平台在一项全新 MLPerf 测试中展现了其领先优势。

被称之为 Network-division 的基准测试将数据传输至一个远程推理服务器。它反映了企业用户将数据存储在企业防火墙后面、在云上运行 AI 作业的热门场景。

在 BERT 测试中,远程 NVIDIA DGX A100 系统提供高达 96%的最大本地性能,其性能下降的原因之一是因为它们需要等待 CPU 完成部分任务。在单纯依靠 GPU 进行处理的 ResNet-50 计算机视觉测试中,它们达到了 100%的性能。

这两个结果在很大程度上要归功于 NVIDIA Quantum InfiniBand 网络、NVIDIA ConnectX SmartNIC 以及 NVIDIA GPUDirect 等软件。

Orin 在边缘的性能提升 3.2 倍

另外,相较于一年前的结果,NVIDIA Jetson AGX Orin 模块化系统的能效提高了 63%,性能提高了 81%。Jetson AGX Orin 可在需要 AI 的狭小空间内以低功率进行推理,包括在由电池供电的系统上。

专为需要更小模块、更低功耗的应用而开发的 Jetson Orin NX 16G 在本次基准测试中首次亮相便大放异彩。其性能是上一代 Jetson Xavier NX 处理器的 3.2 倍。

广泛的 NVIDIA AI 生态

MLPerf 结果显示,NVIDIA AI 得到了业内最广泛的机器学习生态系统的支持。

在这一轮测试中,有十家公司在 NVIDIA 平台上提交了结果,包括华硕、戴尔科技、技嘉、新华三、联想、宁畅、超微和超聚变等系统制造商和微软 Azure 云服务。

他们所提交的结果表明,无论是在云端还是在自己的数据中心运行的服务器中,用户都可以通过 NVIDIA AI 获得出色的性能。

NVIDIA 的众多合作伙伴也参与了 MLPerf,因为他们知道这是一个帮助客户评估 AI 平台和厂商的很有价值的工具。最新一轮结果表明,他们今天所提供的性能将随着 NVIDIA 平台的发展而不断提升。

用户需要的是“多面手”

NVIDIA AI 是唯一能够在数据中心和边缘计算中运行所有 MLPerf 推理工作负载和场景的平台。其全面的性能和效率让用户能够成为真正的赢家。

用户在实际应用中通常会采用许多不同类型的神经网络,这些网络往往需要实时提供答案。

例如,一个 AI 应用可能需要先理解用户的语音请求,对图像进行分类、提出建议,然后以人声作为语音来回答用户。每个步骤都需要用到不同类型的 AI 模型。

MLPerf 基准测试涵盖了这些以及其他流行的 AI 工作负载,所以这些测试能够确保 IT 决策者获得可靠且可以灵活部署的性能。

06b4db66-d561-11ed-bfe3-dac502259ad0.jpg

用户可以根据 MLPerf 的结果做出明智的购买决定,因为这些测试是透明的、客观的。该基准测试得到了包括 Arm、百度、Facebook AI、谷歌、哈佛大学、英特尔、微软、斯坦福大学和多伦多大学在内的广泛支持。

可以使用的软件

NVIDIA AI 平台的软件层 NVIDIA AI Enterprise 确保用户能够从他们的基础设施投资中获得最佳的性能以及在企业数据中心运行 AI 所需的企业级支持、安全性和可靠性。

这些测试所使用的所有软件都可以从 MLPerf 库中获得,因此任何人都可以获得这些领先的结果。

各项优化措施不断地被整合到 NGC(NVIDIA 的 GPU 加速软件目录)上的容器中。本轮测试中提交的每项工作均使用了该目录中的 NVIDIA TensorRT 优化 AI 推理性能。

扫描海报二维码,或点击“阅读原文”,即可观看 NVIDIA 创始人兼首席执行官黄仁勋 GTC23 主题演讲重播!


原文标题:NVIDIA 在 MLPerf 测试中将推理带到新高度

文章出处:【微信公众号:NVIDIA英伟达】欢迎添加关注!文章转载请注明出处。


声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 英伟达
    +关注

    关注

    22

    文章

    3327

    浏览量

    87768

原文标题:NVIDIA 在 MLPerf 测试中将推理带到新高度

文章出处:【微信号:NVIDIA_China,微信公众号:NVIDIA英伟达】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    利用NVIDIA组件提升GPU推理的吞吐

    本实践中,唯品会 AI 平台与 NVIDIA 团队合作,结合 NVIDIA TensorRT 和 NVIDIA Merlin HierarchicalKV(HKV)将推理的稠密网络和热
    的头像 发表于 04-20 09:39 158次阅读

    使用NVIDIA Triton推理服务器来加速AI预测

    这家云计算巨头的计算机视觉和数据科学服务使用 NVIDIA Triton 推理服务器来加速 AI 预测。
    的头像 发表于 02-29 14:04 209次阅读

    周四研讨会预告 | 注册报名 NVIDIA AI Inference Day - 大模型推理线上研讨会

    由 CSDN 举办的 NVIDIA AI Inference Day - 大模型推理线上研讨会,将帮助您了解 NVIDIA 开源大型语言模型(LLM)推理加速库 TensorRT-LL
    的头像 发表于 10-26 09:05 193次阅读

    Codasip推出全新高度可配置的RISC-V基准处理器系列

    RISC-V定制计算领域领导者 Codasip 今天宣布推出全新高度可配置的RISC-V基准处理器系列,旨在实现无限创新。该"700家族系列"包括应用和嵌入式处理器内核。700
    的头像 发表于 10-18 10:03 357次阅读

    Dear Reality推出SPATIAL CONNECT for Wwise——XR音频制作新高度

    (Dear Reality演示视频截图) 游戏混音的未来在头戴式设备中 Dear Reality推出SPATIAL CONNECT for Wwise——XR音频制作新高度 沉浸式音频专家Dear
    的头像 发表于 10-13 15:13 300次阅读
    Dear Reality推出SPATIAL CONNECT for Wwise——XR音频制作<b class='flag-5'>新高度</b>

    开始报名!CadenceTECHTALK:使用 Cadence 托管云服务将生产力极速提升至新高度

    CadenceTECHTALK:使用 Cadence 托管云服务将生产力极速提升至新高度报名通道已经开启!通过本次线上网络研讨会,您将了解到一款经由 Cadence 管理、针对 EDA 优化
    的头像 发表于 10-09 19:25 319次阅读
    开始报名!CadenceTECHTALK:使用 Cadence 托管云服务将生产力极速提升至<b class='flag-5'>新高度</b>

    NVIDIA Grace Hopper超级芯片横扫MLPerf推理基准测试

    Hopper超级芯片首次亮相 MLPerf 行业基准测试,其运行了所有数据中心推理测试,进一步扩大了NVIDIA H100 Tensor
    发表于 09-13 09:45 165次阅读
    <b class='flag-5'>NVIDIA</b> Grace Hopper超级芯片横扫<b class='flag-5'>MLPerf</b><b class='flag-5'>推理</b>基准<b class='flag-5'>测试</b>

    NVIDIA Grace Hopper 超级芯片横扫 MLPerf 推理基准测试

    超级芯片 首次亮相 MLPerf 行业基准测试,其运行了所有数据中心推理测试,进一步扩大了 NVIDIA H100 Tensor Core
    的头像 发表于 09-12 20:40 276次阅读

    最新MLPerf v3.1测试结果认证,Gaudi2在GPT-J模型上推理性能惊人

    英特尔产品在全新MLCommons AI推理性能测试中尽显优势 今日,MLCommons公布针对 60 亿参数大语言模型及计算机视觉与自然语言处理模型GPT-J的 MLPerf推理v3
    的头像 发表于 09-12 17:54 233次阅读
    最新<b class='flag-5'>MLPerf</b> v3.1<b class='flag-5'>测试</b>结果认证,Gaudi2在GPT-J模型上<b class='flag-5'>推理</b>性能惊人

    光纤矩阵,提升视觉体验新高度

    随着科技的不断进步,视觉体验成为了人们追求的重要方向之一。讯维光纤矩阵技术作为现代科技的前沿代表,为提升视觉体验新高度提供了强有力的支持。 作为一种先进的信息传输技术,讯维光纤矩阵利用光纤作为传输
    的头像 发表于 09-01 15:08 359次阅读
    光纤矩阵,提升视觉体验<b class='flag-5'>新高度</b>

    古瑞瓦特打造智慧工商业储能一体柜,引领行业迈向新高度

    古瑞瓦特打造智慧工商业储能一体柜,引领行业迈向新高度 8月16日下午,由古瑞瓦特主办,广东省太阳能协会协办的“万亿蓝海 储赢未来”华南区储能群英汇暨工商业储能新品发布会在佛山成功举行。来自储能行
    的头像 发表于 08-29 21:27 737次阅读
    古瑞瓦特打造智慧工商业储能一体柜,引领行业迈向<b class='flag-5'>新高度</b>

    NVIDIA高度逼真模拟应用PhysX现已开源

    NVIDIA 宣布高度逼真模拟应用PhysX,持续开源
    的头像 发表于 08-01 14:50 393次阅读

    新的 MLPerf 推理网络部分展现 NVIDIA InfiniBand 网络和 GPUDirect RDMA 的强大能力

    MLPerf Inference v3.0 中,NVIDIA 首次将网络纳入了 MLPerf 的评测项目,成为了 MLPerf 推理数据
    的头像 发表于 07-19 19:10 651次阅读
    新的 <b class='flag-5'>MLPerf</b> <b class='flag-5'>推理</b>网络部分展现 <b class='flag-5'>NVIDIA</b> InfiniBand 网络和 GPUDirect RDMA 的强大能力

    如何使用NVIDIA Triton 推理服务器来运行推理管道

    使用集成模型在 NVIDIA Triton 推理服务器上为 ML 模型管道提供服务
    的头像 发表于 07-05 16:30 1158次阅读
    如何使用<b class='flag-5'>NVIDIA</b> Triton <b class='flag-5'>推理</b>服务器来运行<b class='flag-5'>推理</b>管道

    什么是电动飞行汽车eVTOL 电动飞行汽车eVTOL飞出自由出行新高度

    公里外的郊区住宅门口。 这个描述看似很科幻的场景,实则已离我们越来越近。电动垂直起降飞行器(飞行汽车)无需跑道就能实现垂直起降,占用空间仅等同于车身体积的它,将飞出自由出行的新高度。这无疑满足了人类继飞机之后对于飞行
    的头像 发表于 05-18 19:10 2455次阅读