0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

NVIDIA AI平台在MLPerf基准测试实现飞跃

NVIDIA英伟达企业解决方案 来源:NVIDIA英伟达企业解决方案 作者:NVIDIA英伟达企业解 2022-07-01 10:52 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

NVIDIA AI 仍是唯一能够运行 MLPerf 行业基准测试中所有测试的平台, A100 GPU 自发布以来连续两年一直保持着获胜次数最多的纪录。

根据今天发布的 MLPerf 基准测试结果, NVIDIA 及其合作伙伴占了所有参赛生态伙伴的 90%,并且继续提供了最佳的整体 AI 训练性能和提交了最多的测试项。

NVIDIA AI 平台覆盖了 MLPerf 训练 2.0 版本中的所有八项基准测试,突显了其领先的通用性。

除 NVIDIA 之外,无其它加速器运行过所有基准测试,这些基准测试代表了流行的 AI 用例,包括语音识别、自然语言处理、推荐系统、目标检测、图像分类等,而 NVIDIA 自 2018 年 12 月向作为行业标准 AI 基准测试的 MLPerf 提交首轮测试结果以来就一直如此。

领先的基准测试结果与可用性

在连续第四次 MLPerf 训练提交结果中,基于 NVIDIA Ampere 架构的 NVIDIA A100 Tensor Core GPU 依然表现出色。

各个提交者平台在每个网络的“最快训练时间”

Selene 是 NVIDIA 内部的一台 AI 超级计算机,它基于模块化的 NVIDIA DGX SuperPOD,并由 NVIDIA A100 GPU、软件堆栈和 NVIDIA InfiniBand 网络驱动,在八项大规模工作负载测试的四项中获得 “最快训练时间” 。

为了计算单芯片性能,该图表将每份提交结果归一化到每个提交者最常见的尺度,检测分数归一化到速度最快的竞争者,最快竞争者显示为 1 倍。

NVIDIA A100 还保持了单芯片性能上的领导地位,在八项测试中的六项测试中呈现了最快的速度。

共有 16 家合作伙伴使用 NVIDIA AI 平台提交了本轮结果,包括华硕、百度、中国科学院自动化研究所、戴尔科技、富士通、技嘉、新华三、慧与、浪潮、联想、宁畅和超微。

NVIDIA 的大多数 OEM 合作伙伴提交了使用 NVIDIA 认证系统得到的结果,这些服务器经过 NVIDIA 验证,能够为企业部署提供出色的性能、可管理性、安全性和可扩展性。

多种模型驱动实际 AI 应用

AI 应用可能需要理解用户说出的要求,对图像进行分类、提出建议并以语音信息的形式作出回应。

即使是上图简单的用例也需要将近 10个模型,这突出了运行每个基准的重要性

这些任务需要多种类型的 AI 模型按顺序工作,用户需要能够快速且灵活地设计、训练、部署和优化这些模型。

这也是为什么通用性(能够在 MLPerf 及其他版本中运行每个模型)以及领先的性能都是将现实世界的 AI 引入入生产的关键。

通过 AI 实现投资回报

对于客户而言,数据科学和工程团队是最宝贵的资源,他们的生产力决定了 AI 基础设施的投资回报。客户必须考虑昂贵的数据科学团队的成本,这通常在部署 AI 的总成本中占比很重,而部署 AI 基础设施本身的成本相对较少。

AI 研究人员的生产力取决于能否快速测试新的想法,这需要通用性来训练任何模型,以及大规模训练模型所能提供的速度。这就是为什么企业关注单位成本的整体生产力,以确定最佳的 AI 平台——更全面的视角,更准确地代表了部署 AI 的真实成本。

此外, AI 基础设施的利用率取决于可替换性,或在单一平台上加速从数据准备到训练再到推理的整个 AI 工作流程的能力。

凭借 NVIDIA AI,客户可以在整个 AI 流程中使用相同的基础设施,重新利用它来适配数据准备、训练和推理之间的不同需求,这极大地提高了利用率,实现了非常高的投资回报率。

随着研究人员发现新的 AI 突破口,支持最新模型创新是最大程度地延长 AI 基础设施使用寿命的关键。

NVIDIA AI 兼容并适用于每个模型、可以扩展到任何规模,并加速从数据准备到训练再到推理的端到端 AI 流程,能够实现最高的单位成本生产力。

今天的结果再次证明了 NVIDIA 在迄今为止所有 MLPerf 训练、推理和 HPC 评测中所展示的丰富而深厚的 AI 专业性。

3 年半内将性能提高 23 倍

自首次基于 A100 提交 MLPerf 基准测试以来的两年时间里,在 NVIDIA 软件堆栈持续优化的推动下, NVIDIA 平台的性能已提高了 6 倍。

自 MLPerf 问世以来,归功于跨 GPU、软件和大规模改进的全栈式创新, NVIDIA AI 平台在 3 年半时间里,在基准测试中实现了 23 倍的性能提升。正是这种对创新的持续追求,让客户确信他们现今投资的 AI 平台将持续服务 3 至 5 年,并将继续推进以适配最先进的技术。

此外, NVIDIA 于 3 月发布的 NVIDIA Hopper架构有望在未来的 MLPerf 基准测评中实现性能的另一巨大飞跃。

NVIDIA 如何做到这一点

软件创新持续释放 NVIDIA Ampere架构的更多性能。

例如,在提交结果中大量使用的 CUDA Graphs,该软件可以最大限度地减少跨多个加速器上运行作业的启动开销。NVIDIA 不同库的内核优化,如 cuDNN 和预处理库 DALI,解锁了额外的加速。NVIDIA 还实现了跨硬件、软件和网络的全栈改进,如 NVIDIA Magnum IO 和 SHARP,将部分 AI 功能卸载到网络中,以获得更好的性能,特别是在大规模的情况中。

NVIDIA 所使用的所有软件均可从 MLPerf 资源库中获取,所有人都可以获得 NVIDIA 的世界级领先成果。NVIDIA 不断地将这些优化集成到 NVIDIA 的 GPU 应用软件中心—— NGC 上提供的容器中,并通过 NVIDIA AI Enterprise 提供完全由 NVIDIA 支持,并经过优化的软件。

从 A100 GPU 两年前首次提交以来, NVIDIA AI 平台继续在 MLPerf 2.0 中提供最高的性能,仍是唯一能够提交所有基准测试的平台。NVIDIA 的下一代 Hopper 架构有望在未来的 MLPerf 评测中实现另一巨大飞跃。

NVIDIA 平台适用于任何规模的模型和框架,并具有可替代性以处理 AI 工作负载的每个部分。它可以在所有云端和主要的服务器制造商上使用。

原文标题:NVIDIA 与合作伙伴在 MLPerf 中展示领先的 AI 性能和通用性

文章出处:【微信公众号:NVIDIA英伟达企业解决方案】欢迎添加关注!文章转载请注明出处。

审核编辑:汤梓红

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • NVIDIA
    +关注

    关注

    14

    文章

    5725

    浏览量

    110287
  • gpu
    gpu
    +关注

    关注

    28

    文章

    5321

    浏览量

    136206
  • AI
    AI
    +关注

    关注

    91

    文章

    41972

    浏览量

    303061
  • 基准测试
    +关注

    关注

    0

    文章

    21

    浏览量

    7822
  • MLPerf
    +关注

    关注

    0

    文章

    37

    浏览量

    992

原文标题:NVIDIA 与合作伙伴在 MLPerf 中展示领先的 AI 性能和通用性

文章出处:【微信号:NVIDIA-Enterprise,微信公众号:NVIDIA英伟达企业解决方案】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    NVIDIA加速计算平台助力从地球到太空的AI应用

    NVIDIA 今日宣布,其最新一代加速计算平台正在开启太空创新的新时代,将为轨道数据中心 (ODC)、地理空间信息收集以及自主太空运行提供 AI 算力。
    的头像 发表于 03-18 14:44 686次阅读

    NVIDIA Jetson模型赋能AI边缘端落地

    开源生成式 AI 模型不再局限于数据中心,而是开始深入到现实世界的各种机器中。从 Orin 到 Thor,NVIDIA Jetson 系列正在成为运行 NVIDIA Nemotron、Cosmos
    的头像 发表于 03-16 16:27 784次阅读
    <b class='flag-5'>NVIDIA</b> Jetson模型赋能<b class='flag-5'>AI</b><b class='flag-5'>在</b>边缘端落地

    NVIDIA携手合作伙伴基于AI-RAN平台构建未来AI原生无线网络

    实地试验、新的性能基准测试、日益增长的运营商采纳率,以及合作伙伴基于 NVIDIA 平台构建的创新成果,共同印证了行业正加速迈向 AI 原生
    的头像 发表于 03-09 16:36 1152次阅读

    如何评估忆联Gen5 eSSD UH812aAI场景中的性能表现

    随着AI大模型进入万亿参数时代,传统存储性能测试已难以真实反映存储系统实际训练场景中对成本与效率的核心影响。为此,全球权威AI基准测评组织
    的头像 发表于 02-05 09:56 1509次阅读
    如何评估忆联Gen5 eSSD UH812a<b class='flag-5'>在</b><b class='flag-5'>AI</b>场景中的性能表现

    生命科学领先企业采用 NVIDIA BioNeMo 平台加速 AI 驱动的药物研发

    —— NVIDIA 近日宣布对 NVIDIA BioNeMo™ 进行重大扩展, 将通过一个开放式开发平台支持实现实验室闭环(lab-in-the-loop)工作流,以推动
    的头像 发表于 01-14 11:40 741次阅读
    生命科学领先企业采用 <b class='flag-5'>NVIDIA</b> BioNeMo <b class='flag-5'>平台</b>加速 <b class='flag-5'>AI</b> 驱动的药物研发

    如何在NVIDIA Jetson平台上运行最新的开源AI模型

    小型、低功耗的边缘设备上运行先进的 AI 和计算机视觉工作流正变得越来越具有挑战性。机器人、智能摄像头和自主设备需要实时智能来感知、理解并做出反应,而无需依赖云端。NVIDIA Jetson
    的头像 发表于 12-24 10:38 2042次阅读
    如何在<b class='flag-5'>NVIDIA</b> Jetson<b class='flag-5'>平台</b>上运行最新的开源<b class='flag-5'>AI</b>模型

    NVIDIA推动面向数字与物理AI的开源模型发展

    NVIDIA 发布一系列涵盖语音、安全与辅助驾驶领域的全新 AI 工具,其中包括面向移动出行领域的行业级开源视觉-语言-动作推理模型(Reasoning VLA) NVIDIA DRIVE Alpamayo-R1。此外,一项新的
    的头像 发表于 12-13 09:50 1660次阅读

    NVIDIA扩大与微软合作推动AI超级工厂建设

    Microsoft Ignite 大会上,NVIDIA 扩大与微软的合作,包括NVIDIA Blackwell 平台驱动的全新 M
    的头像 发表于 12-01 09:52 1086次阅读

    NVIDIAISC 2025分享最新超级计算进展

    NVIDIA DGX Spark 到 NVIDIA BlueField-4 DPU,新一代网络和量子技术实现飞跃 SC25 上展示
    的头像 发表于 11-25 10:59 1172次阅读
    <b class='flag-5'>NVIDIA</b><b class='flag-5'>在</b>ISC 2025分享最新超级计算进展

    NVIDIA宣布开源Aerial软件

    NVIDIA 开源其 Aerial 软件,并将 NVIDIA Sionna 研究套件和 Aerial 测试平台引入 NVIDIA DGX S
    的头像 发表于 11-03 15:14 1313次阅读

    LambdaTest推出全球首个AI智能体测试平台

    领先的AI原生测试平台LambdaTest已推出其智能体对智能体测试(Agent-to-Agent Testing)平台的封闭
    的头像 发表于 08-26 17:37 1270次阅读

    登顶!华为OceanStor A系列存储再登MLPerf全球性能之巅

    2025年8月5日,全球权威AI性能评测组织公布最新MLPerf® Storage v2.0基准测试结果,华为OceanStor A系列存储联合济南超级计算技术研究院(简称“JNIST
    的头像 发表于 08-07 14:02 973次阅读

    西部数据通过 MLPerfâ Storage V2 测试结果,验证其真实场景下的AI存储性能

    。西部数据(NASDAQ: WDC)近日公布其 MLPerf® Storage V2 测试结果,验证了旗下 OpenFlex™ Data24 4000 系列 NVMe-oF™ 存储平台
    发表于 08-05 18:15 1135次阅读

    自动化测试平台ATECLOUD推出AI算法功能

    作为纳米软件自主研发的自动化测试平台,ATECLOUD 始终致力于为用户提供高效优质的测试解决方案。面对5G、AI等前沿技术的迭代发展,平台
    的头像 发表于 07-22 16:10 1103次阅读
    自动化<b class='flag-5'>测试</b><b class='flag-5'>平台</b>ATECLOUD推出<b class='flag-5'>AI</b>算法功能

    NVIDIA计划打造全球首个工业AI平台

    NVIDIA 宣布,其正在为欧洲制造商构建全球首个工业 AI 云。这家总部位于德国的 AI 工厂将配备 1 万个 GPU,包括通过 NVIDIA DGX B200 系统 和
    的头像 发表于 06-16 14:17 1733次阅读