NVIDIA为需要加速计算的企业客户运行测试服务器-电子发烧友网

借助 NVIDIA AI，戴尔、浪潮、Microsoft Azure 和 Supermicro 在今天发布的新 MLPerf 基准测试中创下快速训练 AI 模型的记录

看看谁刚刚在快速训练 AI 模型方面创下新速度记录：戴尔科技、浪潮、Supermicro以及在 MLPerf 基准测试中首次亮相的 Azure 均在使用 NVIDIA AI。

在今天宣布的 MLPerf 训练 1.1 结果中，NVIDIA平台在所有八个热门工作负载中都创下了记录。

图示：在新一轮的测试中，NVIDIA AI 训练所有模型的速度都快于替代方案

NVIDIA A100 Tensor Core GPU 提供了最出色每芯片性能， Selene 是NVIDIA内部基于模块化NVIDIA DGX SuperPOD架构构建的AI超级计算机，借助NVIDIA InfiniBand网络和NVIDIA软件栈进行扩展，A100在Selene上实现了最快的AI训练速度。

图示：NVIDIA A100 GPU 在所有八项 MLPerf 1.1 测试中均实现最好的每芯片训练性能

云服务更上一层楼

根据最新结果，在训练 AI 模型方面，Azure 的 NDm A100 v4 实例的速度遥遥领先。它运行了新一轮的每项测试，扩展到多达 2，048 个 A100 GPU。

Azure 不仅展示了出色性能，而且在美国的六个地区，现在所有人都可以租借和使用其出色性能。

AI 训练是一项需要大量投入的大型工作。NVIDIA希望用户借助他们选择的服务或系统以创纪录的速度训练模型。

因此，NVIDIA将 NVIDIA AI 与面向云服务、主机托管服务、企业和科学计算中心的产品相结合。

服务器制造商各显身手

在OEM 中，浪潮凭借其八路GPU服务器NF5688M6 和NF5488A5液冷服务器在单节点性能方面创下了最多记录。戴尔和 Supermicro 在四路 A100 GPU 系统上创下了记录。

共有 10 家 NVIDIA 合作伙伴提交了本轮测试结果，其中包含 8 家 OEM 和 2 家云服务提供商。它们占所有提交的 90% 以上。

这是 NVIDIA 生态系统在 MLPerf 训练测试中的第五次亮相，也是到目前为止最出色的亮相。

NVIDIA的合作伙伴之所以积极参与，是因为他们知道 MLPerf 是唯一符合行业标准、经过同行评审的 AI 训练和推理基准测试。对于评估 AI 平台和供应商的客户来说，这是一个有价值的工具。

为速度认证的服务器

百度 PaddlePaddle、戴尔科技、富士通、技嘉科技、慧与、浪潮、联想和 Supermicro 提交了基于本地数据中心的结果（单节点和多节点任务）。

NVIDIA几乎所有的 OEM 合作伙伴都在 NVIDIA 认证系统上运行了测试，NVIDIA为需要加速计算的企业客户验证了服务器。

提交的范围展示了 NVIDIA 平台的广度和成熟度，该平台为各种规模的企业提供最佳的解决方案。

既快速又灵活

NVIDIA AI 是唯一用于提交所有基准测试和用例的平台参与者，这展示了其通用性和高性能。快速灵活的系统提供客户所需的生产力，以加快他们的工作速度。

AI训练基准测试涵盖当今最热门的八个 AI 工作负载和场景，例如计算机视觉、自然语言处理、推荐系统、增强学习等。

MLPerf 测试透明、客观，因此用户可以依靠结果做出明智的购买决策。该行业基准测试组织成立于 2018 年 5 月，得到阿里巴巴、ARM、Google、Intel 和 NVIDIA 等数十家行业领先公司的支持。

三年内加速 20 倍

回顾过去，数据显示，仅在过去 18 个月，NVIDIA A100 GPU 的性能就提升了 5 倍以上。这要归功于软件的持续创新，这也是NVIDIA目前工作的重心。

自从三年前 MLPerf 测试首次亮相，NVIDIA 的性能提高了 20 倍以上。这种大规模加速源于NVIDIA在全栈 GPU、网络、系统和软件方面取得的进步。

图示：NVIDIA AI 在三年内实现了 20 倍以上的改进

持续改进软件

NVIDIA的新进展来自多项软件改进。

例如，借助一类新的内存复制操作，NVIDIA在针对医学成像的 3D-UNet 基准测试中实现 2.5 倍的操作加速。

得益于微调 GPU 以进行并行处理的方式，NVIDIA在针对物体检测的 Mask R-CNN 测试中实现 10% 的速度提升，而在针对推荐系统的测试中实现了 27% 的提升。NVIDIA只是重叠了独立操作，这种技术尤其适合跨多个 GPU 运行的作业。

NVIDIA扩展了 CUDA 图形的使用范围，尽可能减少与主机 CPU 的通信。得益于此，NVIDIA在针对图像分类的 ResNet-50 基准测试中实现了 6% 的性能提升。

NVIDIA在NCCL 上实施了两种新技术。NCCL 是NVIDIA的库，用于优化 GPU 之间的通信。对于 BERT 等大型语言模型，这样可以将结果加速高达 5%。

利用NVIDIA的工作结果

NVIDIA使用的所有软件均在 MLPerf 仓库提供，因此每个人都可以获得NVIDIA的出色结果。NVIDIA不断将这些优化整合到 NGC（NVIDIA的 GPU 应用程序软件中心）上的容器。

它是全栈平台的一部分，已在新的行业基准测试中得到验证，可从各种合作伙伴处获得，能够处理当今真正的 AI 作业。

原文标题：MLPerf | 云服务、OEM 借助 NVIDIA AI 让 AI 训练更上层楼

文章出处：【微信公众号：NVIDIA英伟达企业解决方案】欢迎添加关注！文章转载请注明出处。

审核编辑：彭菁

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

NVIDIA

NVIDIA

+关注

关注
14

文章
4585

浏览量
101691
服务器

服务器

+关注

关注
12

文章
8105

浏览量
82485
数据中心

数据中心

+关注

关注
15

文章
4178

浏览量
69930

原文标题：MLPerf | 云服务、OEM 借助 NVIDIA AI 让 AI 训练更上层楼

文章出处：【微信号：NVIDIA-Enterprise，微信公众号：NVIDIA英伟达企业解决方案】欢迎添加关注！文章转载请注明出处。

使用lwip socket udp功能，开发板为客户端时不能够接收服务器端发送过来的数据？

datarn\"; struct sockaddr_inServerAddr;//开发板为客户端时，需要保存服务器端的 IP 地址及端口号 struct sockaddr_inCl

发表于 04-16 06:01

站群服务器需要多大内存

站群服务器的内存需求取决于网站的数量和流量，以及服务器需要运行的应用和服务。RAKsmart小编为您整理发布站群

发表于 03-04 09:48 •164次阅读

使用NVIDIA Triton推理服务器来加速AI预测

这家云计算巨头的计算机视觉和数据科学服务使用 NVIDIA Triton 推理服务器来加速 AI

发表于 02-29 14:04 •208次阅读

linux服务器和windows服务器

应用和企业环境中使用，那么Win dows服务器可能更适合你的需求。综上所述，Linux服务器和Windows服务器各有优劣，选择适合自己需求的服

发表于 02-22 15:46

如何使用iperf测量AURIX以太网服务器的速度？

嗨，团队，我们正在与 AURIX TC397x 合作。我们正在运行示例中给出的echo应用程序，它运行良好。 AURIX将启动服务器和客户端 CAN 访问终端。我们想测量 AUR

发表于 01-29 08:08

【飞腾派4G版免费试用】如何在飞腾开发板上安装EMQX MQTT服务器

MQTT服务器的搭建和基本测试。如果要部署生产环境下可用的MQTT服务器，还需要进行最重要的认证配置默认情况下EMQX允许任何客户端连接，

发表于 12-26 11:16

创新企业云福利：腾讯云 × NVIDIA 初创加速计划

云 x NVIDIA 初创加速计划助您降低产品使用门槛高性能计算集群 HCC 以高性能云服务器为节点，通过 RDMA 互联，大幅提升网络性能，提供高带宽和极低延迟的网络

发表于 11-13 20:40 •379次阅读

如何找到连接到服务器的客户端计算机的IP地址

在本文中，我们来学习下如何找到连接到服务器的客户端计算机的IP地址。我们将创建一个简单的客户端-服务器场景，让我们探索用于TCP/IP通信的

发表于 10-08 11:37 •981次阅读

云服务器选购指南：一步步指导企业如何挑选合适的云服务器

近年来，随着互联网技术的不断发展，云计算技术逐渐被广泛应用于各种领域。云服务器作为一种基于互联网的计算服务，具有可扩展的计算资源、高可用性、

发表于 09-12 22:52 •281次阅读

快速构建商业模式，企业在云服务器选购上有什么需要注意的？

注意以下几个方面： 1. 云服务器的类型和配置。根据企业的业务需求，选择合适的云服务器类型和配置。例如，如果企业需要处理大量的数据分析和机器

发表于 08-23 23:09 •176次阅读

全球领先系统制造商推出 NVIDIA AI 就绪型服务器，为企业大幅提升生成式 AI 性能

Private AI Foundation with NVIDIA ，帮助企业使用自有业务数据来定制和部署生成式 AI 应用。 NVIDIA AI 就绪型服务器将采用

发表于 08-23 19:10 •375次阅读

PetaExpress小型企业云服务器存储

近年来，云计算行业发展迅速，成为许多企业信息化转型的方向，其中以小企业为主。云计算：企业数据中心的运行

发表于 07-12 10:17 •444次阅读

如何使用NVIDIA Triton 推理服务器来运行推理管道

使用集成模型在 NVIDIA Triton 推理服务器上为 ML 模型管道提供服务

发表于 07-05 16:30 •1156次阅读

请问如何从客户端重启作为服务器工作的ESP8266？

我正在通过客户端从服务器读取传感器值，一切似乎都正常。有时服务器会卡住（尚未发现原因），可以使用 RUN 命令通过浏览器重新启动。问题：如果客户

发表于 05-10 08:12

如何使用esp8266在服务器和客户端之间发送数据？

我是这个小组的新手，我刚刚写信，如果有人能帮助我，我需要一个指南甚至一本书来学习如何使用 esp8266 在服务器和客户端之间发送数据（例如：我有2 esp8266 一个我想将它用作服务器

发表于 04-27 07:05