0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

浪潮AI服务器NF5488A5一举创造18项性能纪录

ss 来源:粤讯 作者:粤讯 2020-10-23 16:59 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

美国东部时间10月21日,全球备受瞩目的权威AI基准测试MLPerf公布今年的推理测试榜单,浪潮AI服务器NF5488A5一举创造18项性能纪录,在数据中心AI推理性能上遥遥领先其他厂商产品。

MLPerf是当前全球最具影响力的AI计算基准评测组织,由图灵奖得主大卫·帕特森(David?Patterson)联合谷歌、斯坦福、哈佛大学等单位共同成立,每年组织全球AI训练和AI推理性能测试并发榜。此次MLPerf的AI推理基准测试有全球23家公司和单位参与,在数据中心及边缘等场景进行AI计算产品的性能比试。今年MLPerf训练榜单已于7月公布。

浪潮NF5488A5获数据中心AI性能绝对优势

此次浪潮NF5488A5一举创造18项MLPerf推理性能纪录,成为创纪录最多的AI服务器。今年的测试中,数据中心AI性能最受关注,全部参与机构提交了507项性能测试数据。浪潮NF5488A5创下了数据中心22个赛项中的13项性能纪录以绝对优势领先,NVIDIA DGX取得了5项数据中心性能纪录。而在此前的MLPerf训练榜单中,NF5488A5在最核心的Resnet50训练任务中也创下了性能纪录,单机性能高居榜首。

浪潮NF5488A5创造18项MLPerf推理性能纪录

性能大幅提升3倍,全栈AI能力优势凸显

在此次基准测试中,浪潮AI服务器NF5488A5在开放优化(Open)和固定任务(Closed)的ResNet50基准性能测试中,均表现优异,相比2019年MLPerf推理榜单的服务器最好性能提升高达3倍。

MLPerf ResNet50推理性能2019 VS 2020对比

NF5488A5是浪潮自研的新一代AI服务器,是此次MLPerf全球竞赛中唯一可以在4U空间内支持8块安培架构A100芯片实现NVLink高速互联的AI服务器。浪潮NF5488A5在系统拓扑上采用了超低延迟设计,支持PCIe 4.0全链路极致优化,高频通信单元采用一级拓扑最近连接,最大限度提升处理器到AI芯片间的通信性能。同时,通过配置NUMA节点,确保每颗处理器与其直连的GPU之间通信性能最优,最大限度降低通信延迟。此外,NF5488A5通过深度优化系统结构设计,确保设备可在高温环境下稳定运行。

本次基准测试中,浪潮展示出了卓越的AI计算软硬件协同优化能力。在硬件层面,通过对CPU、GPU硬件性能的精细校准和全面优化,使CPU性能、GPU性能、CPU与GPU之间的数据通路均处于对AI推理最优状态;在软件层面,结合GPU硬件拓扑对多GPU的轮询调度优化使单卡至多卡性能达到了近似线性扩展;在深度学习算法层面,结合GPU Tensor Core 单元的计算特征,通过自研通道压缩算法成功实现了模型的极致性能优化,在精度无损的情况下性能提升近2倍。

各服务器MLPerf AI推理性能对比(以浪潮NF5488A5为基准,越高越好)

浪潮是全球领先的AI计算领导厂商,其AI服务器在中国的市场份额已连续三年保持在50%以上。浪潮致力于AI计算平台、资源平台和算法平台的研发创新,并通过元脑生态与AI领先企业共同推进AI产业化和产业AI化进程。

责任编辑:xj

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 服务器
    +关注

    关注

    13

    文章

    10093

    浏览量

    90895
  • 浪潮
    +关注

    关注

    1

    文章

    476

    浏览量

    25307
  • 数据中心
    +关注

    关注

    16

    文章

    5519

    浏览量

    74655
  • AI
    AI
    +关注

    关注

    89

    文章

    38121

    浏览量

    296712
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    对话|AI服务器电源对磁性元件提出的新需求

    尚未拉开,整体处于同起跑线。 面对AI服务器电源向“三高”——高功率密度、高效率、高可靠性发展的趋势,AI服务器电源产业链各环节——无论是
    的头像 发表于 10-11 14:55 486次阅读
    对话|<b class='flag-5'>AI</b><b class='flag-5'>服务器</b>电源对磁性元件提出的新需求

    AI数据服务器中电源稳定性的关键:永铭电容的应用

    AI服务器对电源的要求随着AI和高性能计算的发展浪潮服务器中处理
    的头像 发表于 09-01 10:04 410次阅读
    <b class='flag-5'>AI</b>数据<b class='flag-5'>服务器</b>中电源稳定性的关键:永铭电容的应用

    提升AI数据服务器交换机性能与效率的关键:永铭电容的应用

    YMIN永铭电容应用AI数据中心服务器·交换机随着AI技术的快速发展,数据中心和服务器性能需求不断增加。作为
    的头像 发表于 09-01 10:04 248次阅读
    提升<b class='flag-5'>AI</b>数据<b class='flag-5'>服务器</b>交换机<b class='flag-5'>性能</b>与效率的关键:永铭电容的应用

    AI服务器电源技术研讨会部分演讲嘉宾确认

    AI服务器电源是2025-2026年AI硬件确定的增量,英伟达超级芯片GB200功率到2700W,是传统服务器电源的5-7倍,但其面临的挑战
    的头像 发表于 06-24 10:07 789次阅读
    <b class='flag-5'>AI</b><b class='flag-5'>服务器</b>电源技术研讨会部分演讲嘉宾确认

    AI 服务器电源如何迭代升级?

    AI 算力需求增长的今天,AI 服务器电源正陷入 “性能瓶颈与国产替代并行、场景适配与技术创新交织” 的双重挑战。 由Big-Bit商务网、广东省磁性元器件行业协会主办的2025中国
    的头像 发表于 06-23 14:51 860次阅读

    边缘计算服务器全面解析:为什么5G、AI、工业智造都绕不开它?

    说起“边缘计算服务器”,很多人第反应是:这是服务器种吧?是的,但它远不止“服务器种”这
    的头像 发表于 06-03 16:34 672次阅读
    边缘计算<b class='flag-5'>服务器</b>全面解析:为什么<b class='flag-5'>5</b>G、<b class='flag-5'>AI</b>、工业智造都绕不开它?

    RAKsmart服务器如何赋能AI开发与部署

    AI开发与部署的复杂性不仅体现在算法设计层面,更依赖于底层基础设施的支撑能力。RAKsmart服务器凭借其高性能硬件架构、灵活的资源调度能力以及面向AI场景的深度优化,正在成为企业突破
    的头像 发表于 04-30 09:22 598次阅读

    AI 推理服务器都有什么?2025年服务器品牌排行TOP10与选购技巧

    根据行业数据,AI推理服务器性能差异可以达到10倍以上。比如,用普通服务器个700亿参数的大模型,可能需要30秒才能出结果,而用顶级
    的头像 发表于 04-09 11:06 7365次阅读
    <b class='flag-5'>AI</b> 推理<b class='flag-5'>服务器</b>都有什么?2025年<b class='flag-5'>服务器</b>品牌排行TOP10与选购技巧

    性能GPU服务器推荐

    面对市场上种类繁多的GPU服务器,如何选择款适合自身需求的设备呢?接下来,AI部落小编为您推荐。
    的头像 发表于 03-20 10:14 865次阅读

    利用RAKsmart服务器托管AI模型训练的优势

    AI模型训练需要强大的计算资源、高效的存储和稳定的网络支持,这对服务器性能提出了较高要求。而RAKsmart服务器凭借其核心优势,成为托管AI
    的头像 发表于 03-18 10:08 525次阅读

    大功率AI服务器PSU的革新之路

    在人工智能浪潮的席卷下,AI服务器作为支撑各类复杂AI运算的关键硬件,其电源(PSU)的性能表现成为了决定整个系统效能的重要因素。作为大功率
    的头像 发表于 03-10 15:07 1790次阅读
    大功率<b class='flag-5'>AI</b><b class='flag-5'>服务器</b>PSU的革新之路

    个顶俩,新单路反超老双路! 元脑服务器NF3290G8翻倍刷新SPEC纪录

    北京2025年3月3日 /美通社/ -- 日前,国际权威标准性能评测组织SPEC公布最新评测结果,浪潮信息元脑服务器第八代平台产品NF3290G8刷新 SPEC CPU2017测试世界
    的头像 发表于 03-03 17:01 745次阅读
    <b class='flag-5'>一</b>个顶俩,新单路反超老双路! 元脑<b class='flag-5'>服务器</b><b class='flag-5'>NF</b>3290G8翻倍刷新SPEC<b class='flag-5'>纪录</b>

    仁懋MOS产品在AI服务器的应用选型推荐及优势

    AI技术浪潮中,AI服务器是推动智能应用飞速发展的关键力量。而仁懋MOS产品,正以其卓越性能,成为AI
    的头像 发表于 01-23 18:00 937次阅读
    仁懋MOS产品在<b class='flag-5'>AI</b><b class='flag-5'>服务器</b>的应用选型推荐及优势

    Jtti:新加坡服务器性能如何评估

    Jtti 新加坡服务器性能表现如下: 硬件配置 :Jtti新加坡服务器使用Intel Xeon E5-2660处理,这是高
    的头像 发表于 12-19 15:15 753次阅读

    NTP服务器性能优化方法

    NTP(Network Time Protocol,网络时间协议)服务器性能的优化对于确保时间同步的准确性和可靠性至关重要。以下是些NTP服务器
    的头像 发表于 12-18 15:24 1648次阅读