0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

Intel至强6:AI江湖的幕后大佬、NVIDIA B300的唯一伙伴

科技见闻网 来源:科技见闻网 作者:科技见闻网 2025-06-19 16:37 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

随着生成式AI、预测式AI的浪潮一波高过一波,工作负载的类型越来越丰富、复杂度越来越高,对于AI服务器性能、能效的需求也是水涨船高。

每每说到AI服务器、AI工作站、AI一体机等装备,很多人的第一反应就是高算力的AI GPU加速器。

它确实是整个AI系统的主角,承担着最繁重的使命,但是别忘了,只有GPU加速器是无法独自支撑整个系统的,而任何计算系统都离不开CPU处理器的坐镇。

wKgZPGhTzDWAL8KGAAEEp2P-FHc52.jpeg

CPU处理器作为任何计算系统的中枢和大脑,在AI系统中也起着不可替代的作用,只是一贯比较低调罢了。

如果说GPU加速器是AI系统中在台前炫技的耀眼明星,CPU处理器就是隐藏幕后、默默风险的大管家,协调着整个系统的高效运行,尤其是保障GPU加速器的各项需求可以得到全面满足,强大的算力可以高效释放。

因此,这个时候的CPU处理器,我们一般称之为“主控CPU”。

采用最合适、匹配的主控CPU搭档AI加速器,组成高效的AI加速系统,可以在工作负载性能、总体拥有成本(TCO)之间,达到理想的平衡。

wKgZO2hTzDWAF_9wAADbBPQl7u0710.png

在AI加速系统中,主控CPU负责通过提供高效的任务管理,以及出色的预处理性能,来优化处理性能和资源利用率,这对于确保AI模型训练流程中的数据高效供给、维持AI处理器的理想运行状态,都是至关重要的。

主控CPU作为AI加速系统的“中枢神经”,可以执行管理、优化、预处理、处理、卸载等各种任务,从而提高系统性能和能效。

Intel的至强系列处理器,尤其是最新一代至强经系列,无论是根据各种AI基准测试,还是根据全球客户的实际部署经验,都可以说是强大、高效AI加速系统的主控CPU的理想之选。

NVIDIA最新、最强的DGX B300系统,就选择了Intel新款至强6776P来作为主控CPU,而去年的MGX系统曾使用至强6767P等——Intel也是NVIDIA B300唯一的主控CPU合作伙伴。

wKgZPGhTzDWABJ8OAAHV0NN_oCI210.png

至强6为何如此之强?

我们可以从六个不同方向,逐一看看AI加速系统对主控CPU的需求,以及至强6系列是如何满足的。

1、AI加速系统需要非常强大、灵活的IO性能。

至强6系列可以支持多达96条PCIe 5.0通道,比上代增加了20%,双路系统就是192条,因此带宽超高、数量管够,可以灵活分配给不同的加速器、扩展卡。

2、AI加速系统需要尽可能高的单线程性能。

至强6系列不但拥有最多128个性能核心、504MB海量三级缓存,还具备强大的单线程性能,并支持不同的睿频加速技术。

比如PCT(优先核心睿频),可以把少部分核心加速到更高的频率来服务相应的GPU,最多支持8个核心。

比如SST,可以针对不同的核心配置分配不同的频率,使其拥有不同的性能。

3、AI加速系统需要尽可能高的内存容量与带宽。

至强6系列不但支持更高频率的DDR5-6400,还独家率先支持MRDIMM内存,频率可高达8800MHz,带宽进一步提升30%,对比上代领先2.3倍,对于内存敏感性AI负载尤其有利。

再加上多达12个内存通道,至强6系列可提供无与伦比的内存带宽与容量,单路系统最高支持3TB。

NVIDIA DGX B300系统,就选择了每通道两条DIMM(2DPC)、5200MHz频率的方案,主要是为了在带宽和容量以及成本上做到了业界领先的平衡。

另外,至强6系列还支持CXL,可保持CPU内存空间与AI加速器内存之间的一致性,实现高性能资源共享,降低整体系统成本。

4、AI加速系统需要CPU做好数据预处理和卸载。

至强6系列支持AMX(高级矩阵扩展)指令,新增支持FP16数据格式,非常适合这项工作,尤其是随着MoE、Sparse MLP模型的出现和流行,在CPU上卸载部分工作越来越流行。

5、AI加速系统需要强大的RAS。

RAS指的是可靠性、可用性、可维护性,对于工作站、服务器、数据中心硬件是必不可少的属性,至强6当然也少不了,有了它就可以大大减少大规模停机时间,避免高额损失。

RAS技术支持多项高级管理功能,包括遥测、平台监控、共享资源控制、实时固件更新等,汇聚了平台合作伙伴、ISV独立软件开发商、解决方案集成商的丰富专业知识与经验。

6、AI加速系统需要灵活的形态。

至强6系列支持DC-MHS全球标准,无论是NVIDIA MGX还是DGX,双方都有合作,最新的就是DGX B300,由双方共同打造,开展了大量的技术验证工作。

wKgZO2hTzDaAf2qpAAFCYJGMdHA391.png

至强6系列家族中,有三款特殊型号是专门用于主控CPU的。它们均基于P核即性能核的设计。

其中,NVIDIA DGX B300采用的是至强6776P,并且是双路配置。

至强6776P配置了64个核心(128线程),基准频率2.3GHz,全核睿频3.6GHz,最大睿频3.9GHz,PCT睿频可以在最多8个核心上跑到4.6GHz,比传统SKU再次提高了多达700MHz。

另外,它配备336MB缓存,支持八通道DDR5-6400、MRDIMM-8000内存,可提供88条PCIe 5.0通道,热设计功耗350W。

这里解释一下几种不同的睿频频率:

全核睿频即All Core Turbo,是指所有核心处于活跃状态时,所能运行的最高频率,适合作为虚拟机等场景,此时需要每一个核心跑在尽可能高的性能上。

最大睿频即Max Turbo,是在传统SKU中能够达到最高的睿频,它假设一半核心活跃、另一半核心休眠,活跃核心就能够运行在更高的频率,也就是Max Turbo对应的频率。

优先核心睿频即Priority Core Tubo,是指只开启更少量的核心,一般2-8个,让它们进一步加速到更高的频率,从而以更高的性能,满足AI加速系统中GPU、I/O等的苛刻需求,避免出现系统瓶颈。

至于使用哪些核心进行加速,可以在启动前使用BIOS设定,也可以在运行中通过SST-TF工具实时设定。

单路的至强6774P也是64核心,除了基准频率提高到2.5GHz,与至强6776P最大的不同就是仅支持单路但可提供多达136个IO通道,扩展性能更加强悍。

至强6 AP平台的6962P拥有72核心144线程、432MB缓存,基准频率就有2.7GHz,全核睿频也是3.6GHz,最大睿频也是3.9GHz,PCT睿频则是4.4GHz。

它还支持12通道内存,可提供96个PCIe通道,热设计功耗来到了500W。

以上三款都是面向所有客户的开放产品,属于产品规划和路线图的一部分。

wKgZPGhTzDeAQXLAAAH2PiR5s88630.png

刚才多次提到在AI系统中至强6作为主控CPU的配置,这就是概述图,属于高端的DGX,专为AI训练等应用而生。

它配备了双路至强6776P主控CPU处理器,彼此通过UPI高速总线互连,每路都是最多8个PCT睿频核心,客户在使用的时候可以根据需要定制选择8个、6个、4个或2个核心用于PCT睿频。

每一路至强6776P之下,通过两个NIC高速网卡,连接四块AI GPU,整个系统就是八块AI GPU,彼此通过NVLink高速总线互连。

这套系统在选择主控CPU时采取了比较平衡的设计,但性能依然是业界领先的,I/O性能、RAS性能等等也都很均衡,无疑是个理想的选择。

wKgZPGhTzDeAb2mrAAEgn_0g9ZI694.png

当然,我们知道,NVIDIA AI加速系统中已经普遍使用自行研发的Grace CPU处理器,来搭配AI GPU加速器。

事实上,目前市场上,许多AI系统提供商都在使用自研主控CPU来配合AI GPU。

从Intel的角度来看,其服务方向是为客户提供更多选择,而且作为开放系统,始终秉持开放态度,为主控CPU提供最佳选择,以满足客户的多样化需求。

NVIDIA DGX B300产品选择了Intel至强6作为主控CPU,而且这并非测试或者试验产品,而是一款商业化的成熟产品,无疑是对Intel至强产品性能和兼容性的有力认可。

审核编辑 黄宇

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • intel
    +关注

    关注

    19

    文章

    3506

    浏览量

    190604
  • AI
    AI
    +关注

    关注

    90

    文章

    38271

    浏览量

    297324
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    华为云正式发布2026年伙伴政策

    11月29日,主题为“同心同行,智胜未来”的华为云中国伙伴政策发布大会在东莞隆重召开。华为云发布2026年伙伴政策,与合作伙伴携手同心,共绘生态新蓝图,共赢云时代。
    的头像 发表于 12-08 14:12 433次阅读

    锦富技术斩获液冷板订单

    随着AI技术的发展和应用需求激增,市场对GPU性能的要求持续攀升,推动GPU芯片加速迭代升级。当前,GPU产品正从B200向新B300演进,二者均基于Blackwell架构打造;G
    的头像 发表于 10-28 17:39 1429次阅读

    NVIDIA AI网络闪耀2025云栖大会

    2025 云栖大会于 9 月 24 日至 9 月 26 日举办,NVIDIA 作为大会巅峰合作伙伴参与 2025 云栖大会。本文将带您回顾 NVIDIA AI 网络在本届云栖大会上的精
    的头像 发表于 10-13 11:19 840次阅读

    SuperX发布最新XN9160-B300 AI服务器,Blackwell Ultra 比 Blackwell计算能力增加了 50%

    ;SuperX") 今日宣布,正式推出其最新旗舰产品——SuperX XN9160-B300 AI服务器。该服务器搭载NVIDIA Blackwell GPU(B300),旨在满足
    的头像 发表于 10-07 21:36 225次阅读
    SuperX发布最新XN9160-<b class='flag-5'>B300</b> <b class='flag-5'>AI</b>服务器,Blackwell Ultra 比 Blackwell计算能力增加了 50%

    Supermicro开始大批量交付NVIDIA Blackwell Ultra系统和机架即插即用数据中心级解决方案

    上市。目前,Supermicro 正向全球客户交付支持即插即用 (PnP) 的 NVIDIA HGX B300 系统和 GB300 NVL72 机架。
    的头像 发表于 09-17 17:00 665次阅读

    外媒:英伟达正开发新款中国特供芯片B30A 或为旗舰AI芯品B300的阉割版

    30A ;或为旗舰AI芯品B300的阉割版 ;估计性能只有B300的50%--70%。 据外媒路透社报道,为了中国市场;英伟达正在加速研发基于最新Blackwell架构的AI芯片, 
    的头像 发表于 08-20 15:19 3198次阅读
    外媒:英伟达正开发新款中国特供芯片<b class='flag-5'>B</b>30A 或为旗舰<b class='flag-5'>AI</b>芯品<b class='flag-5'>B300</b>的阉割版

    新品|小智墨,你的“口袋”AI伴侣

    我们做了个很好玩的产品:小智墨。相信混硬件圈的你,最近定在B站、抖音、小红书甚至朋友圈刷到过各种DIY的“小智机器人”——个由开源社
    的头像 发表于 07-25 17:48 5388次阅读
    新品|小智墨<b class='flag-5'>伴</b>,你的“口袋”<b class='flag-5'>AI</b>伴侣

    主控CPU全能选手,英特尔至强6助力AI系统高效运转

    2025年3月,英伟达发布了DGX B300 AI加速计算平台。2025年5月,英特尔发布了三款全新英特尔至强6性能核处理器,其中款677
    的头像 发表于 06-27 11:44 645次阅读
    主控CPU全能选手,英特尔<b class='flag-5'>至强</b><b class='flag-5'>6</b>助力<b class='flag-5'>AI</b>系统高效运转

    术业有专攻——AI系统主控CPU英特尔至强6新品处理器浅析

    至强6NVIDIA GPU 协同的硬件基础 在 AI 异构计算架构中,英特尔至强
    的头像 发表于 06-19 16:37 598次阅读
    术业有专攻——<b class='flag-5'>AI</b>系统主控CPU英特尔<b class='flag-5'>至强</b><b class='flag-5'>6</b>新品处理器浅析

    NVIDIA携手合作伙伴提升AI智能体的交互能力

    NVIDIA Enterprise AI Factory 的经验证设计和全新的 NVIDIA AI Blueprint 可帮助企业部署具有沟通、研究和学习能力的智能
    的头像 发表于 05-22 09:52 824次阅读

    英特尔至强6:如何炼就数据中心“全能型选手”

    面对数据中心领域日益激烈的竞争,英特尔紧抓核心产品,继去年推出128核的至强6900P之后,近期又添“新兵”——至强6700P和至强6500P,进步丰富了
    的头像 发表于 03-13 14:57 548次阅读
    英特尔<b class='flag-5'>至强</b><b class='flag-5'>6</b>:如何炼就数据中心“全能型选手”

    英特尔展示基于至强6处理器的基础网络设施

    ; 与5G核心网解决方案合作伙伴的深度合作,加快了英特尔至强6能效核处理器在整个生态系统中的应用; 基于5G核心网工作负载的独立验证确认了英特尔至强
    的头像 发表于 03-08 09:24 863次阅读

    MWC 2025:英特尔展示基于至强6处理器的基础网络设施

    3.2倍3; 与5G核心网解决方案合作伙伴的深度合作,加快了英特尔®至强®6能效核处理器在整个生态系统中的应用; 基于5G核心网工作负载的独立验证确认了英特尔®至强®
    发表于 03-03 15:52 1054次阅读
    MWC 2025:英特尔展示基于<b class='flag-5'>至强</b><b class='flag-5'>6</b>处理器的基础网络设施

    NVIDIA与合作伙伴推出代理式AI Blueprint

    开发者现在可以使用全新 NVIDIA AI Blueprint 构建和部署具备推理、规划和行动能力的定制化 AI 智能体。这些蓝图囊括了 NVIDIA NIM 微服务、
    的头像 发表于 01-09 11:08 1035次阅读

    英伟达AI服务器供应链遇挑战:GB300/B300 DrMOS过热问题

    知名分析师郭明錤近日发布了份投资研究报告,揭示了英伟达在GB300B300 AI服务器开发过程中遭遇的供应链挑战。 据郭明錤透露,英伟达目前正在为GB
    的头像 发表于 12-20 15:16 1400次阅读