0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

术业有专攻——AI系统主控CPU英特尔至强6新品处理器浅析

科技见闻网 来源:科技见闻网 作者:科技见闻网 2025-06-19 16:37 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

一、至强6与NVIDIA GPU协同的硬件基础

wKgZO2hTzFKASm6xAAJa9Y5Fzc8048.png

AI 异构计算架构中,英特尔至强6处理器作为主控CPU可以与NVIDIA最新GPU 很好地协同。根据英伟达官网信息,目前其DGX B300系统选择至强6776P作为唯一主控CPU,采用双路配置,通过UPI总线实现CPU间互连。这8个GPU通过NVLink高速互连,是性能比较高端的DGX,为训练等应用而设计。

作为主控CPU,它和GPU协同工作,而这个系统的性能受到诸多因素的影响,这里列出的是最主要的因素,包括I/O、核心性能、内存(包括带宽和容量)、CPU上的预处理或卸载(offload)能力、整体CPU系统的RAS,以及各种硬件的外形设计等。这些都会影响整个AI系统的端到端性能,因此AI系统通常比较复杂。

wKgZPGhTzFKAdWTCAAHjLwUKPi4936.png

这一设计的性能提升要点在于:

1.业界领先的I/O通道和内存能力

AP平台的双路至强6最多可以提供192条PCIe 5.0通道,也就是可以每路提供96条通道,相比上一代提升20%,内存通道也可以高达12个。直接匹配多GPU的高速接入需求,避免因通道不足导致的带宽瓶颈。

在SP平台上,英特尔还提供了一个差异化的产品,就是在单个CPU插槽上提供了更丰富的I/O资源(Rich I/O one socket),总共有136根的PCIe通道,持单插槽连接多块加速卡与存储设备,适用于边缘端“预处理+推理”一体化场景。同时,其高带宽内存可容纳更大模型参数,提升训练效率。在推理场景中,灵活的核心配置确保资源高效利用,满足多样化需求。

2.核心性能优化

至强6区别于上一代产品的关键技术突破是Priority Core Turbo(PCT),其技术本质是通过 Speed Select(SST)将单路CPU核心划分为两组:最多8个高频核心(PCT 核心)与剩余低频核心。在DGX B300场景中,这一技术直接服务于 “CPU 驱动 GPU” 的典型需求,实现高频核心的精准调度:当 GPU 需要快速获取预处理数据(如从内存读取原始数据并完成清洗、特征工程)时,8个PCT核心可睿频至4.6GHz(传统64核SKU最大睿频为3.9GHz),相比全核睿频(3.6GHz)提升28%。这一特性缩短了数据从CPU到GPU的传输延迟。

3.资源分配的灵活性

PCT核心数量可通过BIOS或 SST-TF工具动态配置,客户可根据实际负载调整——客户在使用时可以根据需要选择8个、6个、4个或2个PCT核心。例如推理场景中若仅需4块GPU工作,可配置4个PCT 核心对应驱动,避免资源浪费。与上一代 Max Turbo 技术的差异在于:PCT允许全核在线(无需半数核心休眠),且维持相同 TDP(350W)与散热设计,确保硬件兼容性,降低客户部署成本。

4.更强的内存架构兼容性

更高的内存带宽对于AI工作负载至关重要,因为AI的工作流程是一个完整的数据处理管道,而非单一环节。在这一过程中,CPU首先负责预处理,从内存中读取数据并进行初步处理,随后将数据传输至GPU。比如,至强6支持8通道到12通道的DDR5-6400内存,还支持MRDIMMs,能提供更高的30%带宽。

在LLM的生成式推理(如文本续写)中,自注意力机制需为每个已处理的Token生成并存储键(Key)和值(Value)矩阵,即KV Cache。KV Cache避免了在解码阶段重复计算历史Token的注意力状态,但会随序列长度线性增长,占用大量GPU显存,需要卸载到下一级存储中。对于CXL内存来说,有一个典型用例是KV Cache的卸载,通过用CXL内存去替代SSD,这样KV Cache的访问速度显著增快,从而提升了性能。

5.RAS和数据预处理

在企业级 AI 训练场景中,系统可靠性直接影响算力利用率与TCO。至强6的RAS 体系覆盖全硬件链路,可以通过RAS特性来可以提高I/O的稳定性、内存系统稳定性、UPI链路稳定性、CPU及平台稳定性。CPU卸载则是针对MoE(混合专家)模型的另一种优化方式。目前市场上已有诸多关于通过AMX矩阵技术将部分MoE模型中的专家层卸载至至强处理器的案例。

wKgZO2hTzFOALNAwAAFdw-RiKn0376.png

二、为何是至强6776P?

NVIDIA DGX B300选择的双路至强 6776P 的核心价值在于业界领先的I/O能力、领先的内存带宽、大内存容量、领先的RAS能力已经为特定AI负载优化的PCT产品。

其4.6GHz的睿频能力显著加速数据处理,PCT核心以4.6GHz频率加速数据预处理(如文本分词、图像解码),通过高速 PCIe 通道将数据传输至GPU,形成 “CPU 预处理→GPU 计算”的流水线作业。这款处理器拥有单路88条PCIe通道,双路则达到176条。

英伟达选择了2 DPC架构(每颗CPU提供8通道内存,每通道2个DIMM)进行配置,双路系统可搭载32根DIMM,内存最大容量达8TB。

综述:开放生态的实际意义

至强6的核心优势在于开放性与兼容性。客户硬件选择自由,可以根据成本动态切换,避免被单一供应商锁定。在软件生态兼容层面,至强6也完全支持主流 AI 框架(如 TensorFlow、PyTorch)与云原生技术,无需重新开发适配层,降低技术迁移成本。

从英伟达的选择逻辑看,DGX B300 采用至强6应该并非单一性能导向,而是综合考量了生态开放性、成本可控性与技术成熟度 —— 至强 6 作为量产级产品,其稳定性与供应链可靠性已通过大规模数据中心验证。

至强6在搭配NVIDIA GPU场景中的价值,本质上源于其对“CPU 角色”的清晰定位:核心数量或睿频频率,都是围绕 GPU 协同需求而定,根据用户的不同需求,也可以选择不同的CPU型号。在关键路径(如高频数据传输、大内存容量、系统稳定性)上,至强6可以实现精准优化。对于企业客户而言,这意味着在 AI 基础设施建设中,可通过标准化硬件获取可预期的性能提升,同时避免为冗余功能支付额外成本。这种 “需求导向型” 技术路线,或许正是其成为英伟达首选主控 CPU 的核心原因。
(来源:微型计算机)

审核编辑 黄宇

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 英特尔
    +关注

    关注

    61

    文章

    10324

    浏览量

    181090
  • cpu
    cpu
    +关注

    关注

    68

    文章

    11329

    浏览量

    225903
  • AI
    AI
    +关注

    关注

    91

    文章

    41138

    浏览量

    302608
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    AI工作站本地养龙虾!英特尔双芯混合算力,告别云端Token焦虑

    4月23日,英特尔公司在北京举办新一代AI工作站平台发布会,英特尔中国区技术部总经理高宇宣布,面向AI工作站,英特尔推出两大重磅产品:
    的头像 发表于 04-26 16:27 4748次阅读
    <b class='flag-5'>AI</b>工作站本地养龙虾!<b class='flag-5'>英特尔</b>双芯混合算力,告别云端Token焦虑

    英特尔发布至强600系列工作站处理器与锐炫Pro B70 GPU,双芯联动重塑AI工作站格局

    4月23日,英特尔公司在北京举办新一代AI工作站平台发布会,推出英特尔® 至强® 600工作站处理器
    的头像 发表于 04-24 09:28 3679次阅读
    <b class='flag-5'>英特尔</b>发布<b class='flag-5'>至强</b>600系列工作站<b class='flag-5'>处理器</b>与锐炫Pro B70 GPU,双芯联动重塑<b class='flag-5'>AI</b>工作站格局

    英特尔至强6“芯”动GTC 2026,为英伟达DCG Rubin解锁系统级性能

    在英伟达GTC 2026大会上,英特尔正式宣布,英特尔至强 6处理器将作为主控
    的头像 发表于 03-19 16:43 393次阅读

    性能再越级!英特尔推出全新酷睿Ultra 200HX Plus系列移动处理器

    英特尔酷睿Ultra 200HX Plus系列登场,全新酷睿 Ultra 9 290HX Plus和酷睿Ultra 7 270HX Plus处理器,为极致性能需求注入更强动力。 今日,英特尔发布全新
    的头像 发表于 03-19 16:43 342次阅读

    轻薄、AI、数日续航、性能强劲,第三代英特尔酷睿Ultra新品重磅上市

    今日,英特尔在上海举办了第三代英特尔酷睿Ultra处理器新品分享会。作为全球首款基于Intel 18A工艺打造的计算平台,第三代英特尔酷睿
    的头像 发表于 03-19 13:12 271次阅读

    探索DeepSeek多样化技术路径,英特尔架构师用至强CPU尝鲜

    近期大模型领域里最火的热词,或者说技术创新点,非Engram (DeepSeek最新论文里设计的Engram机制) 莫属。今天我们想分享的,是英特尔围绕Engram开展的早期探索——用至强® 处理器
    的头像 发表于 02-05 11:13 537次阅读
    探索DeepSeek多样化技术路径,<b class='flag-5'>英特尔</b>架构师用<b class='flag-5'>至强</b><b class='flag-5'>CPU</b>尝鲜

    18A工艺首发!英特尔推出下一代PC处理器,77%游戏性能暴涨+180TOPS算力

    1月6日,在CES 2026上,英特尔发布了代号为Panther Lake 的全新 Core Ultra 3 系列处理器上市产品阵容。该系列处理器基于18A 制程节点打造的
    的头像 发表于 01-07 07:56 2w次阅读
    18A工艺首发!<b class='flag-5'>英特尔</b>推出下一代PC<b class='flag-5'>处理器</b>,77%游戏性能暴涨+180TOPS算力

    从云到端:英特尔展示全栈AI能力,覆盖云、边、PC多场景

    2025年9月25日,杭州——今日,在2025云栖大会上,英特尔与阿里云带来了多项云基础设施创新成果,包括兼容多代际服务(支持第五代英特尔® 至强® 可扩展
    的头像 发表于 09-26 17:27 1754次阅读
    从云到端:<b class='flag-5'>英特尔</b>展示全栈<b class='flag-5'>AI</b>能力,覆盖云、边、PC多场景

    英特尔288核新至强处理器揭秘:Intel 18A制程,3D堆叠与键合,EMIB封装……

      近日,在Hot Chips 2025大会举行期间,英特尔新一代至强处理器 Clearwater Forest首次亮相,这是英特尔基于Intel 18A制程打造的首款服务
    的头像 发表于 08-29 15:59 1999次阅读

    英特尔至强6助力阿里云第九代企业级ECS实例100天赢得超万家客户青睐

    近日,搭载英特尔® 至强® 6性能核处理器的阿里云第九代企业级ECS实例g9i正式迎来商业化100天里程碑,并获得超过10,000家客户的信赖与选择。通过全场景的卓越性能提升,
    的头像 发表于 07-29 15:44 698次阅读

    主控CPU全能选手,英特尔至强6助力AI系统高效运转

    有什么特殊之处呢? AI加速系统为何看重CPU主控能力? 作为造价极高的AI加速系统,DGX B
    的头像 发表于 06-27 11:44 1033次阅读
    <b class='flag-5'>主控</b><b class='flag-5'>CPU</b>全能选手,<b class='flag-5'>英特尔</b><b class='flag-5'>至强</b><b class='flag-5'>6</b>助力<b class='flag-5'>AI</b><b class='flag-5'>系统</b>高效运转

    英特尔锐炫Pro B系列,边缘AI的“智能引擎”

    CTO、高级首席AI工程师张宇博士 英特尔客户端计算事业部边缘计算CTO、高级首席AI工程师张宇博士在MWC AI终端峰会上指出,边缘将崛起为AI
    的头像 发表于 06-20 17:32 1053次阅读
    <b class='flag-5'>英特尔</b>锐炫Pro B系列,边缘<b class='flag-5'>AI</b>的“智能引擎”

    直击Computex 2025:英特尔重磅发布新一代GPU,图形和AI性能跃升3.4倍

    电子发烧友原创  章鹰 5月19日,在Computex 2025上,英特尔发布了最新全新图形处理器(GPU)和AI加速产品系列。包括全新英特尔
    的头像 发表于 05-21 00:57 7755次阅读
    直击Computex 2025:<b class='flag-5'>英特尔</b>重磅发布新一代GPU,图形和<b class='flag-5'>AI</b>性能跃升3.4倍

    直击Computex2025:英特尔重磅发布新一代GPU,图形和AI性能跃升3.4倍

    5月19日,在Computex 2025上,英特尔发布了最新全新图形处理器(GPU)和AI加速产品系列。包括全新英特尔锐炫™ Pro B系
    的头像 发表于 05-20 12:27 5670次阅读
    直击Computex2025:<b class='flag-5'>英特尔</b>重磅发布新一代GPU,图形和<b class='flag-5'>AI</b>性能跃升3.4倍

    英特尔发布全新GPU,AI和工作站迎来新选择

    Computex 2025上,英特尔发布了为专业人士和开发者设计的全新图形处理器(GPU)和AI加速产品系列。包括: 全新英特尔锐炫 ™
    发表于 05-20 11:03 1917次阅读