0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

英特尔揭秘第六代至强架构,披露未来3年产品

sakobpqhz 来源:算力基建 2023-08-29 15:23 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

9月14-15日,AIGC与大模型时代首场AI芯片峰会——2023全球AI芯片峰会将在深圳举行。清华大学教授、中国半导体行业协会副理事长、IEEE Fellow魏少军领衔40+位演讲嘉宾,NVIDIA与AMD齐聚,15家国产AI芯片企业届时将登台,3+Chiplet企业首度亮相。扫码报名,线下交流。

芯片大厂纷纷入坑Chiplet。

一年一度的顶级芯片盛会Hot Chips正在举行,作为全球芯片架构创新的风向标,今年的Hot Chips继续披露工业界前沿研发成果和突破性技术,覆盖人工智能(AI)训练及推理、Chiplet、近存计算、处理器、光子计算、晶圆级集群、神经拟态计算等热门领域。

2ec1eab2-461e-11ee-a2ef-92fbcf53809c.png

本届大会为期三天,NVIDIA、高通英特尔、AMD、谷歌、SK海力士、三星Arm、IBM等芯片巨头,Meta、微软等科技巨头,晶圆级芯片创企Cerebras、光子AI芯片创企曦智科技、稀疏化计算AI芯片创企墨芯人工智能、RISC-V服务器处理器创企Ventana、RISC-V IP供应商SiFive等具有代表性的创业公司,均发表了展现当前芯片工业界前沿趋势的主题演讲。 期间,英特尔揭秘了其第六代至强数据中心处理器的架构变化,详解了新一代架构、E核和P核处理器技术,包括内存和I/O子系统的设计改进,并披露2023~2025年的最新产品路线图。

2efb2c3c-461e-11ee-a2ef-92fbcf53809c.png

英特尔宣布将在明年推出两款采用Intel 3工艺技术的至强新品——为计算密集型和人工智能工作负载优化的高性能核心(P核)和针对高密度和横向扩展工作负载优化的高能效核心(E核)。E核至强处理器(代号Sierra Forest)将在2024年上半年问世,P核至强处理器(代号(Granite Rapids)将紧随其后登场。 总体而言,英特尔将至强处理器称作“人工智能的最佳CPU”,Granite Rapids可将AI工作负载性能提升2-3倍,实现2.8倍的更好内存带宽,内存模组MCR DIMM带宽可提高30-40%;而Sierra Forest可在机架级别将机架密度提高250%,将每瓦性能提高240%。

2f041194-461e-11ee-a2ef-92fbcf53809c.png

插播一则会议预告。9月14-15日,2023全球AI芯片峰会将在深圳举行。清华大学魏少军教授领衔近50位演讲嘉宾,NVIDIA与AMD齐聚,15+国产AI芯片企业届时将登台交锋,3家Chiplet企业首度亮相。开幕式、AI芯片架构创新专场、AI大算力芯片专场和高能效AI芯片专场将在主会场进行。智算中心算力与网络高峰论坛等板块将在分会场进行。扫码报名~

01.全面转向Chiplet,内存和I/O大幅升级英特尔Fellow、数据中心处理器架构师Chris Gianos发表了主题为《为灵活性和价值而设计的未来英特尔至强处理器架构》演讲。 未来的英特尔至强处理器引入了一种新架构,能提供必要的可扩展性、能效、性能和多功能性,满足日益增长的数据中心工作负载和部署需求。 该架构采用模块化设计方式,通过fabric技术把模块化die互连,实现灵活的架构,可将独立的计算和I/O的chiplets(常译为“芯粒”、“小芯片”)进行灵活组合,并借助EmiB封装技术实现高带宽和低延迟。基于该架构的模块化SoC包含通用IP、固件、操作系统、平台组件等组件。

2f7a9008-461e-11ee-a2ef-92fbcf53809c.png

当前最新一代英特尔至强可扩展处理器(代号Sapphire Rapids)最高支持8个DDR5通道和80个PCIe 5.0/CXL 1.1连接通道。相比之下,AMD的EPYC 4数据中心处理器拥有12个DDR5通道和128个PCIe通道。 而第六代至强将在通道数量和内存带宽上取得显著进步,内存配置转向12个通道的DDR/MCR、1-2DPC,先进I/O支持136个通道的PCIe 5.0/CXL 2.0以及6个UPI链路(144通道),内存带宽相比Sapphire Rapids将提高近3倍。值得一提的是服务器内存模组MCR DIMM,据称内存带宽会比传统DDR5大幅提升。早在今年3月英特尔宣布更新其数据中心和人工智能路线图时,就曾演示过一个带有新MCR DIMM模块的的预生产Granite Rapids至强,速率高达8800MT/s,这几乎是当前服务器平台上可用的DDR5(4400~4800MT/s)速率的两倍。下一代至强架构具有可扩展性,将提供P核和E核版本,支持1S-8S规格的P核、1S-2S规格的E核。基于这些功能,不同工艺节点之间能够进行匹配,从而得以实现性能和能效的最佳平衡。 得益于I/O和内存子系统的进步,这一架构提供了高性能和平台灵活性的优化,逻辑单片计算集群相较以往的产品提供了更好的每瓦特性能和每线程性能,并为未来代号为Granite Rapids和Sierra Forest的英特尔至强处理器奠定基础。

02.两种核心架构:

基于Intel 3工艺节点,专攻高性能与高能效

能效已经成为现代云计算和数据中心改变高性能服务器处理器设计的关键因素。对于数据中心来说,省电才是硬道理。

英特尔高级首席工程师、架构师Don Soltis在Hot Chips上发表的《基于高能效核心(E-Core)的英特尔至强处理器:下一代高性能、高能效计算》主题演讲,便重点介绍了代号为Sierra Forest的全新英特尔至强处理器的架构设计细节,如何在消耗同样能源的情况下,让每个芯片完成更多的计算工作。 英特尔探讨了其首款高能效核心E核至强如何补充现有和未来的英特尔高性能核心P核处理器解决方案,以提供一个高度通用的平台,最大限度地提高计算性能、最大限度地降低功耗。 英特尔观察到客户需求正在变化:对高性能CPU核心的需求持续不断;对更高密度和更高每瓦性能的CPU核心的需求也不断增长;不同工作负载及应用,需要在核心性能、核心能效与核心密度之间取得平衡;扩展部署模型要求增加功率、I/O、带宽和内存。

2fad52a4-461e-11ee-a2ef-92fbcf53809c.png

针对这些趋势,英特尔通过P核和E核来满足性能和效率需求。 英特尔第六代至强可扩展处理器将提供P核和E核两种版本的核心架构,其中P核至强Granite Rapids针对计算密集型和AI工作负载的性能进行了优化,E核至强Sierra Forest针对高密度和横向扩展工作负载的能效进行了优化。

2fefc4e0-461e-11ee-a2ef-92fbcf53809c.png

P核和E核均基于最新的Intel 3工艺技术(相当于7nm工艺),支持客户轻松优化,具有硬件兼容、软件栈共享、全面安全性等特点,并在TCO和每瓦性能上取得进步。 两种架构拥有不同的功能集。P核采用经验证的至强架构,优化了每核性能并提高了能效,新软件功能包括支持用于AI/ML的FP16的高级矩阵扩展(AMX)、长度256位的内存加密秘钥、Code SW预取和取指分支提示、单线程MBA+L2高速缓存分配技术/代码和数据优先级(CAT/CDP)。

300c2f9a-461e-11ee-a2ef-92fbcf53809c.png

其微架构对性能进行优化,包括:64KB、16路指令高速缓存(I-cache),改进分支预测和错误恢复,3-cycle FP乘法,更突出的内存请求和预取能力。E核采用全新英特尔至强架构,拥有优化的能效吞吐量性能,软件功能支持BF16、FP16转换,并支持HLAT、CMPccXADD、LAM、LASS、AVX-IFMA、AVX-DOT-PROD-INT8等。

30145670-461e-11ee-a2ef-92fbcf53809c.png

该处理器将拥有144个核心,提供单插槽和双插槽配置,微架构对能效进行优化,包括64kB I-cache、6-wide解码器、5-wide分配器、8-wide retire、2核或4核共享4MB L2、支持处理多达64个outstanding misses。 英特尔声称在机架级别,与当前的Sapphire Rapids相比,E核至强处理器Sierra Forest面向云计算可将机架密度提高250%,将每瓦性能提高240%。

308b53b0-461e-11ee-a2ef-92fbcf53809c.png

03.结语:Chiplet在数据中心走向主流从英特尔对下一代数据中心处理器架构的投资,可以看到面对计算多样性,提高算力涉及的技术跨度更加广泛,需要兼顾到计算单元、I/O单元、内存的可扩展性,更加高速的互连网络,灵活高效的模块化功能,电源管理能力等等。 进入高算力时代,英特尔和AMD这两大数据中心处理器巨头都选择走上了Chiplet路线,在处理器封装大量独立的计算和I/O chiplets,让芯片设计如同“搭积木”般成为可能。这种将I/O功能从计算芯片中分离出来的设计正在风靡数据中心芯片设计行业,不仅是数据中心CPU,英伟达的A100 GPU、AMD的AI芯片MI300、特斯拉Dojo超级计算机的D1芯片等均是Chiplet产品。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 芯片
    +关注

    关注

    463

    文章

    54410

    浏览量

    469128
  • 英特尔
    +关注

    关注

    61

    文章

    10319

    浏览量

    181064
  • chiplet
    +关注

    关注

    6

    文章

    499

    浏览量

    13644
  • 大模型
    +关注

    关注

    2

    文章

    3761

    浏览量

    5269

原文标题:16家芯片顶流火拼Hot Chips!英特尔揭秘第六代至强架构,披露未来3年产品

文章出处:【微信号:算力基建,微信公众号:算力基建】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    超越台积电?英特尔首个18A工艺芯片迈向大规模量产

    电子发烧友网报道(文/李弯弯)10月9日,英特尔公布了代号Panther Lake的新一客户端处理器英特尔®酷睿™Ultra(第三)的架构
    的头像 发表于 10-11 08:14 9381次阅读
    超越台积电?<b class='flag-5'>英特尔</b>首个18A工艺芯片迈向大规模量产

    英特尔至强6“芯”动GTC 2026,为英伟达DCG Rubin解锁系统级性能

    的关键阶段,至强系列处理器为GPU加速AI系统,提供架构一致性与强大扩展能力所发挥的重要支撑作用。 英特尔公司副总裁兼数据中心战略项目总经理Jeff McVeigh表示: “当前,AI发展正从大规模训练加速阶段,转向由智能体AI
    的头像 发表于 03-19 16:43 367次阅读

    探索DeepSeek多样化技术路径,英特尔架构师用至强CPU尝鲜

    近期大模型领域里最火的热词,或者说技术创新点,非Engram (DeepSeek最新论文里设计的Engram机制) 莫属。今天我们想分享的,是英特尔围绕Engram开展的早期探索——用至强® 处理器
    的头像 发表于 02-05 11:13 533次阅读
    探索DeepSeek多样化技术路径,<b class='flag-5'>英特尔</b><b class='flag-5'>架构</b>师用<b class='flag-5'>至强</b>CPU尝鲜

    英特尔举办行业解决方案大会,共同打造机器人“芯”动脉

    11月19日,在2025英特尔行业解决方案大会上,英特尔展示了基于英特尔® 酷睿™ Ultra平台的最新边缘AI产品及解决方案,并预览了针对边缘侧的
    的头像 发表于 11-19 21:51 7092次阅读
    <b class='flag-5'>英特尔</b>举办行业解决方案大会,共同打造机器人“芯”动脉

    瑞萨电子推出第六代DDR5 RCD,传输速率达9600MT/s

    电子发烧友网综合报道 日前,瑞萨电子宣布推出业界首款面向DDR5寄存双列直插式内存模块(RDIMM)的第六代(Gen6)寄存时钟驱动器(RCD),这款全新RCD率先实现了9600兆传输/秒(MT/s
    的头像 发表于 11-19 15:59 6124次阅读
    瑞萨电子推出<b class='flag-5'>第六代</b>DDR5 RCD,传输速率达9600MT/s

    英特尔288核新至强处理器揭秘:Intel 18A制程,3D堆叠与键合,EMIB封装……

      近日,在Hot Chips 2025大会举行期间,英特尔新一至强处理器 Clearwater Forest首次亮相,这是英特尔基于Intel 18A制程打造的首款服务器芯片。会上
    的头像 发表于 08-29 15:59 1963次阅读

    英特尔连通爱尔兰Fab34与Fab10晶圆厂,加速先进制程芯片生产进程

    决定连通爱尔兰的Fab 34与Fab 10晶圆厂。 ​ 目前,英特尔先进制程技术Intel 4/3的主要生产重担,落在了位于爱尔兰莱克斯利普的Fab 34晶圆厂肩头。这一晶圆厂对于英特尔至关重要,当下热门的
    的头像 发表于 08-25 15:05 1079次阅读

    英特尔至强6助力阿里云第九企业级ECS实例100天赢得超万家客户青睐

    近日,搭载英特尔® 至强® 6性能核处理器的阿里云第九企业级ECS实例g9i正式迎来商业化100天里程碑,并获得超过10,000家客户的信赖与选择。通过全场景的卓越性能提升,至强6性
    的头像 发表于 07-29 15:44 694次阅读

    主控CPU全能选手,英特尔至强6助力AI系统高效运转

    20253月,英伟达发布了DGX B300 AI加速计算平台。20255月,英特尔发布了三款全新英特尔
    的头像 发表于 06-27 11:44 1017次阅读
    主控CPU全能选手,<b class='flag-5'>英特尔</b><b class='flag-5'>至强</b>6助力AI系统高效运转

    直击Computex 2025:英特尔重磅发布新一GPU,图形和AI性能跃升3.4倍

    B60和英特尔锐炫Pro B50 GPU,AI加速器产品英特尔Gaudi 3 AI加速器。 英特尔副总裁兼客户端显卡总经理Vivian
    的头像 发表于 05-21 00:57 7734次阅读
    直击Computex 2025:<b class='flag-5'>英特尔</b>重磅发布新一<b class='flag-5'>代</b>GPU,图形和AI性能跃升3.4倍

    直击Computex2025:英特尔重磅发布新一GPU,图形和AI性能跃升3.4倍

    5月19日,在Computex 2025上,英特尔发布了最新全新图形处理器(GPU)和AI加速器产品系列。包括全新英特尔锐炫™ Pro B系列GPU——英特尔锐炫Pro B60和
    的头像 发表于 05-20 12:27 5641次阅读
    直击Computex2025:<b class='flag-5'>英特尔</b>重磅发布新一<b class='flag-5'>代</b>GPU,图形和AI性能跃升3.4倍

    英特尔发布全新GPU,AI和工作站迎来新选择

    英特尔推出面向准专业用户和AI开发者的英特尔锐炫Pro GPU系列,发布英特尔® Gaudi 3 AI加速器机架级和PCIe部署方案   2025
    发表于 05-20 11:03 1912次阅读

    英特尔2025Q1营收127亿美元,数据中心与AI业务可圈可点

      今日,英特尔公布2025第一季度财报。数据显示,英特尔第一季度营收达127亿美元,超出预期指引,产品业务营收为118亿美元,其中数据中心和人工智能事业部(DCAI)营收同比增长8
    的头像 发表于 04-25 17:46 927次阅读

    英特尔首秀上海车展:以“芯”赋能,携手合作伙伴推动全车智能化

    4月23日,在上海车展上,英特尔发布第二英特尔AI增强软件定义汽车(SDV)SoC,并披露全新合作伙伴关系。第二
    的头像 发表于 04-23 21:20 1665次阅读
    <b class='flag-5'>英特尔</b>首秀上海车展:以“芯”赋能,携手合作伙伴推动全车智能化

    英特尔首秀上海车展:以“芯”赋能,携手合作伙伴推动全车智能化

    2025 4 月 23 日,上海 ——今日,在上海车展上,英特尔发布第二英特尔AI增强软件定义汽车(SDV)SoC,并披露全新合作伙伴
    发表于 04-23 14:26 805次阅读