0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

英特尔揭秘第六代至强架构,披露未来3年产品

sakobpqhz 来源:算力基建 2023-08-29 15:23 次阅读

9月14-15日,AIGC与大模型时代首场AI芯片峰会——2023全球AI芯片峰会将在深圳举行。清华大学教授、中国半导体行业协会副理事长、IEEE Fellow魏少军领衔40+位演讲嘉宾,NVIDIA与AMD齐聚,15家国产AI芯片企业届时将登台,3+Chiplet企业首度亮相。扫码报名,线下交流。

芯片大厂纷纷入坑Chiplet。

一年一度的顶级芯片盛会Hot Chips正在举行,作为全球芯片架构创新的风向标,今年的Hot Chips继续披露工业界前沿研发成果和突破性技术,覆盖人工智能(AI)训练及推理、Chiplet、近存计算、处理器、光子计算、晶圆级集群、神经拟态计算等热门领域。

2ec1eab2-461e-11ee-a2ef-92fbcf53809c.png

本届大会为期三天,NVIDIA、高通英特尔、AMD、谷歌、SK海力士、三星Arm、IBM等芯片巨头,Meta、微软等科技巨头,晶圆级芯片创企Cerebras、光子AI芯片创企曦智科技、稀疏化计算AI芯片创企墨芯人工智能、RISC-V服务器处理器创企Ventana、RISC-V IP供应商SiFive等具有代表性的创业公司,均发表了展现当前芯片工业界前沿趋势的主题演讲。 期间,英特尔揭秘了其第六代至强数据中心处理器的架构变化,详解了新一代架构、E核和P核处理器技术,包括内存和I/O子系统的设计改进,并披露2023~2025年的最新产品路线图。

2efb2c3c-461e-11ee-a2ef-92fbcf53809c.png

英特尔宣布将在明年推出两款采用Intel 3工艺技术的至强新品——为计算密集型和人工智能工作负载优化的高性能核心(P核)和针对高密度和横向扩展工作负载优化的高能效核心(E核)。E核至强处理器(代号Sierra Forest)将在2024年上半年问世,P核至强处理器(代号(Granite Rapids)将紧随其后登场。 总体而言,英特尔将至强处理器称作“人工智能的最佳CPU”,Granite Rapids可将AI工作负载性能提升2-3倍,实现2.8倍的更好内存带宽,内存模组MCR DIMM带宽可提高30-40%;而Sierra Forest可在机架级别将机架密度提高250%,将每瓦性能提高240%。

2f041194-461e-11ee-a2ef-92fbcf53809c.png

插播一则会议预告。9月14-15日,2023全球AI芯片峰会将在深圳举行。清华大学魏少军教授领衔近50位演讲嘉宾,NVIDIA与AMD齐聚,15+国产AI芯片企业届时将登台交锋,3家Chiplet企业首度亮相。开幕式、AI芯片架构创新专场、AI大算力芯片专场和高能效AI芯片专场将在主会场进行。智算中心算力与网络高峰论坛等板块将在分会场进行。扫码报名~

01.全面转向Chiplet,内存和I/O大幅升级英特尔Fellow、数据中心处理器架构师Chris Gianos发表了主题为《为灵活性和价值而设计的未来英特尔至强处理器架构》演讲。 未来的英特尔至强处理器引入了一种新架构,能提供必要的可扩展性、能效、性能和多功能性,满足日益增长的数据中心工作负载和部署需求。 该架构采用模块化设计方式,通过fabric技术把模块化die互连,实现灵活的架构,可将独立的计算和I/O的chiplets(常译为“芯粒”、“小芯片”)进行灵活组合,并借助EmiB封装技术实现高带宽和低延迟。基于该架构的模块化SoC包含通用IP、固件、操作系统、平台组件等组件。

2f7a9008-461e-11ee-a2ef-92fbcf53809c.png

当前最新一代英特尔至强可扩展处理器(代号Sapphire Rapids)最高支持8个DDR5通道和80个PCIe 5.0/CXL 1.1连接通道。相比之下,AMD的EPYC 4数据中心处理器拥有12个DDR5通道和128个PCIe通道。 而第六代至强将在通道数量和内存带宽上取得显著进步,内存配置转向12个通道的DDR/MCR、1-2DPC,先进I/O支持136个通道的PCIe 5.0/CXL 2.0以及6个UPI链路(144通道),内存带宽相比Sapphire Rapids将提高近3倍。值得一提的是服务器内存模组MCR DIMM,据称内存带宽会比传统DDR5大幅提升。早在今年3月英特尔宣布更新其数据中心和人工智能路线图时,就曾演示过一个带有新MCR DIMM模块的的预生产Granite Rapids至强,速率高达8800MT/s,这几乎是当前服务器平台上可用的DDR5(4400~4800MT/s)速率的两倍。下一代至强架构具有可扩展性,将提供P核和E核版本,支持1S-8S规格的P核、1S-2S规格的E核。基于这些功能,不同工艺节点之间能够进行匹配,从而得以实现性能和能效的最佳平衡。 得益于I/O和内存子系统的进步,这一架构提供了高性能和平台灵活性的优化,逻辑单片计算集群相较以往的产品提供了更好的每瓦特性能和每线程性能,并为未来代号为Granite Rapids和Sierra Forest的英特尔至强处理器奠定基础。

02.两种核心架构:

基于Intel 3工艺节点,专攻高性能与高能效

能效已经成为现代云计算和数据中心改变高性能服务器处理器设计的关键因素。对于数据中心来说,省电才是硬道理。

英特尔高级首席工程师、架构师Don Soltis在Hot Chips上发表的《基于高能效核心(E-Core)的英特尔至强处理器:下一代高性能、高能效计算》主题演讲,便重点介绍了代号为Sierra Forest的全新英特尔至强处理器的架构设计细节,如何在消耗同样能源的情况下,让每个芯片完成更多的计算工作。 英特尔探讨了其首款高能效核心E核至强如何补充现有和未来的英特尔高性能核心P核处理器解决方案,以提供一个高度通用的平台,最大限度地提高计算性能、最大限度地降低功耗。 英特尔观察到客户需求正在变化:对高性能CPU核心的需求持续不断;对更高密度和更高每瓦性能的CPU核心的需求也不断增长;不同工作负载及应用,需要在核心性能、核心能效与核心密度之间取得平衡;扩展部署模型要求增加功率、I/O、带宽和内存。

2fad52a4-461e-11ee-a2ef-92fbcf53809c.png

针对这些趋势,英特尔通过P核和E核来满足性能和效率需求。 英特尔第六代至强可扩展处理器将提供P核和E核两种版本的核心架构,其中P核至强Granite Rapids针对计算密集型和AI工作负载的性能进行了优化,E核至强Sierra Forest针对高密度和横向扩展工作负载的能效进行了优化。

2fefc4e0-461e-11ee-a2ef-92fbcf53809c.png

P核和E核均基于最新的Intel 3工艺技术(相当于7nm工艺),支持客户轻松优化,具有硬件兼容、软件栈共享、全面安全性等特点,并在TCO和每瓦性能上取得进步。 两种架构拥有不同的功能集。P核采用经验证的至强架构,优化了每核性能并提高了能效,新软件功能包括支持用于AI/ML的FP16的高级矩阵扩展(AMX)、长度256位的内存加密秘钥、Code SW预取和取指分支提示、单线程MBA+L2高速缓存分配技术/代码和数据优先级(CAT/CDP)。

300c2f9a-461e-11ee-a2ef-92fbcf53809c.png

其微架构对性能进行优化,包括:64KB、16路指令高速缓存(I-cache),改进分支预测和错误恢复,3-cycle FP乘法,更突出的内存请求和预取能力。E核采用全新英特尔至强架构,拥有优化的能效吞吐量性能,软件功能支持BF16、FP16转换,并支持HLAT、CMPccXADD、LAM、LASS、AVX-IFMA、AVX-DOT-PROD-INT8等。

30145670-461e-11ee-a2ef-92fbcf53809c.png

该处理器将拥有144个核心,提供单插槽和双插槽配置,微架构对能效进行优化,包括64kB I-cache、6-wide解码器、5-wide分配器、8-wide retire、2核或4核共享4MB L2、支持处理多达64个outstanding misses。 英特尔声称在机架级别,与当前的Sapphire Rapids相比,E核至强处理器Sierra Forest面向云计算可将机架密度提高250%,将每瓦性能提高240%。

308b53b0-461e-11ee-a2ef-92fbcf53809c.png

03.结语:Chiplet在数据中心走向主流从英特尔对下一代数据中心处理器架构的投资,可以看到面对计算多样性,提高算力涉及的技术跨度更加广泛,需要兼顾到计算单元、I/O单元、内存的可扩展性,更加高速的互连网络,灵活高效的模块化功能,电源管理能力等等。 进入高算力时代,英特尔和AMD这两大数据中心处理器巨头都选择走上了Chiplet路线,在处理器封装大量独立的计算和I/O chiplets,让芯片设计如同“搭积木”般成为可能。这种将I/O功能从计算芯片中分离出来的设计正在风靡数据中心芯片设计行业,不仅是数据中心CPU,英伟达的A100 GPU、AMD的AI芯片MI300、特斯拉Dojo超级计算机的D1芯片等均是Chiplet产品。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 芯片
    +关注

    关注

    447

    文章

    47798

    浏览量

    409164
  • 英特尔
    +关注

    关注

    60

    文章

    9425

    浏览量

    168833
  • chiplet
    +关注

    关注

    6

    文章

    379

    浏览量

    12418
  • 大模型
    +关注

    关注

    2

    文章

    1527

    浏览量

    1116

原文标题:16家芯片顶流火拼Hot Chips!英特尔揭秘第六代至强架构,披露未来3年产品

文章出处:【微信号:算力基建,微信公众号:算力基建】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    英特尔:2025全球AIPC将超1亿台占比20%

    英特尔行业资讯
    北京中科同志科技股份有限公司
    发布于 :2024年02月29日 09:15:26

    英特尔1nm投产时间曝光!领先于台积电

    英特尔行业芯事
    深圳市浮思特科技有限公司
    发布于 :2024年02月28日 16:28:32

    英特尔至强处理器优化升级,助力打造未来高能效数据中心

    英特尔最新发布的第五代至强可扩展处理器,拥有多达64个核心,性能提升高达1.4倍。 英特尔于去年12月正式推出了拥有多达64个核心的第五代至强可扩展处理器,其性能相较于上一代
    的头像 发表于 02-26 17:39 319次阅读

    英特尔登顶2023全球半导体榜单之首

    英特尔行业芯事
    深圳市浮思特科技有限公司
    发布于 :2024年02月01日 11:55:16

    英特尔酷睿14处理器系列发布,Arrowlake/LunarLake24问世

    处理器英特尔
    looger123
    发布于 :2024年01月10日 17:44:38

    英特尔专家为您揭秘第五代英特尔® 至强® 可扩展处理器如何为AI加速

    近日,英特尔发布了第五代至强 可扩展处理器,尤其是其“为 AI 加速”的口号引起了广泛关注。 在 AI 快速发展的今天,第五代英特尔 至强 可扩展处理器的成绩亮眼,其相对于上一代
    的头像 发表于 12-23 12:20 455次阅读

    宝德服务器全面升级到第五代英特尔®至强®平台

    发布全新一代基于第五代英特尔®至强®可扩展处理器的宝德服务器。   卓越性能,新一代宝德服务器为计算用户提供更优选 第五代英特尔®至强®处理器具有更可靠的性能和更出色的能效,核心数量可
    的头像 发表于 12-21 16:12 341次阅读
    宝德服务器全面升级到第五代<b class='flag-5'>英特尔</b>®<b class='flag-5'>至强</b>®平台

    AI 无处不在,英特尔酷睿Ultra 和第五代英特尔至强可扩展处理器正式发布

    英特尔  酷睿 Ultra处理器和第五代英特尔   至强   可扩展处理器支持的AI产品亮相,展现了英特尔从云到端全方位的AI迅猛势头。在会
    的头像 发表于 12-16 16:05 392次阅读
    AI 无处不在,<b class='flag-5'>英特尔</b>酷睿Ultra 和第五代<b class='flag-5'>英特尔</b><b class='flag-5'>至强</b>可扩展处理器正式发布

    #高通 #英特尔 #Elite 高通X Elite芯片或终结苹果、英特尔的芯片王朝

    高通英特尔苹果
    深圳市浮思特科技有限公司
    发布于 :2023年10月27日 16:46:07

    英特尔第五代、第六代处理器相关参数曝光

    日前有网友分享了英特尔第五代“Emerald Rapids”、第六代“Granite Rapids”至强处理器的相关规格参数。 而从这个消息可以看到,英特尔第五代
    的头像 发表于 09-08 09:40 677次阅读

    Emulex和博科产品第六代光纤通道评估

    电子发烧友网站提供《Emulex和博科产品第六代光纤通道评估.pdf》资料免费下载
    发表于 08-23 15:19 0次下载
    Emulex和博科<b class='flag-5'>产品</b>的<b class='flag-5'>第六代</b>光纤通道评估

    安装OpenVINO工具套件英特尔Distribution时出现错误的原因?

    安装OpenVINO™工具套件英特尔 Distribution时,出现错误: Python 3.10.0.ECHO is off. Unsupported Python version.
    发表于 08-15 08:14

    英特尔媒体加速器参考软件Linux版用户指南

    英特尔媒体加速器参考软件是用于数字标志、交互式白板(IWBs)和亭位使用模型的参考媒体播放器应用软件,它利用固定功能硬件加速来提高媒体流速、改进工作量平衡和资源利用,以及定制的图形处理股(GPU)管道解决方案。该用户指南将介绍和解释如何为Linux* 使用英特尔媒体加速器
    发表于 08-04 06:34

    英特尔宣布四代至强处理器评测结果

     通过发布第四代英特尔至强可扩展处理器和Max系列产品英特尔致力于满足客户需求,并巩固其在数据中心领域的竞争优势。
    的头像 发表于 06-16 16:24 1924次阅读

    英特尔至强战略背后的思量

    的能效比。第四代至强可扩展处理器采用英特尔目前最新的Intel 7工艺,最大核心可达60核心,凭借全新的Golden Cove架构
    的头像 发表于 05-04 10:46 636次阅读
    <b class='flag-5'>英特尔</b><b class='flag-5'>至强</b>战略背后的思量