0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

英特尔针对7纳米工艺节点做出哪些关键改进?

lhl545545 来源:智东西 作者:智东西 2021-04-03 09:30 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

据称,该GPU计划是迄今为止最大,设计最多的芯片:将具有1000个执行单元(EU),内核数量超过8000个,采用了7种关键技术,包含47个Tile,是有史以来尺寸最大、最复杂的GPU。

英特尔新GPU:Foveros 3D封装不同代工厂Tile

英特尔的Ponte Vecchio GPU集成了超过1000亿个晶体管,47颗XPU Tile以及各种制程节点的混搭。这款GPU采用了Xe-HPC图形架构,该架构是基于英特尔7nm EUV节点的旗舰产品。

除此之外,该芯片还有大量基于不同工艺节点的Tile,其中一些Xe-HPC Tile由台积电等外部晶圆代工厂生产。

目前,尚无法确定英特尔是否会采用台积电的7nm或7nm+ EUV工艺节点,但是鉴于台积电代工的Xe Link I/O Tile采用了标准的非EUV 7nm工艺,英特尔可能会继续采用标准7nm工艺。

英特尔首席架构师Raja Koduri曾经说Ponte Vecchio GPU采用了7项先进技术,技术媒体Wccftech给出了具体名单:

英特尔7nm工艺、台积电7nm工艺、Foveros 3D封装、EMIB(嵌入式多芯片互连桥接)技术、英特尔增强型10nm SuperFin工艺、Rambo Cache(兰博缓存)与HBM2显存。

Raja Koduri也在推特上公布了47颗Tile分别是什么:16颗Xe HPC(internal/external)、8颗Rambo(internal、2颗Xe Base(internal)、11颗EMIB(internal)、2颗Xe Link(external)和8颗HBM(external)。

Ponte Vecchio实际上由两个独立GPU芯片组成,每个GPU包含六个Xe-HPC计算单元。

一对Xe-HPC计算单元直接与兰博缓存相连,兰博缓存采用了英特尔增强型10nm SuperFin工艺。

每个GPU还连接了四个HBM2显存,HBM2采用4Hi或8Hi堆叠(可以简单理解为4层或8层)。一共八个HBM2可以提供多GB的内存容量和带宽负载。此外,每个GPU上还有8个Passive Die Stiffeners

总体来说,英特尔Xe HPC这款MCM结构GPU处理器使用了最先进的Foveros 3D封装技术,将多个来自不同代工厂,使用不同工艺制作的Tile集成在一个平台上,EMIB技术则将HBM2、Xe Link I/O等Tile与GPU互连。

所有这些整合形成了Ponte Vecchio Xe-HPC GPU。

执行单元数量将超1000,提供40倍双精度浮点算术能力

英特尔此前曾介绍过,其Xe-HPC GPU将具有1000个执行单元(EU)。到目前为止,Xe LP有96个EU,它们构成了总共768个内核。

新GPU的每个子层(subslice)有8个EU。第12代GPU中的subslice类似于英伟达SM单元或AMD的CU单元。

而在英特尔的9.5和11代GPU上,每个subslice具有8个EU,因此如果12代保持相同的层次结构,人们将能看到大量由subslice组成的超级切片。从目前的图片上看,英特尔第12代GPU将有8个算术逻辑单元(ALU),与11代和9.5代保持一致。

大致来说,一个GPU芯片将有1000个EU单元,8000个内核,而实际内核数量还要更多。而Xe HP GPU的HPC尺寸也将更大。

Wccftech列出了英特尔GPU的实际EU单元、对内核数量的估计。功率和TFLOPS(每秒浮点运算次数)等数据:

英特尔Xe HP (12.5) 2-Tile GPU: 1024个EU单元,8192个内核,20.48 TFLOPS,1.25 GHz,300W;

英特尔Xe HP (12.5) 4-Tile GPU: 2048个EU单元,16384个内核,36 TFLOPS,1.1 GHz,400W-500W。

英特尔Xe类GPU具有下面几种可变矢量宽度(vector width):SIMT(GPU)、SIMD(CPU)、SIMT+SIMD(最高性能)。

Raja Koduri谈到,英特尔的Xe HPC GPU能够扩展到1000个EU,EU通过几个高带宽内存通道与XE内存结构相连,并且每个EU单元都进行了升级,可以提供40倍的双精度浮点计算能力。

兰博缓存则将在整个双精度工作负载中提供可持续的FP64计算性能。

就工艺优化而言,以下是英特尔针对7纳米工艺节点的一些关键改进:

1、相较10nm节点具有两倍的密度缩放优势;

2、内部的节点优化;

3、DR(Design Rules)的4倍缩减;

4、采用了EUV光刻技术;

5、新一代Foveros和EMIB封装。
责任编辑:pj

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 芯片
    +关注

    关注

    462

    文章

    53543

    浏览量

    459214
  • 英特尔
    +关注

    关注

    61

    文章

    10275

    浏览量

    179324
  • 晶圆
    +关注

    关注

    53

    文章

    5347

    浏览量

    131701
  • gpu
    gpu
    +关注

    关注

    28

    文章

    5099

    浏览量

    134471
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    超越台积电?英特尔首个18A工艺芯片迈向大规模量产

    Lake作为英特尔首款基于Intel 18A制程工艺打造的产品,意义非凡。这一制程是英特尔研发并制造的最先进半导体工艺,标志着英特尔在技术
    的头像 发表于 10-11 08:14 8546次阅读
    超越台积电?<b class='flag-5'>英特尔</b>首个18A<b class='flag-5'>工艺</b>芯片迈向大规模量产

    英特尔举办行业解决方案大会,共同打造机器人“芯”动脉

    11月19日,在2025英特尔行业解决方案大会上,英特尔展示了基于英特尔® 酷睿™ Ultra平台的最新边缘AI产品及解决方案,并预览了针对边缘侧的
    的头像 发表于 11-19 21:51 5194次阅读
    <b class='flag-5'>英特尔</b>举办行业解决方案大会,共同打造机器人“芯”动脉

    18A工艺大单!英特尔将代工微软AI芯片Maia 2

    。   英特尔18A工艺堪称芯片制造领域的一项重大突破,处于业界2纳米节点水平。它采用了两项极具创新性的基础技术——RibbonFET全环绕栅极晶体管架构和PowerVia背面供电技
    的头像 发表于 10-21 08:52 4666次阅读

    美国政府将入股英特尔

    据彭博社报道称,特朗普政府正在与芯片制造商英特尔进行谈判,希望美国政府入股这家陷入困境的公司,随后该公司股价周四上涨 7% 。 英特尔是唯一一家有能力在美国本土生产最快芯片的美国公司,尽管包括台湾
    的头像 发表于 08-17 09:52 920次阅读

    新思科技与英特尔在EDA和IP领域展开深度合作

    近日,在英特尔代工Direct Connect 2025上,新思科技宣布与英特尔在EDA和IP领域展开深度合作,包括利用其通过认证的AI驱动数字和模拟设计流程支持英特尔18A工艺;为I
    的头像 发表于 05-22 15:35 743次阅读

    英特尔发布全新GPU,AI和工作站迎来新选择

    英特尔推出面向准专业用户和AI开发者的英特尔锐炫Pro GPU系列,发布英特尔® Gaudi 3 AI加速器机架级和PCIe部署方案   2025 年 5 月 19 日,北京 ——今日,在
    发表于 05-20 11:03 1670次阅读

    英特尔持续推进核心制程和先进封装技术创新,分享最新进展

    英特尔代工已取得重要里程碑。例如,Intel 18A制程节点已进入风险试产阶段,并计划于今年内实现正式量产。这一节点采用了PowerVia背面供电技术和RibbonFET全环绕栅极晶体管。
    的头像 发表于 05-09 11:42 570次阅读
    <b class='flag-5'>英特尔</b>持续推进核心制程和先进封装技术创新,分享最新进展

    英特尔至强6再推新品!打造最强AI“机头引擎”

    2月底,英特尔一口气发布多款至强6处理器,其中包括备受瞩目的6700/6500性能核处理器。在数据中心领域需求持续攀升的当下,英特尔的这一系列举措显得尤为关键。一方面,公司积极扩充至强 6 处理器
    的头像 发表于 03-13 14:57 592次阅读

    为什么无法检测到OpenVINO™工具套件中的英特尔®集成图形处理单元?

    在 Ubuntu* Desktop 22.04 上安装了 英特尔® Graphics Driver 版本并OpenVINO™ 2023.1。 运行 python 代码: python -c
    发表于 03-05 08:36

    请问OpenVINO™工具套件英特尔®Distribution是否与Windows® 10物联网企业版兼容?

    无法在基于 Windows® 10 物联网企业版的目标系统上使用 英特尔® Distribution OpenVINO™ 2021* 版本推断模型。
    发表于 03-05 08:32

    英特尔®独立显卡与OpenVINO™工具套件结合使用时,无法运行推理怎么解决?

    使用英特尔®独立显卡与OpenVINO™工具套件时无法运行推理
    发表于 03-05 06:56

    英特尔®NCS2运行演示时“无法在启动后找到启动设备”怎么解决?

    使用 英特尔® NCS2 运行 推断管道演示脚本 。 在首次尝试中成功运行演示应用程序。 从第二次尝试开始遇到错误:E: [ncAPI] [ 150951] [security_barrie
    发表于 03-05 06:48

    英特尔任命王稚聪担任中国区副董事长

    英特尔公司宣布,任命王稚聪先生担任新设立的英特尔中国区副董事长一职。王稚聪将全面负责管理英特尔中国的业务运营,直接向英特尔公司高级副总裁、英特尔
    的头像 发表于 03-03 10:54 882次阅读

    英特尔OpenVINO 2025.0正式发布

    生成式AI(GenAI)在模型质量与应用范围上持续爆发式增长,DeepSeek 等顶尖模型已引发行业热议,这种势头预计将在 2025年延续。本次更新聚焦性能提升、更多生成式AI 模型的支持,并针对英特尔神经处理单元(NPU)推出关键
    的头像 发表于 02-21 10:20 1674次阅读
    <b class='flag-5'>英特尔</b>OpenVINO 2025.0正式发布

    使用英特尔AI PC为YOLO模型训练加速

    之后,情况有了新的变化,PyTorch2.5正式开始支持英特尔显卡,也就是说,此后我们能够借助英特尔 锐炫 显卡来进行模型训练了。
    的头像 发表于 12-09 16:14 2109次阅读
    使用<b class='flag-5'>英特尔</b>AI PC为YOLO模型训练加速