0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

中科院提出名为“Zhejiang”的大芯片将使用22 纳米工艺制造

半导体产业纵横 来源:半导体产业纵横 2024-01-05 16:23 次阅读

据中科院研究人员介绍,名为“Zhejiang”的大芯片将使用22 纳米工艺制造。

真正的摩尔定律,即晶体管随着工艺的每次缩小而变得更便宜、更快,这就是正在让芯片制造商抓狂的事。有两种不同的方法可以制造容量更大但通常不是更快的计算引擎,将设备分解成小芯片并将它们连接在一起或将它们蚀刻在整个硅晶圆上,再加上第三种覆盖层,这两种方法都可以与 2.5D 和 3D 堆叠一起使用。芯片以扩展容量和功能。

无论如何,所有这些方法都受到用于蚀刻芯片的光刻设备的掩模版限制的限制。

目前的设备是针对 300 mm 硅片定制的,该屏障为 858 mm2,仅此而已。没有任何芯片可以蚀刻得比这更大。在过去的三十年里,从 150 毫米晶圆到 200 毫米晶圆到 300 毫米晶圆并没有改变掩模版极限,从可见光光刻到水浸光刻再到极紫外光刻也没有改变掩模版极限。假设转向 450 毫米晶圆也不会改变掩模版限制。到 2023 年,拥有 450 毫米晶圆将允许更大容量的晶圆级计算引擎。但 450 毫米晶圆的工程挑战对于 IBM、英特尔三星、台积电、GlobalFoundries 和尼康来说太难解决,但这一努力于 2015 年被放弃。

光罩限制(光穿过芯片掩模以在硅晶圆上蚀刻晶体管的孔径大小)不仅定义了小芯片的设计方式,而且还限制了离散计算和内存块的大小单个晶圆。如果我们有 450 毫米的晶圆,并且晶圆级计算机的所有逻辑都可以用比晶圆更大的掩模版一次性蚀刻,那将是令人惊奇的,但这不是光刻设备的工作原理。总而言之,小芯片和晶圆级之间的区别实际上在于如何构建互连,以利用计算和内存的离散元件来构建计算引擎插槽。

尽管存在这样的限制,业界始终需要构建更强大的计算引擎,并且在摩尔定律结束时,如果能够找到一种方法,让这些设备的制造成本也更低,那就太好了。

中国科学院(CAS)计算技术研究所的研究人员刚刚在《基础研究》杂志上发表了一篇论文,讨论了光刻和小芯片的局限性,并提出了一种他们称之为“大芯片”的架构,该架构模仿了晶圆级Trilogy Systems 在 20 世纪 80 年代的努力以及Cerebras Systems 在 2020 年代成功的晶圆级架构。埃隆·马斯克 (Elon Musk) 的特斯拉正在打造自己的“Dojo”超级计算机芯片,但这不是晶圆级设计,而是将Dojo D1 核心复杂地封装成某种东西,如果你眯着眼睛看,它看起来就像是由 360 个小芯片构建的晶圆级插槽。也许通过 Dojo2 芯片,特斯拉将转向真正的晶圆级设计。看起来并不需要做很多工作就能完成这样的壮举。

中国科学院整理的这篇论文讨论了很多关于为什么需要开发晶圆级器件的问题,但没有提供太多关于他们开发的大芯片架构实际上是什么样子的细节。它并没有表明大芯片是否会像特斯拉对 Dojo 那样采用小芯片方法,或者像 Cerebras 从一开始就一路向晶圆级发展。

研究人员表示,该设计能够在单个分立器件中扩展至 100 个小芯片,我们过去称之为插槽,但对我们来说听起来更像是系统板。目前尚不清楚这 100 个小芯片将如何配置,也不清楚这些小芯片将实现什么样的内存架构(阵列中将有 1,600 个内核)。

我们所知道的是,随着大芯片的迭代,有 16 个 RISC-V 处理器使用芯片上的网络在共享主内存上进行对称多处理,相互连接,并且小芯片之间有 SMP 链接,因此每个块可以在整个复合体中共享内存。

以下是RISC-V 小芯片的框图:

以下是如何使用中介层将 16 个小芯片捆绑在一起形成具有共享内存的 256 核计算复合体,从而实现芯片间 (D2D) 互连:

CAS 研究人员表示,绝对没有什么可以阻止这种小芯片设计以晶圆级实现。然而,对于这次迭代,看起来它将是使用 2.5D 中介层互连的小芯片。

互连与计算元件一样重要,这在系统和子系统设计中始终如此。

“该接口是使用基于时间复用机制的通道共享技术设计的,”研究人员在谈到 D2D 互连时写道。“这种方法减少了芯片间信号的数量,从而最大限度地减少了 I/O 凸块和内插器布线资源的面积开销,从而可以显着降低基板设计的复杂性。小芯片终止于顶部金属层,微型 I/O 焊盘就建在该金属层上。”

虽然一个大芯片计算引擎作为多芯片或晶圆级复合体可能很有趣,但重要的是如何将这些设备互连以提供百亿亿级计算系统。以下是 CAS 研究人员对此的看法:

研究人员在谈到这种计算和内存的分层结构时写道:“对于当前和未来的亿亿级计算,我们预测分层小芯片架构将是一种强大而灵活的解决方案。”如下图所示,这段来自 CAS 的长篇引用纸。“分层小芯片架构被设计为具有多个内核和许多具有分层互连的小芯片。在chiplet内部,内核使用超低延迟互连进行通信,而chiplet之间则以得益于先进封装技术的低延迟互连,从而在这种高可扩展性系统中实现片上延迟和NUMA效应可以最小化。存储器层次结构包含核心存储器、片内存储器和片外存储器。这三个级别的内存在内存带宽、延迟、功耗和成本方面有所不同。在分层chiplet架构的概述中,多个核心通过交叉交换机连接并共享缓存。这就形成了一个pod结构,并且pod通过chiplet内网络互连。多个pod形成一个chiplet,chiplet通过chiplet间网络互连,然后连接到片外存储器。需要仔细设计才能充分利用这种层次结构。合理利用内存带宽来平衡不同计算层次的工作负载可以显著提高chiplet系统效率。正确设计通信网络资源可以确保小芯片协同执行共享内存任务。”

很难反驳这句话中所说的任何内容,但 CAS 研究人员并没有说明他们将如何实际处理这些问题。这是最困难的部分。

有趣的是,该图中的内核被称为“可编程”和“可重新配置”,但我们不确定这意味着什么。它可能需要使用可变线程技术(例如 IBM 的 Power8、Power9 和 Power10 处理器)来完成更多工作,而不是在核心中混合使用 CPUFPGA 元件。

CAS 研究人员表示,大芯片计算引擎将由超过 1 万亿个晶体管组成,占据数千平方毫米的总面积,采用小芯片封装或计算和存储块的晶圆级集成。对于百亿亿级 HPC 和 AI 工作负载,我们认为 CAS 很可能正在考虑 HBM 堆叠 DRAM 或其他一些替代双泵浦主内存,例如英特尔和 SK Hynix 开发的 MCR 内存。RISV-V 内核可能会有大量本地 SRAM 进行计算,这可能会消除对 HBM 内存的需求,并允许使用 MCR 双泵浦技术加速 DDR5 内存。很大程度上取决于工作负载以及它们对内存容量和内存带宽的敏感程度。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 芯片
    +关注

    关注

    447

    文章

    47821

    浏览量

    409198
  • 晶体管
    +关注

    关注

    77

    文章

    9058

    浏览量

    135240
  • 晶圆级
    +关注

    关注

    0

    文章

    26

    浏览量

    9807

原文标题:晶圆级大芯片,中科院提出

文章出处:【微信号:ICViews,微信公众号:半导体产业纵横】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    为什么45纳米至130纳米工艺节点如此重要呢?

    如今,一颗芯片可以集成数十亿个晶体管,晶体管排列越紧密,所需的工艺节点就越小,某些制造工艺已经达到 5 纳米甚至更小的节点。
    的头像 发表于 04-11 15:02 127次阅读
    为什么45<b class='flag-5'>纳米</b>至130<b class='flag-5'>纳米</b>的<b class='flag-5'>工艺</b>节点如此重要呢?

    三星半导体将其“第二代3纳米工艺正式更名为“2纳米”!

    近期,科技巨头三星半导体做出了一个引人注目的决策:将其“第二代3纳米工艺正式更名为“2纳米”。
    的头像 发表于 03-06 13:42 540次阅读

    高频基频(HFF)晶体芯片制造工艺

    制造工艺晶体芯片
    Piezoman压电侠
    发布于 :2024年01月02日 17:28:57

    产学研三界顶级大咖分享:RISC-V场景Show暨开源生态高级别论坛定档12/19

    中科院软件研究所高级工程师于佳耕出席,现场为大家分享新一轮处理器技术突破、RISC-V架构生态建设以及开源操作系统教学。同时,现场嘉宾还将分享勘智AI芯片的性能展示及其在开源操作系统的构建
    发表于 12-15 18:36

    22nm技术节点的FinFET制造工艺流程

    引入不同的气态化学物质进行的,这些化学物质通过与基材反应来改变表面。IC最小特征的形成被称为前端制造工艺(FEOL),本文将集中简要介绍这部分,将按照如下图所示的 22 nm 技术节点制造
    的头像 发表于 12-06 18:17 1439次阅读
    <b class='flag-5'>22</b>nm技术节点的FinFET<b class='flag-5'>制造</b><b class='flag-5'>工艺</b>流程

    三星计划:3年内实现2纳米量产

    10月19日,韩国三星电子在德国慕尼黑举办了名为「三星代工论坛2023」的活动。在这个活动上,三星电子以霸气十足的姿态公布了其芯片制造的先进工艺路线图和代工战略,宣称将在未来3年内量产
    的头像 发表于 11-01 15:07 452次阅读
    三星计划:3年内实现2<b class='flag-5'>纳米</b>量产

    传三星获谷歌Tensor G4 AP订单 将使用第三代4nm工艺制造

    芯片将由三星sf4p(第三代4纳米工艺制作,g3将由第二代sf4工艺制作。另外,xenos 2400处理器也将使用sf4p,预计将用于g
    的头像 发表于 10-31 14:25 404次阅读

    苹果15芯片纳米工艺 苹果15芯片是什么型号

    苹果15芯片纳米工艺 苹果15芯片采用的是采用台积电的 4 纳米工艺
    的头像 发表于 10-08 10:59 2904次阅读

    a17芯片纳米 a17芯片是哪个公司设计的

    a17芯片纳米 a17芯片是3纳米。a17芯片是苹果公司最新的一款芯片,采用台积电的最新3
    的头像 发表于 09-26 11:30 3731次阅读

    三句话生成CPU!中科院ChipGPT攻克AI芯片设计?

    杜克大学陈怡然老师在微博上表达了对芯片自动生成领域的关注,认为这个话题令人振奋,而中科院计算所 ChipGPT 也同样引人瞩目,但是想要真正做到自动化芯片生成还有很长的路要走。
    的头像 发表于 07-16 15:41 537次阅读
    三句话生成CPU!<b class='flag-5'>中科院</b>ChipGPT攻克AI<b class='flag-5'>芯片</b>设计?

    共建、共享开源EDA核心共性技术框架|2023开放原子全球开源峰会开源EDA分论坛成功举办

    发展。 openDACS工委会主任、中科院计算所研究员、全国重点实验室副主任李华伟 李华伟认为,EDA软件是整个集成电路产业的重要支撑,openDACS以覆盖芯片设计-制造-集成全流程为目标,我们打造EDA
    发表于 06-16 13:45

    中科院苏州纳米所:具有Janus结构高机械强度的选择性响应柔性力学传感器

    传感新品 【中科院苏州纳米所:具有Janus结构高机械强度的选择性响应柔性力学传感器】 兼具优异机械性能与不同类型力选择性响应能力,是促进柔性力学传感器件走向实际应用的关键难点之一。现有柔性
    的头像 发表于 06-01 08:45 438次阅读
    <b class='flag-5'>中科院</b>苏州<b class='flag-5'>纳米</b>所:具有Janus结构高机械强度的选择性响应柔性力学传感器

    中科院纳米能源所:研发手术中用于体内血压监测的组织黏合压电软传感器

    传感新品 【中科院纳米能源所:研发手术中用于体内血压监测的组织黏合压电软传感器】 手术期间患者生命体征对医生了解病人状态十分重要。特别是血压监测在手术中起着关键作用,可以帮助医生及时调整治疗方案
    的头像 发表于 05-30 08:37 454次阅读
    <b class='flag-5'>中科院</b><b class='flag-5'>纳米</b>能源所:研发手术中用于体内血压监测的组织黏合压电软传感器

    中科院发布“香山”与“傲来”两项开源处理器芯片

    解决RISC-V操作系统的诸多痛点问题。 2021年起北京市与中科院战略合作,发挥北京市应用牵引和芯片定义的优势,北京市经济和信息化局组织产业界成立开芯,创新“产学研”协同模式,加速“香山”的技术演进
    发表于 05-28 08:43

    中科院:用于摩擦纳米发电机和自供能传感器的表面工程银纳米线透明导电薄膜

    传感新品 【中科院北京纳米能源与系统研究所:用于摩擦纳米发电机和自供能传感器的表面工程银纳米线透明导电薄膜】 摩擦纳米发电机由于能够高效的将
    的头像 发表于 05-11 10:14 701次阅读
    <b class='flag-5'>中科院</b>:用于摩擦<b class='flag-5'>纳米</b>发电机和自供能传感器的表面工程银<b class='flag-5'>纳米</b>线透明导电薄膜