0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

芯片设计挑战:SRAM缩放速度变慢

半导体产业纵横 来源:半导体产业纵横 2022-12-22 12:28 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

如果 SRAM 缩放不可行,未来的芯片性能可能会受到阻碍。

几乎所有处理器都依赖某种形式的 SRAM 缓存。缓存作为一种高速存储解决方案,由于其紧邻处理核心的战略位置,访问时间非常快。拥有快速且可访问的存储可以显着提高处理性能,并减少核心工作所浪费的时间。 在第 68 届年度 IEEE 国际 EDM 会议上,台积电揭示了 SRAM 缩放方面的巨大问题。该公司正在为 2023 年开发的下一个节点 N3B 将包括与其前身 N5 相同的 SRAM 晶体管密度,后者用于 AMD 的Ryzen 7000 系列等 CPU 。 目前正在为 2024 年开发的另一个节点 N3E 并没有好多少,其 SRAM 晶体管尺寸仅减少了 5%。

3df5e91e-7dfd-11ed-8abf-dac502259ad0.png

根据 WikiChip 的一份报告,讨论了半导体行业中 SRAM 收缩问题的严重性。台积电的 SRAM Scaling 已经大幅放缓。台积电报告说,尽管逻辑晶体管密度继续缩小,但其 SRAM 晶体管的缩放比例已经完全趋于平稳,以至于 SRAM 缓存在多个节点上保持相同的大小。它会迫使处理器 SRAM 缓存在微芯片芯片上占用更多空间。这反过来可能会增加芯片的制造成本,并阻止某些微芯片架构变得尽可能小。 对于未来的 CPU、GPU 和 SoC 来说,这是一个主要问题,由于 SRAM 单元面积缩放缓慢,它们可能会变得更加昂贵。

SRAM 缩放速度变慢

台积电在今年早些时候正式推出其 N3 制造技术时表示,与其 N5(5 纳米级)工艺相比,新节点的逻辑密度将提高 1.6 倍和 1.7 倍。它没有透露的是,与 N5 相比,新技术的 SRAM 单元几乎无法缩放。根据 WikiChip,它从台积电在国际电子设备会议 (IEDM) 上发表的一篇论文中获得信息TSMC 的 N3 具有 0.0199µm² 的 SRAM 位单元尺寸,与 N5 的 0.021µm²SRAM 位单元相比仅小约 5%。改进后的 N3E 变得更糟,因为它配备了 0.021 µm² SRAM 位单元(大致相当于 31.8 Mib/mm²),这意味着与 N5 相比根本没有缩放。 同时,英特尔Intel 4(最初称为 7nm EUV)将 SRAM 位单元大小从 0.0312µm² 减少到 0.024µm²,对于 Intel 7(以前称为 10nm Enhanced SuperFin),我们仍在谈论 27.8 Mib/mm ²,这有点落后于 TSMC 的 HD SRAM 密度。 此外, WikiChip 回忆起 Imec 的演示文稿,该演示文稿显示在带有分支晶体管的“超过 2nm 节点”上的 SRAM 密度约为 60 Mib/mm²。这种工艺技术还需要数年时间,从现在到那时,芯片设计人员将不得不开发具有英特尔和台积电宣传的 SRAM 密度的处理器。

现代芯片中的 SRAM 负载

现代 CPU、GPU 和 SoC 在处理大量数据时将大量 SRAM 用于各种缓存,从内存中获取数据效率极低,尤其是对于各种人工智能 (AI) 和机器学习 (ML) 工作负载。但是现在即使是智能手机的通用处理器、图形芯片和应用处理器也带有巨大的缓存:AMD 的 Ryzen 9 7950X 总共带有 81MB 的缓存,而 Nvidia 的 AD102 使用至少 123MB 的 SRAM 用于 Nvidia 公开披露的各种缓存。 展望未来,对缓存和 SRAM 的需求只会增加,但对于 N3(将仅用于少数产品)和 N3E,将无法减少 SRAM 占用的裸片面积并降低新的更高成本节点与 N5 相比。从本质上讲,这意味着高性能处理器的裸片尺寸将会增加,它们的成本也会增加。同时,就像逻辑单元一样,SRAM 单元也容易出现缺陷。在某种程度上,芯片设计人员将能够通过 N3 的 FinFlex 创新(在一个块中混合和匹配不同种类的 FinFET 以优化其性能、功率或面积)来减轻更大的 SRAM 单元。 台积电计划推出其密度优化的 N3S 工艺技术,与 N5 相比,该技术有望缩小 SRAM 位单元的尺寸,但这将在 2024 年左右发生,我们想知道这是否会为 AMD、Apple 设计的芯片提供足够的逻辑性能,英伟达高通

缓解措施

在成本方面缓解 SRAM 区域扩展放缓的方法之一是采用多小芯片设计,并将较大的缓存分解为在更便宜的节点上制造的单独裸片。这是 AMD 对其 3D V-Cache 所做的事情,尽管原因略有不同。另一种方法是使用替代内存技术,如 eDRAM 或 FeRAM 用于缓存,尽管后者有其自身的特点。 无论如何,在未来几年,基于 FinFET 节点的 3nm 及更高节点的 SRAM 缩放速度放缓似乎是芯片设计人员面临的主要挑战。

编辑:黄飞

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 台积电
    +关注

    关注

    44

    文章

    5787

    浏览量

    174739
  • cpu
    cpu
    +关注

    关注

    68

    文章

    11216

    浏览量

    222913
  • gpu
    gpu
    +关注

    关注

    28

    文章

    5099

    浏览量

    134443
  • sram
    +关注

    关注

    6

    文章

    808

    浏览量

    117219

原文标题:停止SRAM微缩,意味着更昂贵的CPU和GPU

文章出处:【微信号:ICViews,微信公众号:半导体产业纵横】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    AI推理的存储,看好SRAM

    看到了其前景并提前布局。AI推理也使得存储HBM不再是唯一热门,更多存储芯片与AI推理芯片结合,拥有了市场机会。   已经有不少AI推理芯片、存算一体芯片
    的头像 发表于 03-03 08:51 2411次阅读
    AI推理的存储,看好<b class='flag-5'>SRAM</b>?

    高速数据存取同步SRAM与异步SRAM的区别

    在现代高性能电子系统中,存储器的读写速度往往是影响整体性能的关键因素之一。同步SRAM(Synchronous Static Random Access Memory)正是在这一需求下发展起来的重要
    的头像 发表于 11-18 11:13 141次阅读

    SRAM是什么,SRAM芯片型号都有哪些

    高端处理器芯片中通常设计有包含四个层级的SRAM缓存子系统:从专属于单个处理器核心的一级缓存,到多个计算单元共享的三级或四级末级缓存,每一级都在存取速度、存储容量与制造成本之间实现精密平衡。
    的头像 发表于 11-12 13:58 290次阅读

    外置SRAM芯片设计之间的平衡

    在存储解决方案中,外置SRAM通常配备并行接口。尽管并口SRAM在数据传输率方面表现卓越,但其原有的局限性也日益凸显。最明显的挑战在于物理尺寸:不论是占用的电路板空间或是所需的引脚数量,并行接口都
    的头像 发表于 10-26 17:25 796次阅读

    如何利用Verilog HDL在FPGA上实现SRAM的读写测试

    本篇将详细介绍如何利用Verilog HDL在FPGA上实现SRAM的读写测试。SRAM是一种非易失性存储器,具有高速读取和写入的特点。在FPGA中实现SRAM读写测试,包括设计SRAM
    的头像 发表于 10-22 17:21 3953次阅读
    如何利用Verilog HDL在FPGA上实现<b class='flag-5'>SRAM</b>的读写测试

    【「AI芯片:科技探索与AGI愿景」阅读体验】+AI芯片的需求和挑战

    当今社会,AI已经发展很迅速了,但是你了解AI的发展历程吗?本章作者将为我们打开AI的发展历程以及需求和挑战的面纱。 从2017年开始生成式AI开创了新的时代,经历了三次热潮和两次低谷。 生成式
    发表于 09-12 16:07

    新思科技SRAM PUF与其他PUF类型的比较

    在此前的文章《SRAM PUF:为每颗芯片注入“不可复制的物理指纹”,守护芯片安全》中,我们探讨了基于SRAM的物理不可克隆功能(PUF)的基本原理,并介绍了
    的头像 发表于 09-05 10:46 983次阅读

    ​ISSI SRAM满足5G基站高带宽需求​

    ISSI IS62WV51216BLL-55TLI是一款8Mb(512K×16)高速异步SRAM,采用55ns访问速度、2.5V~3.6V宽电压设计,支持-40℃~85℃工业级温度范围,适用于车载导航、工业控制及通信设备等高可靠性场景。
    的头像 发表于 09-04 10:00 450次阅读
    ​ISSI <b class='flag-5'>SRAM</b>满足5G基站高带宽需求​

    如何保持SRAM的状态,并在芯片复位时不初始化?

    如何保持SRAM的状态,并在芯片复位时不初始化?
    发表于 08-25 06:09

    借助AMD无顶盖封装技术应对散热挑战

    随着电子行业向更小节点迈进,现代应用要求更高的时钟速率和性能。2014 年,斯坦福大学教授 Mark Horowitz 发表了一篇开创性的论文,描述半导体行业面临相关登纳德缩放及摩尔定律失效的挑战
    的头像 发表于 08-21 09:07 686次阅读

    如何保持SRAM的状态并在芯片复位时不初始化?

    如何保持SRAM的状态,并在芯片复位时不初始化?
    发表于 08-21 07:17

    季丰推出SRAM错误地址定位黑科技

    近期受晶圆厂委托, 季丰在执行完SRAM芯片在中子辐射下SER测试后, 通过对SRAM芯片的深入研究,对测试失效数据的分析,将逻辑失效地址成功转换为物理坐标地址,最终在图像上显示失效位
    的头像 发表于 06-03 10:08 803次阅读
    季丰推出<b class='flag-5'>SRAM</b>错误地址定位黑科技

    全球驱动芯片市场机遇与挑战

    日前,在CINNO Research举办的“全球驱动芯片市场机遇与挑战”会员线上沙龙中,CINNO Research首席分析师周华以近期行业密集的资本动作为切口,揭开了显示驱动芯片市场的深层变革。
    的头像 发表于 03-13 10:51 1560次阅读

    在i.MX RT处理器上使用PXP实现缩放和旋转组合操作

    本文主要探讨如何使用PXP实现缩放和旋转组合操作,PXP是NXP推出的一个2D图形加速器,主要完成对图像的数据格式转换、固定角度旋转(90°,180°,270°),任意比例缩放、混色,移位以及翻转等功能。运行平台为i.MX RT1170/1160/1060/1050/10
    的头像 发表于 02-20 10:53 1568次阅读
    在i.MX RT处理器上使用PXP实现<b class='flag-5'>缩放</b>和旋转组合操作

    增加通道信号的时候,ADS1298的转换数据的速度变慢,这是为什么?

    在我增加通道信号的时候,发现1298的转换数据的速度变慢,这是为什么?谁能帮帮我
    发表于 02-13 08:16