0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

DRAM设计中的散热问题

要长高 来源:semiengineering 作者: KAREN HEYMAN 2022-06-14 17:13 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

DRAM 世界中,散热问题正处于危机点。在 14nm 及以下,在最先进的封装方案中,可能需要一个全新的指标来解决热密度如何越来越多地将小问题变成大问题的乘数效应。

一些过热的晶体管可能不会对可靠性产生很大影响,但数十亿个晶体管产生的热量会影响可靠性。对于 AI/ML/DL 设计尤其如此,高利用率会增加散热,但热密度会影响每个先进的节点芯片和封装,这些芯片和封装用于智能手机、服务器芯片、AR/VR 和许多其他高-性能设备。对于所有这些,DRAM布局和性能现在是首要的设计考虑因素。

Nantero 的首席系统架构师、《The JEDEC DDR5 NVRAM 规范。“从 90° 到 95°C,它开始恐慌。超过 95°C,您将开始丢失数据,因此您最好开始关闭系统。”

Gervasi 说,这些数字基于 14nm 技术。他预计先进节点和先进封装的情况会更糟。“当你缩小到 10nm、7nm、5nm 或 3nm 时,会发生什么?你的联系失控了。你让自己更容易受到串扰的影响,所以横锤开始变得更加危机。这是一个非常严重的问题。”

造成这种情况的主要原因之一是 DRAM 的基本设计。尽管 DRAM 接口的数量不断增加——无论是 DDR5、LPDDR5、GDDR6、HBM 还是其他接口——它们都保留了基本相似的结构。

“DRAM 芯片的核心基本上是一个连接到开关的非常小的电容器,” Cadence产品营销集团总监 Marc Greenberg 说。“要将数据写入该单元,您允许电流流入该电容器以从该单元读取数据。你能感觉到那个电容器上是否有电荷。”

不幸的是,这导致了一个众所周知的缺点。“存储在这些微型电容器上的电荷是相对少量的电荷,”格林伯格说。“当它变热时,它对泄漏非常敏感。”

无论架构多么新颖,大多数基于 DRAM 的内存仍面临因过热而导致性能下降的风险。易失性内存的刷新要求(作为标准指标,大约每 64 毫秒一次)加剧了风险。“当您将温度提高到 85°C 以上时,您需要更频繁地刷新电容器上的电荷,”格林伯格说。“因此,您将开始转向更频繁的刷新周期,以解释由于设备变得越来越热,电荷从这些电容器中泄漏得更快的事实。不幸的是,刷新该电荷的操作也是电流密集型操作,它会在 DRAM 内部产生热量。天气越热,你就越需要更新它,但你会继续让它变得更热,整个事情就会分崩离析。”

这是不归路。“如果一个 DRAM 由于热量/热量而发生故障,那么其他 DRAM 很可能也会发生故障,” Rambus的研究员和杰出发明家 Steven Woo 说。“原因是所有的 DRAM 通常都彼此靠近,所以如果温度很高,那么对所有 DRAM 都是危险的。即使使用强大的服务器内存系统,由于与热相关的故障而仅丢失几个 DRAM 也可能意味着整个系统出现故障。所以热量和热量对于内存系统来说是一个非常重要的问题。”

它不仅仅是服务器。一个芯片上大约有 80 亿个晶体管,手机会变得很热,可能需要在冰箱里呆上几分钟。发生这种情况时,应用程序将无法正常运行。

对于越来越密集的高级封装也是如此。Synopsys研究员Victor Moroz 说:“热量成为内存的一个问题,特别是在使用堆叠技术时,例如逻辑上的 SRAM 。” “当你这样做时,会产生影响,因为那是它从相邻逻辑中溢出热量的时候,这对内存来说是一件坏事——对于 SRAM 来说,不是那么多,但对于 DRAM 来说这是一件大事,因为这个刷新时间成倍地依赖于温度,因为它是一个结泄漏。当你把DRAM和逻辑放在同一个封装里,如果是高性能计算的逻辑,那么DRAM就会吃亏。你的刷新时间缩短了,你必须更频繁地刷新它。”

多年来,对耐热性的需求不断增加。“当我第一次加入公司时,0° 或负 40°C 可能是低端,而高端则为 100° 或 110°C,”Woo 说。“但如今,汽车行业需要一些最极端的温度保证。”

更高的温度会导致更高的刷新率,从而降低性能,尤其是在数据密集型应用程序中。“在某些情况下,如果温度接近可接受的工作范围的上限,系统可能会选择提高 DRAM 的刷新率,”他说。“DRAM 保留其数据的时间取决于温度,在更高的温度下,可能需要提高刷新率以确保数据不会丢失。更高的刷新率意味着我们正在占用 DRAM 的一些带宽,因此系统的性能可能会在更高的刷新率下受到影响。”

这必须融入设计。“例如,如果你正在设计一个 I/O 控制器,你就会有这个数据流被扔给你,你需要吸收它,”Gervasi 解释说。“在当今设计所有线卡的 DRAM 世界中,如果 DRAM 刷新 350 纳秒,则该内存处于离线状态。但数据流不会停止。这意味着您必须围绕缓冲数据设计整个架构 350 纳秒,然后才能再次开始清空该缓冲区。”

尝试调整刷新率会导致不愉快的权衡。“现在 5% 的系统性能专门用于保留您已经编写的内容,”Gervasi 说。“这是解决办法吗?显然是这样,因为如果人们想要在 85°C 以上运行,就必须这样做——放弃一些系统性能以获得数据完整性。”

内存选择很重要

为了应对这些担忧,半导体生态系统正在尝试多种解决方案,以最大限度地减少热问题并提高可靠性。是德科技内存解决方案项目经理 Randy White 指出,LPDDR 通过整合一种称为“温度补偿自刷新”的功能来解决刷新问题。 “当您需要刷新内存库时,芯片上有一个内置温度传感器。有一个查找表显示,“核心温度每升高 1 度,就需要按比例增加刷新周期的频率。” 同样,DDR5 DRAM 现在包括一个内部温度传感器。设计精确的片上温度传感器很困难,因此它的精度只有 +/-5°C。但总比没有好,这就是 DDR4 的存在。这至少有助于了解何时打开风扇,并大致说明气流设计的效果如何。”

在标准层面,JEDEC 一直在尝试可能的修复方案,Gervasi 说,“我们已经在 DRAM 内部设置了热跳闸点,并讨论了在下一代拥有后门访问端口的可能性,DRAM 可以在说,‘我这里太热了。你需要做点什么。要么减慢数据访问速度,要么加快风扇速度。‘”

格林伯格说,市场上已经流行的一种方法是在芯片中内置纠错功能。“在更先进的 DRAM 类型中,如 LPDDR5 和 DDR5 等密度非常高的类型,内存制造商正在实施片上纠错。当一个位由于其电荷泄漏而变得不可读时,DRAM 设备上的纠错电路能够通过将该位单元中应该存在的数据与它周围的其他位单元以及一些错误拼凑在一起来纠正该错误校正位,也包含在 DRAM 芯片中。”

这种技术使内存制造商能够提供扩展温度范围的 DRAM。许多方法都基于汉明码,这是一种可以追溯到打孔带时代的纠错方案,但仍有助于纠正一个错误并检测两个错误。更先进的方法也已进入市场。当然,没有人会透露他们的专有算法,但在之前的博客文章中,Synopsys 的高级技术营销经理 Vadhiraj Sankaranarayanan 对 DRAM 纠错进行了高级概述。

Cadence 和其他公司还为高可靠性应用提供了超出 ECC 现有功能的额外校正。

十多年来一直在取笑该行业的一项技术是微流体冷却。除了散热器、风扇或外部液体冷却等标准商用冷却元件外,学术实验室正在进行的实验正在将冷却直接整合到芯片中,这种方法称为集成微流体冷却,其中微流体通道被蚀刻到芯片中,允许冷却液流过它。

尽管这在理论上听起来像是一个近乎完美的解决方案,并且已被证明可以在实验室中工作,但Siemens Digital Industries Software的电子和半导体行业负责人 John Parry指出,它不太可能在商业生产中发挥作用。“从流体腐蚀到泄漏问题,您都遇到了各种问题,因为您正在处理极小、非常精细的物理几何形状。他们被抽了。我们通常发现与之相关的可靠性最低的功能之一是机电设备,例如风扇和泵,因此您最终会在许多不同的方向上变得复杂。”

不同的方法

Nantero 的 NRAM 是经过彻底重新思考并成功走出实验室的内存设计。它不是 DRAM,而是由碳纳米管制成的非易失性芯片,并且已经证明它可以承受极端的热条件。概念验证:Gervasi 指出,它在修复哈勃望远镜的航天飞机任务中在太空中进行了测试。

对于 JEDEC,Gervasi 正在开发允许 NRAM 芯片无缝插入 DRAM 的规范。但不管 NRAM 最终取得怎样的成功,他认为碳至少提供了一条摆脱热难题的方法。“碳纳米管是卷起的钻石。它们几乎是热分布。它们实际上将被部署,即使它们不将它们用作存储单元,因为这是进行热扩散和热分布的好方法。碳纳米管也被讨论用于印刷电路板布线或芯片布线,因为它在热分布方面非常完美。”

格林伯格说,无论选择何种芯片和其他组件,都必须在设计阶段左移并模拟热问题,而不是将它们视为以后可以修复的不便。“你一定要考虑事情会变得多热。这往往是事后的想法。人们只是假设要完成您必须做的计算工作,总有一个更大的散热器可以购买。那些制造电池供电设备、手机、平板电脑和手表的人关心的是功耗,而不是热量。可以采用许多模拟技术来改善功耗和改善散热状况。”

当然,生产前的模拟需要与生产后的物理分析相结合,特别是测试芯片并根据它们的性能对它们进行分类。“如果可以的话,你真的想建立一种设计,因为这可以让你获得规模经济,”Rambus 的 Woo 说。“然后你可能想根据不同的规格对其进行测试。测试流程是当你有机会说,‘这个设备实际上覆盖了非常广泛的范围,所以也许我们可以把它卖到汽车市场。

最后,如果更糟到绝对最坏,可以更改规范,但这对于某些用例(例如移动设备)可能是一场灾难。相比之下,允许大型数据中心中的芯片温度升高可能会带来令人惊讶的环境效益。至此,是德科技的 White 回忆说,一家公司曾要求 JEDEC 将工作温度的规格提高 5 度。对潜在节省的估计是惊人的。根据他们每年用于冷却的能源消耗量,他们计算出 5 度的变化可以转化为每年关闭三个燃煤电厂。JEDEC 最终在这个建议上妥协了。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • DRAM
    +关注

    关注

    40

    文章

    2373

    浏览量

    188153
  • 晶体管
    +关注

    关注

    78

    文章

    10250

    浏览量

    146259
  • NRAM
    +关注

    关注

    1

    文章

    12

    浏览量

    9807
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    电机定子与线圈绝缘散热的核心选择 | 氮化硼PI散热

    在电机运行过程,定子作为核心部件,其与线圈的绝缘性能和散热效率直接决定了电机的可靠性、使用寿命与运行效率。氮化硼PI散热膜凭借氮化硼(BN)优异的导热性能与聚酰亚胺(PI)卓越的绝缘特性,成为电机
    的头像 发表于 12-01 07:22 292次阅读
    电机定子与线圈绝缘<b class='flag-5'>散热</b>的核心选择 | 氮化硼PI<b class='flag-5'>散热</b>膜

    浮思特 | NMB散热风扇静音如何?卓越静音效果提升散热性能

    随着现代电子设备的不断发展,散热风扇在保证设备稳定运行方面的作用愈发重要。尤其是在高性能计算、工业设备及服务器等领域,如何在确保散热效果的同时降低噪音,成为了设计的关键问题。作为全球知名的
    的头像 发表于 11-06 14:15 192次阅读
    浮思特 | NMB<b class='flag-5'>散热</b>风扇静音如何?卓越静音效果提升<b class='flag-5'>散热</b>性能

    如何为特殊设备定制最佳散热方案?——CNC散热片定制指南

    在现代电子设备与工业应用散热效率直接影响设备的稳定性与寿命。散热片作为核心散热组件,其设计精度与性能表现至关重要。CNC(计算机数控)加工技术凭借高精度、高灵活性的优势,成为
    的头像 发表于 10-22 15:07 276次阅读

    通讯设备散热解决方案

    ,缩短使用寿命,甚至引发故障。因此,散热解决方案成为通讯设备设计与制造的关键环节。 散热的核心目的是将设备内部产生的热量有效地传递到外部环境,从而维持元件在安全温度范围内工作。常见
    的头像 发表于 09-16 15:07 488次阅读

    CNC散热器铝件加工:精密制造散热解决方案

    在电子设备、新能源汽车及工业控制领域,散热器的性能直接影响系统的稳定性与寿命。CNC(计算机数控)加工技术凭借其高精度、高效率的特点,成为散热器铝件制造的核心工艺。通过CNC加工,铝制散热器能够实现
    的头像 发表于 08-07 17:43 937次阅读

    利基DRAM市场趋势

    特征表现为标准程度高、市场规模庞大、下游应用集中、 周期性显著且技术迭代迅速。相比之下,利基DRAM与主流产品相比性能要求不那么严格,依赖成熟工艺技术。尽管市场规模较小,但它在满足汽车、通讯、工业应用、医疗设备等行业的多样化需求
    的头像 发表于 06-07 00:01 3981次阅读
    利基<b class='flag-5'>DRAM</b>市场趋势

    什么是散热器?为什么它在工业计算机很重要?

    我们将分解散热器的基本原理,并解释它们在保持系统稳定性方面的重要性,这些散热器采用先进的散热器技术设计,可在恶劣的环境实现较佳性能。散热
    的头像 发表于 05-23 13:10 1016次阅读
    什么是<b class='flag-5'>散热</b>器?为什么它在工业计算机<b class='flag-5'>中</b>很重要?

    智慧路灯如何解决散热问题

    引言         在智慧城市建设,叁仟智慧路灯作为关键一环,融合了照明、通信、环境监测等多种功能。然而,随着功能集成度的提升,散热问题成为影响其稳定运行与使用寿命的关键因素。高温不仅会导致
    的头像 发表于 03-30 10:30 601次阅读

    电脑的散热设计

    框或外壳,避免热点集中。 2. 热管(Heat Pipe)热管是电脑散热的核心组件之一,通过内部工质的相变循环高效传递热量。台式机CPU散热器和笔记本电脑均依赖热管将芯片热量快速传导至
    发表于 03-20 09:39

    DRAM基本单元最为通俗易懂的图文解说

    本文要点提示:           1. DRAM 的工作原理图文解说,包括读写以及存储;          2. 揭秘DRAM便宜但SRAM贵之谜。       内存应该是每个硬件工程师都绕不开
    的头像 发表于 03-04 14:45 1869次阅读
    <b class='flag-5'>DRAM</b>基本单元最为通俗易懂的图文解说

    电源模块的散热技术解析

    电源模块作为电子设备的核心组件,其性能和稳定性对整个系统的运行至关重要。然而,电源模块在工作过程中会产生大量的热量,如果不能有效地散热,会导致温度升高,从而影响模块的性能和寿命。因此,高效散热技术
    的头像 发表于 02-03 14:25 1590次阅读

    三星否认重新设计1b DRAM

    问题,在2024年底决定在改进现有1b nm工艺的同时,从头设计新版1b nm DRAM。 不过,三星通过相关媒体表示相关报道不准确。尽管三星否认了重新设计,但有业内人士透露,三星的目标是提升1b DRAM的性能和良率。据了解,三星启动了名为“D1b - p”的开发项目,
    的头像 发表于 01-23 10:04 1298次阅读

    三星重启1b nm DRAM设计,应对良率与性能挑战

    nm DRAM。 这一新版DRAM工艺项目被命名为D1B-P,其重点将放在提升能效和散热性能上。这一命名逻辑与三星此前推出的第六代V-NAND改进版制程V6P相似,显示出三星在半导体工艺研发上的持续创新与投入。 据了解,在决定
    的头像 发表于 01-22 14:04 1316次阅读

    散热片最新的自然界散热原理或先进的工程散热理念

    在当今科技飞速发展的时代,电子设备性能不断攀升,散热问题愈发成为制约设备稳定运行和性能发挥的关键因素。为满足这一迫切市场需求,我们投入大量科研力量,经过不懈努力与创新探索,成功研发出一款全新的散热
    的头像 发表于 12-18 09:48 1244次阅读
    <b class='flag-5'>散热</b>片最新的自然界<b class='flag-5'>散热</b>原理或先进的工程<b class='flag-5'>散热</b>理念

    DRAM的基本构造与工作原理

    本文介绍了动态随机存取器DRAM的基本结构与工作原理,以及其在器件缩小过程面临的挑战。 DRAM的历史背景与发展 动态随机存取器(Dynamic Random Access Memory,简称
    的头像 发表于 12-17 14:54 5203次阅读
    <b class='flag-5'>DRAM</b>的基本构造与工作原理