0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

如何加速HBM仿真迭代优化?

jf_pJlTbmA9 来源:Cadence楷登PCB及封装资源中 作者:Cadence楷登PCB及封装 2023-11-29 16:13 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

首发IEDN电子技术设计

近年来随着高性能计算需求的持续增长,HBM(High Bandwidth Memory,高带宽存储器)总线接口被应用到越来越多的芯片产品中,然而HBM的layout实现完全不同于传统的Package/PCB设计,其基于2.5D interposer的设计中,由于interposer各层厚度非常薄且信号线细,使得直流损耗、容性负载、容性/感性耦合等问题严重,给串扰和插损指标带来了非常大的挑战。

为应对这些挑战,传统上可以通过参数化建模进行大量例子扫描迭代仿真,来确定合适的方案。但由于HBM设计方案可变化的方式非常多,使得扫描仿真的工作量很大,同时大量的扫描仿真也对仿真计算资源和产品交付时间造成了很大的压力。

本篇文章将针对上述HBM设计挑战和传统仿真流程上的问题,提出相应的解决方案。

HBM仿真实例

HBM仿真设计的关键在于,确定合适的interposer出线类型。HBM的出线类型仿真确认流程在行业里有两种方式:

1)前仿真确认,即仿真工程师创建参数化的HBM出线类型仿真,通过仿真确认最佳出线类型,并反馈给layout工程师实现。相对来说效率较高,可尝试大量的出线类型进而选择更好的。这是一种主流的方式。

2)后仿真确认,即layout工程师做多种不同的设计用于仿真。相对来说效率较低,可尝试的出线类型数量有限,难以获得最佳值。本文将不做讨论。

wKgZomVdhHeARiXHAAA5EnHFx_8203.png

图1 HBM出线类型截面

上图1是4种简化的HBM出线类型截面示意图,这个设计方案中有5层金属层,其中褐色为信号,绿色为GND。从这4种出线类型中可以看到,信号和GND分布的位置是不同的,对应的性能也会有所不同。这些位置信息可以定义为变量信息,而位置的变化就是变量的取值,因此,需要进行扫描仿真来判断最佳位置。HBM的出线类型相关的变量可达十几种,比如:信号金属宽度/厚度、GND金属宽度、相对位置、介质厚度、纵向GND处理方式等。各种变量在不同的取值组合下,相应地、迭代的case数量会达到几百种甚至更多,这需要在前仿真中完成。因此,传统方法上获得一个较好的出线类型有很大工作量和仿真时间需求。

如何在有限的时间内,在仿真少数case的情况下,就找到较好的答案?

Cadence Optimality Intelligent System Explorer的AI算法在下图2的HBM仿真设计流程中替代了传统的遍历扫描,实现了AI智能参数化判别扫描,来加速迭代结果收敛。应用AI算法使得计算几十个例子所得的结果就能达到传统数百个参数化仿真迭代的效果。

wKgaomVdhHqAV7hQAACYuyq05RM708.png

图2 HBM仿真设计流程图

根据用户计划仿真的HBM出线类型和对应的变量,将其在Cadence Clarity 3D Workbench中创建出HBM 3D结构图,如下图3。注意:所有需要参与参数化仿真的结构都要定义为变量,比如:金属线宽度。

wKgZomVdhHyAT_eSAAWG2PZqNkc301.png

图3 HBM 3D结构

完成HBM 3D结构设计、仿真端口频率等设置后,在Optimality Explorer界面中勾选相关参与扫描的变量,并对变量取值范围进行定义。变量取值类型支持连接值、离散值、数组三种类型,如下图4。离散和数组类型是因为在生产中有些结构只有固定几种选项可以选择,比如:介质厚度、金属厚度。

wKgaomVdhIKAWs0KAABJli1dXp8097.png

图4参数扫描定义

完成变量参数定义后,接着定义相应端口的插损、串扰相关表达式及收敛目标函数,如下图5,以便用于AI仿真收敛。

wKgZomVdhIOAQgfmAABEobHnJgM472.png

图5定义收敛目标函数

下图6为仿真结果收敛记录图表。从图表上可以看到第29次的时候已经获得非常好的值,这时用户就可以停止本次仿真或者先用第29次的结果作下一步的仿真。Optimality Explorer支持多case并行仿真,以进一步减少仿真时间。

wKgaomVdhIaACySXAAFle4Ao1tQ272.png

图6收敛纪录图表

将优化完成的HBM出线类型对应的S参数在时域里验证,如果能满足要求,则将对应的参数传递给interposer layout工程师,并根据这些参数完成最终的HBM设计。最终,设计好的HBM layout导入Clarity 3D Solver中再次提取模型,并加载到Cadence Sigrity Topology Explorer(TopXP)中进行最后的时域眼图仿真,如下图7。

wKgZomVdhIiAY0HlAAGbqb04_6c606.jpg

图7时域链路

总结

本例中应用了Cadence公司的Optimality Explorer优化,其内嵌AI算法,并与Clarity 3D Solver的参数化仿真结合,帮助用户快速收敛结果。Optimality Explorer具有极强的样本有效性,只需较少地迭代次数,即可得到一个较好的结果。内部AI优化算法通过基于目标函数的前期评估结果建立替代函数(概率模型),来找到最小化目标函数的值。该AI算法与传统随机或网格搜索的不同之处在于,它在尝试下一组超参数时,会参考前期的评估结果,因此可以省去很多无用功,最终达到快速收敛的效果。

本文转载自:Cadence楷登PCB及封装资源中心

审核编辑 黄宇

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 仿真
    +关注

    关注

    55

    文章

    4560

    浏览量

    138793
  • HBM
    HBM
    +关注

    关注

    2

    文章

    436

    浏览量

    15902
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    网格为王,仿真破界——Altair HyperMesh 重塑CAE工程设计新范式?

    的自动识别、网格的智能生成与优化,甚至能基于历史仿真数据进行预测性分析,帮助工程师提前规避设计风险,进一步缩短设计迭代周期。同时,结合GPU加速技术,实现大规模复杂系统的快速
    发表于 04-23 14:47

    智造引擎,仿真之巅:Altair HyperWorks 重塑工程研发新格局?

    设计环节,形成 “仿真 - 优化 - 设计” 闭环,加速创新落地。4. AI 驱动仿真:颠覆传统,效率提升千倍最新 HyperWorks 2026 深度融合几何深度学习、GPU
    发表于 04-03 14:45

    Altair Radioss:瞬态动力学仿真专家?

    的标杆求解器,以高可扩展性、高精度、高鲁棒性为核心支柱,构建了覆盖多物理场、全材料体系、全行业场景的仿真能力,成为全球超 1000 家企业(汽车行业占比 40%)验证结构安全、驱动设计优化的首选工具。一
    发表于 03-27 14:13

    Altair OptiStruct:重构结构研发逻辑,引领工业仿真优化新纪元

    落地应用;支持并行计算与高性能计算集群,大幅提升大规模模型、多工况优化的求解速度,让工程师从漫长的仿真等待中解放,将更多精力投入设计创新与方案迭代。二、全行业赋能,深耕高端制造,助力产品核心竞争力升级
    发表于 03-20 10:25

    Altair CFD 以技术赋能工程创新?

    (Altair® ultraFluidX®)原生GPU加速,可超高速完成车辆、建筑空气动力学仿真,一夜即可完成一轮高瞬态仿真迭代。2. 全类型仿真
    发表于 02-28 14:47

    存储迭代暗涌:HBM4与UFS4.1浪潮下,烧录环节何以成为新瓶颈?

    存储芯片市场扩产繁荣,HBM4、UFS4.1等先进技术加速量产,但被低估的烧录环节成关键瓶颈。先进存储对烧录的速度、精度和协议复杂度提出极高要求,面临三重技术关卡。需专用烧录方案突破瓶颈,其是国产存储跨越量产“最后一公里”的关键。当前存储周期启动,烧录设备可靠性决定先进芯
    的头像 发表于 12-22 14:03 799次阅读

    HBM量价齐飞,UFS加速普及:存储狂飙下的“最后质检”攻坚战

    HBM 量价齐飞、UFS 4.1 普及推动存储技术狂飙,却凸显烧录与测试这一 “最后质检” 难题。高端存储性能竞赛(HBM4 带宽 2TB/s、UFS 4.1 读写 4.2GB/s)与产能成本博弈
    的头像 发表于 12-18 11:15 660次阅读

    JEDEC制定全新内存标准,将取代HBM

    电子发烧友网综合报道 随着人工智能算力需求的指数级爆发,数据中心对内存的性能、容量与成本平衡提出了前所未有的严苛要求。HBM凭借1024-bit甚至2048-bit的超高位宽,成为AI加速卡的核心
    的头像 发表于 12-17 09:29 2058次阅读

    AI大算力的存储技术, HBM 4E转向定制化

    电子发烧友网报道(文/黄晶晶)如今英伟达GPU迭代速度加快至每年一次,HBM存储速率如何跟上GPU发展节奏。越来越多的超大规模云厂商、GPU厂商开始转向定制化HBM。而HBM存储厂商以
    的头像 发表于 11-30 00:31 8962次阅读
    AI大算力的存储技术, <b class='flag-5'>HBM</b> 4E转向定制化

    基于 SRT4 的整数除法器的优化

    主要的除法运算优化方法是使用基本的SRT-4算法进行除法运算,以模拟SRT-64除法运算: 为了减少时钟周期并提高运算频率,极大基法是SRT算法中提出的一种方法。在该方法中,每次迭代的位数取决于所
    发表于 10-23 07:23

    人工智能+工业软件:智能仿真加速赋能产业变革

    在智能制造领域,工业仿真为数字孪生与智慧工厂建设提供核心支撑;在绿色可持续发展领域,仿真技术助力优化能源配置与碳排放减排方案;在人工智能与虚拟现实领域,仿真则为算法训练、沉浸式体验搭建
    的头像 发表于 10-09 14:16 572次阅读

    HBM技术在CowoS封装中的应用

    HBM通过使用3D堆叠技术,将多个DRAM(动态随机存取存储器)芯片堆叠在一起,并通过硅通孔(TSV,Through-Silicon Via)进行连接,从而实现高带宽和低功耗的特点。HBM的应用中,CowoS(Chip on Wafer on Substrate)封装技术
    的头像 发表于 09-22 10:47 2841次阅读

    【产品介绍】Altair MotionView支持多体仿真优化软件

    AltairMotionView支持多体仿真优化AltairMotionView革新了多体仿真、可视化和优化。与AltairMotionSolve相结合,可提高工程生产力并
    的头像 发表于 09-19 17:02 1092次阅读
    【产品介绍】Altair MotionView支持多体<b class='flag-5'>仿真</b>与<b class='flag-5'>优化</b>软件

    硬核加速,软硬协同!混合仿真赋能RISC-V芯片敏捷开发

    RISC-V开放指令集架构(ISA)正为芯片产业带来革命性机遇,其开源性与模块化特性助力企业实现定制化、差异化创新,显著加速产品迭代。随着RISC-V向高性能多核架构演进,软硬件协同验证复杂度急剧
    的头像 发表于 08-29 10:49 1294次阅读
    硬核<b class='flag-5'>加速</b>,软硬协同!混合<b class='flag-5'>仿真</b>赋能RISC-V芯片敏捷开发

    HBM应用在手机上,可行吗?

      电子发烧友网报道(文/梁浩斌)最近有不少关于HBM技术被应用到手机的消息,此前有消息称苹果会在20周年iPhone,也就是2027年推出使用HBM DRAM的iPhone手机,提高端侧AI能力
    的头像 发表于 07-13 06:09 7682次阅读