0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

推荐一个Joules里十分好用的小功能—Xreplay.Joules

陌上风骑驴看IC 来源:陌上风骑驴看IC 作者:陌上风骑驴 2022-11-25 17:44 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

胖友们大家好,太久不见,大家都还好吗?发量减少了多少?脂肪堆积了多少?核酸码绿着吗?股票红着吗?

大部分驴友都深陷在口罩围起的囹圄之中,辗转徘徊无可奈何却又不得不逆来顺受,接受这时代落下的粒粒灰尘,背负着转圈或是前行。遥想三年之前,我们踏海攀山远渡重洋去欣赏历史遗留的美好跟自然赠予的壮阔,跟陌生人聚在一起喝酒聊天畅想无尽的未来。

如今,核酸码禁锢了一切,“病毒”扰乱了一切的秩序,每个人都成了“饿汉”只能顾着眼前,似乎今天的码还绿着就已是最大的幸运跟恩赐,连回家探亲这么理所应当的事都成了大逆不道贪得无厌,得谢深刻严肃真诚的谢!

30a191ac-6c99-11ed-8abf-dac502259ad0.png

闲篇儿扯完,回到今天的主体,给大家推荐一个Joules 里十分好用的小功能—— Xreplay. Joules 诞生于2015 年诞生之初是奔着RTL 功耗去的,而驱动RTL 功耗分析变得重要的原因是AI / GPGPU / 5G 这类运算量巨大的设计的兴起。也是因为这类设计,使得动态功耗优化成了继timing, leakage, Congestion 之后需要从综合开始考虑并优化的另一个对象,而实现工具优化动态功耗需要有精确且场景典型的波形文件予以驱动,如何得到典型场景的波形需要架构师跟设计师根据设计真实应用场景确定,如何得到精确的波形则需要借助于EDA 工具。

30f5c60a-6c99-11ed-8abf-dac502259ad0.png

设计团队会提供给实现团队RTL 跟RTL 对应的仿真波形,而RTL 仿真波形中只有 “state points” 的信息<所谓state point 包括时序逻辑输出、primary input, primary output>,从综合到PR 的每一步,设计的逻辑都会发生变化,包括时序逻辑跟组合逻辑,如果每优化一步就拿去做后仿得到一个精确的波形再接着优化显然不现实,所以这部分工作必须由工具自己去完成。在最早期,实现工具会用自己的算法去推导每一个逻辑节点的toggle 信息,而为了runtime 实现工具内部toggle rate 的推导算法都相对简单,精度也差强人意,不精确的toggle 信息一定会误导工具的优化方向。因此Joules 的Xreplay 功能应求而生。

312b5324-6c99-11ed-8abf-dac502259ad0.png

Xreplay 的思路非常简单,Joules 从RTL 波形里得到state points 的toggle 信息,有了state points 的信息,Joules 调用仿真器Xcelium 对剩余没有标上的逻辑做仿真,因为state points 将整个设计切分成了一个个的逻辑锥,使得仿真“区域” 变得很小,所以使得Xreplay 的仿真比对整个网标做门级仿真的时间短得多,更关键的是Xreplay 是直接集成在Genus 跟Innovus 中的,只需要在Genus 跟Innovus 中配置参数就可以,数据的交互工具会独立完成,这样就避免了flow 的中断。

315c4772-6c99-11ed-8abf-dac502259ad0.png

Xreplay 使用也非常简单,需要的输入文件有:

library 仿真模型:所有用到的std cell的仿真模型,如果是pg netlist 用带pg 的仿真模型,否则用不带pg 的仿真模型。不需要memory 跟hard macro的仿真模型,因为Xreplay 不需要跨memory 跟hard macro 仿真。

netlist:被仿真的netlist, Joules支持对GTECH netlist 跟mapped Gate netlist.

RTL 仿真波形:Joules 需要从RTL波形中抓取state point 的波形信息,对于没有反标上的primary input joules 会根据default toggle或user 指定的toggle 去仿真,对于没标上的寄存器工具会根据寄存器的输入去仿其输出的toggle.

mapping file: RTL2gate 的mapping file, 如果是对综合的netlist 做Xreplay 直接用Genus 写出的mapping file 就可以,如果是对PR 之后的netlist 做Xreplay 则需要将综合跟PR 的mapping file 做个合并,在Joules 21.15 之后的版本直接用merge_mapping_file 这个命令去merge 就可以。Joules 可以自动做stim mapping 但因为stim_auto_mapping 无法得知phaseinversion 的信息,所以仍需要mapping file。

SDC:Joules 需要从SDC 中得到clock 的信息。

SDF / SPEF:Xreplay 支持Zero-delay 跟delay 的仿真,如果要做delay 模式的仿真需要读入SDF 或SPEF。

31848700-6c99-11ed-8abf-dac502259ad0.png

Xreplay 输出的波形是VCD, 从Joules 21.16 开始也可以直接输出FSDB 波形。VCD 波形跟FSDB 波形会有一点区别,VCD 波形里会save zero delay glitch toggle 而FSDB 波形里不会save 这部分信息。读回VCD 计算功耗时可以加option:-filter_zero_delay 将Zero delay glitch toggle 过滤掉。

What iszero delay glitch ? What is purpose to have this glitch in this waveform?

LV >> Signalhaving two values at same time stamp. This is from race condition.

Did thisglitch is added by Joules when doing replay? How can Joules do it? it do nothave delay information and we did the zero_delay simulation when replay, whythis zero delay will be invoked?LV>>No this is not added by Joules, Joules run simulation based on input stim andnetlist, Joules follows the input waveform unless directed to do otherwise.

Andthese zero_delay information can only be recognized by Cadence tool, Synopsystool will auto filter these glitch.

LV>> Thisis waveform and not tool specific. There are no zero-delay glitches in FSDB.

Whyjoules include this zero_delay glitch by default? which is difficult forcustomer to debug the difference between different power calculation tool?

LV>> Defaultis changed from 22.x. By default Joules will filter zero-delay glitches.

Xreplay 的流程非常简单,包括两部分,第一部分配置Xcelium 相关参数,第二部分执行Xreplay。

31b1988a-6c99-11ed-8abf-dac502259ad0.png

32005d30-6c99-11ed-8abf-dac502259ad0.png

说一千道一万,工程上的事还是得用数据说话,Xreplay 的精度如何呢?这里有一组Xreplay 后的波形跟后仿真波形读到Joules 或第三方工具中功耗计算的数据对比。

Xreplay gate level stim Power correlation
case1 379.7mW 379.4mW -0.08%
case2 42.98mW 42.8mW -0.42%
case3 159.06mW 159.35mW 0.18%
case4 212.8mW 214.04mW 0.58%
case5 147.4mW 149.9mW 1.6%

Joules Xrelay 做的事情其实很简单就是根据已有的RTL 波形通过仿真的手段得到Gate level 波形, 而有了Gate level 波形就可以去做:

更精确的功耗优化

在设计早期去分析Glitch power

在设计早期做PI 分析






审核编辑:刘清


声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • VCD
    VCD
    +关注

    关注

    0

    文章

    37

    浏览量

    35819
  • RTL
    RTL
    +关注

    关注

    1

    文章

    393

    浏览量

    62379

原文标题:Joules Xreplay

文章出处:【微信号:MoShangFengQiLv,微信公众号:陌上风骑驴看IC】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    【「高速数字设计(基础篇)」阅读体验】 + 书籍评测第

    本帖最后由 jf_45494258 于 2025-11-9 11:02 编辑 很开心第次参加电子发烧友举办的书籍测评活动,十分感谢!说小插曲,书籍已经到了好久,我还以为十一
    发表于 11-09 10:31

    STM32CubeProgrammer怎么才能在cubeprogrammer上实现部分升级?

    目前我使用STM32CubeProgrammer在STM32mp157上实现系统升级,但是每次都是完全的系统升级,包括BOOT分区,vendorFS分区,rootFS分区,userFS分区等等,十分
    发表于 08-11 07:49

    HarmonyOS实战:Tab顶部滑动悬停功能实现

    日常开发过程中,遇到这种 Scroll 嵌套 List 列表滑动顶部悬停的场景十分常见,在鸿蒙开发时也正好实现了这个功能,本篇文章将带你步步实现 Tab 顶部悬停的效果,建议点赞收藏!
    的头像 发表于 06-24 17:07 282次阅读

    HarmonyOS实战:3秒实现自定义轮播图

    那么简单,需要考虑的细节很多。不过在 HarmonyOS 中实现轮播图却是十分的简单,本篇文章教你在最短的时间内快速实现自定义的 轮
    的头像 发表于 06-24 17:06 388次阅读

    树莓派复古游戏,你会选哪一个

    复古游戏与树莓派单板计算机的组合十分常见。在树莓派项目列表中,几乎都会包含至少复古游戏项目。复古游戏发行版让在树莓派上开启复古游戏之旅变得轻而易举,其中Batocera和RetroPie是两
    的头像 发表于 06-16 16:56 812次阅读
    树莓派复古游戏,你会选哪<b class='flag-5'>一个</b>?

    的高效连接:12 孔航空插头的多线路集成优势

    而且,其安装与维护也十分便捷。标准化接口设计,让安装人员能快速完成插头连接。在设备维护时,清晰的线路标识与易于操作的结构,方便技术人员排查、更换故障线路,减少停机时间,降低维护成本。
    的头像 发表于 06-10 11:50 334次阅读
    以<b class='flag-5'>一</b>抵<b class='flag-5'>十</b>的高效连接:12 孔航空插头的多线路集成优势

    HarmonyOS实战:高德地图定位功能完整流程详解

    前言 地图定位功能相信很多人都用过,在鸿蒙的应用程序开发中,使用高德地图的定位功能变得十分常见,那么在鸿蒙中次完整的地位功能怎么实现?如果
    的头像 发表于 06-09 15:23 866次阅读

    超级新品!中广欧特斯热泵地暖空调体机,好用种“境界”

    享清凉,严寒添温暖新国标冷暖四“超级”制冷制热能效更高,使用更省电搭载重降噪黑科技运行噪声再降10%、直降3~5dB(A)超长质保,年整机免费包修让用户尊
    的头像 发表于 05-08 11:39 611次阅读
    超级新品!中广欧特斯热泵地暖空调<b class='flag-5'>一</b>体机,<b class='flag-5'>好用</b>是<b class='flag-5'>一</b>种“境界”

    NAT网关(网段隔离器)有什么功能?哪个品牌好用

    实现多个设备共享公网IP地址的目的。同时,NAT网关还提供了定的安全性,通过隐藏内部网络的结构,降低了被外部攻击的风险。 在工业领域中,对于需要高性能、高安全性的实时访问要求会更高,对于NAT网关的要求也就越高。因此选择
    的头像 发表于 02-19 17:14 1068次阅读
    NAT网关(网段隔离器)有什么<b class='flag-5'>功能</b>?哪个品牌<b class='flag-5'>好用</b>?

    调试TVP7002(VGA接口)芯片,十分烫手是怎么回事?

    最近在调试TVP7002(VGA接口)芯片,发现7002裸板在室温下正常工作时的芯片温度为60度,十分烫手,查了下电源好像也没什么异常,希望哪位有用的高手指点下调试方向。
    发表于 02-08 07:30

    光谱仪的作用和功能

    光谱仪是种用于分析和测量光的性质和特征的科学仪器,其作用和功能十分广泛,具体如下:
    的头像 发表于 01-28 14:03 4013次阅读

    堰新批智慧路灯投用,集多种功能身 智慧路灯案例分享

    堰新批智慧路灯投用,集多种功能身 智慧路灯案例分享
    的头像 发表于 01-03 10:39 574次阅读
    <b class='flag-5'>十</b>堰新<b class='flag-5'>一</b>批智慧路灯投用,集多种<b class='flag-5'>功能</b>于<b class='flag-5'>一</b>身 智慧路灯案例分享

    有内部模式让ADS8363面有两AD,能AD工作在全差工作在伪差吗?

    PDE位只能控制工作2 x 2 fully-differential和4 x 2 pseudo-differential。 有内部模式让ADS8363面有两AD,能AD工作在
    发表于 01-02 07:57

    hdmi是什么电平?hdmi信号有几对差还有几个单端的,差的信号是不是cml电平?

    出来的cml信号在还原成hdmi信号,接到显示器上。现在有几个问题: 1,hdmi是什么电平?第次接触,hdmi信号有几对差还有几个单端的,差的信号是不是cml电平? 2,如果
    发表于 12-24 06:34

    智多晶EDA工具HqFpga软件实用小功能

    智多晶EDA工具HqFpga软件实用小功能增加啦,支持生成可调用网表的功能和ballmap功能。下面来给大家讲解下如何通过HqFpga软件生成可调用的网表文件以及ballmap
    的头像 发表于 12-05 10:23 1839次阅读
    智多晶EDA工具HqFpga软件实用<b class='flag-5'>小功能</b>