0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

实战演练:Calibre如何成为暴力堆机器之王

傅里叶的猫 来源:傅里叶的猫 2023-07-17 15:25 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

Siemens的Calibre是业内权威的版图验证软件,被各大Foundry厂广泛认可。用户可以直接在Virtuoso界面集成Calibre接口,调用版图验证结果数据,使用起来极为方便。

今天,我们就来聊聊这款软件。

版图验证是芯片设计中非常重要的一环,一共包括三个环节。

DRC(Design Rule Check):检查版图是否符合Foundry厂的制造工艺规则,确保芯片能被正确生产出来;

LVS(Layout Versus Schematic):版图工程师需要将画好的版图与原理图对比,确保两者所有连接保持一致;

寄生参数提取(Parasitic Extraction):将版图中的寄生参数提取出来,在Virtuoso中反馈结果,前端工程师会进行后仿验证,重新评估电路特性并进行修改,保证流片正确。

e1d20c7c-2436-11ee-962d-dac502259ad0.jpg

这三个环节分别由Calibre的DRC、LVS、PEX三种工具来完成。

e203bae2-2436-11ee-962d-dac502259ad0.png

Calibre任务典型特性

重内存,可拆分,适合暴力堆机器

e20f8552-2436-11ee-962d-dac502259ad0.png

Calibre任务有两大特性:

1、重内存需求,2T或4T的超大型内存机器都有可能登场

版图文件很大,需要处理的数据量非常大,但本身的逻辑判断并不复杂,所以通常不刚需高主频机型,但要求多核、大内存的机器。CPU与内存的比例通常能达到1:4或1:8,极端情况下这个比例会更高,2T或4T的超大型内存机器都有可能登场。

2、可拆分,无关联,适合暴力堆机器

我们在模拟这篇文里写过版图验证就像是一个“大家来找茬“的游戏。

在运行任务的时候,Calibre会把版图切分成相互没有逻辑关系的块状分区,这些分区之间彼此没有相关性,互不干扰,所以可以同时进行。

切得越细,同时检查的人更多,效率就越高。

e2222a4a-2436-11ee-962d-dac502259ad0.png

三体里的切法大家还记得吧,一字横切。

而芯片只能竖着切,可以十字切法。横切会影响到芯片层与层之间的连接关系。

e24d54c2-2436-11ee-962d-dac502259ad0.png

暴力堆机器也是有技术含量的

e2596f6e-2436-11ee-962d-dac502259ad0.png

1、 首先,要有光,你得有大内存的机器

我们的全球资源池可以根据用户需求在全球范围内调度海量云端异构资源。GPU、TPU、FPGA,要啥都有。

e2649c72-2436-11ee-962d-dac502259ad0.jpg

其中,FCC-B产品提供准动态资源池,拥有行业特需的大内存机型,具有较低的整体拥有成本。而且,可以扩展到FCC-E使用弹性资源。

总之,大内存的机器,没有问题。

那么,万一不是一直不够,是偶尔不够怎么办呢?

我们有一个小技巧,专门应用这种内存峰值场景。

Swap,交换分区,就是在内存不够的情况下,操作系统先把内存中暂时不用的数据,存到硬盘的交换空间,腾出内存来让别的程序运行。

比如跑一组Calibre任务需要10小时,其中9个小时的内存使用量都在200G左右,只有1个小时达到了260G。

e2863c38-2436-11ee-962d-dac502259ad0.png



如果选择256G内存的机型配置,任务必崩无疑。

但要是为了这1小时不到10G的内存溢出而全程使用512G的配置,成本翻倍,未免有点太不划算了。

使用Swap交换分区就可以无缝填补这一空缺,非常匹配这种内存峰值场景。


2、 怎么把这些机器组队管理起来?

有了机器,下一步当然是要把它们利用起来。

Calibre默认支持单机多核并行跑任务,这意味着只要机器足够大,就可以同时处理很多任务。

但是,当你的大机器不够多,或者根本拿不到大机器的时候,就很苦恼了。

我们的方法是:将所有机器组成一个集群——多机多核的方式同时跑多个任务。

集群自动化管理,少量大机器需要,大量小机器就更需要了。

为啥?

理由一,能方便地自动化运维整个集群

比如软件安装配置、资源监控、集群管理等工作,是需要IT一台台机器去逐一手动操作,还是鼠标点几下就可以完成?

理由二,能快速方便地分配业务,提高资源利用率

比如,临时需要将一批机器从团队A划拨给团队B使用,有没有什么办法可以让IT快速方便地进行配置?

比如,因为资源使用的不透明和缺乏有序管理,会出现不同人对同一资源的争抢,任务排队等现象。同时,你会发现资源利用率还是不高。

3、怎么让机器自动化干活,不用人操心?

自动化干活可太有必要了。

否则,那么多任务,那么多机器,需要多少双手和眼睛才能忙得过来?

来,我们给你“手”和“眼睛”。

首先是我们的“手”——Auto-Scale功能。

来看一下本地手动跑任务与Auto-Scale自动化跑任务的区别:

e30cc2ee-2436-11ee-962d-dac502259ad0.png

基于我们自主研发的调度器——Fsched,Auto-Scale自动伸缩功能自动化创建集群,自动监控用户提交的任务数量和资源需求,动态按需地开启与关闭所需算力资源,做到分钟级弹性伸缩,在提升效率的同时有效降低成本。

有了“手”干活,还得有“眼睛”盯着防止出错。

我们能多维度监控任务状态,提供基于EDA任务层的监控、告警、数据统计分析功能与服务。

e332752a-2436-11ee-962d-dac502259ad0.jpg

你看,不仅可以自动化跑任务,还能时刻帮你盯着任务是否出错。

e203bae2-2436-11ee-962d-dac502259ad0.png

来,我们小暴力一下

e20f8552-2436-11ee-962d-dac502259ad0.png

先说结论:

我们在单台大机器和多台小机器组合场景下分别跑了同一组Calibre任务。

单台大机器场景下,随着核数的增加,任务耗时呈现明显的线性下降关系,整体性能曲线非常贴近基准线(单机核数有上限,本次实证中,我们使用的最大单机为128核,并根据32核、64核、128核的耗时规律预估了256核单机的耗时数据,仅供参考)。

多台小机器组合场景下,随着机器数量的翻倍,任务耗时同样线性下降,但在后期倍数关系上有所损耗,多机性能曲线略低于基准线和单机性能曲线。

e3703cb6-2436-11ee-962d-dac502259ad0.png

实证过程:

1、使用fastone云平台调度32核、64核、128核单机分别运行一组Calibre任务,耗时分别为14小时57分49秒、7小时30分28秒、3小时50分11秒;

2、按上条实证数据,预估使用fastone云平台调度256核单机运行一组Calibre任务的耗时为1小时58分6秒;

3、使用fastone云平台调度2、4、8台32核机器分别运行一组Calibre任务,耗时分别7小时43分51秒、4小时6分14秒、2小时15分34秒。

e24d54c2-2436-11ee-962d-dac502259ad0.png

还有大家关心的Intel第四代机器

我们也搞来跑了一下

e2596f6e-2436-11ee-962d-dac502259ad0.png

在上一节中,我们使用的均为第三代英特尔至强可扩展处理器,而在2023年1月11日,英特尔正式推出了第四代至强可扩展处理器。

我们立马搞来跑了一遍,为了对比参照,我们还拉上了第二代和第三代,并且把核数都按比例换算为48核。

实证过程:

1、使用fastone云平台调度48核第二代英特尔处理器运行一组Calibre任务,耗时10小时46分26秒;

2、使用fastone云平台调度48核第三代英特尔处理器运行一组Calibre任务,耗时9小时56分13秒,相比第二代提升7.77%;

3、使用fastone云平台调度48核第四代英特尔处理器运行一组Calibre任务,耗时8小时18分43秒,相比第三代提升16.35%,比第二代提升22.85%。

e3c6cc98-2436-11ee-962d-dac502259ad0.png

可以看到每一代都有提升,且型号越新,提升幅度越大,三代比二代提升了7.77%,四代比三代提升了16.35%。

而在价格上,目前四代和三代的类似机型换算一下,几乎是相同的。

e203bae2-2436-11ee-962d-dac502259ad0.png

实证小结

e20f8552-2436-11ee-962d-dac502259ad0.png

1、Calibre DRC/LVS/PEX不刚需高主频机型,但要求多核、大内存的机器,任务可拆分,适合暴力堆机器;

2、fastone云平台的全球动态资源池、集群自动化管理能力、自动化跑任务并监控告警的功能可完美匹配Calibre的需求;

3、随着计算资源的提升,Calibre的任务耗时呈现明显的线性关系,其中单机整体性能曲线非常贴近基准线,多机效果后期会略有折损;

4、最新型号的处理器可以大幅提升Calibre的效率,可根据项目周期与实际预算综合考量机型配置。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • cpu
    cpu
    +关注

    关注

    68

    文章

    11216

    浏览量

    222897
  • 芯片设计
    +关注

    关注

    15

    文章

    1128

    浏览量

    56437
  • Calibre
    +关注

    关注

    0

    文章

    19

    浏览量

    10067

原文标题:实战演练:Calibre如何成为暴力堆机器之王

文章出处:【微信号:傅里叶的猫,微信公众号:傅里叶的猫】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    基于迅为RK3588开发板实现高性能机器狗主控解决方案- AI能力实战:YOLOv5目标检测例程

    基于迅为RK3588开发板实现高性能机器狗主控解决方案- AI能力实战:YOLOv5目标检测例程
    的头像 发表于 11-28 11:32 820次阅读
    基于迅为RK3588开发板实现高性能<b class='flag-5'>机器</b>狗主控解决方案- AI能力<b class='flag-5'>实战</b>:YOLOv5目标检测例程

    Air8000 模块 CAN 接口实战开发:从入门到配置的完整流程指南

    在工业通信与物联网应用中,CAN 总线以其高可靠性和实时性成为关键通信方式。Air8000 模块集成 CAN 接口后,为设备互联提供了强大支持。本文将带你进行一次完整的实战演练,系统解析
    的头像 发表于 10-29 14:05 259次阅读
    Air8000 模块 CAN 接口<b class='flag-5'>实战</b>开发:从入门到配置的完整流程指南

    PKDV5351高压差分探头在氢燃料电池电压均衡监测中的实战应用案例

    一、项目背景与核心挑战 在新一代氢燃料电池汽车的研发过程中,某新能源企业遭遇了氢燃料电池电压监测的关键难题。该氢燃料电池由200节单体电池串联而成,工作电压峰值高达3500V。为了精准把控电压
    的头像 发表于 10-09 13:40 245次阅读
    PKDV5351高压差分探头在氢燃料电池<b class='flag-5'>堆</b>电压均衡监测中的<b class='flag-5'>实战</b>应用案例

    提升辐射发射整改能力——为现代工程师量身定制的线上实战特训营

    面临的一个大挑战。为了帮助电子工程师提高辐射发射整改能力,赛盛技术推出了针对性的辐射发射整改特训营。通过系统的课程内容、实战演练与专家指导,旨在帮助学员掌握解决辐射
    的头像 发表于 09-10 11:47 364次阅读
    提升辐射发射整改能力——为现代工程师量身定制的线上<b class='flag-5'>实战</b>特训营

    仁懋MOS:暴力风扇高效运转的幕后功臣

    暴力风扇的世界里,每一次强劲风力的输出,都离不开众多精密器件的协同工作。而仁懋电子的MOSFET(金属氧化物半导体场效应晶体管),凭借其出色的性能,成为暴力风扇产品的关键选择。下面,就为大家带来
    的头像 发表于 07-24 17:43 680次阅读
    仁懋MOS:<b class='flag-5'>暴力</b>风扇高效运转的幕后功臣

    Ansible代码上线项目实战案例

    在DevOps浪潮中,自动化部署已经成为每个运维工程师的必备技能。今天我将分享一个完整的Ansible代码上线项目实战案例,让你的部署效率提升10倍!
    的头像 发表于 07-24 14:03 367次阅读

    中海达创新产品助力水文应急监测演练

    近日,松辽委水文局(信息中心)开展2025年度水文应急监测演练,旨在通过演练提高应急组织指挥和各部门协调配合能力,进一步完善应急监测体系,提升整体水文应急监测能力,为处置突发洪水事件提供有力的水文技术支撑。
    的头像 发表于 06-26 15:55 680次阅读

    森林防灭实战告捷!卓翼智能长白山首演“空天地一体”集群灭火

    近日,吉林省应急管理厅在长白山林区组织开展森林草原防灭火实战综合演练,此次演练旨在检验无人机在复杂地形下森林草原防灭火实战效能,切实提升复杂地形下森林火灾“打早、打小、打了”能力,响应
    的头像 发表于 06-23 09:15 782次阅读
    森林防灭<b class='flag-5'>实战</b>告捷!卓翼智能长白山首演“空天地一体”集群灭火

    实战演练:使用相机气密性检测仪进行防水测试

    在摄影领域,尤其是进行户外摄影,不少摄影师会在恶劣环境下使用相机,这就对相机的防水性能有了要求。而相机气密性检测就是判断相机防水性能的重要途径,下面我们就来一次使用相机气密性检测仪进行防水测试的实战
    的头像 发表于 05-30 11:04 396次阅读
    <b class='flag-5'>实战</b><b class='flag-5'>演练</b>:使用相机气密性检测仪进行防水测试

    从户外弱网到指挥大屏 | 千视P3+D350护航防汛演练全程直播

    2025年4月15日,福清市开展了一场覆盖城区、山区、沿海三地的防汛防台风应急响应演练,模拟台风引发极端天气下的内涝、山洪及海堤险情等场景。此次演练由福清市人民政府防汛抗旱指挥部主办,旨在通过实战
    的头像 发表于 05-26 16:32 721次阅读
    从户外弱网到指挥大屏 | 千视P3+D350护航防汛<b class='flag-5'>演练</b>全程直播

    笙泉高转速暴力风扇控制方案(MDF101A)登场

    本帖最后由 noctor 于 2025-5-21 10:32 编辑 笙泉高转速\"暴力风扇\"控制方案(MDF101A)登场 手持暴力风扇需求稳定成长 随着全球气温
    发表于 05-20 15:32

    无刷暴力风扇方案,转速与静音的完美平衡

    高转速、强风力和低噪音,使暴力风扇迅速成为市场上的热门产品。今天来跟大家分享其利天下技术的130000rpm无刷暴力风扇驱动方案。一、方案设计亮点:高性能与便携性的完美结合主控芯片:采用高性能32位
    的头像 发表于 04-22 18:07 1518次阅读
    无刷<b class='flag-5'>暴力</b>风扇方案,转速与静音的完美平衡

    使用MCUXpresso for VS Code插件开发Zephyr的hello world

    本期来到Zephyr实战经验演练,小编带着大家一起使用MCUXpresso for VS Code插件来开发一个属于Zephyr的hello world。
    的头像 发表于 01-03 09:21 1780次阅读
    使用MCUXpresso for VS Code插件开发Zephyr的hello world

    基于PY32MD310单片机开发的11万转强力涡轮暴力风扇方案介绍

    今天给大家介绍下我们的11万转高速暴力风扇方案,搭载了11万转高性能无刷电机、采用独特旋钮设计产出更大风力。暴力风扇在日常生活中有着很好的应用。可以用做一些电子产品清灰,宠物毛发吹干,除尘助燃等
    的头像 发表于 01-02 17:52 1575次阅读

    暴力风扇方案:高转速强劲风力无刷风扇方案

    在当今科技高速发展的时代,电子设备的性能不断提升,散热问题也日益成为关注的焦点。而 13w 高转速暴力风扇方案的出现,为解决各种设备的散热难题提供了强大的技术支持。 一、高转速暴力风扇的重要性 随着
    的头像 发表于 12-30 17:48 3148次阅读