0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

PrimeSimSPICE:异构计算模型实现数量级性能突破

星星科技指导员 来源:synopsys 作者:Srinivas Kodiyalam, 2023-05-24 16:53 次阅读

作者:Srinivas Kodiyalam,Samad Parekh

随着对更高计算性能的需求不断增加,HPC 行业正朝着异构计算模型发展,其中 GPUCPU 协同工作以执行通用计算任务。在这种异构计算模型中,GPU 充当 CPU 的加速器,以减轻 CPU 的负载并提高计算效率。为了利用这种计算模型和大规模并行的GPU架构,需要重新设计应用软件。Synopsys 和 NVIDIA 的工程师一直在合作,使用 GPU 来加速电路仿真技术。

IC设计的复杂性继续呈指数级增长。就在过去十年中,随着工艺技术从平面技术发展到鳍式场效应晶体管技术,器件数量和寄生效应显著增加。现代工艺技术还需要对更多的工艺、电压和温度角落进行验证,导致设计复杂性增加几个数量级。在此期间,CPU 性能的提升在很大程度上趋于平稳,而 GPU 性能一直在增长,并继续远远超出摩尔定律。随着时间的推移,这些趋势只会进一步扩大两种计算方法之间的差距。GPU 在应对电路仿真挑战方面具有显著优势,包括大量的浮点运算和内存带宽使用,以及具有大型布局后电路的大量独立计算作业。

这是一个由一流的 SPICE 和 FastSPICE 技术组成的统一工作流程,可加速模拟射频、混合信号、定制数字和存储器设计的创建。PrimeSim Continuum解决方案建立在创新的SPICE和FastSPICE架构之上,为设计团队提供10倍的仿真速度,同时保持签核准确性。PrimeSim的下一代架构采用独特的GPU技术,可提供执行全面的模拟和RF设计分析所需的显著性能改进,同时满足签核精度要求。在 NVIDIA DGX 系統上運行的測試模型顯示,多核 CPU 的加速速度範圍為 4-12 倍。虽然各种电路类型的性能都有所提高,但在运行大型布局后仿真时,可以看到最好的改进。当与较长的瞬态运行时间相结合时,性能改进更加明显。

wKgZomRt01WAWI0DAAE_Mc_P7M4745.png

PrimeSim 通过利用 CUDA GPU 的大规模并行性实现了最令人印象深刻的性能提升。涉及的核心技术有:

异构 GPU 和 CPU 架构上的同步并行计算

鲁棒稀疏求解器,用于求解方程的电路仿真系统

准确高效的 IC 元件建模

紧凑高效的 GPU 数据模型和管理,以及

快速电路仿真数据库构建和数据处理

纳米级 IC 仿真的复杂性和爆炸式的模型尺寸需要多个具有极快互连的 GPU。NVIDIA DGX 系統和 HGX™ 平台整合了 NVIDIA GPU、NVIDIA NVLink®、NVIDIA Mellanox® InfiniBand® 網路的全部功能,以及完全優化的 NVIDIA® AI 和 HPC 軟體體閣,以提供最高的應用應用效能。

审核编辑:郭婷

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • cpu
    cpu
    +关注

    关注

    68

    文章

    10442

    浏览量

    206560
  • gpu
    gpu
    +关注

    关注

    27

    文章

    4417

    浏览量

    126702
  • HPC
    HPC
    +关注

    关注

    0

    文章

    279

    浏览量

    23418
收藏 人收藏

    评论

    相关推荐

    异构计算的前世今生

    异构计算已经成了半导体业界不得不思考的一个话题,传统通用计算性能捉襟见肘,过去承诺的每隔一段时间芯片性能翻倍的豪言壮语已经没有人再提了。如今我们用到的手机中,各种除CPU以外的
    的头像 发表于 12-17 09:35 3935次阅读

    【产品活动】阿里云GPU云服务器年付5折!阿里云异构计算助推行业发展!

    ,本周将会推出针对异构计算GPU实例GN5年付5折的优惠活动,希望能够打造良好的AI生态环境,帮助更多的人工智能企业以及项目顺利上云。随着深度学习对人工智能的巨大推动,深度学习所构建的多层神经网络模型
    发表于 12-26 11:22

    labview的采样率上限数量级是10^6吗?

    这意味着labview的采样率上限数量级是10^6吗?
    发表于 09-28 13:05

    请问AD9361跳频稳定时间是一个什么数量级

    我看AD9361的UG上面有关于RF DC OFFSET的矫正时间计算公式,但是还是不太清楚。请问当跳频范围超过100M时,RF DC offset 跟跳频范围相关的时间在一个什么数量级呢,AD9361在GHz跳频的时候总共需要的矫正时间是一个什么
    发表于 02-15 14:39

    异构计算在人工智能什么作用?

    异构计算(Heterogeneous Computing)是指使用不同类型指令集和体系架构的计算单元组成的计算系统。异构计算性能、成本和
    发表于 08-07 08:39

    什么是异构并行计算

    先了解什么是异构并行计算同构计算是使用相同类型指令集和体系架构的计算单元组成系统的计算方式。而异构计算
    发表于 07-19 08:27

    异构计算的前世今生

    算系统加速器/协处理器的应用趋势 / TOP5002020年以后,各国的超级计算机计划都定位在了Exascale的百亿亿级别,要想实现目标,要么靠堆核心规模来堆性能,要么就是选择异构计算
    发表于 12-26 08:00

    异构计算场景下构建可信执行环境

    异构计算场景下,如何构建可信执行环境呢?分布式机密计算是一种思路,将CPU上的技术应用到其他的XPU上是另一种思路,但最关键的问题是怎么用。该问题在AI安全上非常明显,AI模型都在GPU上,TEE想用
    发表于 08-15 17:35

    请问模型推理只用到了kpu吗?可以cpu,kpu,fft异构计算吗?

    请问模型推理只用到了kpu吗?可以cpu,kpu,fft异构计算吗?
    发表于 09-14 08:13

    异构计算芯片的机遇与挑战

    并行计算更高效率和低延迟的计算性能,尤其是业界对计算性能需求水涨船高的情况下,异构计算变得愈发重
    发表于 09-27 10:22 26次下载

    FPGA异构计算现状及优化

    基于FPGA的通用CNN加速设计,可以大大缩短FPGA开发周期,支持业务深度学习算法快速迭代;提供与GPU相媲美的计算性能,但拥有相较于GPU数量级的延时优势,为业务构建最强劲的实时AI服务能力
    发表于 11-15 11:44 8256次阅读
    FPGA<b class='flag-5'>异构计算</b>现状及优化

    异构计算的能效感知调度模型

    的精细表述及有效量化,建立面向协同异构计算且易于复用的能效感知云调度模型;另一方面,提出并实现适于超计算机混合体系的多学科背景的元启发式多目标全局优化算法.从技术上解决了面向不同环境目
    发表于 01-10 15:38 0次下载
    <b class='flag-5'>异构计算</b>的能效感知调度<b class='flag-5'>模型</b>

    异构计算的两大派别 为什么需要异构计算

    20世纪80年代,异构计算技术就已经诞生了。所谓的异构,就是CPU、DSP、GPU、ASIC、协处理器、FPGA等各种计算单元、使用不同的类型指令集、不同的体系架构的计算单元,组成一个
    发表于 04-28 11:41 2.3w次阅读

    异构计算,你准备好了么?

    摩尔定律失灵了,已是不争的事实。单纯的提升一种芯片性能变的代价越来越高,与此同时,异构计算成为提高计算力的主流方向。 什么是异构计算异构计算
    发表于 09-25 17:27 360次阅读

    从CPU到ASIC,架构越来越碎片化

    是超异构计算架构。CPU+GPU+FPGA+DSA等多种架构处理引擎组成的超异构计算实现既要又要:接近CPU的灵活性,接近ASIC的性能效率,以及多个
    发表于 01-05 11:31 1633次阅读