0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

基于1.35M Instance设计的GPU加速实例

芯行纪 来源:芯行纪 2025-04-15 16:54 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

CPU是计算机的核心部件,由运算器、控制器寄存器组和内部总线等部分组成。常见的x86架构CPU核心数相对较少,一般在8 - 32核左右,主要是为了解决复杂的逻辑运算和顺序执行指令的任务。它在处理单线程任务时效率很高,能够快速执行复杂的指令集,例如进行数学计算、程序的流程控制等操作。

GPU最初是为了图形渲染而设计的,其架构与CPU有很大不同,采用了大规模并行架构。以英伟达的CUDA架构为例,它拥有成千上万个CUDA核心,这些核心可以同时处理多个任务。例如,在深度学习中,GPU可以加速神经网络的训练过程,因为神经网络的训练涉及大量的矩阵运算,这些运算可以并行处理,GPU的并行架构能够大大缩短训练时间。近两年,GPU也成为EDA(电子设计自动化)加速的技术热点。

在数字SoC芯片的设计和实现中,为了达到功能、性能、功耗和面积目标,芯片设计者通常需要进行多轮次的迭代和优化。数字后端实现环节由于涉及的数据规模庞大且迭代次数多,基于CPU的计算耗时相当长。一般来说,一个后端设计大概需要半年左右的时间,以一个10M Instance规模的模块设计为例,基于常见的x86_64架构、16核×128CPU、2.8G主频的服务器运行数字后端各项任务,每轮时长大约为:布局(Place)75小时、时钟树综合(CTS)45小时、时钟优化(CTSopt)45小时、布线(Route)35小时、布线优化(RouteOpt)60小时。如果能够有效利用GPU的并行计算能力,将对芯片设计的加速非常有帮助。

芯行纪自主研发的新一代数字实现解决方案,通过适配GPU的环境,使用GPU为自研布局布线软件AmazeSys进行了加速,并且获得了可观的加速效果。以下是一个基于1.35M Instance设计的GPU加速实例,运行方案如下:

仅使用CPU,启用31个CPU线程

使用CPU和GPU,启用31个CPU线程和1个GPU (3584 CUDA cores)

a5369560-190a-11f0-9310-92fbcf53809c.png

图1:机器配置

从图2可以看到,通过启用1个GPU,placement各个主要阶段得到了5到20倍不等的加速比。

a5461c74-190a-11f0-9310-92fbcf53809c.png

图2:Placement过程中的加速比

从图3可以看到,使用两种方案的wire length基本持平, GPU加速时虽然overflow略有增加,但总体获得了9.1倍加速的效果。并且,当GPU数量增加、性能增强,加速比也将会继续增大。

a54ff0f0-190a-11f0-9310-92fbcf53809c.png

图3:使用GPU加速的结果

数字布局布线涉及的串行计算相对较多,但每一个环节只要能够有并行的可能的情况下,提前考虑算法以及GPU环境的匹配,是能够实现加速可能性的。GPU加速对数字电路的后端设计而言,属于EDA工具研发中的新挑战。芯行纪AmazeSys数字布局布线软件适配GPU硬件加速技术,为设计者缩短设计周期、加速设计创新提供了新的途径。

关于芯行纪

芯行纪科技有限公司汇聚EDA研发和技术支持精英,主营研发符合3S理念(Smart、Speedy、Simple)、包含新一代布局布线技术的数字实现EDA平台,并提供高端数字芯片设计解决方案,助力提升芯片设计效率,以科技创新推动发展新质生产力。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 控制器
    +关注

    关注

    114

    文章

    17648

    浏览量

    190291
  • gpu
    gpu
    +关注

    关注

    28

    文章

    5100

    浏览量

    134477
  • 计算机
    +关注

    关注

    19

    文章

    7764

    浏览量

    92692
  • eda
    eda
    +关注

    关注

    72

    文章

    3057

    浏览量

    181533

原文标题:GPU硬件加速在数字实现EDA中的应用

文章出处:【微信号:gh_2894c3fc5359,微信公众号:芯行纪】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    《CST Studio Suite 2024 GPU加速计算指南》

    许可证模型的加速令牌或SIMULIA统一许可证模型的SimUnit令牌或积分授权。 4. GPU计算的启用 - 交互式模拟:通过加速对话框启用,打开求解器对话框,点击“加速”按钮,打
    发表于 12-16 14:25

    GPU加速XenApp/Windows 2016/Office/IE性能会提高吗

    Shark来查看哪些程序/进程使用GPU(硬件加速)。它看起来不像Internet Explorer 11或Office 2016根本不使用GPU。我已经验证IE和Office都启用了硬件
    发表于 09-12 16:24

    可与NvFBC一起使用的GPU

    我想在一个项目中使用NvFBC,但我不清楚究竟支持哪些GPU。我们可能会在生产中使用Quadro M4000,但我的开发机器中有一台GTX 980,我无法使用它(NvFBC_CreateEx在
    发表于 09-25 15:04

    GPU加速matlab程序

    最近遇到了一个加速matlab程序的问题,不知道如何利用GPU,以及使用GPU的先决条件,是不是GPU加速必须要用cuda,最重要的是只用G
    发表于 03-30 11:21

    tengine是如何使用arm的GPU进行加速

    【嵌入式AI】多目标分类检测系统实战中,tengine是如何使用arm的GPU进行加速的,这个原理能详细说明一下吗?
    发表于 09-02 14:18

    Javascript如何实现GPU加速

    由 Demi 于 星期四, 2018-09-06 16:10 发表 一、什么是Javascript实现GPU加速? CPU与GPU设计目标不同,导致它们之间内部结构差异很大。 CPU需要应对通用
    发表于 09-06 20:21 971次阅读

    算法 | 超Mask RCNN速度4倍,仅在单个GPU训练的实时实例分割算法

    YOLACT——Real-time Instance Segmentation提出了一种简洁的实时实例分割全卷积模型,速度明显优于以往已有的算法,而且就是在一个 GPU 上训练取得的!
    的头像 发表于 06-11 10:34 7906次阅读

    首个采用NVIDIA M2050 GPU实例 开启GPU云计算下个十年

    十年前,AWS(Amazon Web Services)发布了首个采用 NVIDIA M2050 GPU实例。当时,基于 CUDA 的应用主要专注于加速科学模拟,AI 和深度学习还
    的头像 发表于 02-24 12:08 2265次阅读

    使用GPU加速RELION进行生物结构解析

    NVIDIA 与智东西公开课共同策划推出「GPU 加速高性能计算(HPC)经典应用在线研讨会」。研讨会将聚焦经典高性能计算和科学计算应用,以及如何在 GPU 平台更好的加速这些应用。
    的头像 发表于 06-22 10:06 2275次阅读

    OrCAD Capture CIS instance和occurrences概念解析

    Capture CIS 中两个重要概念:instance 和 occurrences 用 OrCAD 设计原理图必须理解两个概念 instance 和 occurrences。对于元件放置、替换、修改属性等很多操作都和这两个概念有关。
    的头像 发表于 10-11 11:01 1.5w次阅读
    OrCAD Capture CIS <b class='flag-5'>instance</b>和occurrences概念解析

    Oracle 云基础设施提供新的 NVIDIA GPU 加速计算实例

    也即将在 OCI Compute 上推出。 OCI 上的 NVIDIA  H100 Tensor Core GPU 实例 OCI Co mpute 裸机实例配备了具有  NVIDIA Hopper   架构 的 NVIDIA
    的头像 发表于 09-25 20:40 1170次阅读
    Oracle 云基础设施提供新的 NVIDIA <b class='flag-5'>GPU</b> <b class='flag-5'>加速</b>计算<b class='flag-5'>实例</b>

    GPU虚拟化技术MIG简介和安装使用教程

    使用多实例GPU (MIG/Multi-Instance GPU)可以将强大的显卡分成更小的部分,每个部分都有自己的工作,这样单张显卡可以同时运行不同的任务。本文将对其进行简单介绍并且
    的头像 发表于 10-11 14:42 1912次阅读
    <b class='flag-5'>GPU</b>虚拟化技术MIG简介和安装使用教程

    instance是何时翻转的?每次有多少instance在翻转?

    在run dynamic vectorless IR时,instance是何时翻转的?每次有多少instance在翻转?
    的头像 发表于 01-26 09:31 1172次阅读
    <b class='flag-5'>instance</b>是何时翻转的?每次有多少<b class='flag-5'>instance</b>在翻转?

    GPU加速计算平台是什么

    GPU加速计算平台,简而言之,是利用图形处理器(GPU)的强大并行计算能力来加速科学计算、数据分析、机器学习等复杂计算任务的软硬件结合系统。
    的头像 发表于 10-25 09:23 973次阅读

    GPU加速云服务器怎么用的

    GPU加速云服务器是将GPU硬件与云计算服务相结合,通过云服务提供商的平台,用户可以根据需求灵活租用带有GPU资源的虚拟机实例。那么,
    的头像 发表于 12-26 11:58 853次阅读