0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

HPC硬件的设计面临哪些挑战

lPCU_elecfans 来源:电子发烧友网 作者:电子发烧友网 2022-09-07 09:43 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

电子发烧友网报道(文/周凯扬)晶体管的复杂程度持续走高,加上晶圆厂不断增加的设计规则,不少IC设计公司都发现自己陷入了一个你追我赶的境地。半导体设计如今需要额外的高性能计算资源才能保证开发的速度和质量,一旦这些资源没到位,工程师就都会受到限制,他们自己开发的硬件在追逐性能目标的同时,手头的设计工具也提出了一个不低的性能指标。

行业面临的设计挑战

如今芯片设计面临着诸多挑战,成本与良率、晶体管效率、裸片尺寸限制以及功耗与性能的取舍等等。这些挑战对任何公司来说都是需要攻克的难关,就拿AMD来说,在他们的芯片设计中,预计2023年的逻辑门数将是2013年的225倍,要完成这样的设计工作,所以无论是EDA还是FPGA都得加入这轮军备竞赛,而且产品发布周期和质量目标使得AMD必须保持这个节奏。

晶体管数量对EDA提出了更高的要求,比如AMD的Versal Premium ACAP拥有920亿晶体管,未来将发布的Instinct MI300拥有1460亿晶体管,而这种晶体管密度下的设计并不是单靠制造工艺的演进就能解决的。以晶圆厂和EDA厂商不断强调的DTCO(设计与工艺协同优化)为例,在台积电给出的数据中,5nm到16nm这个范围内,面积上的改进基本都是靠制造工艺的提升,而到了3nm这个节点,DTCO所占功劳已经近乎一半。

可如果不通过高性能计算硬件的辅助,是难以实现这等量级的设计自动化的。尤其是在先进工艺的后端设计上,需要更多的多线程运算、更长的运行时间,也面临着更大的内存和数据压力。

HPC硬件带来的改变无论是高性能多核CPU,还是最新的GPUASIC加速器,都为EDA带来了性能上的飞跃。比如利用Ansys的EDA工具在应用AMD的Instinct GPU后,其求解器速度提高了三到六倍,而Epyc 7003处理器的超大三级缓存,也让其在仿真工具负载上有了1.48倍的性能提升。

另一个显而易见的趋势,就是HPC与AI的交集。过去的HPC节点中,x86处理器才是负责各种工作负载的主体。尽管如今这一点并没有改变,但我们可以看到AI已经成了HPC上不可或缺性能指标,所以无论是特定域加速的AI加速器还是GPU,也都在HPC机器上普及,EDA也同样因此受益。

比如通过AI将验证和测试线性化,从而直接预估综合的结果质量,减少对仿真的需求,又或是利用生成式AI来扩展设计空间和完成自动优化,以及通过AI来完成掩模优化,进一步提高良率等等,而这些都需要HPC硬件拥有一定的AI计算能力,才能满足EDA愈发算法化的自动化工作。

更何况就连GPU本身的设计也开始用上AI,以英伟达的Hopper H100 GPU为例。英伟达在设计H100的算数电路时用到了深度强化学习模型PrefixRL,在整个H100的架构中,就有近13000个实例是完全由AI来设计的。

可打造这样一个模型需要的硬件资源也不可小觑,比如每个GPU的物理仿真需要用到256个CPU,训练一个64位加法器电路就需要32000个GPU工时。但结果是喜人的,PrefixRL AI设计出来的加法器电路与最先进的EDA工具设计的电路性能和功能相当,但面积却小上25%。可以看出在AI这块,就连EDA厂商自己也还有不少提升的空间。

云端HPC的加入可在HPC硬件如此高昂的价格下,不少IC设计公司,尤其是初创企业,都望而却步,因为他们承受不起打造这样一个基础设施的成本,比如有的EDA公司的专用硬件加速服务器就要千万元一台。哪怕自己有达标的硬件资源,也不像EDA厂商预优化的硬件平台那样高效。

所以EDA厂商纷纷与云服务厂商合作,开始打造EDA的云HPC平台,云端按需使用的付费模式和对HPC硬件资源的灵活分配,大大降低了设计成本。像亚马逊这样自己也投身半导体行业的云服务厂商,每年也会完成多次流片。为了展示HPC云实例的性能,他们拿自己来作为范例,AWS的Gravition、Inferentia等服务器芯片,从RTL到GDS2,也都是全部在AWS云上完成的。

结语HPC硬件的设计离不开先进的EDA软件工具,可越来越复杂的设计要求,也使得EDA工具开始依赖HPC硬件才能发挥全部优势,这种闭环推动了整个半导体行业延续并超越摩尔定律。而下个时代迎来了Chiplet和3D封装,也为EDA带来了布线、时序和信号完整度等方面的更大挑战,为了迎接这一挑战,也是时候加大在EDA硬件上的投入了。

审核编辑:彭静
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 处理器
    +关注

    关注

    68

    文章

    20378

    浏览量

    255606
  • 硬件
    +关注

    关注

    13

    文章

    3666

    浏览量

    69231
  • 晶体管
    +关注

    关注

    78

    文章

    10470

    浏览量

    148930
  • HPC
    HPC
    +关注

    关注

    0

    文章

    351

    浏览量

    25105

原文标题:​节节攀升的EDA硬件要求

文章出处:【微信号:elecfans,微信公众号:电子发烧友网】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    AI硬件浪潮来袭,移远如何打通AI硬件落地的“最后一公里”

    硬件开发中普遍面临的困境,并全方位展示AIOpenPlatform如何系统性解决AI硬件产品落地的核心挑战,为行业提供可落地的工具化方案。AI硬件
    的头像 发表于 05-08 19:03 436次阅读
    AI<b class='flag-5'>硬件</b>浪潮来袭,移远如何打通AI<b class='flag-5'>硬件</b>落地的“最后一公里”

    算力爆发时代IP设计面临哪些新挑战

    生成式 AI、Chiplet、多Die 架构、具身智能……新一轮计算浪潮正在深刻改变芯片设计方式,也对底层 IP 技术提出了前所未有的挑战
    的头像 发表于 04-23 13:56 277次阅读

    HPC系列高性能微控制器:特性、参数与应用解析

    HPC系列高性能微控制器:特性、参数与应用解析 在电子工程领域,高性能微控制器是众多项目的核心组件,它们的性能直接影响着整个系统的运行效率和稳定性。National Semiconductor推出
    的头像 发表于 04-19 10:45 269次阅读

    微电网稳定性理论在实际应用中面临哪些挑战

    受微电网自身结构特性、运行环境复杂性、设备多样性及控制策略适配性等多重因素影响,现有微电网稳定性理论在实际工程应用中面临诸多瓶颈,理论模型与实际运行场景的脱节、控制策略落地困难、稳定性评估偏差
    的头像 发表于 03-09 10:37 634次阅读
    微电网稳定性理论在实际应用中<b class='flag-5'>面临</b>哪些<b class='flag-5'>挑战</b>

    Chiplet,如何助力HPC

    纵横小芯片架构代表了芯片设计和集成方式的根本性变革。随着传统芯片架构在功耗、散热和空间方面逼近物理极限,一种新型架构正在兴起,有望为高性能计算(HPC)开辟一条新的发展道路。这种架构被称为小芯片架构
    的头像 发表于 02-26 15:15 947次阅读
    Chiplet,如何助力<b class='flag-5'>HPC</b>?

    智算中心电源系统中的碳化硅(SiC)技术应用深度研究报告

    随着人工智能(AI)大模型训练、推理任务以及高性能计算(HPC)需求的爆发式增长,全球数据中心正面临前所未有的能源挑战
    的头像 发表于 02-14 21:58 1w次阅读
    智算中心电源系统中的碳化硅(SiC)技术应用深度研究报告

    芯片可靠性面临哪些挑战

    芯片可靠性是一门研究芯片如何在规定的时间和环境条件下保持正常功能的科学。它关注的核心不是芯片能否工作,而是能在高温、高电压、持续运行等压力下稳定工作多久。随着晶体管尺寸进入纳米级别,芯片内部犹如一个承受着巨大电、热、机械应力考验的微观世界,其可靠性面临着原子尺度的根本性挑战
    的头像 发表于 01-20 15:32 680次阅读
    芯片可靠性<b class='flag-5'>面临</b>哪些<b class='flag-5'>挑战</b>

    爱普科技扩大S-SiCap™技术应用版图 满足AI与HPC新需求

    全球客制化存储芯片解决方案设计公司爱普科技今日宣布,S-SiCapTM(Stack Silicon Capacitor)产品线持续深化技术布局,聚焦AI服务器与高性能计算(HPC)的整合挑战
    的头像 发表于 12-24 17:53 820次阅读

    亚太地区AI数据中心可持续发展面临重重挑战

    当Chat GPT每秒“吞吐”数万次请求、自动驾驶汽车毫秒级解析路况、AI大模型训练一口“吞”掉百万度电时,我们正亲历着一场由“算力浪潮”驱动的科技革命;与此同时,一个严峻的现实问题也浮出水面:强大的AI背后是对电力的极度渴求,算力增长与能源约束之间的矛盾已成为全球面临的关键挑战
    的头像 发表于 12-10 10:24 1402次阅读
    亚太地区AI数据中心可持续发展<b class='flag-5'>面临</b>重重<b class='flag-5'>挑战</b>

    开发无线通信系统所面临的设计挑战

    的设计面临多种挑战。为了解决这些挑战,业界逐渐采用创新的技术解决方案,例如高效调变与编码技术、动态频谱管理、网状网络拓扑结构以及先进的加密通信协议。此外,模块化设计、可升级架构与边缘计算的结合,为系统带来更高的灵活性与未来发展潜
    的头像 发表于 10-01 15:15 1w次阅读

    工控一体机在轨道交通领域的应用解决方案面临哪些挑战

    在轨道交通领域,工控一体机扮演着关键角色,广泛应用于自动售检票系统、列车运行监控系统、智能调度系统以及车站设备控制系统等多个核心环节。然而,其在实际应用过程中面临着诸多严峻挑战。​
    的头像 发表于 09-08 17:28 1016次阅读

    FOPLP工艺面临挑战

    FOPLP 技术目前仍面临诸多挑战,包括:芯片偏移、面板翘曲、RDL工艺能力、配套设备和材料、市场应用等方面。
    的头像 发表于 07-21 10:19 1872次阅读
    FOPLP工艺<b class='flag-5'>面临</b>的<b class='flag-5'>挑战</b>

    TC Wafer晶圆测温系统当前面临的技术挑战与应对方案

    尽管TC Wafer晶圆系统已成为半导体温度监测的重要工具,但在实际应用中仍面临多项技术挑战。同时,随着半导体工艺不断向更小节点演进,该系统也展现出明确的发展趋势,以满足日益严格的测温需求。
    的头像 发表于 07-10 21:31 1432次阅读
    TC Wafer晶圆测温系统当前<b class='flag-5'>面临</b>的技术<b class='flag-5'>挑战</b>与应对方案

    AI 时代来袭,手机芯片面临哪些新挑战

    边缘AI、生成式AI(GenAI)以及下一代通信技术正为本已面临高性能与低功耗压力的手机带来更多计算负载。领先的智能手机厂商正努力应对本地化生成式AI、常规手机功能以及与云之间日益增长的数据传输需求
    的头像 发表于 06-10 08:34 1442次阅读
    AI 时代来袭,手机芯片<b class='flag-5'>面临</b>哪些新<b class='flag-5'>挑战</b>?

    高性能计算面临的芯片挑战

    高性能计算(简称HPC)听起来像是科学家在秘密实验室里才会用到的东西,但它实际上是当今世界上最重要的技术之一。从预测天气到研发新药,甚至训练人工智能,高性能计算系统都能帮助解决普通计算机无法
    的头像 发表于 05-27 11:08 1309次阅读
    高性能计算<b class='flag-5'>面临</b>的芯片<b class='flag-5'>挑战</b>