0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

新一轮AI竞赛中,为什么HPC一定是赢家?

新思科技 来源:未知 2023-03-23 06:35 次阅读

本文转自《TechSugar》感谢《TechSugar》对新思科技的关注

当前,以ChatGPT为代表的生成式人工智能应用风头无两,正在全球科技巨头间掀起新一轮的技术竞赛。在很多人看来,ChatGPT的上线或可被视作一次新产业革命的引爆点,而这个引爆点之所以能出现,则离不开背后的高性能计算与大数据基础设施。

ChatGPT基于Open AI公司的GPT-3系列语言大模型来实现,GPT(Generative Pre-trained Transformer)即生成式预训练转换模型,是一种基于互联网可用数据训练的文本生成深度学习模型。

为了实现和人类可比拟的语言交互和语言组织能力,GPT-3的参数达到1750亿个,相比之下,2018年推出的GPT-1,参数为1.17亿个,而2019年推出的GPT-2参数则达到15亿个,量变最终将引发质变,参数规模的飞速膨胀,对支撑GPT运行的硬件系统提出了越来越高的要求,对于类似GPT这样的大模型,没有高性能硬件支撑,根本无法去实现与部署,更不要说随着新数据的涌入来迭代了。

所以,在众厂商纷纷宣布加码大模型AI投入时,有人断言,新一轮AI竞赛鹿死谁手还很难说,但高性能计算(HPC)系统中的高算力芯片、高带宽互连芯片和存储芯片一定是赢家。

HPC及其核心

芯片发展趋势

那么,高性能计算要如何发展才能更好地支持新一波人工智能发展浪潮?而人工智能将如何影响到高性能计算本身呢?有如下几点,可供探讨。

第一,高性能计算与人工智能相得益彰。人工智能的每一次高速发展,都离不开背后硬件基础设施的支持,而高速发展的AI又对硬件基础设施提出了更高的要求,激励芯片或系统性能成倍上升。

在Open AI 2018年发布的报告中,对自2012至2018年人工智能训练对算力的需求超过30万倍,算力需求平均每3.5个月翻一番,这给芯片及硬件系统更新换代带来极大压力,因为按摩尔定律的性能升级速度,已经不能满足AI训练对芯片性能的需求增长速度了。

为了打破性能瓶颈,新思科技提出了SysMoore开发方法学,通过全系统优化,有效释放了性能提升潜力。

反过来,AI能力也在提升芯片开发效率,帮助开发者设计出性能更出色的芯片。例如,通过应用新思科技的DSO.ai工具,开发者将一款HPC处理器的运行频率提高了100Mz,而开发时间缩短了一半,整个团队的产出效率提升至原来的三倍。

bf7b3c4c-c901-11ed-bfe3-dac502259ad0.png

第二,HPC芯片性能提升方式从平面扩展转变为立体增长。多晶片系统(Multi-Die System)正在成为HPC芯片的主要发展潮流,从HPC的系统角度来看,采用先进封装技术将不同芯片封装在一起的方式,比PCB互连能大幅提升系统性能,因而HPC芯片在实现上,2.5D封装与3D封装的设计将越来越多。

而由于成熟的接口IP可以直接以芯粒(Chiplet)方式与计算内核进行拼接,多晶片系统开发方式还可以有效保证良率,加快开发效率。

多晶片系统的实现,需要设计方法学的更新,以实现高带宽、低延迟、低功耗和无差错工作的片间接口,多晶片系统的片间接口技术对于数据中心与边缘设备的快速、可靠的数据传输至关重要。

采用先进封装技术将芯片进行立体堆叠,为芯片性能提升打开了无限可能,但也需要更强的EDA工具、设计方法学和IP,来处理多晶片系统中的异构集成、互连和封装问题。此外,随着数据中心互连技术的发展,开发者还需要具备硅光学等领域的专业知识和技术。

新思科技的3DIC Compiler是一个高效易用的多晶片系统设计实现平台,可以为各种不同工艺制造的芯粒拼接堆叠提供完整的开发环境。

例如,从多晶片系统项目启动时,开发者就需要用3DIC Compiler对多晶片系统进行功能划分,将整体设计分解为多个芯粒,接下来,可以用3DIC Compiler进行早期版图规划和基于封装的信号完整性分析,以实现更好的片间连接性能和更优的功耗表现。

bfcd9d2a-c901-11ed-bfe3-dac502259ad0.jpg

第三,边缘计算设备将不断进步迭代。人工智能的训练发生在数据中心,但推理或数据收集都离不开边缘设备。

在人工智能应用中,对边缘设备的延迟要求越来越高,希望能进一步减少边缘设备数据处理和传输延迟,这就要求优化边缘设备主芯片的数据传输速度和效率。而边缘设备数量众多,因而在芯片层面能够降低功耗的话,将对整个云加边缘体系的节能降耗贡献极大。

所以,边缘端芯片需要强大的仿真和验证工具、功耗和热分析功能、设计布局的智能实施,以及一系列关键功能和接口的认证IP模块,新思科技可以为开发者提供从边缘到云端可应用的基础IP、接口IP、安全IP和处理器IP,优化实现高性能、低延迟和低功耗,同时支持先进的工艺技术。

第四,从信息安全、可靠性和运营成本等考虑,HPC芯片需要全生命周期管理。HPC系统规模巨大,运营成本高昂,可以处理PB乃至ZB级别的数据,可以实时运行大模型。这种级别的系统一旦出现故障,由于业务暂停造成的经济损失,数字会十分惊人。

所以,一个好的HPC系统,应该具备卓越的可靠性、可用性和服务能力,而要做到这一点,系统角度可以通过冗余设计来增加可靠性,但更重要的则是从芯片层级来减少故障率。

在芯片层级减少系统的故障率,就需要用到新思科技的硅生命周期管理(Silicon Lifecycle Management,SLM )的理念。

SLM通过内置IP来收集芯片运行中的各种参数,并将芯片运行数据传输至指定位置进行分析和跟踪,从而让系统可以实时监控各个核心芯片的运行状况,为系统建立起芯片健康状况跟踪图,从而更好地预测和预防故障的发生,最终实现故障率降低和最小化故障损失。

第五,可持续发展是HPC产业长期繁荣的基础。由于规模巨大,HPC系统能耗惊人,专家预测,到2030年,仅数据中心用电量将占到全球总用电量的3%至7%,不少区域甚至抵制建设数据中心,以免因其耗能巨大而导致当地环境恶化。所以,如何有效解决HPC/数据中心能耗和散热问题,已经成为其能否可持续发展的关键。

在新思科技为HPC/数据中心提供的完整解决方案中,处处体现了节能降耗的理念。例如,通过低功耗设计方法学和功耗优化过的IP核来实现HPC芯片的整体功耗优化,从而降低HPC系统能耗,有效降低系统功耗,而新思科技各种高效率开发、仿真和验证工具,大幅降低了研发一款芯片的总体用时和资源占用,则是从更广泛角度上为可持续发展做出的贡献。

总结

随着互联网与人工智能技术的发展,HPC产业的重要性与日俱增,大数据与大数据模型的应用,都对HPC系统的性能与能耗提出了更高要求,只有从芯片层级出发来对HPC系统进行优化,才能真正让HPC系统性能不断升级,能效持续优化,走上真正的可持续发展之路。


声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 新思科技
    +关注

    关注

    5

    文章

    716

    浏览量

    50067

原文标题:新一轮AI竞赛中,为什么HPC一定是赢家?

文章出处:【微信号:Synopsys_CN,微信公众号:新思科技】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    AI服务器催生创新变革,电子行业迎来新一轮产品质量挑战

    AI需求暴增、5G升级周期和汽车智能电动化等因素的推动下,全球电子市场进入新一轮的增长期,尤其是在通信电子、消费电子和汽车电子等领域。需求增长促使上游产能升级的同时,也带来了制造和设计上更严格
    发表于 04-19 17:49 439次阅读
    <b class='flag-5'>AI</b>服务器催生创新变革,电子行业迎来<b class='flag-5'>新一轮</b>产品质量挑战

    AI独角兽Cohere寻求新一轮融资,目标估值达50亿美元

    加拿大AI领军企业Cohere,作为OpenAI的有力竞争者,近日正在积极寻求新一轮的融资。据悉,该公司的目标是以高达50亿美元的估值筹集5亿美元的资金。这一雄心勃勃的举措显示了Cohere在人工智能领域的深厚实力与坚定信心。
    的头像 发表于 03-26 11:25 334次阅读

    求助,给到USB OTG FS内核的时钟为什么一定是要48M呢?

    给到USB OTG FS内核的时钟为什么一定是要48M呢?
    发表于 03-22 11:26

    思锐智能、百功半导体、芯视界微电子三家企业相继宣布完成新一轮融资

    近日,思锐智能、百功半导体、芯视界微电子三家企业相继宣布完成新一轮融资。
    的头像 发表于 03-07 15:59 337次阅读

    消费级AR品牌雷鸟创新宣布完成新一轮亿元级融资

    WitDisplay消息,3 月 4 日消息,消费级 AR 品牌雷鸟创新今天宣布完成新一轮亿元级融资。
    的头像 发表于 03-05 11:29 1432次阅读

    人形机器人企业Figure AI在最新一轮融资中累计筹得约6.75亿美元

    据外媒报道,当地时间2月24日,致力于研发人形机器人的美国初创公司Figure AI在最新一轮融资中累计筹得约6.75亿美元。
    的头像 发表于 02-28 11:39 635次阅读

    高端封装基板供应商芯爱科技完成新一轮融资

    芯爱科技,作为一家高端封装基板供应商,近日宣布完成了新一轮融资,累计获得社会资本超过25亿元人民币。这一轮融资吸引了众多知名投资机构的参与,包括比亚迪、越秀产业基金、阳光融汇资本、高远资本等头部资本。
    的头像 发表于 01-18 15:53 446次阅读

    云脉芯联完成亿元级新一轮融资

    云脉芯联,一家专注于数据中心网络芯片和云网络解决方案的创新型科技企业,近日宣布完成亿元级新一轮融资。此轮融资由上海浦东创新投资发展(集团)有限公司和上海张科垚坤创业投资合伙企业(有限合伙)共同投资。所筹资金将主要用于加速核心产品的研发及规模应用落地。
    的头像 发表于 01-16 15:20 392次阅读

    开年资本“热”,已有3家LED企业完成最新一轮投资

    开年以来,资本对LED产业的投资热情不减,近日已有3家LED企业完成最新一轮投资。
    的头像 发表于 01-11 13:50 789次阅读

    产学研三界顶级大咖分享:RISC-V场景Show暨开源生态高级别论坛定档12/19

    和中科院软件研究所高级工程师于佳耕出席,现场为大家分享新一轮处理器技术突破、RISC-V架构生态建设以及开源操作系统教学。同时,现场嘉宾还将分享勘智AI芯片的性能展示及其在开源操作系统的构建
    发表于 12-15 18:36

    AI大模型接入手机,行业迎来新一轮竞赛

    选择端侧部署,看上去最划算 当前,AI大模型接入手机存在两种选择:云端部署和端侧部署。 目前,大多数厂商选择在端侧部署轻量级大模型,而在云端部署的则是千亿级AI大模型。 为了平衡
    发表于 12-05 10:11 397次阅读
    <b class='flag-5'>AI</b>大模型接入手机,行业迎来<b class='flag-5'>新一轮</b><b class='flag-5'>竞赛</b>

    HPCAI:完美融合

    HPC早于AI问世,因此这两个领域在软件和基础设施方面存在显著差异。要将它们有机地融合在一起,需要对工作负载管理和工具进行必要的调整。以下是HPC如何逐步发展以迎合AI挑战的一些方法。
    的头像 发表于 10-22 14:59 877次阅读

    新一轮AI浪潮赋能多个万亿市场,业者如何把握时代机遇

    不同领域得到广泛的应用。从工业制造到医疗保健,从服务引导到家居生活,不断涌现的机器人替代了人们在机械、重复或高风险场景下的工作。 这就是新一轮AI浪潮给社会带来的巨大改变之一。新一轮AI
    发表于 08-16 11:36 254次阅读
    <b class='flag-5'>新一轮</b><b class='flag-5'>AI</b>浪潮赋能多个万亿市场,业者如何把握时代机遇

    微软开启新一轮裁员 这些部门将受影响

    据GeekWire报道,微软目前正进行新一轮裁员。一些员工通过LinkedIn更改了个人资料,表明他们属于新一轮裁员的范围,主要影响到销售、市场营销和客户支持等部门。
    的头像 发表于 07-11 16:23 565次阅读

    生成式AI赋能,智能家居有望进入新一轮增长期

    电子发烧友网报道(文/黄山明)随着今年消费经济的逐步复苏,智能家居等消费需求也开始得到释放,同时伴随生成式AI的爆发式发展,也将赋能智能家居实现更优质的使用体验,从而促进智能家居进入到新一轮的增长期
    的头像 发表于 05-20 01:10 2068次阅读