0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

Zettascale仍是妄想?HPC不得不面对的成本问题

基于树莓派的自动驾驶 来源:电子发烧友网 作者:周凯扬 2023-05-19 00:32 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

电子发烧友网报道(文/周凯扬)要说HPC对更高算力等级的追求,往往在很长一段时间之前就开始了,比如最近才开始冒头的Exascale超算,其实也是从2007年左右才开始规划的,直到去年才有了Frontier的出现,以及将在今年上线的Aurora和El Captitan超算。其中经历了不少阻碍,比如处理器的设计问题、供应链的短缺加上正式上线前持续的优化等。

然而,在达成了一个目标后,我们就会忍不住去设想下一个目标,Zettascale到底离我们有多远?到了现在我们也都知道,肯定不会像Intel前图形部门负责人Raja Koduri说的那样,在2027年左右实现。可我们也都知道现在是一个算力指数增长的时代,为何真正的Zettascale系统却还要那么久才能出现呢?除了技术演进外,自然就是成本问题。

规模硬件成本

首先考虑到的就是规模成本,目前的Exascale级别系统中,拥有成千上万个节点已经不是什么稀奇事了,而作为Exascale千倍的Zettascale系统,除非通用算力有了飞跃式的提升,不然这样的规模化部署即便是大型云服务厂商或国家实验室都难以负担。

就已上面提到的Frontier为例,这台超算由9472块AMD Epyc 7453 CPU和37888块Radeon Instinct MI250X GPU组成,单是硬件成本就达到了6亿美元左右。同样,如此庞大规模的系统在运营规模上也不可小觑,根据超算实验室负责人透露,在这类机器上运行应用程序两周的成本大概在700万美元。

以上还只是规模化的计算硬件成本,每一个超算系统还要考虑到规模化的电源、冷却和线缆带来的成本。如果节点数量翻倍的话,以上附加硬件费用也都要统统翻倍,甚至可能会指数级上涨。

至于可用的规模化量子计算超算,解决药物代谢之类的复杂科学问题,那需要的物理量子位可能要在千万级以上,总的硬件成本范围大概在50亿美元和200亿美元之间。可以说,如果无法把这个成本降下几个数量级,那么为HPC付出的成本代价势必会令所有人退却。

设计成本

要想及时进入Zettascale时代,直接购买第三方供应的处理器必然是最省事的,但对比近来几个超算系统的部署进度,供应商不一定能保证按时交付,有太多因素会影响到原本的部署计划。而且这种方式因为其通用性缺失省了不少麻烦,却不一定省钱。那么自研处理器是否会是更加省钱的方法呢?

以日本的富岳超算为例,虽然该系统整个项目的成本达到了10亿美元,但其中包括了A64FX这一ARM CPU的设计与硬件成本。更不用说同样的架构未来可以用于打造下一代超算系统。而不需要购买时下昂贵的第三方处理器。

拥有同样想法的还有印度政府,他们为国内超算系统打造的AUM处理器同样采用了ARM架构,甚至由于采用了96核的Arm Neoverse V1设计,并采用了台积电的5nm工艺,在性能上甚至要高于A64FX。

可由于采用了先进工艺,其设计成本本身就很难降低下来,以目前的市价来看,台积电N5节点的设计成本大概在5亿美元,所以如果不是真的打算把自研一直走下去,这种方法反而是最费钱的一种。

小结

我们是靠吃到了工艺、设计双双爆发的红利,才能以这么快的速度进入了Exascale时代,至于64位下的Zettascale系统,我们很可能还是要等到2035年才能得见真容。但这并不代表我们不能从现在开始准备,虽然离部署还很遥远,但对各大处理器和架构的评估,其实早就在各大研究机构中开展了。尤其是随着AI负载的加入,任何HPC系统都必须决定未来通用计算与AI计算各自的占比,并研究专为AI打造的一套全新HPC应用程序。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • HPC
    HPC
    +关注

    关注

    0

    文章

    350

    浏览量

    25071
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    新洁能250V SGT MOSFET NCEP025S90T:Qrr直降86%,RRSOA提升5倍

    、电压过冲,迫使工程师不得不额外增加缓冲电路,成本与空间双双承压。无锡新洁能新推出的250VSGT(屏蔽栅沟槽技术)功率MOSFETNCEP025S90T,以“Su
    的头像 发表于 04-14 15:43 107次阅读
    新洁能250V SGT MOSFET NCEP025S90T:Qrr直降86%,RRSOA提升5倍

    科技老登戴辉回顾 华南理工大学和我不得不说的故事

    昨天是中山先生逝世101周年。 我讲述过很多次中大故事,今天来讲述华南理工大学的故事。 1952年院系调整,在中大原校址上,整合中大、岭南大学等多所大学的工学院建立华南工学院,又以中大农学院为基础建立了华南农学院。以文理为主的中山大学则搬到了岭南大学校址(康乐园)。 华工诞生最早是1952年院系调整,后来改到1934(中大工学院建立),又改到1918了。 这个数字已经“去中大化”了,但所幸牌坊还在。我想起《牧马人》中的爱情:“面
    的头像 发表于 03-13 15:50 261次阅读
    科技老登戴辉回顾 华南理工大学和我<b class='flag-5'>不得不</b>说的故事

    Chiplet,如何助力HPC

    纵横小芯片架构代表了芯片设计和集成方式的根本性变革。随着传统芯片架构在功耗、散热和空间方面逼近物理极限,一种新型架构正在兴起,有望为高性能计算(HPC)开辟一条新的发展道路。这种架构被称为小芯片架构
    的头像 发表于 02-26 15:15 872次阅读
    Chiplet,如何助力<b class='flag-5'>HPC</b>?

    从&quot;不得不做&quot;到&quot;放心让它做&quot;——工业巡检的人机协作革命

    在高温冶金车间、化工厂,总有一些"不得不做"却"不敢让人做"的巡检任务。企业管理者面临着两难抉择:要么让员工暴露在危险环境中,冒着安全隐患;要么投入巨大人力成本,依赖人工效率低下的巡检方式。 这就
    的头像 发表于 01-28 14:38 276次阅读

    芯盾时代OIAM为央国企信创体系筑牢身份安全基座

    随着国资委79号文相关要求的深入落地,央国企信创替代工作已从早期的单点替代,全面进入了核心业务系统替换的“深水区”。在完成了办公软件、OA、邮箱等“全面替换”任务后,企业的目光不得不聚焦到那块不得不换、却又异常难啃的“硬骨头”上——微软AD。
    的头像 发表于 01-23 10:27 630次阅读

    不得不服~!Profinet转ethercat网关模块应用案例

    某工厂需实现西门子S7-1200PLC与伺服驱动的通讯,由于PLC支持PROFINET协议,而伺服驱动采用EtherCAT协议,二者无法直接进行通讯。为解决该问题,采用稳联技术(WL-PN-ECATM)智能Profinet转EtherCAT网关模块。此过程需导入GSD文件、设定IP地址与设备名称、添加从站伺服并配置PDO参数。待连接成功后,可将配置信息下载至网关设备,从而实现全面的数据交互。 经工厂实际使用验证,该设备可替代NT151-RE-RE和AB3313产品的功能。 一、配置连接方案 配置模块 正确连接电
    的头像 发表于 01-19 16:49 1244次阅读
    <b class='flag-5'>不得不</b>服~!Profinet转ethercat网关模块应用案例

    北极芯微DTS6010单点dToF传感器模组产品核心优势

    随工人熟练度波动,隐性成本居高不下;二是镜头外凸进一步挤占本已紧张的ID空间,让扫地机、微型无人机等产品不得不牺牲电池或散热面积。
    的头像 发表于 12-31 13:56 654次阅读

    家门口的科技盛宴!给你三个不得不去CEIC 2025的理由!

    行业资讯
    脑极体
    发布于 :2025年11月03日 10:08:30

    芯片选错,百万报废!做带屏AI语音玩具,这篇选型攻略你不得不看!

    一款优秀的带屏AI语音玩具背后,是精准的芯片选型艺术。面对市场上琳琅满目的芯片解决方案,如何找到性能、成本和功耗的最佳平衡点?这不仅是技术挑战,更是产品哲学的体现。小而美:ESP32-C2的极简之道
    的头像 发表于 10-10 18:03 828次阅读
    芯片选错,百万报废!做带屏AI语音玩具,这篇选型攻略你<b class='flag-5'>不得不</b>看!

    Molex莫仕PCIe解决方案如何塑造数据中心格局

    随着人工智能(AI)、机器学习(ML)和云计算的发展,数据中心不得不面对爆炸式增长的数据,压力不断增长。这些工作负载需要更快、更高效的基础设施,以前所未有的速度处理和存储数据。
    的头像 发表于 08-14 09:59 2661次阅读
    Molex莫仕PCIe解决方案如何塑造数据中心格局

    无人机为什么能稳定飞行?IMU功不可没

    无人机在天空中自由穿梭、稳稳悬停,背后究竟是什么在发挥关键作用呢?这就不得不提到一个重要部件 ——IMU。
    的头像 发表于 08-12 14:27 1665次阅读

    SPI通信可不可以不使用中断?

    你好,我目前在使用TC377芯片,我需要在PWM中断内使用QSPI通信,出于某种原因,我不得不将PWM中断优先级提到最高,这导致我无法进入spi中断。因此,我希望知道SPI通信可不可以不使用中断?
    发表于 07-31 08:15

    开启高频抑制功能,让变频器测量更精确 横河WT5000功率分析仪

    变频器中的核心功率器件也逐渐由IGBT向SiC等耐压更高、开关频率更高的器件发展。然而在高频、大功率环境下进行功率测量的工程师们却不得不面对日益增多的高频干扰..
    的头像 发表于 06-30 11:29 1098次阅读
    开启高频抑制功能,让变频器测量更精确 横河WT5000功率分析仪

    芯资讯|WTK6900P语音识别芯片,引领健康个护产品迈⼊“零按键”智能交互时代

    ⼩伙伴们,不知道你们有没有⽤过眼部按摩仪或者肩颈按摩仪?有没有过这样的“尴尬”体验:当你悠哉游哉地躺在躺椅上,戴上眼部按摩仪,按得正舒服时想调节⼀下模式,却不得不中断放松状态⼿动调节按摩参数,复杂
    的头像 发表于 06-10 10:17 661次阅读
    芯资讯|WTK6900P语音识别芯片,引领健康个护产品迈⼊“零按键”智能交互时代

    唯创WTK6900P,引领按摩器等健康个护产品迈入“零按键”智能语音交互时代

    小伙伴们,不知道你们有没有用过眼部按摩仪或者肩颈按摩仪?有没有过这样的“尴尬”体验:当你悠哉游哉地躺在躺椅上,戴上眼部按摩仪,按得正舒服时想调节一下模式,却不得不中断放松状态手动调节按摩参数,复杂
    的头像 发表于 05-27 12:03 674次阅读
    唯创WTK6900P,引领按摩器等健康个护产品迈入“零按键”智能语音交互时代