0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

Zettascale仍是妄想?HPC不得不面对的成本问题

基于树莓派的自动驾驶 来源:电子发烧友网 作者:周凯扬 2023-05-19 00:32 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

电子发烧友网报道(文/周凯扬)要说HPC对更高算力等级的追求,往往在很长一段时间之前就开始了,比如最近才开始冒头的Exascale超算,其实也是从2007年左右才开始规划的,直到去年才有了Frontier的出现,以及将在今年上线的Aurora和El Captitan超算。其中经历了不少阻碍,比如处理器的设计问题、供应链的短缺加上正式上线前持续的优化等。

然而,在达成了一个目标后,我们就会忍不住去设想下一个目标,Zettascale到底离我们有多远?到了现在我们也都知道,肯定不会像Intel前图形部门负责人Raja Koduri说的那样,在2027年左右实现。可我们也都知道现在是一个算力指数增长的时代,为何真正的Zettascale系统却还要那么久才能出现呢?除了技术演进外,自然就是成本问题。

规模硬件成本

首先考虑到的就是规模成本,目前的Exascale级别系统中,拥有成千上万个节点已经不是什么稀奇事了,而作为Exascale千倍的Zettascale系统,除非通用算力有了飞跃式的提升,不然这样的规模化部署即便是大型云服务厂商或国家实验室都难以负担。

就已上面提到的Frontier为例,这台超算由9472块AMD Epyc 7453 CPU和37888块Radeon Instinct MI250X GPU组成,单是硬件成本就达到了6亿美元左右。同样,如此庞大规模的系统在运营规模上也不可小觑,根据超算实验室负责人透露,在这类机器上运行应用程序两周的成本大概在700万美元。

以上还只是规模化的计算硬件成本,每一个超算系统还要考虑到规模化的电源、冷却和线缆带来的成本。如果节点数量翻倍的话,以上附加硬件费用也都要统统翻倍,甚至可能会指数级上涨。

至于可用的规模化量子计算超算,解决药物代谢之类的复杂科学问题,那需要的物理量子位可能要在千万级以上,总的硬件成本范围大概在50亿美元和200亿美元之间。可以说,如果无法把这个成本降下几个数量级,那么为HPC付出的成本代价势必会令所有人退却。

设计成本

要想及时进入Zettascale时代,直接购买第三方供应的处理器必然是最省事的,但对比近来几个超算系统的部署进度,供应商不一定能保证按时交付,有太多因素会影响到原本的部署计划。而且这种方式因为其通用性缺失省了不少麻烦,却不一定省钱。那么自研处理器是否会是更加省钱的方法呢?

以日本的富岳超算为例,虽然该系统整个项目的成本达到了10亿美元,但其中包括了A64FX这一ARM CPU的设计与硬件成本。更不用说同样的架构未来可以用于打造下一代超算系统。而不需要购买时下昂贵的第三方处理器。

拥有同样想法的还有印度政府,他们为国内超算系统打造的AUM处理器同样采用了ARM架构,甚至由于采用了96核的Arm Neoverse V1设计,并采用了台积电的5nm工艺,在性能上甚至要高于A64FX。

可由于采用了先进工艺,其设计成本本身就很难降低下来,以目前的市价来看,台积电N5节点的设计成本大概在5亿美元,所以如果不是真的打算把自研一直走下去,这种方法反而是最费钱的一种。

小结

我们是靠吃到了工艺、设计双双爆发的红利,才能以这么快的速度进入了Exascale时代,至于64位下的Zettascale系统,我们很可能还是要等到2035年才能得见真容。但这并不代表我们不能从现在开始准备,虽然离部署还很遥远,但对各大处理器和架构的评估,其实早就在各大研究机构中开展了。尤其是随着AI负载的加入,任何HPC系统都必须决定未来通用计算与AI计算各自的占比,并研究专为AI打造的一套全新HPC应用程序。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • HPC
    HPC
    +关注

    关注

    0

    文章

    342

    浏览量

    24825
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    家门口的科技盛宴!给你三个不得不去CEIC 2025的理由!

    行业资讯
    脑极体
    发布于 :2025年11月03日 10:08:30

    芯片选错,百万报废!做带屏AI语音玩具,这篇选型攻略你不得不看!

    一款优秀的带屏AI语音玩具背后,是精准的芯片选型艺术。面对市场上琳琅满目的芯片解决方案,如何找到性能、成本和功耗的最佳平衡点?这不仅是技术挑战,更是产品哲学的体现。小而美:ESP32-C2的极简之道
    的头像 发表于 10-10 18:03 430次阅读
    芯片选错,百万报废!做带屏AI语音玩具,这篇选型攻略你<b class='flag-5'>不得不</b>看!

    Molex莫仕PCIe解决方案如何塑造数据中心格局

    随着人工智能(AI)、机器学习(ML)和云计算的发展,数据中心不得不面对爆炸式增长的数据,压力不断增长。这些工作负载需要更快、更高效的基础设施,以前所未有的速度处理和存储数据。
    的头像 发表于 08-14 09:59 2389次阅读
    Molex莫仕PCIe解决方案如何塑造数据中心格局

    无人机为什么能稳定飞行?IMU功不可没

    无人机在天空中自由穿梭、稳稳悬停,背后究竟是什么在发挥关键作用呢?这就不得不提到一个重要部件 ——IMU。
    的头像 发表于 08-12 14:27 1132次阅读

    SPI通信可不可以不使用中断?

    你好,我目前在使用TC377芯片,我需要在PWM中断内使用QSPI通信,出于某种原因,我不得不将PWM中断优先级提到最高,这导致我无法进入spi中断。因此,我希望知道SPI通信可不可以不使用中断?
    发表于 07-31 08:15

    开启高频抑制功能,让变频器测量更精确 横河WT5000功率分析仪

    变频器中的核心功率器件也逐渐由IGBT向SiC等耐压更高、开关频率更高的器件发展。然而在高频、大功率环境下进行功率测量的工程师们却不得不面对日益增多的高频干扰..
    的头像 发表于 06-30 11:29 709次阅读
    开启高频抑制功能,让变频器测量更精确 横河WT5000功率分析仪

    智同科技推动国产RV减速器行业发展

    把时间拨回十年前,我们不得不承认,国产RV减速器行业在中国市场举步维艰。
    的头像 发表于 06-26 16:27 830次阅读

    关于渗压计的这些问题不得不知……

    行业资讯
    南京峟思工程仪器
    发布于 :2025年03月20日 17:30:21

    不得不知的PCB丝印类型及其重要作用!

    一站式PCBA智造厂家今天为大家讲讲pcb丝印的类型及其作用有哪些?PCB丝印的类型及其作用。在现代电子制造领域,PCB的设计和生产过程中,丝印是一个不可忽视的重要环节。丝印不仅能提升PCB的可读性和美观度,还为后期装配、维护等环节提供了极大便利。作为一家PCB制板厂家,向客户解释不同类型的丝印及其作用,不仅有助于展示产品的特点和优势,也能增强客户对产品质量和性能的信心。 1. PCB丝印的定义和作用 PCB丝印指的是在电路板表面印刷的标记
    的头像 发表于 03-17 09:48 1296次阅读

    中兴通讯40年——五个不得不说的故事

    今年2月7日是中兴成立40年。 我写了《华为通信科技史话》的书(人民邮电出版社),从侧面体现了同城兄弟中兴通讯的科技发展过程。 中兴历史上有五个重要的故事。 1、中兴在1993年凤凰涅槃 1985年2月7日,由侯为贵先生牵头,航天科技771所(当时是691厂)等单位共同出资成立了中外合资企业——深圳市中兴半导体有限公司。 1993年4月,中兴半导体公司改组,691厂、深圳广宇工业公司与民营科技企业深圳中兴维先通公司共同投资组建深圳市中兴新通讯设
    的头像 发表于 02-13 16:04 5150次阅读
    中兴通讯40年——五个<b class='flag-5'>不得不</b>说的故事

    康佳特推出高性能COM-HPC模块conga-HPC/cBLS

    德国康佳特,作为嵌入式和边缘计算技术的领先供应商,近日宣布扩展其高性能COM-HPC计算机模块产品线,推出了全新的conga-HPC/cBLS模块。这款模块专为需要强大计算性能的边缘与基础设施
    的头像 发表于 02-08 16:49 900次阅读

    HPC工作负载管理的关键要素

    HPC工作负载管理是一个复杂而精细的过程,涉及资源分配、作业调度、性能监控与优化以及故障处理与恢复等多个关键要素。下面,AI部落小编带您了解HPC工作负载管理的关键要素。
    的头像 发表于 02-08 09:53 533次阅读

    HPC云计算的技术架构

    HPC云计算结合了HPC的强大计算能力和云计算的弹性、可扩展性,为用户提供了按需获取高性能计算资源的便利。下面,AI部落小编带您了解HPC云计算的技术架构。
    的头像 发表于 02-05 14:51 689次阅读

    HPC按需计费模式的优势

    当下,HPC按需计费模式不仅降低了用户的经济负担,提高了资源利用效率,还推动了科技创新的普及和发展。以下,是对HPC按需计费模式优势的梳理,由AI部落小编整理。
    的头像 发表于 01-24 09:55 639次阅读

    云计算和HPC的关系

    尽管云计算和HPC在架构、应用场景和成本效益等方面存在显著差异,但云计算和HPC之间并非孤立存在,而是相互补充、协同发展的关系。下面,AI部落小编带您探讨云计算和HPC的关系。
    的头像 发表于 12-14 10:35 667次阅读