0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

千亿美元打造一个系统,成本越来越高的AI超算

E4Life 来源:电子发烧友 作者:周凯扬 2024-04-09 00:19 次阅读

电子发烧友网报道(文/周凯扬)从近年来新发布的超算机器和新的HPC AI性能榜单可以看出,AI算力已经在超算中成了不可忽视的性能指标之一,但也为厂商带来了更大的成本挑战。比如微软近期就爆出和OpenAI合作,打造一个千亿美元级别的超算系统。

千亿美元打造AI超算

根据外媒报道,此次打造的千亿美元超算系统名为Stargate,星门。这一超算系统仅仅只是微软和OpenAI一系列数据中心合作项目之一,但造价已经高到离谱了。从规模上看,这个超算的硬件配置已经到了远超现有系统的程度。据爆料,星门将集成百亿个最新英伟达GPU,造价可能会达到1150亿美元。不过在互联方案上,微软可能会跳过英伟达的InfiniBand专用方案,而采用更加通用以太网方案。

当然了,虽然总成本较高,但微软并没有一次建成的部署策略,而是分拆成五个阶段,整个项目在2028年成功建成。这样可以尽早让该系统投入使用,毕竟对于新的模型而言,率先发布才不会错失市场机会。这或许也与微软采用通用的以太网方案有关,毕竟面对跨度如此长的方案而言,专用方案很可能会面临被兼容性差和被淘汰的局面。微软预计会在第四阶段,也就是2026年左右,正式启用这一超算系统。

除此之外,超算的部署地点依然待定,这无疑与部署地的电网供电能力息息相关,当地政府如果能提供支持自然最好。不过从硬件规模来看,单系统的耗电已经达到千兆瓦级,无论是对美国哪个州而言,都是巨大的供电挑战。也正因如此,微软正在考虑核能在内的其他替代能源方案。

超算部署成本发生的变化

时至今日,微软已经在OpenAI上花了130亿美元,使用其数据中心来为ChatGPT之类的应用提供硬件支持。但此次的星门项目更是规模浩大,这也说明了新模型的训练和推理,仍在对数据中心的硬件提出新的要求,需要用性能更强的AI超算来解决。

但这并不意味着普遍的超算成本真的有这么夸张的变化,要知道目前TOP500上排名第一的超算Frontier,其成本也只有6亿美元。对于科研专用的单个超算系统而言,虽然造价不算低,但在政府的科研经费支持下,研究机构还是可以负担起的。

不过值得注意的是,TOP500上的超算都有公开的跑分成绩,为了实现这样的成绩,需要一定时间的优化,再运行一段时间的测试才会有此成绩。而市面上,尤其是在不少大型互联网公司内部,也存在并没有公开提交成绩的超算,因为这类系统几乎是从诞生起就被投入商业使用了。

所以市面上肯定有超过6亿美元的超算系统,比如Meta就在几个月前打造了两套系统,分别集成了2万个H100 GPU,总成本在10亿美元以上。其他的互联网公司,诸如国内的百度、腾讯等,想必也有庞大的硬件购买计划。

写在最后

随着HPC与AI在需求和计算负载上的融合,市场趋势从前几年的“带AI功能的HPC系统”变成了“同样可以用于HPC的AI系统”。但从其规模来看,对于HPC市场也未尝不是一件好事,毕竟目前AI超算的商业价值更高,能够吸引到更多的投资和补贴,也有望进一步推动HPC硬件的革新速度。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • AI
    AI
    +关注

    关注

    87

    文章

    26478

    浏览量

    264108
  • HPC
    HPC
    +关注

    关注

    0

    文章

    280

    浏览量

    23419
  • 超算
    +关注

    关注

    1

    文章

    109

    浏览量

    8973
收藏 人收藏

    评论

    相关推荐

    谷歌拟投千亿美元AI实力或领跑业界

    据企鹅号报道,DeepMind公司首席执行官德米斯·哈萨比斯在TED大会上,面对媒体对微软公司和OpenAI建设价值千亿美元超级计算机“星际之门”的提问,他未披露具体投资金额,但表示谷歌在人工智能领域的投入将超越千亿
    的头像 发表于 04-16 16:41 356次阅读

    我们该如何应对SOC中越来越庞大和复杂的SDC约束?

    SOC设计变得越来越复杂,成本越来越高,设计和验证也越来越困难。
    的头像 发表于 03-13 14:52 473次阅读
    我们该如何应对SOC中<b class='flag-5'>越来越</b>庞大和复杂的SDC约束?

    IC datasheet为什么越来越薄了?

    刚毕业的时候IC spec动则三四百页甚至一千页,这种设置和使用方法很详尽,但是这几年IC datasheet为什么越来越薄了,还分成了IC功能介绍、code设置、工厂量产等等规格书,很多东西都藏着掖着,想了解IC什么东西都要发邮件给供应商,大家有知道这事为什么的吗?
    发表于 03-06 13:55

    为何开关频率要大于30kHz,且有越来越高的趋势?

    为何开关频率要大于30kHz,且有越来越高的趋势?开关频率大小的限制因素是什么? 开关频率的大小是指开关电路每秒钟进行开关操作的次数。在电力电子设备中,开关频率主要用于调节电路的响应速度和功率传输
    的头像 发表于 01-31 17:39 617次阅读

    为什么PoE应用需要越来越高的功率?

    本期我们和大家分享的话题是以太网供电,即我们常说的PoE的发展以及以太网供电这种应用对双绞线的要求。
    的头像 发表于 11-30 10:22 276次阅读

    部分新能源充电企业服务费涨50%,开电车费用越来越高?!

    行业芯事行业资讯
    电子发烧友网官方
    发布于 :2023年11月29日 18:00:17

    FPGA和CPU、GPU有什么区别?为什么越来越重要?

    CPU 力逐渐达到瓶颈,越来越无法满足神经网络指数级增长的力需求。在数据中心这人类力需求最高的设施中,
    发表于 11-09 14:09

    您与1秒钟测量两千尺寸之间仅差台智能测径仪!

    随着产线的发展,自动化程度越来越高,生产速度越来越快,人们对产品的品质要求越来越高,对检测也提出了更高的要求。传统的检测与测量手段已经很难满足测量效率要求,业内迫切需要种新型高效率的
    发表于 11-07 17:15

    单片机在以后会越来越趋向于低端化应用吗?

    随着现在的技术和产品功能需求越来越高,好像单片机能完成的事情越来越少;以后是不是嵌入式芯片是主流,单片机渐渐只能在低端上应用?
    发表于 10-24 08:30

    新能源汽车对快充性能的要求越来越高

    近年来,随着新能源汽车的渗透,转型增速过快与补能落后矛盾愈发凸显。
    的头像 发表于 10-23 10:10 511次阅读

    为什么国内PCB渗透率越来越高

     PCB层数增高,对电性能、铜箔粗糙度等有很多的要求,需要很多的经验才能承接高层板,一直能超前3-4年,跟深X差不多,深X比较可惜的是由于地缘zz没法参与欧美的一些企业。
    发表于 07-11 14:42 553次阅读

    边缘AI应用越来越普遍,AI模型在边缘端如何部署?

    电子发烧友网报道(文/李弯弯)在人工智能时代,越来越多的AI应用需要从云端扩展到边缘端,比如智能耳机、智能摄像机、智能手环、物流机器人等,在边缘端部署AI已经成为趋势。如今AI大模型迅
    的头像 发表于 07-04 00:11 1951次阅读
    边缘<b class='flag-5'>AI</b>应用<b class='flag-5'>越来越</b>普遍,<b class='flag-5'>AI</b>模型在边缘端如何部署?

    数字时代云成本越来越高,企业IT负责人们该如何选择弹性云服务器呢?

    。 首先,成本是一个重要的考虑因素。企业需要根据自身的业务需求和预算,选择合适的弹性云服务器配置和计费方式。其次,安全性也是一个重要的考虑因素。企业需要选择能够提供安全保障的弹性云服务器服务商。此外,弹性云服
    的头像 发表于 06-24 00:25 202次阅读

    AI视觉检测在工业领域的应用

    随着制造业的智能化、自动化程度越来越高AI视觉检测系统已经成为种重要的智能制造设备,它能够大幅提高生产线上的检测能力和效率。
    发表于 06-15 16:21

    为什么“通信界小红帽”RedCap的关注度越来越高

    在移动通信领域,技术标准每十年更新一代,每两年推出一个版本,似乎已成为固定节奏,这就意味着每一代大约要经历5~6个版本。按照3GPP(3rd Generation Partnership Project,第三代合作伙伴计划)组织此前的规划,5G的技术演进将分为两个阶段,第一阶段为R15、R16、R17版本,第二阶段为R18、R19、R20版本,即5.5G,随后将迈入6G时代。
    发表于 06-07 11:27 275次阅读
    为什么“通信界小红帽”RedCap的关注度<b class='flag-5'>越来越高</b>?