0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

AI巨头筹划价值1100多亿美元的超级计算机项目

半导体产业纵横 来源:半导体产业纵横 2024-03-30 14:57 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

美国的超级计算机又有新看点了。

据报道,Microsoft 和 OpenAI 正在开发一个大型数据中心,以容纳一台拥有数百万个GPU 的专注于AI的超级计算机。The Information报道称,该项目的成本可能“超过1150亿美元”,而目前在OpenAI内部被称为“星际之门”(Stargate)的超级计算机将位于美国。

该报告称,Microsoft将为数据中心买单,该数据中心可能比当今一些最大的运营中心“成本高出100倍”。Stargate将是两家公司希望在未来6年内建立的一系列数据中心项目中最大的一个,高管们希望在2028年之前运行它。

报告称,OpenAI和Microsoft正在分阶段构建这些超级计算机,Stargate将是第5阶段的系统。The Information的消息人士称,第4阶段的系统成本更低,最早可能在2026年启动,并且可能希望在威斯康星州的Mt. Pleasant开始。该系统可能需要几个Stargate,还需要足够的电力供应(至少几千兆瓦),以至于Microsoft和OpenAI正在考虑替代能源,例如核能。

消息人士表示,这种规模的数据中心将具有挑战性,部分原因是现有设计需要“将比过去更多的GPU放入单个机架中,以提高芯片的效率和性能,这意味着还要设计新颖的方法来保持良好的散热性能。

听起来这些公司也有可能利用这个设计来摆脱对英伟达的依赖。该报告称,OpenAI希望避免在Stargate中使用英伟达的InfiniBand电缆,尽管Microsoft在当前的项目中使用它们。OpenAI声称它宁愿使用以太网电缆。

很多事情仍有待确定,因此价格和计划似乎都可能发生变化,目前尚不清楚何时会最终确定细节。该信息还指出,尚未确定这台计算机将位于何处,以及它是将构建在单个数据中心还是“邻近的多个数据中心”中。

今年早些时候,有报道称,OpenAI首席执行官山姆·阿尔特曼(Sam Altman)雄心勃勃地制造人工智能芯片,并希望筹集多达7万亿美元来建设晶圆厂来生产它们。去年,Microsoft 发布了专门用于 AI 项目的 128 核 Arm 数据中心 CPU 和 Maia 100 GPU。也有报道称,Microsoft为人工智能数据中心开发自己的网络设备。随着人工智能的兴起,英伟达的GPU需求量很大,因此,像Microsoft和OpenAI这样的公司可能希望有一些其它选择是有道理的。

“我们一直在规划下一代基础设施创新,以继续推动人工智能的发展,”Microsoft首席通信官弗兰克·肖(Frank Shaw)告诉The Information,但他没有直接评论该超级计算机计划。

Microsoft在与OpenAI的合作中投入了数十亿美元,主要是以计算能力的形式运行其模型。如果Stargate或类似的东西成为现实,随着投资的规模越来越大,而且越来越复杂,这种伙伴关系只会越来越深。

美国超算有哪些?

2023年11月,全球超级计算大会正式公布了第62期全球超级计算机TOP500排行榜,美国橡树岭国家实验室的Frontier仍保持着第一名位置,中国的神威·太湖之光和天河二号A也进入了前十五,分别排名第11和第14。

排名第一的Frontier以1.194 EFlop/s的HPL性能继续保持领先地位。其搭载了基于最新的HPE Cray EX235a架构的2GHz AMD EPYC 64C 处理器,共有8699904个CPU和GPU核心。此外,Frontier还具有高达52.59 GFlops/W的额定能效,并可借助于HPE的Slingshot 11网络进行数据传输。

排名第二是美国阿贡国家实验室的Aurora超级计算机,其以585.34 PFlop/s的HPL性能杀入榜单。需要指出的是,此次 Aurora 的数值是在当前未完全建成状态下提交的,目前仅有计划中最终规模的一半。根据规划,Aurora 在建设完成后将配备21248个Intel Xeon Max系列CPU、63744个Intel Max系列GPU、20.42PB内存,峰值性能可达 2 EFlop / s,远超 Frontier。

排名第三的是安装于微软美国Azure云中的Eagle,HPL性能为561.2 PFlop/s,这也是云服务厂商取得的最高排名。其基于英特尔至强铂金8480C处理器和英伟达H100打造。

排名第四的是日本的富岳超级计算机,HPL分数为442.01 PFlop/s,基于富士通自研的基于Arm架构的 48 核处理器A64FX,总共装有大约16万个CPU芯片。

排名第五的是来自芬兰卡亚尼欧洲高性能计算中心的超级计算机LUMI,HPL性能达379.07 PFlop/s,基于HPE Cray EX235a 架构,配备了2GHz AMD EPYC 64C 处理器和AMD Instinct MI250X GPU。

排名第六的是意大利 CINECA 的一个 EuroHPC 站点上的 Leonardo 系统,HPL性能达 238.7 Pflop/s。它是一个 Atos BullSequana XH2000 系统,处理器为Intel Xeon Platinum 8358 32C 2.6GHz,加速器为 NVIDIA A100 SXM4 40 GB,采用四轨 NVIDIA HDR100 Infiniband 作为互连。

排名全球第七是美国田纳西州橡树岭国家实验室(ORNL)的Summit超级计算机,由 IBM 打造,目前在 HPL 性能为 148.8 Pflop/s,拥有 4,356 个节点,每个节点配备两个 POWER9 CPU(每个具有 22 个核心)和6个 NVIDIA Tesla V100 GPU(每个含有 80 个 SM),通过 Mellanox 双轨 EDR InfiniBand 网络保持连接。

第八名是西班牙 EuroHPC / 巴塞罗那超级计算中心最新安装的 MareNostrum 5 ACC 超算系统,这个 使用 Xeon Platinum 8460Y 处理器以及 NVIDIA H100 和 Infiniband NDR200,实现了 183.2 Pflop/s 的 HPL 性能。

排名第九的新 Eos 系统是英伟达打造的基于DGX SuperPOD 的系统,配备Intel Xeon Platinum 8480C 处理器、NVIDIA H100 加速器和 Infiniband NDR400 的 NVIDIA DGX H100,实现了 121.4 Pflop/s 的性能。

排名第十的是美国加利福尼亚州劳伦斯利弗莫尔国家实验室的 Sierra 系统。它的架构与排名第七的系统 Summit 非常相似,由 4,320 个节点组成,每个节点配备两个 POWER9 CPU 和四个 NVIDIA Tesla V100 GPU,可实现 94.6 Pflop/s 的性能。

此外,GREEN500 排名第一的位置仍然是美国纽约熨斗研究所的 Henri。该系统的能效等级为 65.40 GFlops / Watt,同时 HPL 得分为 2.88 PFlops / s。Henri 是一台联想 ThinkSystem SR670,配备 Intel Xeon Platinum 和 NVIDIA H100,共有 8,288 个核心,在 TOP500 排行榜上排名第 293 位。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 处理器
    +关注

    关注

    68

    文章

    20327

    浏览量

    254743
  • 超级计算机
    +关注

    关注

    2

    文章

    483

    浏览量

    43482
  • AI
    AI
    +关注

    关注

    91

    文章

    40982

    浏览量

    302533

原文标题:AI巨头筹划价值1100多亿美元的超级计算机项目

文章出处:【微信号:ICViews,微信公众号:半导体产业纵横】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    计算机专业408考研科目

    408 跨考零基础:三个月入门到精通路线 站在2026年的节点回望,计算机考研408(计算机学科专业基础综合)早已超越了单纯的知识点考核,它更像是一场对逻辑思维与系统观的深度洗礼。对于跨考且零基
    发表于 04-11 16:44

    使用NVIDIA技术驱动的超级计算机助力开放科学研究

    五个备受瞩目的 HPC 奖决赛入围项目凭借 Alps、JUPITER 和 Perlmutter 超级计算机的支持在气候建模、流体模拟等领域取得了重大突破。
    的头像 发表于 11-25 11:17 971次阅读

    快450000000倍!超导量子计算机“天衍-287”建成

    平台诞生,处理特定问题的速度较当前最快超级计算机快4.5亿倍,成为全球量子计算实用化进程中的关键里程碑。     “天衍-287”的核心竞争力源于其量子
    的头像 发表于 11-18 08:40 8893次阅读
    快450000000倍!超导量子<b class='flag-5'>计算机</b>“天衍-287”建成

    奥士康召开DGX Spark AI超级计算机项目表彰大会

    2025年9月22日,奥士康科技股份有限公司隆重召开DGXSparkAI超级计算机项目表彰大会,以表彰在客户开发、产品研发、工程设计和批量生产等方面作出突出贡献的核心团队。
    的头像 发表于 09-24 10:51 1038次阅读

    NVIDIA DGX Spark桌面AI计算机开启预订

    DGX Spark 现已开启预订!丽台科技作为 NVIDIA 授权分销商,提供从产品到服务的一站式解决方案,助力轻松部署桌面 AI 计算机
    的头像 发表于 09-23 17:20 1510次阅读
    NVIDIA DGX Spark桌面<b class='flag-5'>AI</b><b class='flag-5'>计算机</b>开启预订

    传iPhone 17 Pro起始存储或为256GB 特斯拉解散Dojo超级计算机团队 微软大裁15000人 CEO承认深感愧疚

    特斯拉解散Dojo超级计算机团队 据外媒爆料称,特斯拉正在解散其Dojo超级计算机团队,原团队负责人彼得·班农(Peter Bannon)将离
    的头像 发表于 08-08 11:33 1351次阅读

    NVIDIA助力AI超级计算机Isambard-AI投入使用

    英国布里斯托大学的超级计算机 Isambard-AI 采用 NVIDIA Grace Hopper 超级芯片,其 AI 算力达到了 21 E
    的头像 发表于 07-28 15:07 1416次阅读

    基于飞腾CPU的安全计算机平台研制项目通过试验评审

    近日,中国城市轨道交通协会技术装备专业委员会在青岛组织召开 “基于国产芯片和操作系统的安全计算机平台研制项目” 上道试验暨结题验收评审会,基于飞腾CPU的安全计算机平台研制项目顺利通过
    的头像 发表于 07-23 13:59 1111次阅读

    自动化计算机的功能与用途

    工业自动化是指利用自动化计算机来控制工业环境中的流程、机器人和机械,以制造产品或其部件。工业自动化的目的是提高生产率、增加灵活性,并提升制造过程的质量。工业自动化在汽车制造中体现得最为明显,其中许多
    的头像 发表于 07-15 16:32 881次阅读
    自动化<b class='flag-5'>计算机</b>的功能与用途

    工业计算机与商用计算机的区别有哪些

    工业计算机是一种专为工厂和工业环境设计的计算系统,具有高可靠性和稳定性,能够应对恶劣环境下的自动化、制造和机器人操作。其特点包括无风扇散热技术、无电缆连接和防尘防水设计,使其在各种工业自动化场景中
    的头像 发表于 07-10 16:36 899次阅读
    工业<b class='flag-5'>计算机</b>与商用<b class='flag-5'>计算机</b>的区别有哪些

    NVIDIA驱动的现代超级计算机如何突破速度极限并推动科学发展

    现代高性能计算不仅使得更快的计算成为可能,它正驱动着 AI 系统解锁更多领域的科学突破。 高性能计算经历了多次迭代,每一次都源于对技术的创造性再利用。例如,早期的
    的头像 发表于 06-26 19:39 1409次阅读
    NVIDIA驱动的现代<b class='flag-5'>超级</b><b class='flag-5'>计算机</b>如何突破速度极限并推动科学发展

    Blue Lion超级计算机将在NVIDIA Vera Rubin上运行

    德国莱布尼茨超算中心(LRZ)将迎来全新超级计算机 Blue Lion,其算力比该中心现有的 SuperMUC-NG 高性能计算机提升了约 30 倍。这台新的超级
    的头像 发表于 06-12 15:39 1341次阅读

    NVIDIA技术赋能欧洲最快超级计算机JUPITER

    NVIDIA 宣布,搭载 NVIDIA Grace Hopper 平台的 JUPITER 超级计算机成为欧洲最快超级计算机,其运行 HPC 和 AI
    的头像 发表于 06-12 15:33 1634次阅读

    NVIDIA助力全球最大量子研究超级计算机

    NVIDIA 宣布将开设量子-AI 技术商业应用全球研发中心(G-QuAT),该中心部署了全球最大量子计算研究专用超级计算机 ABCI-Q。
    的头像 发表于 05-22 09:44 1074次阅读

    一文带你了解工业计算机尺寸

    工业计算机是现代自动化、人工智能(AI)和边缘计算的支柱。这些坚固耐用的系统旨在承受恶劣的环境,同时为关键应用提供可靠的性能。然而,由于有这么多可用的外形尺寸,为您的工业计算机选择合适
    的头像 发表于 04-24 13:35 1187次阅读
    一文带你了解工业<b class='flag-5'>计算机</b>尺寸