0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

AMD和惠普企业介绍新制造的超级计算机Frontier

中科院半导体所 来源:悦智网 作者:Charles 2022-11-03 16:07 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

AMD和惠普企业介绍新制造的超级计算机Frontier。

当前全世界最快的超级计算机是美国田纳西州橡树岭国家实验室打造的Frontier,该计算机运算功能强大,运算速度比其他7台最快的超级计算机的总和还要高,是运算速度排名第二的计算机的2倍多。Frontier不仅是第一台突破每秒百亿亿次计算(exaflops)门槛的计算机,还在全球高能效超级计算机中排名第二。现在,协作制造Frontier的超微半导体公司(AMD)和惠普企业揭开了该超级计算机正常运转的电子诀窍。

Frontier由74个惠普企业Cray EX超级计算机柜组成,这些机柜共容纳超过9400个CPU。每个节点都包含1个优化的第三代AMD EPYC 64核2千兆赫Trento处理器,用于一般任务处理,以及4个AMD Instinct MI250X加速器,用于高度并行超级计算和人工智能AI)运算,此外,还有5太字节闪存,协助向GPU快速输送数据。Frontier总共包含9408个CPU、37632个GPU和8730112个内核,这些组件由145千米的网络电缆连接在一起。美国田纳西州橡树岭国家实验室表示,这台全球领先的超级计算机的功耗约为21兆瓦。

f0f8bc84-5a9f-11ed-a3b6-dac502259ad0.jpg

2022年5月,在德国汉堡的全球高性能计算大会上,Frontier展示了每秒1.1 exaflops的整体性能,成为全球500强超级计算机的巅峰。它还可能变得更快,理论峰值性能为2 exaflops。

另外,Frontier在最新的全球绿色500强中排名第二,该排名衡量超级计算机的能源效率。(这并不影响它在整体性能上成为全球最快的超级计算机。)不过,日本的MN-3作为先前全球绿色500强的榜首,每瓦能实现39.38 gigaflops(每秒10亿浮点运算),而Frontier的测试开发系统为每瓦52.23 gigaflops。

Frontier成功的一个关键在于采用AMD的Infinity Fabric互连架构,每个节点内CPU和GPU连接方式有助于增加CPU和GPU的一致性,即它们的共享数据视图完全相同。

得克萨斯州奥斯汀AMD公司GPU和加速处理数据中心的副总裁布拉德•麦克雷迪(Brad McCredie)说:“一致性对于提升性能非常重要。它能帮助你确保分配合适的处理器运行合适的工作负载。很容易使并行CPU处理小任务和GPU处理大型任务。”

在Frontier的开发中,AMD表示,其面对的最大的挑战是功率性能。“有很多文献说,要达到每秒百亿亿次运算,需要几十万个GPU和150兆到500兆瓦功率,而我们想要使用几万个GPU和20兆瓦功率来实现。”麦克雷迪说,“因此,开发过程中上上下下每个人都在追求效率。”

例如,Frontier的每个GPU上都紧密结合一个128千兆字节的高带宽内存。这可以帮助GPU克服计算机性能的一个著名瓶颈:内存和处理之间的数据传输。

此外,Frontier的每个GPU还使用了台积电生产的先进6纳米节点芯片。因此,“它们执行双精度浮点运算的速度与单精度浮点运算相同,这是一项重大创新。”麦克雷迪说。

借助这些进步,Frontier只需几万个GPU,而不需要几十万个GPU。“它承担所有的并行管理,将程序员身上的负担转移到硬件上。这使得该系统更易于编程。”麦克雷迪说。

一个“计算刀片”上有2个AMD节点,74个机柜中的每个都装有64个这种刀片。计算刀片通过惠普企业Slingshot连接器互连,每个连接器都有一个专门设计的64端口交换机,可提供每秒12.8太字节的网络带宽。各组刀片的连接采用一种被称为蜻蜓的拓扑结构,数百个机柜和数十万个节点都可以相互通信,任意两个节点之间最多可以跳转3次。

“Slingshot的部署得到了高度优化,根据所需距离合理采用能效最高的电缆,直连铜缆和有源光缆。”惠普企业资深会员和HPC/MCS的首席技术官迈克•伍德克(Mike Woodacre)说。他补充道,去除低效的通用器件“显著降低了线缆的能耗”。

机柜中计算机刀片的降温采用了液体冷却。惠普企业高性能计算和人工智能系统副总裁杰拉尔德•克莱恩(Gerald Kleyn)表示,这台超级计算机的密度能够达到传统风冷结构的5倍。其结果是,这种紧凑的系统反过来大大降低了布线要求和运行费用。

“突破百亿亿次计算的门槛很重要,同时位列全球绿色500强第二更是非凡。”克莱恩说。此外,他说,在疫情期间和全球性供应链问题的环境下,实现这一点“全靠美国橡树岭国家实验室、惠普企业和AMD之间强大的团队合作”。

Frontier下一步的工作包括继续测试和验证该系统。该实验室表示,2022年后期将继续进行最后验收和早期科学应用,计划于2023年初全面开放应用于科学项目。

已经计划在Frontier展开的项目包括癌症研究、药物研发、核聚变、特殊材料、超高效引擎和恒星爆炸。这台机器的目标是将完成这类工作所需的时间从几周缩短到几个小时,从几个小时缩短到几秒。

“Frontier可帮助科学家们开展更多的科学研究,这意味着更接近高效清洁能源,更快发现有效的病毒疫苗。”麦克雷迪说,“Frontier成为首个百亿亿次级计算机,这是我们整个征途的开始。看到美国橡树岭国家实验室的研究人员致力于解决气候、能源和疫情方面的问题,以及人类面临的其他重大挑战,我们已经从制造一台强大的计算机走向想要制造一些对每个人都有帮助的东西。”

审核编辑 :李倩

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • amd
    amd
    +关注

    关注

    25

    文章

    5723

    浏览量

    140634
  • 计算机
    +关注

    关注

    19

    文章

    7852

    浏览量

    93601
  • 超级计算机
    +关注

    关注

    2

    文章

    485

    浏览量

    43523

原文标题:首台百亿亿次计算机内部的秘密

文章出处:【微信号:bdtdsj,微信公众号:中科院半导体所】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    千比特量子计算机横空出世!国产企业进入商业化“快车道”

    量子相继宣布新一轮融资,玻色量子还发布了国内首个突破千比特规模的专用量子计算机“驭量·山海1000”。     量子+A I成为关注点, 国内量子计算机多路线并进 什么是量子计算机?与经典计算
    的头像 发表于 04-14 09:07 5832次阅读
    千比特量子<b class='flag-5'>计算机</b>横空出世!国产<b class='flag-5'>企业</b>进入商业化“快车道”

    上海计算机视觉企业行学术沙龙走进西井科技

    12月5日,由中国图象图形学学会青年工作委员会(下简称“青工委”)、上海市计算机学会计算机视觉专委会(下简称“专委会”)联合主办,上海西井科技股份有限公司、江苏路街道商会承办的“上海计算机视觉
    的头像 发表于 12-16 15:39 810次阅读

    深圳中国首个光量子计算机制造工厂落成

    据央视新闻报道;在24日;深圳南山区国内首个光量子计算机制造工厂正式进入小规模生产阶段,据悉该工厂是隶属于玻色量子;总面积约5000平方米,集研发、制造、测试于一体,用于实现光量子计算机的工程化、标准化和规模化生产。第一台
    的头像 发表于 11-25 17:17 2330次阅读

    工控机与普通计算机的核心差异解析

    在工业自动化和智能制造领域,计算机设备作为核心控制单元,其选择直接影响整个系统的稳定性与可靠性。工控机与普通计算机虽同属计算设备,但其设计目标、性能侧重和应用场景存在根本性差异。准确理
    的头像 发表于 11-25 14:45 2081次阅读
    工控机与普通<b class='flag-5'>计算机</b>的核心差异解析

    使用NVIDIA技术驱动的超级计算机助力开放科学研究

    五个备受瞩目的 HPC 奖决赛入围项目凭借 Alps、JUPITER 和 Perlmutter 超级计算机的支持在气候建模、流体模拟等领域取得了重大突破。
    的头像 发表于 11-25 11:17 1104次阅读

    奥士康召开DGX Spark AI超级计算机项目表彰大会

    2025年9月22日,奥士康科技股份有限公司隆重召开DGXSparkAI超级计算机项目表彰大会,以表彰在客户开发、产品研发、工程设计和批量生产等方面作出突出贡献的核心团队。
    的头像 发表于 09-24 10:51 1146次阅读

    【作品合集】赛昉科技VisionFive 2单板计算机开发板测评

    赛昉科技VisionFive 2单板计算机开发板测评作品合集 产品介绍: 昉·星光 2是全球首款集成了3D GPU的高性能量产RISC-V单板计算机,搭载昉·惊鸿-7110(型号:JH-7110
    发表于 09-04 09:08

    工业计算机的重要性

    工业计算机对某些行业至关重要。我们将在下面详细解释这些行业中的工业计算机应用。1.制造与工业自动化工业级计算机非常适合制造工厂,特别是那些想
    的头像 发表于 07-28 16:07 818次阅读
    工业<b class='flag-5'>计算机</b>的重要性

    NVIDIA助力AI超级计算机Isambard-AI投入使用

    英国布里斯托大学的超级计算机 Isambard-AI 采用 NVIDIA Grace Hopper 超级芯片,其 AI 算力达到了 21 ExaFLOPS,不仅是英国最快的系统,同时也是全球能效最高的系统之一。
    的头像 发表于 07-28 15:07 1537次阅读

    自动化计算机经过加固后有什么好处?

    -40℃的寒冷环境中运行⁰C和温度达到85℃的灼热环境,这要归功于此类系统中使用的宽温度组件和被动冷却技术。2.抗冲击和振动自动化计算机是工业级计算机,其设计和制造
    的头像 发表于 07-21 16:44 829次阅读
    自动化<b class='flag-5'>计算机</b>经过加固后有什么好处?

    自动化计算机的功能与用途

    工业自动化是指利用自动化计算机来控制工业环境中的流程、机器人和机械,以制造产品或其部件。工业自动化的目的是提高生产率、增加灵活性,并提升制造过程的质量。工业自动化在汽车制造中体现得最为
    的头像 发表于 07-15 16:32 982次阅读
    自动化<b class='flag-5'>计算机</b>的功能与用途

    工业计算机与商用计算机的区别有哪些

    工业计算机是一种专为工厂和工业环境设计的计算系统,具有高可靠性和稳定性,能够应对恶劣环境下的自动化、制造和机器人操作。其特点包括无风扇散热技术、无电缆连接和防尘防水设计,使其在各种工业自动化场景中
    的头像 发表于 07-10 16:36 998次阅读
    工业<b class='flag-5'>计算机</b>与商用<b class='flag-5'>计算机</b>的区别有哪些

    NVIDIA驱动的现代超级计算机如何突破速度极限并推动科学发展

    现代高性能计算不仅使得更快的计算成为可能,它正驱动着 AI 系统解锁更多领域的科学突破。 高性能计算经历了多次迭代,每一次都源于对技术的创造性再利用。例如,早期的超级
    的头像 发表于 06-26 19:39 1495次阅读
    NVIDIA驱动的现代<b class='flag-5'>超级</b><b class='flag-5'>计算机</b>如何突破速度极限并推动科学发展

    Blue Lion超级计算机将在NVIDIA Vera Rubin上运行

    德国莱布尼茨超算中心(LRZ)将迎来全新超级计算机 Blue Lion,其算力比该中心现有的 SuperMUC-NG 高性能计算机提升了约 30 倍。这台新的超级
    的头像 发表于 06-12 15:39 1462次阅读

    NVIDIA技术赋能欧洲最快超级计算机JUPITER

    NVIDIA 宣布,搭载 NVIDIA Grace Hopper 平台的 JUPITER 超级计算机成为欧洲最快超级计算机,其运行 HPC 和 AI 工作负载的速度是第二名的两倍以上。
    的头像 发表于 06-12 15:33 1769次阅读