0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

CCF HPC China 2023 | 超融合以太加持:北京大学高性能计算平台将迎来大提速

华为数据通信 来源:未知 2023-08-25 18:10 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

wKgZomToju-APKHNAABYb2B4C6Q259.png

8月25日,在青岛举行的全国高性能计算学术年会大会(CCF HPC China 2023)上,2023华为高性能计算解决方案分论坛同步举办。来自北京大学计算中心工程师付振新分享了“北京大学高性能计算平台超融合以太数据中心网络解决方案实践”。

wKgZomToju-Aaw42AADGekqd3fA526.jpg

北京大学计算中心工程师 付振新 现场分享

为满足校内的教学科研计算需求,北京大学从2018年起陆续建设了“未名一号”、“未名生科一号”、“未名教学二号”等高性能计算集群,有力地提升了校内的算力供应能力。随着承载的用户、计算任务和数据量不断增加,原有平台的网络基础设施性能逐渐不敷使用,因此北京大学在2023年进行了高性能计算平台的系统及网络改造项目。经过全方位的综合评估,北京大学最终选择了华为超融合以太数据中心网络解决方案,实现高性能计算平台的大提速,真正释放算力基础设施的全部潜力。

科研创新迎来算力时代

进入二十一世纪以来,人类的科学探索逐渐深入高度复杂、高度不确定性的新环境,大量庞大而复杂的科学问题需要借助超级计算机来进行模拟仿真、预测。从传统的化学化工、生物制药、高能物理、金融工程、社会治理,到新兴的大数据、人工智能、网络信息安全等等,都因强大算力的加持而取得了超出以往的全新进展和成果。

北京大学早在2018年就建成了高性能计算校级公共平台,先后建成投用了“未名一号”、“未名教学二号”、“未名生科一号”等5套集群。不过随着平台使用人数、计算任务的增加,网络基础设施的流量吞吐量和复杂性都大大增加,年均节点占用率都在80%以上,“未名生科一号”的节点占用率甚至长期处于95%以上,作业时间和排队时间变得越来越漫长。针对这一问题,几家供应商分别提出了基于IB、RoCEv1、RoCEv2等技术打造的网络方案。在北京大学组织的基准测试和通用地球系统模式CESM、分子动力学软件VASP等应用场景测试中,华为提供的基于RoCEv2的超融合以太数据中心网络解决方案表现出了优异性能,能够有效缩短作业运行时间和排队时间,于是成功入选北京大学高性能计算平台的改造项目。

生态开放、性能优异:RoCE前景看好

为适应用户对计算效率、时延、扩展性等方面的苛刻要求,高性能计算需要在不同节点之间实时高速传递海量数据,这对服务器互连方案的要求非常高。目前业界主流的计算互联协议有RoCE和IB两种,其中IB具有高吞吐、低时延、高可靠性等特点,技术先进,不过主要掌握在英特尔、IBM、英伟达等企业手中,技术和产品生态都比较封闭,成本高昂。RoCE则是一种基于以太网络的RDMA网络协议,生态相对开放,而且着力于实现网络的无损传输,深受各国高性能计算和AI等产业欢迎,被认为是未来全球数字化的重要路径。

华为基于RoCE的超融合以太技术,具有完善的流量控制、拥塞控制、流量调度和应用加速功能,独家实现了以太网0丢包。此外,华为还开发了在网计算(INC)技术有效提高集合通信效率、降低总的任务完成时间,在时延方面比IB略胜一筹。

在北京大学组织的测试中,共有TCP/IP、IB、RoCEv2三种方案,分别用基准测试工具Linpack和地球系统模式CESM、分子动力学软件VASP等应用进行实验。结果表明,承载VASP应用时,华为100GE RoCEv2略优于IB;承载Linpack和CESM时,华为方案与IB性能表现基本一致。此前权威评测机构Tolly也曾做过测试,在拥塞条件下的带宽和时延等基础性能测试、MPI计算性能基准测试以及HPC应用测试中,华为方案的性能都优于其它厂商的IB组网方案。这些实测结果都表明,华为超融合以太网络解决方案可完全可以代替IB方案。

wKgZomTojvCAATpjAAGCrMSf09s160.png

支持算力建设,服务数字未来

近年来,华为超融合以太网络解决方案已经在国内外多个高性能计算平台项目中落地应用。比如在2022年,华为超融合以太网络解决方案还在武汉超算中心、阿联酋高级国家研究和教育网络Ankabut项目中投入了应用,因其卓越性能而得到了客户的高度评价。

在北京大学高性能计算平台的前期项目中,“未名二号”集群就采用了华为100GE RoCE无损以太网络方案。“未名二号”由240台CPU计算节点和30台GPU计算节点组成,后续可扩容至340台CPU计算节点。与IB方案相比,北京大学高性能计算平台管理人员发现华为RoCE方案无需用户改变使用习惯,以太网带宽增加更快,性能也超出预期。

随着HPC和AI应用的快速发展,对网络带宽吞吐的需求将不断增长,从100GE、200GE、400GE到800GE等更高速率不断演进的以太网络无疑是最佳的承载技术。与此同时,RoCE无损以太网络在时延、吞吐量、可靠性、编解码和调制技术等方面也在不断进步,使得无损以太网络的总体性能不断提高,未来有望在自动驾驶、智能制造、生物科技、金融等更多行业和领域投入应用。

wKgZomTojvGAOb8aAAEeyHFS5w4874.png

wKgZomTojvGAUssyAABH79rerUY727.gif 点击“阅读原文”,了解更多华为数据通信资讯!


原文标题:CCF HPC China 2023 | 超融合以太加持:北京大学高性能计算平台将迎来大提速

文章出处:【微信公众号:华为数据通信】欢迎添加关注!文章转载请注明出处。


声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 华为
    +关注

    关注

    217

    文章

    35783

    浏览量

    260712

原文标题:CCF HPC China 2023 | 超融合以太加持:北京大学高性能计算平台将迎来大提速

文章出处:【微信号:Huawei_Fixed,微信公众号:华为数据通信】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    深开鸿荣获2025年度中国计算机学会“技术发明一等奖”!

    2025年10月24日,在中国计算机学会(CCF)主办的2025中国计算机大会(CNCC2025)颁奖典礼上,正式揭晓了2025年度“CCF科技成果奖”评选结果,由深开鸿联合
    的头像 发表于 10-27 15:21 420次阅读
    深开鸿荣获2025年度中国<b class='flag-5'>计算</b>机学会“技术发明一等奖”!

    北京大学彭练矛院士团队在高性能压力传感领域取得重要进展!突破性能瓶颈!

    的设计思路,这极大制约了其在需要精确力反馈与动态控制的复杂场景中的应用。   针对这一挑战,北京大学电子学院胡又凡-彭练矛团队提出了一种全新的“接触主导的局域电位移场增强”设计策略。该策略通过巧妙地设计传感器
    的头像 发表于 09-28 10:52 1070次阅读
    <b class='flag-5'>北京大学</b>彭练矛院士团队在<b class='flag-5'>高性能</b>压力传感领域取得重要进展!突破<b class='flag-5'>性能</b>瓶颈!

    【产品介绍】Altair HPCWorks高性能计算管理平台HPC平台

    AltairHPCWorksAltair高性能计算平台最大限度地利用复杂的计算资源,并简化计算密集型任务的工作流程管理,包括人工智能、建模和
    的头像 发表于 09-18 17:56 523次阅读
    【产品介绍】Altair HPCWorks<b class='flag-5'>高性能</b><b class='flag-5'>计算</b>管理<b class='flag-5'>平台</b>(<b class='flag-5'>HPC</b><b class='flag-5'>平台</b>)

    光电融合!中国团队突破6G全频段通信瓶颈

    月27日晚在线发表于《自然》杂志。   北京大学、香港城市大学组成的联合研究团队(图源:北京大学新闻网)   6G是继 5G 之后的新一代无线通信网络,旨在提升通信性能,实现全域覆盖、
    的头像 发表于 09-05 09:27 3642次阅读
    光电<b class='flag-5'>融合</b>!中国团队突破6G全频段通信瓶颈

    CCF HPC China 2025鄂尔多斯完美谢幕,共谱算新篇章

    8 月 13 日至 16 日,以 “绿动算力 融合” 为主题的第 21 届 CCF 全国高性能计算学术大会(
    的头像 发表于 08-21 13:06 316次阅读
    <b class='flag-5'>CCF</b> <b class='flag-5'>HPC</b> <b class='flag-5'>China</b> 2025鄂尔多斯完美谢幕,共谱<b class='flag-5'>超</b>算新篇章

    中科驭数亮相2025 CCF全国高性能计算学术大会

    在昨日开幕的中国计算机学会全国高性能计算学术大会(CCF HPC China 2025)上,中科
    的头像 发表于 08-20 09:39 626次阅读

    中科曙光发布了国内首个行业标准化融合算力平台:Nebula800

    8月15日,2025CCF全国高性能计算学术大会(HPC China2025)期间,中科曙光发布了国内首个行业标准化
    的头像 发表于 08-16 10:51 2800次阅读

    中科曙光助力中国首部融合行业标准发布

    8月14日,我国高性能计算领域首部融合行业标准《融合集群能力要求》在2025
    的头像 发表于 08-15 15:00 886次阅读

    澎峰科技邀您相约CCF HPC China 2025

    第21届CCF全国高性能计算学术年会(CCF HPC China 2025) 将于 2025年8
    的头像 发表于 08-07 11:33 1013次阅读

    知存科技助力北京大学校友论坛圆满落幕

    近日,由知存科技倾情支持的北京大学校友论坛在热烈的氛围中圆满落幕。作为第九届集微半导体大会的特色环节,今年的北大校友论坛吸引了数十位来自半导体产业不同领域的校友齐聚上海张江科学会堂,共叙母校情谊
    的头像 发表于 07-17 10:18 683次阅读

    中科曙光助力中国商飞高性能计算平台落地

    近日,中国商飞上海航空工业(集团)有限公司(以下简称“上航公司”)国产高性能计算平台建成落地。该平台由中科曙光依托“
    的头像 发表于 05-13 18:01 849次阅读

    香橙派AIpro(20T)走进北京大学、上海交通大学等高校鲲鹏昇腾科教创新卓越中心特训营

    近日,北京大学、上海交通大学等高校鲲鹏昇腾科教创新卓越中心特训营-DeepSeek专场成功举办。活动旨在基于昇腾技术的DeepSeek本地化部署实践分享,培养学员自主创新开发能力。华为技术专家
    的头像 发表于 04-18 11:51 977次阅读
    香橙派AIpro(20T)走进<b class='flag-5'>北京大学</b>、上海交通<b class='flag-5'>大学</b>等高校鲲鹏昇腾科教创新卓越中心特训营

    超级计算HPC 之间的界限日趋模糊

    难以区分,这推动了商业和科学应用性能的巨大提升,也给两者带来了类似的挑战。虽然超级计算高性能计算(HP
    的头像 发表于 03-17 10:33 833次阅读
    超级<b class='flag-5'>计算</b>与 <b class='flag-5'>HPC</b> 之间的界限日趋模糊

    康佳特发布高性能COM-HPC模块

    德国康佳特近日宣布扩展其高性能COM-HPC计算机模块产品线,推出全新的conga-HPC/cBLS模块。该模块专为需要强大计算
    的头像 发表于 02-05 18:21 1237次阅读

    HPC计算的技术架构

    HPC计算结合了HPC的强大计算能力和云计算的弹性、可扩展性,为用户提供了按需获取高性能
    的头像 发表于 02-05 14:51 689次阅读