0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

是什么,让中国成为一台超级计算机?

脑极体 来源:脑极体 作者:脑极体 2022-08-03 09:13 次阅读

2022年7月29日,由工信部与山东省政府主办的首届中国算力大会在济南开幕。在东数西算如火如荼发展的大背景下,各种关于算力的重磅话题在这次大会中轮番登场,热闹非凡。其中,算力网络建设相关议题引发了各界关注。

据了解,“中国算力网”是鹏城实验室在国家有关部委指导下推进的算力网络计划。该计划提出了“像建设电网一样建设国家算力网,像运营互联网一样运营算力网,让用户像用电一样使用算力服务”的发展愿景。算力网络既是对现有网络体系的巨大升级,也是对计算产业与应用边界的颠覆。有人认为,如果中国算力网真正建成,那么整个中国将变成一台全球最大的计算机。无论你在中国何处,都可以像获取水力、电力一样获取源源不断的算力。

当然,想要实现“全国一台计算机”的宏大设想,让东数西算工程成为跨时代的发展支点,还需要解决一系列产业挑战和技术问题。如何确保算力全国性的流动与调用中不损失、不浪费?如何实现全社会范围内的算力投资回报最大化?这就需要有一套完整、先进的技术与产业底座作为算力网络建设的支撑。

综合来看,算力网络IP化是最具产业共识与标准化可行性的升级方案,而云网融合则是确保企业精准应用算力,激活算力价值的核心方案。基于“IPv6+”打造的智能云网,是算力网络建设的底座最优选择。

《旧唐书》:“大厦永固,是栋梁榱桷之全也”。基于“IPv6+”打造的智能云网底座,就从数据中心网络与算力调度网络两方面,支撑起了算力网络大厦的时代栋梁。

大厦将兴:算力网络建设的挑战与需求

东数西算,网络为先。计算全国化调度能够成立的基本前提条件,是网络端可以实现算力不过度浪费损耗,同时算力成本整体可控,而这就需要打造全国性的算力网络。算力网络是一个标准的“木桶效应”体系。从网络架构上来,算力网络需要容纳数据中心网络、传输网、接入网等部分,任何一段网络无法有效负载算力,都将导致整个网络的价值丧失。从技术协作角度看,算力网络高度考验着存、算、网的整体协同。网络能力必须完整发挥出存、算端的能力升级,网络需要配合算力的高效释放、灵活调度,为使用者提供便捷可用的算力资源。

在算力时代,算力是中心,网络是根基。但网络的重要性又导致了算力网络建设过程中的一系列挑战。比如说网络的灵活调度、高度无损,以及运维管理的智能化、网络的节能环保等等。其中非常重要的问题,就是上面所说如何满足算力网络“木桶效应”的特点,进行数据中心网络、网络传输体系、边缘侧网络的整体能力升级,确保算力网络不会有某一处“漏水”导致前功尽弃。

为了实现这一目标,最为可取的方式就是建立统一化、标准化,同时满足一系列算力网络需求的网络底座。而华为基于“IPv6+”创新技术,联合各界伙伴打造的智能云网就符合这一需求。智能云网可以有效实现网络高清无损的需求,同时可以引入IPv6网络灵活配置、方便部署的能力,堪称算力时代的联接底座。建立在云网融合基础上的智能云网,可以实现对算力价值的放大,承载更多应用,并实现算力和网络的相互促进以及全网算力的统筹调配和协同利用。

而在如何解决算力网络“木桶困境”的问题上,智能云网的价值也体现无疑。智能云网可以实现数据中心网络升级和算力传输网络升级的同步进行。两大网络的同步采用智能云网,可以实现数据中心网络的“栋”,与算力传输网络的“梁”彼此支撑,最终实现“全国一台计算机”的大厦崛起。

一栋擎天:数据中心网络架起算力引擎

在中国传统建筑中,“栋”是房屋的主要支撑点,负载着全屋的重量,而数据中心在整个东数西算工程中就承担着这样的作用。而数据中心网络的智能云网升级,也就是算力网络中起到支撑作用的“栋”。

在数据中心当中,有无数台服务器联接起一个庞大的计算集群体系。而服务器联接规模越大,对联接能力的要求也就越高。如果网络联接能力不佳,很有可能造成算力在数据中心中就被无端消耗,不仅难以实现计算集群化的目标,更损失了巨量的能源。比如说,海量服务器之间进行数据互访时,很容易由于流量突发而产生丢包。以RoCE网络为例,0.1%的丢包会导致网络吞吐率下降50%,最终造成算力资源的严重浪费。

因此,数据中心网络要能够实现零丢包、100%释放,可以说是全国性算力网络能够实现的前置条件之一。为此,华为推出了智能无损数据中心网络2.0,可以帮助全国各地的数据中心构建算力时代的网络基石。华为智能无损数据中心网络2.0,面向通用计算、高性能计算、存储等场景全新升级,具备应用加速、高通量、低时延等特点,实现多元算力水平显著提升。华为创新地将智能无损算法引入数据中心网络交换机,攻克了以太网丢包难题。在服务器规模不变的情况下,数据中心内算力最高可提升93%。为了构建超大规模算力集群,华为将直连拓扑和自适应路由引入以太网领域,目前最高可支持27万台服务器的零丢包组网。尤其值得注意的是,华为智能无损数据中心网络2.0能够支持IPv6部署,从而可以实现数据中心网络更调度更加灵活,运维管理更加便利。

算力中心网络的升级,可以有效构筑其算力网络的核心引擎,进而支撑起算力唾手可得的未来图景。

百梁纵横:以智能云网搭建算力运输网络

想要实现算力的灵活高效获取,让算力变成水和电一样的基础设施,就必须要有一张能够将算力输送到千行百业的运输网络。想要让企业像获取电力一样获取算力,像使用网络一样使用云服务,就必须由智能云网来做算力网络的运输通道。这一根根梁,通向着一个个行业,一家家企业,最终实现算力网络的落地部署。

不久之前,华为刚刚发布了智能云网2.0解决方案。智能云网2.0在智能云网1.0的基础上,进行新架构、新体验、新模式、新服务四方面升级。算力网络承载着海量企业成百上千的业务。针对每家企业对算力的需求不同,智能云网中搭载了智能云图算法和基于IPv6+的一系列技术创新,最终可以实现按照业务需求为企业提供最佳调度算力网络路径,实现供需侧的最优资源配置。同时,智能云网还可以通过切片技术将网络划分成不同车道,确保算力高效、及时和准确地送达企业。

而在边缘侧场景这个“算力网络的最后一公里”,由于边缘侧设备在不断剧增,算力协同难度更大,网络配置挑战更多。需要实现边缘算力和网络的相互感知,最终完成“网络+算力”在边缘的联合优化调度。华为积极探索算力感知路由创新,将网络接入节点根据应用标识对应用进行实时流量调度,从而提升整网算力、存储、网络等资源利用率,为用户提供边缘最优算网服务。

2020年10月,华为首次发布了智能云网解决方案,开启了云网融合的新时代。如今,智能云网已经成为业界共识,被誉为智能时代的“新电网”。截至2022年6月,华为完成了260多张智能云网和40000多个智能云端部署。在智能云网的帮助下,算力网络可以更加高效、准确地完成落地,实现东数西算愿景快速实现。

通过最先进的网络技术与解决方案,帮助实现算力网络升级,正在带来一系列改变,比如说——

把算力变成继水、电之后的又一公共资源,随时通入每家每户,千行百业。

把数字中国变成一台超级计算机,联接东西,纵横南北。

把计算与智能的伟大变革契机,留在这片土地上。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 超级计算机
    +关注

    关注

    2

    文章

    434

    浏览量

    41612
  • 算力
    +关注

    关注

    1

    文章

    659

    浏览量

    14364
  • 东数西算
    +关注

    关注

    0

    文章

    74

    浏览量

    2596
收藏 人收藏

    评论

    相关推荐

    英伟达帮助日本建造混合量子超级计算机

    英伟达正在帮助日本建造混合量子超级计算机,这是日本国家量子计算计划的一部分。
    的头像 发表于 04-23 14:54 220次阅读

    诺和诺德基金会将联手英伟达打造丹麦AI超级计算机

    诺和诺德基金会携手英伟达,共同宣布在丹麦打造一台领先的AI超级计算机。这台超级计算机将致力于推动医疗保健、生命科学以及绿色转型等领域的科研与
    的头像 发表于 03-21 13:43 162次阅读

    【量子计算机重构未来 | 阅读体验】+ 初识量子计算机

    欣喜收到《量子计算机——重构未来》书,感谢电子发烧友论坛提供了我了解量子计算机的机会! 自己对电子
    发表于 03-05 17:37

    Tesla 计划斥资 5 亿美元建造一台由 NVIDIA 的 AI GPU 提供支持的 Dojo 超级计算机

    ABSTRACT摘要Tesla计划斥资5亿美元建造一台由NVIDIA的AIGPU提供支持的Dojo超级计算机,因此该公司正在加大基于AI的开发力度。JAEALOT2024年1月27日Tesla计划
    的头像 发表于 02-19 12:45 314次阅读
    Tesla 计划斥资 5 亿美元建造<b class='flag-5'>一台</b>由 NVIDIA 的 AI GPU 提供支持的 Dojo <b class='flag-5'>超级</b><b class='flag-5'>计算机</b>

    特斯拉将在纽约州打造Dojo超级计算机

    特斯拉近日宣布,将在美国纽约州布法罗市投资5亿美元,建造一台名为“Dojo”的超级计算机。这一决策源于纽约州稳定的电力供应、杰出的人才储备以及满足项目需求的充足空间。
    的头像 发表于 02-01 10:32 340次阅读

    特斯拉将斥资5亿美元建造Dojo超级计算机

    据外媒报道,特斯拉将在其位于纽约布法罗的超级工厂投资超过5亿美元,建造一台名为Dojo的超级计算机。这一举措旨在推进特斯拉的自动驾驶汽车计划。
    的头像 发表于 01-29 11:26 351次阅读

    欧盟首台百亿亿次级超级计算机JUPITER建设成果显著,进入新阶段

    欧洲超级计算机联盟 EuroHPC JU 曾于 2023 年 10 月宣布,将投资 2.73 亿欧元打造欧洲第一台超大规模超级计算机——JU
    的头像 发表于 01-25 14:40 277次阅读

    如何超级简单的 DIY 一台 树莓派5 供电的计算机

    的适应性意味着,如果你愿意,你可以创建更复杂的东西。 (它有点笨重,但很坚固,而且非常容易制作) 早在之前,我们就用 Raspberry Pi 4 制作了一台非传统的便携式电脑。现在是时候用全新的 Raspberry Pi 5 将其现代化了。 在我们了解构建计算机所需的
    的头像 发表于 12-15 17:48 375次阅读
    如何<b class='flag-5'>超级</b>简单的 DIY <b class='flag-5'>一台</b> 树莓派5 供电的<b class='flag-5'>计算机</b>

    工业计算机的应用

    工业计算机在半导体设备上的应用,具体在哪方面。比如说图像处理使用什么样的计算机,工业控制使用哪方面的计算机
    发表于 09-12 14:19

    计算机组成与设计

    计算机组成与设计 计算机组成与设计是计算机科学中最基础的课程之一,它主要阐述了计算机的组成原理和设计方法。随着计算机技术的快速发展,
    的头像 发表于 08-17 12:37 937次阅读

    gh200和超级计算机哪个牛

    gh200和超级计算机哪个牛 随着科技的不断发展,计算机已经成为人类生活不可或缺的一部分。计算机的崛起极大地改变了世界和每个人的生活。过去几
    的头像 发表于 08-17 10:51 323次阅读

    gh200和超级计算机哪个牛

    gh200和超级计算机哪个牛  随着科技的不断发展,计算机已经成为人类生活不可或缺的一部分。计算机的崛起极大地改变了世界和每个人的生活。过去
    的头像 发表于 08-16 17:34 334次阅读

    NVIDIA Cambridge-1 AI 超级计算机通过云让更多研究人员能够访问

    进行开创性的药物研究、探索替代能源还是寻找预防金融欺诈的新方法,访问先进的 AI 计算资源都是推动创新的关键。这种新的计算模式可以解决生成式 AI 所带来的挑战,并推动下一轮创新。 Cambridge-1 是 NVIDIA 在英国上线的
    的头像 发表于 06-19 19:05 301次阅读

    NVIDIA Grace 掀起新型节能 Arm 超级计算机的新浪潮

    英国科研联盟 GW4 打造能效提升 6 倍的超级计算机,用于气候科学、医学研究等领域 德国汉堡 - 国际超算大会(ISC)- 2023 年 5 月 21 日 - NVIDIA 今天
    的头像 发表于 05-23 07:10 383次阅读

    三星计划开发基于内存的超级计算机

    "三星电子的目标是在2028年前开发出一台基于内存的超级计算机,"三星电子设备解决方案业务的首席执行官Kyung Kye-hyun周四在大田的KAIST发表演讲时说。
    发表于 05-12 11:26 186次阅读