0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

算力网络的架构

倩倩 来源:算力基建 作者:算力基建 2022-08-17 09:32 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

01算力网络的架构

之前我提到过,算力网络的作用,是为用户提供算力资源服务。 它将算力资源彻底“融入”通信网络,以一个更整体的形式,提供最符合用户需求的算力资源服务。

2294e8d2-1dcc-11ed-ba43-dac502259ad0.png

这是一个高度灵活、高度智能的网络。
算力网络的核心特征,是它通过算力,实现了对算力资源、网络资源的全面接管,可以让网络实时感知用户的算力需求,以及自身的算力状态。经过分析后,算力网络可以调度不同位置、不同类型的算力资源,为用户服务。 我们可以把它理解成一个“万能水龙头”。它总能够按你的需要,提供合适强度、合适温度、合适酸碱度的水流,让你拥有最好的用水体验。 那么,我们自然会很好奇,这个“万能水龙头”的背后,究竟是一张怎样的“水网”?它是如何进行资源控制和调度的? 接下来,我们就看看算力网络的体系架构。 首先,我需要提前说明一下,算力网络目前还是一个研究中的技术,并没有完全定型。所以,我下面给出的,只是各个运营商和设备商的算力网络架构(设想)图,相互之间会存在一定的差异。而且,未来也很可能在发生变动,请大家知悉。 下面的这几张,就是运营商和设备商比较有代表性的算力网络架构(设想)图:

22afd106-1dcc-11ed-ba43-dac502259ad0.png

中国移动(来自《算力网络技术白皮书》,2022)

22cc62e4-1dcc-11ed-ba43-dac502259ad0.png

中国移动(来自《算力网络白皮书》)

22e47532-1dcc-11ed-ba43-dac502259ad0.png

中国联通(来自华为WIN-WIN创新周,2022)

2300e6f4-1dcc-11ed-ba43-dac502259ad0.png

中国联通算力网络架构 (来自《算力网络架构与技术体系白皮书》)

230ef0fa-1dcc-11ed-ba43-dac502259ad0.png

中国电信云网融合目标技术架构 (来自《云网融合2030技术白皮书》)

2316084a-1dcc-11ed-ba43-dac502259ad0.png

华为(来自华为WIN-WIN创新周,2022) 这些图都有点复杂,相信大家都不太看得懂。我画一个简单的示意图,大家应该能看明白:

232ace2e-1dcc-11ed-ba43-dac502259ad0.png

简单来说,还是信息通信的分层思想,按层级来看,就能理清思路。为了减轻阅读压力,大家可以先把右边的绿色低碳和安全防护先pass掉。 我们从下往上,一层一层来看。

算网基础设施

算力网络的最下层,依然是算网基础设施层,这个逃不掉的。在算力网络中,基础设施不再仅仅是算力资源(CPU、存储、GPU等),还包括了网络资源。 在算力资源这边,对算力基础设施的整合,依旧是以云技术为核心,包括云原生、虚拟化、容器等。 在这里,和算力有关的一些底层新技术创新,也值得关注,例如异构计算、无服务计算(Serverless Computing)、存算一体、算力卸载等。大家可以先不管,以后再专题介绍。 网络这边,变化比较大。前几期文章给大家介绍过,云网融合趋势下的网络变化,用一句话来解释,就是把封闭的网,变得更开放(解耦),让它变成像计算机一样,可以通过软件的方式(软件定义),去给它下“命令”。 网络的底层(物理层、数据链路层),在传输网这边,依旧是光(只有光,才能保证通信带宽和容量等基本硬指标)。光底层的技术,例如OTN、OXC、ROADM、C+L频段、400G/800G啥的,都还是它们,没有什么区别。 在接入网那边,5G NR、PON(50G-PON),也没有什么特别(除了边缘算力会有点关系之外)。 变化大的,在网的上层。我们待会再讲。

算网一体(算力资源管理、网络资源管理)

再往上,开始有不一样了。因为算力网络要调度算力和网络资源,所以,需要对资源进行“预处理”和“衔接”。(这一层,其实很多架构里都归于编排管理层。我觉得单独拎出来,会比较容易理解一些。) 这一层,最值得关注的是算力路由。 算力网络和传统网络的最大区别,在于它所拥有三大特性。第一大特性,就是算力路由。 在算力之前,先要说说算力感知。 算力感知是网络对算力资源和算力服务的部署位置、实时状态、负载信息、业务需求的全面感知。中国移动的算力感知网络白皮书,就是站在算力感知的角度,进行分析的。

233e837e-1dcc-11ed-ba43-dac502259ad0.png

算力感知网络的体系架构 (来自中国移动《算力感知网络CAN技术白皮书2021》) 一方面,各算力节点将算网信息度量建模后统一发布,网络通过对多节点上报的算网信息进行聚合,构建全局统一的算网状态视图。另一方面,网络完成对业务算网需求的统一解析,实现对业务的全面感知,为基于业务需求进行算力调度提供保障。

234f39f8-1dcc-11ed-ba43-dac502259ad0.png

算力状态感知与通告 (来自《算力感知网络CAN技术白皮书2021》) 说白了,算力感知的目的,就是摸清手上到底有多少资源,用户到底有怎样的需求。 感知的对象,肯定需要进行度量和标识。于是,就有了算力度量和算力标识。 这两块,运营商目前非常重视。 算力这个东西存在多样性,也存在异构硬件芯片,所以,目前还没有形成统一的度量体系和标准。这会对建立统一的算力模型造成麻烦。很简单,度量单位都不一样,如何进行算力评估和计费? 算力标识的话,就相当于算力的身份证。用户通过算力标识指示所需服务,网络通过解析算力标识获取目标算力服务、算力需求等信息,为算力调度等提供基础。这个算力标识,必须是全局统一且可验证的。 好了,接下来,就是算力路由。 在刚才那个中国移动的算力感知网络架构图里,在算力资源层之外,还单独划了一个算力路由层。 算力路由层是算力感知网络的核心功能层,支持对网络、计算、存储等多维资源、服务的感知与通告,实现“网络+计算”的联合调度。 算力路由层,包括算力路由控制技术和算力路由转发技术,实现业务请求在路由层的按需调度。 说到算力路由,肯定就要说到CFN(Computing First Networking,计算优先网络)。 CFN广义上有时候会被用来指代整个算力网络。但是,在这里,CFN是一种分布式路由协议,在不同边缘云之间,按需进行着算力的调度和均衡。

2363e434-1dcc-11ed-ba43-dac502259ad0.png

CFN技术架构(来自《算力感知网络技术白皮书》) CFN这个东西其实很有意思。我们传统理解的路由,都是数据报文的路由。CFN这里的路由,是将计算资源状况和网络资源状况作为路由信息,发布到网络。然后呢,网络基于虚拟的服务ID,将计算任务报文,路由到最合适的计算节点。 目前,CFN协议主要通过在业务路由的BGP报文头中,以扩展字节信息的方式携带算力信息,将网络中计算节点的负载情况实时向全网进行扩散。 很显然,算力路由和CFN,是上一层进行算力调度的前提。

编排管理

再往上,就是算力网络的核心关键部分——编排管理。 搞过核心网NFV(网元功能虚拟化)的同学,对编排一定非常熟悉。在NFV架构里,就有编排。这是一个很有意思的词,把你给“收编、安排”了。说白了,就是完全控制和调度。 算力网络的第二大特性,就是算力调度。 算力调度,就是基于算网大脑,进行全网算力资源的智能编排、弹性调度。 更具体来说,是:完成算力运营及算力服务编排,完成对算力资源和网络资源的管理,包括对算力资源的感知、度量和OAM管理等;实现对终端用户的算网运营,以及对算力路由层和网络资源层的管理。 算力资源被感知、标识和感知之后,为了进行管理,还有一个算力资源管理的逻辑过程(也有被单独称为:算力管理层)。主要包括算力注册、算力OAM(性能监控、故障管理)、算力运营(计费管理、服务合约等)。

236c2d2e-1dcc-11ed-ba43-dac502259ad0.png

算力管理层(来自《算力感知网络CAN技术白皮书2021》) 这个功能划分就很麻烦。在有的运营商架构图里,这块被定义为算力管理层,单独存在。而在有的架构图里,没有这一层,划在了编排管理层。所以说,各个理解都不一样,很头大。反正大家要知道,有这么一个功能组。 想要实现它,肯定离不开一个控制网络的“神经中枢”。 调度和编排算力网络的核心控制部分,有的运营商把它叫做“算网大脑”。 这个“算网大脑”,有四个重要的作用: 1、获取全域实时的算、网、数资源,以及云、边、端分布情况,构建全域态势感知地图。 2、跨域协同调度,将多域协同的调度任务智能、自动地分解给各个使能平台,实现算、网、数的资源调度。 3、多域融合编排,针对多域融合业务需求,基于算、网、数的原子能力按需灵活组合编排。 4、智能辅助决策,基于不同业务的SLA要求、网络整体负载、可用算力资源池分布等因素,智能、动态地计算出算、网、数的最优协同策略。
算网管理编排层,维护全局静态的算力、服务和网络拓扑信息,并同步给各入口算力路由节点。算力路由节点维护算力服务的拓扑信息以及算力资源和网络的资源实时状态信息,通过分布式算力路由节点进行算网协同调度。 “算网大脑”是算力网络的神经中枢,统筹全局资源,重要性不言而喻。
在“算网大脑”中引入AI人工智能,那肯定是不用说了。除了AI之外,现在,运营商和设备商还打算往里面塞“数字孪生”、“意图引擎”,极力提升“算网大脑”的智能化水平。 说实话,仔细看管理编排层,我就有一种感觉,算力网络就是SDN和NFV技术的升级加融合,处处都是这两个技术的影子。只不过,表面又加上很多其它的技术,形成了一个更完整、更庞大的体系。

服务运营

算力大脑之上,是不是就没有了?并不是,别忘了,我们还有服务运营层。 服务运营层,说白了,就是给上层应用提供管控算力网络的接口。算网大脑不是真正的老板,只是一个“大管家”。真正管控网络的,是上层用户和应用。 服务运营层的目的,就是向上提供算力网络的能力开放。重点技术包括:算力交易、算力并网、算力封装、意图感知等。 算力网络的第三大特性,就是算力交易。

23818534-1dcc-11ed-ba43-dac502259ad0.png

路由、调度、交易,是算力网络三大特性 算力交易是算力网络的一个重要创新。 在算力和网络没有融合之前,用户使用谁家的云计算,就给谁钱,使用谁家的通信网络,就给谁钱。算网融合后,算力到处都是,调度来调度去,你到底该给谁钱? 算力交易,就是为了解决这个问题。 在算力交易场景中,会有一个可信泛在算力交易平台。

238b1108-1dcc-11ed-ba43-dac502259ad0.png

来自《算力网络——云网融合2.0时代的网络架构与关键技术》 大致过程是这样的: 首先,算力消费方提出详细的算力需求。然后,算力交易平台根据需求,将可用的资源整合,生成一个算力网络资源表。根据时延和成本等因素,会有对应的报价。接下来,算力消费方根据资源表,选择一个最适合自己的“套餐”。然后,就是在算力交易平台上签订交易合约。再然后,交易平台根据合约,通过算力网络调度资源,并且更新资源信息。最后,合约结束,服务终止,释放资源。

23988b44-1dcc-11ed-ba43-dac502259ad0.png

算力网络交易平台(来自《整合多方算力网络,实现计算资源利用率最优》,雷波) 在21世纪,凡是提到交易模式,就一定会牵扯到一个词——区块链。 是的没错,算力交易平台,也是借助区块链技术,实现分布式账本、匿名交易等功能。 综上所述,算力网络紧密围绕用户的算力需求,覆盖了算力产生、调度、交易、消费的全生命周期。算力网络想要实现的,就是算随人动,算随“需求”动,达到极致完美的算力供给与需求匹配,一点也不将就,一点也不浪费。

02算力网络的标准进展

这几年,算力网络在国内非常热门。不管是运营商还是设备商,都极为重视这个概念。 尤其是国内运营商,对算力网络简直就是到了狂热的地步。 原因很简单,国外运营商很少碰网,基本上就是搞搞通信,最多搞搞传统通信的云化。而国内运营商,既有网,又有云,特别希望把网和云的资源融合、盘活。而且,我们国家比较重视基础设施建设,算力网络是重要的数字基础设施,所以,运营商作为国企,也特别看重这块的积累。
一方面,为了掌握技术标准的主动权,另一方面,为了品牌宣传和形象造势,三大运营商在算力网络上就开始卷起来了。 2019年,是公认的算力网络元年。这一年的11月1日,中国联通率先行动,在北京PT展期间,发布了《中国联通算力网络白皮书》。这是国内第一本和算力网络相关的白皮书。 此后,国内运营商们争先恐后,陆续发布了多本白皮书,以及积极推动算力网络的标准制定。

23a89660-1dcc-11ed-ba43-dac502259ad0.png

在标准推进方面,我根据网上的资料,整理了一张表格,大致记录了各大标准组织在算力网络标准制定方面的情况,仅供参考:

23beb80a-1dcc-11ed-ba43-dac502259ad0.png

综合自中信证券,各大白皮书,官网消息

试验进展:

23d10ab4-1dcc-11ed-ba43-dac502259ad0.png

来自中信证券

03结语

从实际情况来看, 算力网络离我们还有很长一段距离。目前,我们处于云网融合的进展阶段,算网一体或算力网络,还在研究之中。 尽管如此,算力网络作为算力和联接力未来的发展趋势,是毋庸置疑的。算与网的融合一体,是必然的,也是整个通信行业的归途。传统通信作为“管道”,无法提升自己的价值,唯有全面投入云的怀抱,才是最好的出路。 好了,以上就是今天文章的全部内容。技术干货很多,看起来比较费劲。有些东西是我自己的理解,也不一定准确,欢迎大家批评指正。

审核编辑 :李倩

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 运营商
    +关注

    关注

    4

    文章

    2426

    浏览量

    46295
  • 通信网络
    +关注

    关注

    22

    文章

    2098

    浏览量

    53982
  • 算力
    +关注

    关注

    2

    文章

    1385

    浏览量

    16555

原文标题:算力网络,到底是如何工作的?

文章出处:【微信号:算力基建,微信公众号:算力基建】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    湘军,让变成生产

    脑极体
    发布于 :2025年11月25日 22:56:58

    国产AI芯片真能扛住“内卷”?海思昇腾的这波操作藏了多少细节?

    反而压到了310W。更有意思的是它的异构架构:NPU+CPU+DVPP的组合,居然能同时扛住训练和推理场景,之前做自动驾驶算法时,用它跑模型时延直接降了20%。 但疑惑也有:这种密度下,散热怎么解决?而且昇腾的生态适配速度能
    发表于 10-27 13:12

    华为AI WAN助力城域网开启新征程

    近日,中国电信股份有限公司研究院在未来网络大会上推出了《城域网白皮书(2025)》,进一步明确了城域网络在面向
    的头像 发表于 09-16 14:58 753次阅读

    【「芯片 | 高性能 CPU/GPU/NPU 微架构分析」阅读体验】+NVlink技术从应用到原理

    前言 【「芯片 | 高性能 CPU/GPU/NPU 微架构分析」书中的芯片知识是比较接近当前的顶尖芯片水平的,同时包含了芯片架构的基础知识,但该部分知识比较晦涩难懂,或许是由于我一
    发表于 06-18 19:31

    AIGC基础设施技术架构与行业实践

    AIGC基础设施技术架构与行业实践 一、硬件层:AI的物理载体 芯片技术升级‌ 国际前沿‌:某国际芯片巨头2025年发布的GB200
    的头像 发表于 05-29 07:44 594次阅读
    AIGC<b class='flag-5'>算</b><b class='flag-5'>力</b>基础设施技术<b class='flag-5'>架构</b>与行业实践

    RAKsmart智能架构:异构计算+低时延网络驱动企业AI训练范式升级

    在AI大模型参数量突破万亿、多模态应用爆发的今天,企业AI训练正面临效率与成本的双重挑战。RAKsmart推出的智能架构,以异构计算
    的头像 发表于 04-17 09:29 595次阅读

    魔方IO扩展模块介绍 网络篇1

    不同的总线接口功能。在不同场景中,有采用串口、网络或者是CAN总线通信,魔方®都可以通过模块的选型提供支持;并且可以根据场景需要,提供微定制服务。 以上3款为新推出IO扩展模块,不支持单独出货,需搭配Z系列
    的头像 发表于 04-09 14:33 752次阅读
    <b class='flag-5'>算</b><b class='flag-5'>力</b>魔方IO扩展模块介绍 <b class='flag-5'>网络</b>篇1

    中航光电2025美国光通讯展圆满结束

    近日,第50届美国光通讯展(OFC 2025)在美国加州旧金山莫斯科尼会展中心圆满落幕。作为全球光通信领域历史最悠久的顶级盛会,本届OFC汇聚了来自世界各地的行业精英,围绕AI与光通信融合、网络
    的头像 发表于 04-08 15:47 759次阅读

    领域常用名词解释

    本文系统地整理和解释了领域中常用的数十个关键名词,并按照以下维度进行了分类:基础概念、系统架构、硬件架构、基础运算类型、计算模式、相关软件架构
    的头像 发表于 04-07 11:21 1198次阅读
    <b class='flag-5'>算</b><b class='flag-5'>力</b>领域常用名词解释

    DeepSeek推动AI需求:800G光模块的关键作用

    数据传输速率,减少带宽瓶颈,成为数据中心和AI集群架构优化的重点。光模块速率的跃升不仅提升了传输效率,也为大规模并行计算任务提供了必要的带宽保障。 800G光模块如何解决DeepSeek大规模
    发表于 03-25 12:00

    信而泰CCL仿真:解锁AI极限,智中心网络性能跃升之道

    中心RoCE网络提供精准评估方案,助力企业突破瓶颈,释放AI澎湃动力! 什么是智中心 智中心(AIDC,Artificial Int
    的头像 发表于 02-24 17:34 979次阅读
    信而泰CCL仿真:解锁AI<b class='flag-5'>算</b><b class='flag-5'>力</b>极限,智<b class='flag-5'>算</b>中心<b class='flag-5'>网络</b>性能跃升之道

    DeepSeek对芯片的影响

    DeepSeek模型,尤其是其基于MOE(混合专家)架构的DeepSeek-V3,对芯片的要求产生了深远影响。为了更好地理解这一影响,我们可以从几个方面进行分析。一.MOE架构
    的头像 发表于 02-07 10:02 1614次阅读
    DeepSeek对芯片<b class='flag-5'>算</b><b class='flag-5'>力</b>的影响

    中心的如何衡量?

    作为当下科技发展的重要基础设施,其的衡量关乎其能否高效支撑人工智能、大数据分析等智能应用的运行。以下是对智中心算衡量的详细阐述:一、
    的头像 发表于 01-16 14:03 4177次阅读
    <b class='flag-5'>算</b>智<b class='flag-5'>算</b>中心的<b class='flag-5'>算</b><b class='flag-5'>力</b>如何衡量?

    科技云报到:要更要“利”,“精装”触发大模型产业新变局?

    科技云报到:要更要“利”,“精装”触发大模型产业新变局?
    的头像 发表于 01-16 10:24 785次阅读