0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

数据中心解耦架构的技术路线解析

架构师技术联盟 来源:架构师技术联盟 2023-10-09 10:18 次阅读

随着网络硬件技术地快速发展,资源解耦架构因其资源利用率高、硬件拓展性好等诸多优势,成为了未来数据中心的主要发展方向之一,从资源管理的角度出发,目前的方案主要分为三个技术路线,包括“以CPU为中心”、“以内存为中心”和“资源去中心化”。

第七届未来网络发展大会发布《算网操作系统白皮书》、《光电融合服务定制广域网》、《以网络IO为中心的无服务器数据中心》白皮书,本文选自"以网络IO为中心的无服务器数据中心"。。

以内存为中心

在“以内存为中心”的技术路线下,内存管理功能从传统操作系统中分离出来,并运行在内存侧,以便实现内存的独立拓展和异构计算单元对内存的共享访问,进而实现更高效的数据处理和计算。例如,内存池化后可预处理内存分配和回收,进而提高内存的利用效率和性能;内存共享后可以减少计算核心之间的数据搬移次数,从而加速计算任务的完成;大内存消除了数据的换出换入开销等。在此技术路线上,目前的实现方案有HP The Machine、天蝎项目和NetDAM等。

1、HP The Machine

惠普在2016年的伦敦发布会上推出了“以内存为中心”的新型计算机原型机——The Machine。如图2-10所示,与传统计算机相比,The Machine[12]架构主要有以下几个关键技术,包括系统级芯片(SoC)、统一存储、内存池化共享和全光通信

fd60d4da-6637-11ee-939d-92fbcf53809c.png

首先,The Machine采用了经过能效和算法优化的SoC,是TheMachine的核心组成,旨在支撑高度可扩展、节能且安全的系统,主要由FAM(Fabric-attached Memory)芯片、I/O端口、网络相关组件等构成。其中,FAM芯片的主要功能是连接传统计算核心与远端内存池,同时减少对数据移动的需求。

此外,该SoC还提供安全特性,如硬件强制隔离等。其次,The Machine中的存储是统一的。具体来说,原来由RAM和硬盘/闪存承担的存储任务(RAM负责临时存储,硬盘/闪存负责长期存储)全部由NVM完成。在传统的分层存储架构下,数据需要在两种存储(RAM与硬盘/闪存)之间来回交换,这既影响性能又增加能耗。

2、天蝎项目

在国内的服务器市场,BAT三家互联网公司在2011年联合成立了天蝎联盟。于2014年8月,天蝎联盟正式升级为开放数据中心委员会(ODCC)。如图2-11所示,天蝎计划[13]发展至今,已演进至3.0版本。

fd7d5916-6637-11ee-939d-92fbcf53809c.png

天蝎1.0确立了集中供电、集中风扇(散热)、集中管理的天蝎整机柜服务器基本形态。机柜模块作为整机柜服务器的“外壳”,中间4U空间用于部署集中供电模块(Power Supply Unit,PSU)、集中管理模块以及网络模块(交换机)。

为了更好的协调组织活动,扩大天蝎整机柜服务器的适用范围,ODCC发布了天蝎2.0规范,主要包括机柜的尺寸、机柜背板和顶部功能、风扇尺寸、服务器节点与机柜系统解耦等。此外,基于中国数据中心行业的基本情况,天蝎2.0规范还对环境(温湿度)及机房提出了高度、供电和承重等方面的要求。

天蝎3.0旨在打破1U/2U服务器节点的限制,解除计算和存储资源在小空间里的耦合,在机柜级的大空间里再耦合。CPU、内存、闪存、硬盘等同类资源物理上聚集在一起,形成不同种类的资源池。从外部看,整机柜服务器是一个整体,但其内部的资源是可以分割的,不同类型、数量的资源自由组合为不同配置的“逻辑”服务器,必要时还可以更改配置或打散重组,提高资源利用率,进一步降低能耗。

3、NetDAM

NetDAM主要思想是将内存直接挂载到以太网控制器上,并提供大量的ALU和可编程逻辑,旨在提供高效的内存池化、存内计算(In-Memory Computing)以及在网计算(In-Network Computing)的新范式。

fd9867ba-6637-11ee-939d-92fbcf53809c.png

从NetDAM的功能构成来看,其通过内存共享以及对存内计算和在网计算的指令级支持,实现主机内和主机间协议的桥接。具体来说,NetDAM采用以太网IP/UDP来传输NetDAM数据,主要通过以下四个技术点来保证低时延和大带宽:

1)确定性时延:NetDAM通过消除PCIe DMA和跳过缓存一致性嗅探来固定了数据包处理流水线,从而实现数据包在确定时延内得到回复;

2)可选的可靠性传输:该设计主要出于以下两点考虑,一是具有虚拟化或容器覆盖支持的无损以太网将带来大量开销,二是很多分布式应用可以设计幂等接口,简单地重传并不影响结果;

3)可选的排序:交换操作运行乱序执行,因为每个数据包中都有内存地址字段来隔离操作内存空间,同时每个数据包中也有序列号字段以支持用户在编程逻辑中增加可选的重排序模块;

4)多径传输:为了使数据传输与网络拓扑无关,NetDAM在UDP数据包内加入段路由头,因此源节点可以选择专用路径,避免交换机缓冲区溢出,充分利用网络带宽。

fda78fec-6637-11ee-939d-92fbcf53809c.png

NetDAM实现的存算资源互联系统,CPU、DSA、存储等资源可以通过AXI、CHI或PCIe/CXL等总线直连到NetDAM,不同NetDAM之间通过以太网互联,NetDAM上的内存资源形成共享池。

资源去中心化

在“以CPU为中心”的技术路线下,所有存算资源的管理和使用逻辑都运行在CPU上,并通过访问远端资源的方式使用解耦的其他存算资源。此技术路线不仅使CPU成为故障中心,还会因远端资源管理引入大量的带宽和时延开销,特别在大规模部署的资源解耦数据中心中这一问题尤为显著。

“以内存为中心”的技术路线是将传统OS中的内存管理功能迁移至内存侧,使得内存资源可按需独立拓展,同时实现不同类型的计算核心对内存资源的共享使用。该技术路线虽然减少了内存管理的开销,但除内存外的其他资源(如外存等)还由CPU来进行管理和调度,仍存在“以CPU为中心”技术路线的局限性。

总的来说,以上两种技术路线,本质上仍是都是以某种资源为中心的管理逻辑,此逻辑使得其他资源仍受制于某类资源,进而无法充分发挥解耦资源的使用效率,并在可拓展性和弹性方面仍存在不足,因此,“资源去中心化”的理念被提出,数据中心中的计算、存储和网络等资源都被视为独立的服务,不同资源的拓展和使用均不存在依赖关系。

在“资源去中心化”的技术路线下,传统OS被彻底解耦,使不同资源的管理功能位于相应的资源侧,彼此之间通过消息传递的方式进行通信和协作,真正实现所有资源的高可按需拓展和高弹性使用。

具体来说,“资源去中心化”包含拆分内核功能、将管理模块运行在相应资源的控制器上、用网络消息代替一致性。

目前来说,“资源去中心化”的具体实现仍处于探究完善阶段,如LegoOS,但它的设计理念对资源解耦数据中心的资源管理与使用逻辑设计有着重要的启示和参考价值,可充分发挥资源解耦架构下资源的可拓展性和使用弹性。

编辑:黄飞

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 以太网
    +关注

    关注

    40

    文章

    5079

    浏览量

    166251
  • cpu
    cpu
    +关注

    关注

    68

    文章

    10451

    浏览量

    206583
  • 数据中心
    +关注

    关注

    15

    文章

    4189

    浏览量

    70116
  • 解耦
    +关注

    关注

    0

    文章

    40

    浏览量

    11833
  • 存内计算
    +关注

    关注

    0

    文章

    14

    浏览量

    1290

原文标题:数据中心解耦架构技术路线(下)

文章出处:【微信号:架构师技术联盟,微信公众号:架构师技术联盟】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    锐捷网络中标中国联通数据中心集采项目

    等方面的优异表现密不可分。  作为三大运营商数通产品的主流供应商,锐捷网络持续跟进运营商数据中心的建设需求,以及产品技术的演进路线。同时,锐捷网络数据中心交换机产品在国内市场经过多年磨
    发表于 01-24 10:14

    网络发展怎么改变企业数据中心的面貌的

    云和网络规模提供商已经实施了软件定义存储、融合架构和超融合架构。以太网存储结构(ESF)技术已经成为数据中心转型不可或缺的一部分,使那些具有前瞻性思维的企业级存储
    发表于 08-16 15:08

    2019北京国际数据中心技术设备展览会

    数据中心展,据中心技术展,据中心设备展,北京数据中心展,北京据中心
    发表于 09-06 17:09

    会议预告-2019北京国际数据中心技术设备展览会

    数据中心展,据中心技术展,据中心设备展,北京数据中心展,北京据中心
    发表于 09-11 17:17

    易天重点解析监控系统在数据中心机房的重要性

    严重的环境里,容易造成静电、电容击穿器件等故障,为何我们要求数据中心机房设备要周期性地进行除尘就是这个道理,本身灰尘中就含有不少的污染物。  数据中心机房在高速的发展,各种新技术层出不穷,也让
    发表于 10-09 15:00

    数据中心的建设也看重风水

    相比中国传统的风水理论,数据中心所看重的风水则更加贴合实际。以整体架构来划分,目前的主流的数据中心已经进入第三代,并开始向第四代演进。第一代和第二代数据中心分别诞生于20世纪40和70
    发表于 08-07 06:22

    技术引导数据中心向板上光通信聚拢

    将部分取代可插拔光模块占据数据中心主要应用市场。50G PAM4是一项可信的技术,但是100G PAM4 DSP目前还不行50G PAM4是一项可信的技术。100G PAM4 DSP目前还不行。人们期待一
    发表于 10-26 16:47

    40G数据中心之铜缆布线

    助于从成本和技术的角度去更好地管理基础设施。  40G数据中心铜缆布线的劣势  当前的40G以太网铜缆解决方案限制了其部署架构。40G QSFP+高速线缆组件的传输距离可达5-7m。因此,QSFP+高速
    发表于 11-18 15:00

    2020第十二届北京国际数据中心技术设备展览会

    2020第十二届北京国际数据中心技术设备展览会2020 the 12th beijing international data center technology equipment
    发表于 01-03 10:28

    未来数据中心与光模块发展假设

    向云计算的转变正在成为许多组织的共同特征,但所有这些组织都希望对自己信息保持控制。为了使组织能够利用其私有云基础架构,它们将不得不部署数据中心。在IDC的调查中发现,在云上花费的总金额中有超过28%都
    发表于 08-07 10:27

    Intel公布2021年CPU架构路线图及封装技术

    在Intel举办的架构日活动上,Intel公布2021年CPU架构路线图、下一代核心显卡、图形业务的未来、全新3D封装技术,甚至部分2019年处理器新
    发表于 11-02 07:47

    数据中心太耗电怎么办

    ​​​​​​摘要:其实对于节能,传统技术也是做了“十二分”的努力。但是在技术不断演进的情况下,传统节能技术还是存在问题,如何破?本文分享自华为云社区《数据中心节能?来试试华为NAIE
    发表于 06-30 06:27

    数据中心是什么

    数据中心是什么:数据中心是全球协作的特定设备网络,用来在因特网络基础设施上传递、加速、展示、计算、存储数据信息。数据中心大部分电子元件都是由低直流电源驱动运行的。
    发表于 07-12 07:10

    如何去提高数据中心的运营效率呢

    现如今,尽管IT业界的各种新兴技术可能正发生着各种突飞猛进的快速变化,但每家数据中心仍然需要依赖电力资源的消耗来维持其运行能力。故而,数据中心运营商们仍然需要通过更新电源使用、冷却和电气设计方案,来
    发表于 09-09 06:14

    什么是数据中心

    数据中心是企业用来容纳其关键业务应用程序和信息的物理设施。随着它们的发展,重要的是要长期考虑如何保持它们的可靠性和安全性。什么是数据中心数据中心通常被称为单个事物,但实际上它们由许多技...
    发表于 09-15 06:46