0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

借助NVIDIA Aerial CUDA增强5G/6G的DU性能和工作负载整合

NVIDIA英伟达企业解决方案 来源:NVIDIA英伟达企业解决方案 作者:NVIDIA 2024-05-24 11:10 次阅读

Aerial CUDA 加速无线接入网 (RAN)可加速电信工作负载,使用 CPUGPU 和 DPU 在云原生加速计算平台上提供更高水平的频谱效率 (SE)。

适用于 Aerial 的 NVIDIA MGX 系统基于先进的 NVIDIA Grace Hopper 超级芯片NVIDIA Bluefield-3 DPU 构建,旨在加速 5G 端到端无线网络

虚拟化 RAN (vRAN)分布式单元(DU)

集中式单元(CU)

用户平面函数(UPF)

vRouter

网络安全

这种全栈加速方法可提供领先的性能和频谱效率,同时降低总拥有成本(TCO),并为更好的资产回报(ROA)开辟新的盈利机会。NVIDIA 6G 研究云平台中提供了 Aerial CUDA 加速的 RAN 软件堆栈。

电信公司已投入数十亿资金购买 4G/5G 频谱,预计他们将再次投入购买 6G 频谱,以满足日益增长的移动用户需求。

该生态系统包括芯片制造商、OEM 和独立软件供应商(ISV),可提供具有不同性能特征的解决方案。这些解决方案主要基于专用硬件,例如专用集成电路ASIC)或系统级芯片(SoC),用于处理计算密集型第 1 层(L1)和第 2 层(L2)功能。

挑战在于如何在 RAN 解决方案中实施算法的复杂程度与实施成本和功耗之间取得平衡。

电信公司希望能够分解 RAN 工作负载的硬件和软件,使其能够在云基础设施上构建网络,从而为软件创新、新的差异化服务、控制硬件生命周期管理以及提高总体拥有成本(TCO)开辟可能性。

vRAN 展示了商用现成(COTS)平台运行 RAN 分布式单元(DU)工作负载的能力。但是,由于计算性能差距,需要加速,从而实现某些工作负载的固定功能加速,例如前向纠错(FEC)。

在本文中,我们将讨论用于 DU 工作负载加速的 Aerial CUDA 加速 RAN 的进展,详细介绍所使用的算法和预期收益、所使用的底层硬件,以及它整合 DU、集中式单元(CU)和核心等电信工作负载以及使用多租户功能托管创收工作负载的能力。最后,我们将探讨电信公司有望实现的总体 TCO 和 ROA 优势。

Aerial CUDA 加速 RAN

NVIDIA Aerial RAN 将适用于 5G 和 AI 框架的 Aerial 软件与 NVIDIA 加速计算平台相结合,帮助电信公司降低 TCO 并实现基础设施盈利。

Aerial RAN 具有以下主要特性:

一个软件定义、可扩展、模块化、高度可编程和云原生的框架,无需任何固定函数加速器。它使生态系统能够灵活地采用其商业产品所需的模块。

DU L1、DU L2+、CU、UPF 和其他网络功能的全栈加速,可实现工作负载整合,从而更大限度地提高性能和频谱效率,实现出色的系统 TCO。

通用型基础架构,具有多租户,可支持传统工作负载和先进的 AI 应用程序,从而实现出色的 RoA。

全栈加速

全栈加速依托如下两个支柱:

NVIDIA Aerial 软件,可加速 DU 功能 L1 和 L2;

支持生态系统在平台上运行和优化 CU 或 UPF 等工作负载,并实现工作负载整合。

图 1 显示加速 DU L1 和 L2 是 NVIDIA 实现全栈加速的关键方面。

1112401621-0.png

DU 加速

Aerial 已实施先进算法,以提高 RAN 协议栈的频谱效率,涵盖 DU L1 和 L2。

本文中介绍的加速 L1 和 L2 功能是通过一种利用加速计算平台内的 GPU 并行计算能力的通用方法实现的。

图 2 显示 MGX 服务器平台在同一 GPU 实例上托管经加速的 L1 cuPHY 和 L2 MAC 调度程序 cuMAC,并由 CPU 托管 L2+ 堆栈。这展示了基于 GPU 的平台在同时加速多个计算密集型工作负载方面的强大功能。

11124044A-1.png

L1 (cuPHY)

Aerial cuPHY 是 RAN 物理层 L1 的数据和控制通道的 3GPP 兼容、GPU 加速的全内联实现。它提供 L1 高 PHY 库,通过利用 GPU 的强大计算能力和高度并行性来处理 L1 的计算密集型部分,提供无与伦比的可扩展性。它支持标准多输入多输出(sMIMO)和大规模 MIMO(mMIMO)配置。

作为一种软件实现,它支持持续增强和优化工作负载,正如 cuPHY 随着时间推移在 AX800 加速平台和全新 MGX 平台上持续实现容量提升。

L1 中的信道估计是任何无线接收机中的基础块,优化的信道估计器可以显著提高性能。传统的信道估计方法包括最小平方(LS)或最小均方误差(MMSE)。这些方法的比较总结在表 1 中。

NVIDIA 使用新的通道估计器增强了 cuPHY L1,该估计器的性能优于表 1 中列出的方法。此实现使用复制核 Hilbert 空间(RKHS)通道估计器算法。

RKHS L1 信道估计

RKHS 信道估计专注于时域信道脉冲响应(CIR)的有意义部分,可限制不必要的噪声并放大脉冲响应的相关部分(图 3)。

RKHS 需要复杂的计算,接近无限凸优化问题。RKHS 将这个无限凸问题转换为有限凸问题,而不会损失任何性能。

RKHS 计算密集型,非常适合在 GPU 上进行并行处理。表 2 总结了 sMIMO 和 mMIMO 配置的 RKHS 增益和计算需求。

RKHS 计算得出的 CIR(图 4)与实际通道(在模拟环境中测量得出)非常接近,用于具有四个天线和两个 UL 层的分接延迟线(TDL)- C 通道模型。

在一系列调制和编码方案(MCS)中,与信噪比(SNR)曲线相比,改进后的 CIR 显著提高了误码率(BER)。图 5 显示了 RKHS 相对于 MMSE(具有两个不同的窗口,1 s 和 2.3 s)的优势,对于 MCS 15,可提供高达 2.5 dB 的增益。

L2 (cuMAC)

RAN 协议栈中的 L2 MAC 调度程序在决定 UE 如何访问无线电资源方面发挥着重要作用。而这反过来又决定了整个网络的频谱效率。

对于 5G 系统,有许多自由度,包括:

传输时间间隔(TTI)插槽

已分配的物理资源块(PRB)

MCS

MIMO 层选择

典型的调度程序专注于单个单元,这会限制实现的性能。表 3 显示了典型调度程序方法的比较。

在 NVIDIA ,我们使用比例公平(PF)算法实施了多单元调度程序,其性能优于表 3 中列出的两种方法。

多单元调度程序

NVIDIA 多单元调度程序通过优化大量相邻单元的调度参数(TTI、PRB、MCS 和 MIMO 层),显著提高了无线性能(图 6)。

使用 PF 算法的多单元调度需要复杂的计算逻辑来解决所有单元中的各种变量。这非常适合具有大规模并行处理能力的 GPU。表 4 总结了 sMIMO 和 mMIMO(联合调度 20 个单元)的优势和计算需求。如您所见,CPU 计算需求很高。

图 7 显示了 20 个 100MHz 4T4R 4DL/2UL 单元(每个单元具有 500 个活跃 UE 和 16 个 UE/TTI)的频谱效率。

DU 综合加速提升

总而言之,RKHS 信道估计支持每个 UE 更高的 MCS 分配,而多单元调度器代表了无线电资源调度的重大飞跃。这两种方法都能显著提高频谱效率,并在 GPU 上得到优化实施。

例如,对于 6 单元的 100MHz 64T64R 系统,实现 2 倍以上的 SE 增益将需要大约 240 个核心(大约 8 个 32 核心 CPU),需要额外的 CPU 服务器。相较于 GPU 实现,其中 L1 PHY 处理和 L2 调度程序托管在单个服务器中的单个 GPU 上。

工作负载整合

如前文所述,全栈加速的第二个支柱是整合多个工作负载并在 Aerial RAN 上加速这些工作负载。这是通过利用 NVIDIA 加速计算平台中的 GPU、CPU 和 DPU 的可用计算资源来实现的。

针对电信工作负载,MGX 系统提供针对数据中心的模块化和可扩展架构。该系统可提供所需的计算能力,以整合 RAN CU、RAN 智能控制器(RIC)应用等功能以及 UPF 等核心功能。

NVIDIA Grace Hopper 超级芯片结合了 NVIDIA Grace 和 NVIDIA Hopper 架构,使用 NVIDIA NVLink-C2C 为 5G 和 AI 应用提供 CPU+GPU 一致性内存模型。

CU 可以利用许多 Grace CPU 核心。RIC 应用程序(例如通常包含 AI/ML 技术以提高频谱效率的 xApp)可以在 GPU 上进行加速。

随着我们进一步进入网络,UPF 等功能通过使用关键的 DPU 功能可以从 DPU 加速中受益:

GTP 加密和解密

流哈希处理和接收端缩放(RSS)

深度数据包检测(DPI

工作负载整合使电信公司能够更大限度地减少部署在数据中心的服务器数量,从而全面提高 TCO。

多租户 Aerial RAN

电信公司需要一个可以满足电信工作负载严苛的性能和可靠性要求的平台,能够在一个通用平台上托管不同类型的电信工作负载(从 RAN 到核心)。

电信 RAN 基础设施的利用率明显不足。借助多租户云基础设施,电信公司可以在有闲置容量时通过可盈利的应用程序提高利用率。

可以为电信公司提供盈利机会的工作负载类型包括生成式 AI 和基于大语言模型(LLM)的多接入边缘计算(MEC)应用程序。这些类型的工作负载在分布式电信边缘数据中心引发了前所未有的计算需求。

由于需要在边缘支持大量基于 LLM 的应用程序,因此专用于执行 LLM 推理的边缘 GPU 服务器和各种 MEC 应用程序正在大幅增加。

图 9 显示了 MGX 平台,该平台可以托管所有工作负载,并帮助电信公司克服计算资源利用不足的问题,减少总体能源足迹,并提高基础设施的货币化程度。

共享 AI 和电信基础设施

Aerial CUDA 加速 RAN 的优势

到目前为止,我们已经讨论了 NVIDIA Aerial 软件如何帮助提高整体频谱效率,以及加速计算平台如何提供处理能力,以在同一平台上整合多个工作负载。

多租户平台支持 AI 工作负载的货币化。5 年期 TCO 分析显示,该平台的可用时间约为 AI 的 30%,并考虑到典型的每小时 GPU 定价,可提供显著抵消平台成本的收入。与仅使用 CPU 的系统相比,此 ROA 对每美元指标的性能有重大影响。

根据条形图显示,与 x86 CPU 相比,采用 AI 创收的 GPU 的每成本性能提升了 4.1 倍。

结束语

总而言之,Aerial RAN 可提供出色的 TCO 并释放新的收入机会,从而更大限度地提高投资回报率(ROA)。

NVIDIA 正在改变电信基础设施,该基础设施基于 NVIDIA 加速计算平台构建,并由 Aerial 软件提供支持。Aerial CUDA 加速的 RAN 可满足电信公司的愿望,以 TCO 高效的方式提供市场领先的无线功能,并能够开始以当今部署的基础设施无法实现的方式从部署的基础设施中获利。

在本文中,我们详细介绍了使用新算法在 L1 和 L2 上实现的频谱效率提升,并讨论了基于 RAN 和 LLM 的工作负载加速 AI 工作负载的能力。新一代 NVIDIA 平台将通过提供更高的单元密度和更高的工作负载加速来进一步改进这些关键指标。

Aerial CUDA 加速 RAN 作为 NVIDIA 6G 研究云平台的一部分提供。




审核编辑:刘清

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 集成电路
    +关注

    关注

    5341

    文章

    10912

    浏览量

    355117
  • NVIDIA
    +关注

    关注

    14

    文章

    4670

    浏览量

    102065
  • ASIC芯片
    +关注

    关注

    2

    文章

    91

    浏览量

    23577
  • 超级芯片
    +关注

    关注

    0

    文章

    31

    浏览量

    8825
  • MIMO技术
    +关注

    关注

    0

    文章

    43

    浏览量

    7412

原文标题:借助 NVIDIA Aerial CUDA 加速 RAN,增强 5G/6G 的 DU 性能和工作负载整合

文章出处:【微信号:NVIDIA-Enterprise,微信公众号:NVIDIA英伟达企业解决方案】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    俄罗斯决定绕过5G 直接开发6G

    5G6G
    电子发烧友网官方
    发布于 :2022年07月28日 16:51:32

    什么是5G NR?

    新电台。高通评论说,NR是一个复杂的话题,因为它涉及到一种新的基于OFDM的无线标准。图1 5G无线接入架构由LTE演进和新的无线接入技术(NR)组成,它与LTE不向后兼容,可从1GHz到100GHz工作
    发表于 05-03 11:34

    【AD新闻】5G的基站数量是4G两倍?国内5G的发展情况

    /NFV架构、网络切片、MEC等技术,让网络更灵活,更高效,进而满足5G需求多样化的需求。从无线侧来看,基站重构就是CU/DU高层切分和DU/AAU低层切分,让整个网络架构更加扁平。在5G
    发表于 08-22 10:52

    怎么在5G测试wifi性能

    我使用控制台项目来测试两个CYW43907 EVKS中的WiFi性能。一个是AP,另一个是STA。如果我想在AP和STA之间进行5G的测试,我应该设置命令吗?我猜想,在StaseTap AP命令中
    发表于 11-27 11:17

    6G网络将是什么样子的?

    日前,工信部IMT-2020(5G)无线技术工作组组长粟欣透露6G概念研究将在今年启动。这意味着中国与全球同步开始6G研究。除了中国,美国、俄罗斯、欧盟等国家和地区也在进行相关的概念设
    发表于 08-16 07:16

    基于OTN的5G中传/回传承载方案

    4G只有前传和回传两部分,而5G承载网随着RAN架构的重构,核心网云化、C/U分离、数据面分布式部署,使网络更趋扁平化,划分为前传网络、中传网络和回传网络三部分。AAU连接DU部分为5G
    发表于 07-17 17:08

    5G网络的建设方案

    采用玻璃钢,禁止采用金属材质或金属支撑架。    图6 美化外罩场景改造方案  1.4.1.4有空余抱杆或新增抱杆空间  对于不属于以上场景,不能通过整合改造腾出5G抱杆位。如果天面有空余抱杆或新增抱杆
    发表于 12-03 14:03

    推荐收藏:25G光互连——5G前传篇

    :25G灰光模块)5G前传光纤直驱如果采用双纤双向方案方案,DU与AAU直接相连,每个AAU需与DU连接两根光纤实现收发,共需使用6根光纤和
    发表于 07-08 17:01

    5G的落地现状与未来变局 精选资料推荐

    5月17日,是中国电信日。从2G5G时代,短短几十年间,中国就从曾经的落后迅速跨越到了如今的领跑地位。三天前,在由工信部召开的5G6G
    发表于 07-27 07:59

    已结束-【盖楼送书NO.56G开山之作!华为轮值董事长撰序推荐——《6G无线通信新征程》

    成立的组织,一方面使5G被定义得能够适应这些垂直行业的独特需求;另一方面,随着商用化的进程,也激发出越来越多5G不能满足的创新需求,由此催生的5.5G将能够持续增强,但无疑又将激发出更
    发表于 08-31 11:17

    6G

    5G6G,未来的通讯将改变中国科技智能的方方面面,面对科技爆发的新时代,华为从无到有,从弱到强,引领着通讯科技前沿变革,对国家科技领域的振兴和发展贡献力了力量。了解6G也能更好的看清更远的路,和美国发展
    发表于 09-04 09:22

    6G联盟又开会!华为等国内通信巨头被除名?

    微软、高通、三星和诺基亚等等,唯独没有华为。可惜的是,在6G时代,老美注定要沦为陪衬!​为什么这么说呢?首先,我们先了解下什么是6G5g之后中国能创造辉煌吗?1、什么是6G?从1
    发表于 12-01 16:08

    5G 器件的设计与开发: 5G 性能范围

    注意到5 g 是由几个不同的性能级别组成的。5 g 网络由以下部分组成:低频带范围(600兆赫至3ghz)中频范围(3吉赫至
    发表于 04-10 21:31

    高频微波射频pcb板在5G6G应用下的新机遇

    ;二要进一步降低材料的损耗、提高Q值;三要探索新的、合适的材料体系,简单地认为现有性能优异的微波介质陶瓷材料体系在太赫兹下也能表现出良好性能是不严谨的。微波介质陶瓷是5G/6G通信的关
    发表于 03-28 11:18

    5G网络架构,5G中的SDR和SDN是什么?

    了前传的负载性能优化的要求不仅限于前传,因为资源实例化的位置、访问和管理都很大程度上取决于服务切片的要求。在这种情况下,基于 SDR 和SDN/NFV 的架构(图 4)可以提供帮助。   5G 优化
    发表于 05-05 09:48