0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

使用NVIDIA Maxine的MEC视频会议解决方案

星星科技指导员 来源:NVIDIA 作者:NVIDIA 2022-04-20 16:44 次阅读

SoftBank 是一家致力于推动信息革命的全球技术公司。该公司经营宽带、固定线路电信、电子商务、信息技术、金融、媒体和营销。为了改善用户的通信体验,并克服 5G 容量和覆盖问题,软银使用了 NVIDIA Maxine GPU- 具有最先进人工智能功能的加速 SDK 来构建虚拟协作和内容创建应用程序。

在本文中,您将了解软银如何使用 Maxine 超分辨率和硬件加速的编解码操作来减少必须上传到多址边缘计算( MEC )服务器的数据量。除了解决有限带宽的挑战外, Maxine 功能(如噪音消除和虚拟背景)使软银能够为用户提供最佳的视频会议解决方案。

使用 MEC 的好处

边缘计算使提供商能够将其技术部署到更接近用户的位置。简单地说,边缘计算减少了关键任务、高吞吐量、低延迟应用程序的带宽和延迟预算。这是通过使用 MEC 网络技术将计算从远程云服务器移动到更靠近消费源的节点来实现的。边缘计算在很大程度上依赖于网络技术,如 4G ,以及最近的 5G ,以提供连接性。

poYBAGJfx9SAOldaAACOjfDXMmg207.png

图 1 涉及 MEC 服务器的管道的简化概述

5G 功能(如超高速、超低延迟和多个同时连接)支持新的使用案例,如远程医疗和智能工厂,这些都是以前无法通过无线连接实现的。 MEC 是实现低延迟、高吞吐量用例支持的关键。 MEC 通过部署区域 MEC 服务器并仅向云发送最低限度的必要数据,在边缘尽可能多地进行处理,从而减少响应延迟。 MEC 服务器通常使用 GPU 大规模并行计算能力以高速处理大量数据。

5G 网络的挑战

当前的 5G 网络以一种称为非独立( NSA )的配置运行。此配置结合了 4G LTE 网络和 5G 基站,其中某些 5G 功能(如网络切片)不可用。 5G SA (独立)配置具有 5G 核心和基站。 5G SA 对 5G 的端到端支持加快了服务速度,降低了成本,提高了服务质量,是部署服务的更好平台。

当 5G SA 配置上市时,完整的 5G 网络就完成了。换言之, 5G 分两步发展: 5G NSA 和 5G SA 。每一步都需要资本投资。

另一方面,包括软银在内的一些电信运营商已经开始在 4G LTE 和 5G NR 中使用 4G LTE 低频段频率。理论上,容量和覆盖率是无线通信中的权衡。为了确保 5G SA 配置的高质量广域覆盖,软银使用 MEC 尽可能有效地减少服务延迟。

pYYBAGJfx9WATXIQAAA_RumBmig968.png

图 2 5G 频率中容量和覆盖率之间的权衡

此外,还有一些技术挑战。移动网络通常被设计为适应比上行链路更高的下行链路速度。这种设计理念适用于一般应用,如智能手机上的流媒体视频,因为大部分流量是下行链路。然而,一些关键应用需要强大的上行链路连接。其中之一是视频会议,用户需要相当大的上行带宽来传输高分辨率视频和音频

当前 5G 上行链路容量不足,需要载波聚合和 MIMO 天线来提供更多的上行链路分配。随着越来越多的设备连接到 5G ,节省带宽,特别是在上行链路中,是所有全球电信运营商面临的共同挑战。

上行链路带宽密集型应用,例如视频会议,可以在减少的上行链路带宽(例如, 500 Kbps )下以与充足带宽( 100 Mbps )相同的服务质量来服务。在这些情况下,可以连接更多的设备,同时提供高质量的服务。

基于 NVIDIA Maxine 的 MEC视频会议解决方案

NVIDIA Maxine 是一个 GPU 加速 SDK 平台,它使视频会议服务的开发人员能够构建和部署使用云中最先进模型的人工智能功能。 Maxine 包括使用 NVIDIA 研究的最新创新的 API ,如伪影减少、身体姿势估计、超分辨率和噪声消除。 Maxine 还使用其他产品,如 NVIDIA Riva,来提供封闭字幕和访问虚拟助理等功能。这些功能在 NVIDIA GPU 上得到充分加速,以便在云中运行实时视频流应用程序。

Maxine 应用程序使服务提供商能够在任何设备(包括计算机、平板电脑手机)上为每个用户提供相同的功能。关键的一点是,所有的处理都是在云上进行的,因此在任何设备上运行的应用程序都需要最少的资源。使用 Maxine 构建的应用程序可以轻松部署为微服务,并在 Kubernetes 环境中扩展到数十万个流。

其想法是减轻视频会议系统中涉及的计算密集型处理,减少必须上传到 MEC 服务器的数据量。这是通过超分辨率和硬件加速编解码操作等视频效果的组合来实现的。 Maxine 还增加了生活质量功能,如噪音消除、虚拟背景、房间回声消除等。

这对最终用户意味着什么?基本上,具有低带宽连接的终端用户在现场工作时会受到各种背景噪音的干扰,因此可以连接到干净的音频和高清晰度视频。例如,一个工厂经理在一个嘈杂的生产车间,在一个有 180p 流连接的偏远地点,似乎在一个有 720p 流的安静会议室里。计算资源的卸载也意味着终端用户可以在资源有限的设备(如手机和笔记本电脑)上执行多任务,从而延长电池寿命和更多可用内存。

前面提到的功能包含在以下SDKs中:

视频效果 SDK

音频效果 SDK

增强现实 SDK

此外, NVIDIA 视频编解码器 SDK 提供硬件加速编码和解码,以帮助视频会议周围的基础设施。

poYBAGJfx9aAIYGgAAJwhdH90Q8173.png

图 4 Maxine AI 人脸编解码器概述

软银如何使用 NVIDIA Maxine

通常,如果要在移动电话上使用视频会议解决方案,必须首先安装客户端应用程序。就软银而言, Zoom 客户端安装在运营商网络上的 MEC 服务器上,而不是移动电话上。移动电话的视频和麦克风输出通过 5G 网络输入到 MEC 上的 Zoom 客户端。 MEC 将智能手机的麦克风和摄像头识别为虚拟麦克风和摄像头,并将其用作 Zoom 客户端的输入。

pYYBAGJfx9eAVvOGAACL0_bYNIA425.png

图 5 软银和 Maxine POC :概览图

以下是用于软银概念验证实施的硬件和软件规范:

Hardware

GPU :Quadro RTX6000(驱动程序版本: 456 。 43 )

CPU英特尔至强黄金 6244

Software

Windows 服务器 2019

WebRTC 本机客户端 Momo

CUDA11 。 1

NVIDIA Maxine 视频效果 SDK( 2021 年 3 月 25 日 -VFX 预发布)

NVIDIA Maxine 音频效果 SDK EA

这项工作使用了软银的 MEC 服务器( Windows )、一个改进的基于 C ++的开源 WebRTC 客户端“ WebRTC 客户端 Momo ”,以及一个使用视频效果 SDK 和音频效果 SDK API 的应用程序。

AudioEffectSDK 中的NvAFX_RUN API (NVAFX_EFFECT_DENOISER)和视频效果 SDK 中的NvVFX_RUN API (NVVFX_FX_SUPER_RES)用于执行视频超分辨率和噪声消除。

poYBAGJfx9iAJqJmAAFcO1rHrdY642.png

图 6 视频效果 SDK API 的示例代码

pYYBAGJfx9mAThSAAAD0GY5BMqw084.png

图 7 Audio Effects SDK API 的示例代码

使用 WebRTC 协议从 5G 用户设备发送的视频流以低比特率(在此验证中, H 。 264 ( CBR ) 180p )上传到 MEC ,以节省上行链路带宽。 MEC 以低比特率接收降级的音频和视频,并使用 Maxine SDK 提高质量。对于视频, MEC 服务器使用 Maxine SuperResolution功能将从用户设备以 180p 发送的视频调整为 720p 。SuperResolution降低噪音并恢复高频分量,从而产生高质量的视频。

图 8 显示了SuperResolution的结果。

pYYBAGJfx96AN6SdAAOs2lwJNb0534.png

图 8 原始块状图像(左半部分)与应用 Maxine AI 功能后的图像(右半部分)

在图 8 中,左侧是应用SuperResolution之前的原始数据,右侧是放大的图像。面部细节中的块状伪影被替换为更多像素,从而生成高质量图像。您可以使用随 Video Effects SDK 提供的示例应用程序复制这些结果。有关完整演示,请参见a Maxine 前/ Maxine 后视频。

与超分辨率结果一样,视频中将显示噪声消除结果。

视频显示了用户在键盘上打字时说话的场景中测试 Maxine 噪音消除功能的结果。在这里,选择键盘声音作为样本,但在软银 PoC 的整个开发过程中,噪音消除在各种情况下也很有用。软银认为,噪音消除使嘈杂的环境会议成为可能,如户外或汽车会议。

您可以使用 Audio Effects SDK 提供的示例应用程序复制这些结果。

提高视频流的质量

通过在 MEC 服务器上部署 Maxine ,除了低延迟外,软银现在还为所有最终用户提供高质量的视频和音频体验。由于不需要额外的硬件或用户设备,因此通过上行链路带宽的高节省实现了改进的最终用户体验。为了进一步提高视频质量,软银计划使用 Maxine AI 人脸编解码器。

关于作者

Mana Murakami 是 NVIDIA 的高级解决方案架构师。她专注于向日本的电信客户加速基于 AI 、 GPU 的 vRAN 和 GPU 计算。 Mana 于 2015 年加入 NVIDIA ,担任 CUDA 工程师,并担任将 GPU 计算推广到 HPC 和制造业的技术领导。在加入 NVIDIA 之前,她从事图像处理的研究和开发,如色度键控和超分辨率。

Tanay Varshney 是 NVIDIA 的一名深入学习的技术营销工程师,负责广泛的 DL 软件产品。他拥有纽约大学计算机科学硕士学位,专注于计算机视觉、数据可视化和城市分析的横断面。

审核编辑:郭婷

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 解码器
    +关注

    关注

    9

    文章

    1073

    浏览量

    40151
  • NVIDIA
    +关注

    关注

    14

    文章

    4588

    浏览量

    101694
  • 计算机
    +关注

    关注

    19

    文章

    6644

    浏览量

    84481
收藏 人收藏

    评论

    相关推荐

    酷虎CUHUB会议室集成解决方案的优点有哪些?

    在现代商业环境中,高效的会议是成功的关键。酷虎CUHUB致力于提供顶尖的音视频会议解决方案,以应对企业在沟通协作方面所面临的挑战。
    的头像 发表于 04-24 10:56 51次阅读
    酷虎CUHUB<b class='flag-5'>会议</b>室集成<b class='flag-5'>解决方案</b>的优点有哪些?

    基于视频会议系统的指挥车工程通信解决方案

    指挥车工程在应对紧急事件、协调资源以及现场指挥等方面发挥着至关重要的作用。为了实现高效、稳定的通信,提升指挥决策效率,基于讯维视频会议系统的通信解决方案应运而生。 一、系统架构 该通信解决方案
    的头像 发表于 03-08 16:44 153次阅读

    SD-WAN视频会议解决方案效果如何?SD-WAN如何加速视频会议

    当今的数字化办公环境中,视频会议已经成为了企业间沟通和协作的重要工具。但是,网络状况不佳和带宽限制等问题可能会对视频会议质量产生影响。幸运的是,SD-WAN(软件定义广域网)技术的运用为优化视频会议
    的头像 发表于 02-28 14:34 141次阅读

    创通联达推出全场景智能视频会议解决方案

    近日,全球领先的物联网产品和解决方案提供商,创通联达在CES2024上重磅推出了其备受期待的全场景智能视频会议解决方案,旨在提升企业沟通与协作的体验和效率,为视频会议领域带来又一创新突
    的头像 发表于 01-12 11:05 321次阅读

    【飞腾派4G版免费试用】3.JITSI视频会议想开就开

    Jitsi Meet 是一个开源项目,它不需要用户支付昂贵的许可费用。这使得它成为一个经济实惠的视频会议解决方案。 扩展性: Jitsi Meet 的扩展性强,你可以在自己的服务器上部署,从而更好地控制
    发表于 12-25 18:44

    高品质万兆园区网络带你领略音视频会议体验升级,沟通无边界,视频零卡顿

    随着互联网的快速发展、企业数字化的不断深入,音视频业务已经成为了企业园区网络中的一项重要业务。大量的企业会在日常工作中把视频会议作为提升办公效率的重要手段。 举例,欧洲的某家知名银行,业务遍及全球
    的头像 发表于 11-16 20:25 241次阅读
    高品质万兆园区网络带你领略音<b class='flag-5'>视频会议</b>体验升级,沟通无边界,<b class='flag-5'>视频</b>零卡顿

    SIGGRAPH 2023 | NVIDIA 扩展 Maxine 视频编辑功能,展示 3D 虚拟会议研究成果

    Maxine 的生产版本现已在 NVIDIA AI Enterprise 中推出;研究演示示范了 3D 技术如何提升视频通信的质量。 在 NVIDIA
    的头像 发表于 08-10 20:15 505次阅读

    SDWAN解决跨国办公视频会议网络卡顿

    跨国办公视频会议网络卡顿解决办法——SDWAN
    的头像 发表于 07-21 14:30 306次阅读

    视频会议的优势与实际应用

    一、什么是视频会议 随着时代发展,信息流的速度越来越快,距离已经不再是沟通的障碍。 视频会议有时也被称为网络视频会议,是一种为两地或多地用户提供画面语音实时传送以完成会议目的系统设备。
    的头像 发表于 07-13 16:58 569次阅读

    视频会议进入云时代,为何企业需要华为云会议

    随着互联网技术的发展和工作习惯的变化,视频会议已经成为了企业沟通协作的重要方式。无论是内部培训、项目研讨、商务洽谈,还是政务交流、远程医疗、在线教育,视频会议都能够提供高效、便捷、安全的解决方案
    的头像 发表于 07-03 22:31 280次阅读

    云上办公时代,华为云会议如何保障企业的开会效率与数据安全?

    随着视频会议进入云时代,企业对于云会议的需求日益增长。华为云会议作为专业的视频会议云服务,深度理解企业各种会议场景需求,为政企客户提供即开即
    的头像 发表于 07-03 22:31 245次阅读

    Valens Semiconductor与芯鼎科技合作推出360°多摄像头视频会议解决方案

    。芯鼎科技是一家领先的人工智能图像处理芯片设计公司,双方将共同开发360°多摄像头视频会议解决方案,为用户打造卓越、标准的会议室以及跨会议室体验。 该
    的头像 发表于 06-15 14:52 630次阅读

    Valens将在InfoComm 2023上展示视频会议解决方案,提升混合办公场所的工作效率

    视频会议解决方案,该解决方案将推动会议空间的发展,促进更具包容性和协作性的视频会议设置,以适应当今灵活工作场所的需求。InfoComm美国
    的头像 发表于 06-06 15:00 502次阅读
    Valens将在InfoComm 2023上展示<b class='flag-5'>视频会议</b><b class='flag-5'>解决方案</b>,提升混合办公场所的工作效率

    一文回顾MAXHUB 2023年新品发布会:三大空间数字化解决方案亮相 会议协作能力全升级

    会议平板、未来款会议平板、视频会议一体机 MS31、智会屏、无线全向麦 BM51五大硬件终端,实现本地会议、云会议、硬件
    的头像 发表于 05-10 10:51 973次阅读
    一文回顾MAXHUB 2023年新品发布会:三大空间数字化<b class='flag-5'>解决方案</b>亮相 <b class='flag-5'>会议</b>协作能力全升级

    MAXHUB发布沉浸式视频会议方案:多项能力突破协作边界

    三大空间数字化解决方案,让组织数字化看得见、摸得着,并渗透到每一个角落。在组织决策中心“会议空间”,MAXHUB实现全4K硬件视频会议、无线BYOM视频会议、沉浸式
    的头像 发表于 05-10 10:21 614次阅读
    MAXHUB发布沉浸式<b class='flag-5'>视频会议</b><b class='flag-5'>方案</b>:多项能力突破协作边界