0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

新版NVIDIA Maxine为实时音频和视频通信铺平道路

NVIDIA英伟达 来源:NVIDIA英伟达 作者:NVIDIA英伟达 2022-09-26 09:19 次阅读

抢先体验 AI 微服务在云端提供的优质通信

新版NVIDIA Maxine为实时音频视频通信铺平了道路。无论是参加视频会议、致电客户服务中心,还是进行直播,Maxine 都能够助您实现清晰明确的沟通,增强虚拟交互的效果。

NVIDIA Maxine 是一套由 GPU 加速的 AI 软件开发套件 (SDK) 和云原生微服务,用于部署经过优化和加速的 AI 功能,可达到实时增强音频、视频和增强现实 (AR) 效果的目的。

借助 Maxine 的先进模型,最终用户无需使用昂贵的设备即可改进音频和视频质量。基于 NVIDIA AI 的技术使标准的麦克风和摄像头设备也能够达到这些高质量的效果。

在 GTC 上,NVIDIA 宣布为云原生微服务重新构建 Maxine,并推出了 Maxine 音频效果微服务的抢先体验版。此外,还推出了新的 Maxine SDK 功能,包括发言者聚焦和人脸表情估计,并正式推出了眼神交流功能。NVIDIA Maxine 现在还包含现有 SDK 功能的增强版。

Maxine 实现云原生

Maxine 的云原生微服务允许开发者构建实时 AI 应用。微服务可以独立管理,并在云端进行无缝部署,从而缩短开发周期。

抢先体验版的 Audio Effects 微服务中包含四种先进的音频功能:

背景噪音消除:使用 AI 模型消除多种常见的背景噪音,同时保留说话者的自然声音。

房间回声消除:使用 AI 模型消除音频中的混响,恢复说话者声音的清晰度。

音频超高分辨率:提高音频信号的时间分辨率,改善音频质量。该功能目前支持 8 kHz 到 16 kHz 以及 16 kHz 到 48 kHz 的上采样。

声学回声消除:消除输入音频流中的实时声学设备回声,从而去除不匹配的声对和双声。借助基于 AI 的技术,Maxine 实现了比传统数字信号处理算法更有效的回声消除。

Pexip 是一家领先的企业视频会议和协作解决方案提供商,正在利用 NVIDIA 的 AI 技术将虚拟会议提升到更高水平,为现代员工队伍提供先进的功能。

Pexip 战略联盟高级副总裁 Eddie Clifton 表示:“随着 Maxine 向云原生微服务的转化,我们能够更加轻松地将 NVIDIA 的先进 AI 技术与我们独特的服务器端架构结合起来。这使我们的 Pexip 团队能够为虚拟会议提供更强的体验。”

探索 SDK 的增强功能

Maxine 提供了三款由 GPU 加速的 SDK,能够通过 AI 重塑实时通信的音频、视频和 AR 效果。

音频效果 SDK 可提供多效果、低延迟,以及基于 AI 的音频质量增强算法。发言者聚焦是抢先体验版中的新功能,该功能能够分离前景和背景发言者的音轨,使听众能够更加轻松地识别每种声音。此外,还更新了音频超高分辨率SDK 功能,使其具备更高的质量。

视频效果 SDK 会使用标准网络摄像头输入创建基于 AI 的视频效果。虚拟背景功能已获得更新,增强了时间稳定性,该功能能够分割个人形象并应用由 AI 驱动的背景去除、替换或模糊功能。

AR SDK 基于标准网络摄像头馈送,提供基于 AI 的实时 3D 面部追踪和身体姿态估计。新功能包括:

眼神交流:通过预估和将视线与摄像头对齐来模拟眼神交流。

人脸表情估计:追踪人脸并推断主体所呈现的表情。

更新了以下 AR 功能:

身体姿态估计:以 2D 和 3D 形式预测和追踪人体的 34 个关键点,并且现已支持多人追踪。

面部特征点追踪:使用 126 个关键点来识别面部特征和轮廓。现已可使用“画质”模式来追踪由于头部运动和表情造成的头部姿势和面部变形(实时追踪的自由度为 3 度),实现了更高质量的跟踪效果。

人脸网格:以高达 3000 个顶点和 6 个自由度的 3D 网格表示人脸,并且现在包括USC 创意技术研究所的 3D 可变形模型。

直接体验 Maxine 的惊艳效果。

体验由 AI 的强大功能带来的先进效果

Maxine SDK 和微服务可为您提供一套低延迟的 AI 效果,且可与现有的客户基础设施进行集成。由于 Maxine 的尖端 AI 功能的构建以 NVIDIA AI 平台为基础,并且拥有领先的预训练模型,所以开发者用户可利用其来创建、定制和部署优质的音频和视频质量功能。

Maxine 也是NVIDIA Omniverse Avatar Cloud Engine的一部分,NVIDIA Omniverse Avatar Cloud Engine 是一系列基于云的 AI 模型和服务,可供开发者构建、定制和部署交互式虚拟形象。Maxine 的可定制云原生微服务允许您在 AI 效果制作流程中进行独立部署。而且,您可以在本地、云端或边缘部署 Maxine。

审核编辑:汤梓红

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • NVIDIA
    +关注

    关注

    14

    文章

    4582

    浏览量

    101675
  • AI
    AI
    +关注

    关注

    87

    文章

    26389

    浏览量

    263992
  • 云原生
    +关注

    关注

    0

    文章

    222

    浏览量

    7842

原文标题:GTC22 | 全新 NVIDIA Maxine 云原生架构可大规模实现突破性影音质量

文章出处:【微信号:NVIDIA_China,微信公众号:NVIDIA英伟达】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    英伟达携手台积电、新思科技,力推下一代半导体芯片制造技术

    英伟达与台积电、 Synopsys 已做出决策,将在其软件环境、制造工艺以及系统上整合英伟达的 cuLitho 计算光刻平台。此举旨在大幅提升芯片制造速率,并为英伟达即将推出的 Blackwell 架构 GPU 铺平道路
    的头像 发表于 03-19 11:41 219次阅读

    巍泰技术基于 TurMass™ 通信技术的道路交通安全雷达风险防控解决方案

    车辆检测雷达与 TurMass™ 无线通信技术结合,实现了对道路交通安全风险的有效防控。该方案包括道路安全哨兵系统和智能雾灯诱导系统,利用雷达实时探测车辆信息并通过无线
    的头像 发表于 03-15 14:35 281次阅读
    巍泰技术基于 TurMass™ <b class='flag-5'>通信</b>技术的<b class='flag-5'>道路</b>交通安全雷达风险防控解决方案

    Starlab与SpaceX联手,商业空间站将进驻低地球轨道

    SpaceX 商业业务高级副总裁 Tom Ochinero对此评论道:“Starlab 的单次发射方案若能得到验证,不仅会提升这项商业模式的可信度,还将为未来的发展铺平道路。”
    的头像 发表于 02-01 14:24 195次阅读

    通宇通讯全力布局5G技术与特殊领域产品

    此外,近来,通宇通讯已经在咸宁开设了全资子公司——“通宇卫星通讯(湖北)有限公司”,以此进一步深化其对卫星通信领域的投资,为今后卫星通信产品的规模化生产和扩展铺平道路
    的头像 发表于 12-12 09:54 243次阅读

    SIGGRAPH 2023 | NVIDIA 扩展 Maxine 视频编辑功能,展示 3D 虚拟会议研究成果

    Maxine 的生产版本现已在 NVIDIA AI Enterprise 中推出;研究演示示范了 3D 技术如何提升视频通信的质量。 在 NVIDI
    的头像 发表于 08-10 20:15 502次阅读

    NVIDIA Jetson Nano上的智能视频分析

    电子发烧友网站提供《NVIDIA Jetson Nano上的智能视频分析.zip》资料免费下载
    发表于 07-06 10:39 0次下载
    <b class='flag-5'>NVIDIA</b> Jetson Nano上的智能<b class='flag-5'>视频</b>分析

    如何把视频转换成音频 视频转换成音频的原理是什么

    视频文件包含了一系列连续的图像帧,每帧都由像素组成。而音频文件则包含一系列连续的声音样本。在视频转换成音频时,首先需要将视频中的图像帧和声音
    发表于 06-30 15:15 886次阅读

    使用Openvino从视频实时检测逃票

    电子发烧友网站提供《使用Openvino从视频实时检测逃票.zip》资料免费下载
    发表于 06-29 10:53 0次下载
    使用Openvino从<b class='flag-5'>视频</b>中<b class='flag-5'>实时</b>检测逃票

    树莓派音频视频播放

    树莓派音频视频播放
    的头像 发表于 06-21 11:41 419次阅读

    毫米波通信的关键技术及其应用5G

    %交通量,预计将增至67%到2017年[1],[2]。因此,未来的移动宽带通信系统将对网络提出更高的要求容量尽管5G标签还为时过早,但这项技术可能有助于为更先进的移动设备铺平道路应用程序。为了提高通信容量,
    发表于 06-06 15:42 5次下载

    NVIDIA 与软银公司合作,利用 Grace Hopper 超级芯片建设面向生成式 AI 和 5G/6G 的软银下一代数据中心

    该平台。 为在全球范围内快速部署生成式 AI 应用和服务铺平道路,通过与 NVIDIA 合作,软银将打造能够在多租户通用服务器平台上托管生成式 AI 和无线应用
    的头像 发表于 05-30 01:40 442次阅读
    <b class='flag-5'>NVIDIA</b> 与软银公司合作,利用 Grace Hopper 超级芯片建设面向生成式 AI 和 5G/6G 的软银下一代数据中心

    RTC实时音频是什么?

    RTC Real-TimeCommunication 实时视频,是一种给行业提供高并发、低延时、高清流畅、安全可靠的全场景、全互动、全实时的音视频服务的终端服务。
    的头像 发表于 05-26 17:28 993次阅读
    RTC<b class='flag-5'>实时</b><b class='flag-5'>音频</b>是什么?

    HDMI 2.1:引导 GenX 音频视频体验

    HDMI(高清多媒体接口)是一种音频视频接口,连接我们的电视、计算机、视频游戏机、蓝光播放器、有线电视盒等已经存在了很长一段时间,以提供高质量的音频视频体验。
    的头像 发表于 05-26 14:46 855次阅读
    HDMI 2.1:引导 GenX <b class='flag-5'>音频视频</b>体验

    实时互动下视频QoE端到端轻量化网络建模

    视频或者实时互动场景下QoE体验的影响因素主要有媒体体验和互动体验。媒体体验分为视频体验和音频体验。视频体验包括画质、流畅度、播放设备等。
    的头像 发表于 05-25 15:48 568次阅读
    <b class='flag-5'>实时</b>互动下<b class='flag-5'>视频</b>QoE端到端轻量化网络建模

    5G时代来临,机器人的春天还会远吗

    第五代无线技术将为新一代机器人的发展铺平道路,让未来机器人可以通过无线而非有线通信链路自由漫游,并利用云计算和数据存储的海量资源。借助于这些功能,几乎可以实时地对机器人进行精确的动态控制,在本地
    的头像 发表于 05-08 10:18 492次阅读