0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

图灵设计NVENC单元的性能和质量

星星科技指导员 来源:NVIDIA 作者:Roman Arzumanyan 2022-04-28 15:43 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

从开普勒开始的所有 NVIDIA GPUs 都支持完全加速的硬件视频编码; GPUs 从费米开始支持完全加速的硬件视频解码。最近发布的图灵硬件提供了张量核心和更好的机器学习性能,但新的 GPU 还加入了新的多媒体功能,如改进的 NVENC 单元,以在视频编解码器中提供更好的压缩和图像质量。

让我们更仔细地看一看图灵设计的新的 NVENC 单元的性能和质量。

NVENC 性能测试设置

H.264 出现于 15 年前,已经成为一种无处不在的视频编码标准。它已经成为业界最重要和最广泛的编解码器。这些测试展示了 Tesla T4 与著名的开源编码器 libx264 在两种情况下的性能:

高质量模式,代表最常见的编码方案与 VBR 控制和 B 帧启用。

低延迟快速模式,适用于对延迟敏感的应用程序,如远程游戏或视频会议。

为此,测试计算机的配置如表 1 所示:

poYBAGJqRkWAMOQBAABkGfjAF4w897.png

我们使用了各种输入视频进行 RD 估计,如 basketball _ drive 、 bq _ terrace 、仙人掌、 crowd _ run 、 ducks _ take _ off 、 jokey 、和服,以及更多分辨率为 1280 × 720 、 1920 × 1080 和 3840 × 2160 的视频。

绩效和质量结果

平衡序列

图 1 到图 4 显示, Tesla T4 在高质量模式下为 libx264 提供相同或稍好的视觉质量,如 Kimono、 BQ Terrace 和 Park Scene 。

poYBAGJqReqAeGu1AADRnbCAPGs298.png

pYYBAGJqRfOAJWLxAADBfsd4PzE341.png

与 libx264 相比, T4 显示了更好的预测和过滤。

红皮艇和仙人掌序列分别包含显著的混沌运动和圆周运动。与 libx264 相比, NVENC 在这些包含复杂内部预测的场景中显示出明显的优势。

Tesla T4 NVENC 在低延迟模式下的性能很容易超过 libx264 。请注意 Tesla T4 如何在高分辨率下更有效,在相同的比特率下提供 1db 更好的视觉质量。

poYBAGJqRieAaoeBAADFobyJrNk315.png

图灵 GPUs 配备了功能强大的 NVENC 视频编码单元,与 libx264 等复杂的软件编码器相比,它提供了更高的视频压缩效率,因为它结合了更高的性能和更低的能耗。理想的代码转换解决方案需要具有成本效益(美元/流)和节能(瓦/流)。让我们看看在多个测试序列中平均的性能和功耗结果,如图 13 和 14 所示。

poYBAGJqRbWAWNgLAAAr-zX6VSQ870.png

图 13 。在高质量模式下以每秒 30 帧同时编码的流数

poYBAGJqRbeAFAGrAAAsdAzr5H8030.png

图 14 。在低延迟模式下以每秒 30 帧同时编码的流数。

T4 以高质量模式同时编码 22 个 720p 流。 GPU 还可以平均处理 10 个 1080p 的流和 2 到 3 个超高清( 2160p )分辨率的流。这相当于在相同的视觉质量级别上几乎是 libx264 的两倍。

在低延迟模式下运行显示出 T4 更大的优势。它可以编码 37 个 720p 分辨率的流, 17-18 个 1080p , 4-5 个超高清,性能比 libx264 高 2-2.7 倍,具有更高的视觉质量。您可以在图 15 和图 16 中看到每个流的瓦特数。

pYYBAGJqRb6AMc3bAAAvq-wAxCA408.png

图 15 。高质量模式下平均每流功耗瓦特

poYBAGJqRcGAZk8xAAAvASLNIxE444.png

图 16 。低延迟模式下平均每流功耗瓦特

Tesla 还显示出很高的功率效率,在高质量模式下优于 libx264 2-4x ,在低延迟模式下高达 5 倍,同时保持低负载。

结论

与前几代相比, NVIDIA 的 Tesla T4 的编码能力有了很大的提高。与 libx264 这样的软件编码器相比,它在高质量模式下显示出相同或更好的视觉质量,而在低延迟模式下则优于它们。这相当于在功耗降低 2-5 倍时性能提高了一倍。

关于作者

Roman Arzumanyan拥有俄罗斯南部罗曼大学( Rostov-on-Don , 2012 )和罗曼大学应用数学硕士学位。之后,他在俄罗斯三星研发院( 2012-2015 )、英特尔公司( 2015-2017 )工作。目前,他在莫斯科担任开发技术工程师。他的研究兴趣包括视频编码、高性能和 GPGPU 。

审核编辑:郭婷

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • NVIDIA
    +关注

    关注

    14

    文章

    5694

    浏览量

    110118
  • gpu
    gpu
    +关注

    关注

    28

    文章

    5272

    浏览量

    136070
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    深入剖析LP3906:多功能电源管理单元的卓越性能与应用

    深入剖析LP3906:多功能电源管理单元的卓越性能与应用 在电子设备的设计中,电源管理是至关重要的一环,它直接影响着设备的性能、稳定性和功耗。今天,我们就来深入探讨一款备受关注的多功能电源管理
    的头像 发表于 04-21 15:00 70次阅读

    深度解析LM10506:高性能电源管理单元的卓越之选

    深度解析LM10506:高性能电源管理单元的卓越之选 一、引言 在当今电子设备不断追求高性能、低功耗的时代,电源管理单元(PMU)的重要性愈发凸显。TI公司的LM10506作为一款先进
    的头像 发表于 04-19 11:15 209次阅读

    奇异摩尔与图灵量子达成深度战略合作

    上海 - 4月15日,奇异摩尔与图灵量子达成深度战略合作,双方将共同研发并推进下一代光互联OIO(Optical Input/Output)技术项目,旨在以芯片级光互联解决方案突破算力瓶颈,构建光电
    的头像 发表于 04-15 17:52 982次阅读

    成都华微与图灵量子达成战略合作

    近日,成都华微电子科技股份有限公司(以下简称“成都华微” 股票代码688709)与图灵量子正式达成战略合作,并签署数千万元合同订单。双方将围绕光电融合技术领域,充分发挥各自优势,共同推动相关技术的应用与产业化进程,助力构建更加完善的产业链生态。
    的头像 发表于 03-26 15:03 341次阅读

    ADP5043:高性能微电源管理单元的全面解析

    ADP5043:高性能微电源管理单元的全面解析 在电子设备的设计中,电源管理单元(PMU)起着至关重要的作用。它不仅要为各个组件提供稳定的电源,还要确保系统的高效运行和可靠性。今天,我们就来深入探讨
    的头像 发表于 03-10 14:00 243次阅读

    ADP5042:高性能微电源管理单元的深度解析

    ADP5042:高性能微电源管理单元的深度解析 在电子设备的设计中,电源管理单元(PMU)起着至关重要的作用,它直接影响着设备的性能、稳定性和功耗。今天,我们就来深入探讨一款高
    的头像 发表于 03-10 14:00 149次阅读

    资料] 汽车软件质量跃迁的系统性路径:基于ISO 26262标准的单元测试体系重构与中日实践深度对比(2026学术研究报告)

    各位伙伴,请问一个问题,[资料] 汽车软件质量跃迁的系统性路径:基于ISO 26262标准的单元测试体系重构与中日实践深度对比(2026学术研究报告),这份数据谁有源参考文献,有酬感谢
    发表于 01-08 10:09

    汽车软件质量跃迁的系统性路径:基于ISO 26262标准的单元测试体系重构与中日实践深度对比(2026学术研究报告)

    。” 研究命题 :在速度与质量的博弈中,单元测试不仅是技术问题,更是战略安全防线。 2. 理论基石:ISO 26262与ASPICE的合规性框架 2.1 ISO 26262-6:2018对单元测试的法定
    发表于 01-05 14:58

    喜报 | 回映电子 品牌公司「图灵脑机」完成天使轮融资,开启事业新征程!

    当脑科学的探索突破边界,当智能技术的革新席卷而来,科技革命正加速演进。今日,我们满怀喜悦与期待,恭贺回映电子品牌公司——图灵脑机科技有限公司正式成立,并成功斩获天使轮投资!这一里程碑事件,不仅标志着
    的头像 发表于 12-25 19:06 1049次阅读
    喜报 | 回映电子 品牌公司「<b class='flag-5'>图灵</b>脑机」完成天使轮融资,开启事业新征程!

    RDMA设计11:性能监测单元设计

    本文主要交流设计思路,在本博客已给出相关博文一百多篇,希望对初学者有用。注意这里只是抛砖引玉,切莫认为参考这就可以完成商用IP设计。 性能监测单元负责监测 RoCE v2 高速数据传输系统的运行
    发表于 12-24 09:50

    嵌入软件单元测试的全面研究与实践

    引言 嵌入软件单元测试是确保嵌入式系统质量和可靠性的关键环节。嵌入式系统广泛应用于汽车电子、工业控制、医疗设备等关键领域,其软件直接操控硬件,任何微小的错误都可能导致严重后果。单元
    的头像 发表于 12-01 14:31 865次阅读

    新能源汽车质量保证体系与传统汽车单元测试规范的融合研究

    摘要 随着新能源汽车产业的快速发展,其质量保证体系面临前所未有的挑战。本文探讨了将传统汽车成熟的单元测试规范应用于新能源汽车领域的可行性,重点分析了ISO 26262标准体系在新能源汽车电子控制系统
    的头像 发表于 11-07 10:10 397次阅读

    NVMe高速传输之摆脱XDMA设计之六:性能监测单元设计

    性能监测单元负责监测 NVMe over PCIe 逻辑加速引擎的运行状态和统计信息, 包括复位后 运行时间信息、 NVMe 指令数量统计信息、 数据操作数量统计信息、 IOPS 性能统计 信息
    发表于 07-02 19:51

    NVMe IP高速传输却不依赖XDMA设计之六:性能监测单元设计

    性能监测单元负责监测 NVMe over PCIe 逻辑加速引擎的运行状态和统计信息, 包括复位后 运行时间信息、 NVMe 指令数量统计信息、 数据操作数量统计信息、 IOPS 性能统计 信息、 指令延迟统计信息等。
    的头像 发表于 07-02 19:49 564次阅读
    NVMe IP高速传输却不依赖XDMA设计之六:<b class='flag-5'>性能</b>监测<b class='flag-5'>单元</b>设计

    如何评估CAN总线信号质量

    CAN总线网络的性能在很大程度上取决于其信号质量。信号质量差可能导致通信错误,进而引发系统故障、效率降低甚至安全隐患。因此,评估和确保CAN总线信号质量是维护系统健康和可靠性的关键。
    发表于 06-07 08:46