0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

基于Arm架构的珠峰芯片加速极致视频体验

Arm社区 来源:Arm社区 2024-11-01 13:54 次阅读

作者:安谋科技 (Arm China) 高级软件产品经理 杨喜乐

视频编解码技术作为支撑超高清视频及泛音视频产业发展的基石,其重要性愈发凸显。H.264/AVC 是目前广泛使用的编解码标准,能够在较低的数据速率下提供高质量的视频流,是在线视频和移动端视频的理想选择;H.265/HEVC 进一步提高了压缩效率,在传输高清视频流和 4K 视频时所需的带宽大约是 H.264 的一半。然而,新一代编解码技术在节省带宽的同时,也对算力提出了更高的要求。

尽管专用视频加速卡(如 ASICs)和 GPU 在特定任务上展现出卓越性能,但通用服务器 CPU 因其出色的灵活性、广泛的适用性以及更高的性价比,正在成为视频转码场景中的主流选择。随着多核 CPU 架构和视频编解码技术的不断进步,可以预见 CPU 在视频转码领域的应用将更加广泛。

在本文中,我们将探讨基于 Armv9 架构的中兴微电子“珠峰 1.0”芯片在 x264/x265 视频转码场景下,所展现的可扩展算力和稳定核心,并通过与主流 x86 架构产品相比,展示珠峰芯片所具备的性能和能效优势。

x264/x265 基准测试

“珠峰 1.0”是中兴微电子发布的首颗领域定制融合处理器,搭载 128 个核心,主频最高达到 3.1GHz。该芯片可提供指令集加速,比如 SVE/SVE2 等向量计算技术等,并在视频转码等高算力场景中能够让工作负载以可预测的方式稳定运行。与此同时,依托于 Arm 成熟坚实的软件生态和主流视频编解码库中基于最新 Arm 架构指令的优化,珠峰芯片可以为视频转码和其他云工作负载提供卓越的性能和能效收益。

x264 和 x265 作为主流的开源编解码器实现在业界得到了广泛的认可和应用,我们将通过实测 x264/x265 转码场景下的编码速度(每秒帧数,FPS)来对比珠峰芯片和主流 x86 产品(英特尔 IceLake[1]、英特尔 Sapphire Rapids (SPR)[2] 和 AMD Milan[3])在多线程和整个 socket 配置下的性能和吞吐。

93b52a6a-9802-11ef-a511-92fbcf53809c.png

表 1:珠峰芯片和主流 x86 架构产品平台配置

(配置: 内核: 6.0; GCC 编译器: 12.2;

x86 开启 turbo,1 线程 = 1 逻辑 CPU)

测试视频:

https://ultravideo.fi/video/Bosphorus_1920x1080_120fps_420_8bit_YUV_Y4M.7z

测试命令脚本:

x264:

for cpu in ${cpulist[@]};do

cmd = numactl -C $cpu ${x264_DIR}/x264 -o output_${cpu}.mkv

${input_video_DIR}/Bosphorus_1920x1080_120fps_420_8bit_YUV.y4m --preset medium --

frames 600 --threads 1 &

done

x265:

for cpu in ${cpulist[@]};do

cmd = numactl -C $cpu ${x265_DIR}/x265 -o output_${cpu}.mkv

${input_video_DIR}/Bosphorus_1920x1080_120fps_420_8bit_YUV.y4m --preset medium --

frames 600 --no-wpp --pools ',' --frame-threads 1 &

done

<<< 左右滑动查看完整脚本 >>>

八线程转码测试

93e7f4f4-9802-11ef-a511-92fbcf53809c.png

图 1:单线程下 x264 的平均转码速率对比

940f86d6-9802-11ef-a511-92fbcf53809c.png

图 2:单线程下 x265 的平均转码速率对比

我们可以看到,在八线程的配置下,珠峰芯片在 x264/x265 转码场景中相比 x86 架构芯片平均每线程分别有 1.34 倍和 1.17 倍的性能优势。

单 socket 转码测试

942d53f0-9802-11ef-a511-92fbcf53809c.png

图 3:单 socket 下 x264 转码速率对比

945a4996-9802-11ef-a511-92fbcf53809c.png

图 4:单 socket 下 x265 转码速率对比

在单 socket 的配置下,珠峰芯片在 x264/x265 转码场景中相比 x86 架构芯片单 socket 分别有 2.96 倍和 2.54 倍的性能优势。

转码能效比

除了拥有最佳的转码性能外,基于 Armv9 架构的珠峰芯片非常注重性能和功耗的平衡,卓越的能效可以极大地减少视频转码中产生的碳足迹。下面是珠峰芯片和主流 x86 架构产品 (IceLake、SPR 和 Milan)热设计功耗 (TDP) 的比较:

946b22a2-9802-11ef-a511-92fbcf53809c.png

图 5:热设计功耗 (TDP) 对比

结论

在 x264/x265 视频转码的场景下,我们可以清楚地看到基于 Armv9 架构的中兴微电子珠峰芯片具备强劲的可扩展算力和稳定核心,测试结果显示,与主流 x86 架构产品选择相比(如英特尔至强第四代 Sapphire Rapids),该芯片提供了卓越的性能和能效,在运行 x264 时性能优势高达 2.08 倍,而在运行 x265 时性能优势高达 1.79 倍;此外,能效提升高达 1.35 倍。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 处理器
    +关注

    关注

    68

    文章

    19404

    浏览量

    230797
  • 芯片
    +关注

    关注

    456

    文章

    51154

    浏览量

    426292
  • ARM
    ARM
    +关注

    关注

    134

    文章

    9164

    浏览量

    368625
  • cpu
    cpu
    +关注

    关注

    68

    文章

    10901

    浏览量

    212682

原文标题:基于 Arm 架构的珠峰芯片加速极致视频体验

文章出处:【微信号:Arm社区,微信公众号:Arm社区】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    40分钟教你学会什么是ARM架构

    门老大Chris Shore 做了一个最短小精悍的视频,用40分钟教会大家到底什么是ARM架构,并且ARM公司的Video Team团队帮忙制作了中文字幕,方便大家学习观看。请大家看这
    发表于 10-14 16:07

    ARM架构是什么

    从单片机转到ARM,主要需要学习ARM架构ARM相比单片机多了一些外设和总线。在仅仅是裸奔的情况下,如果熟悉了ARM
    发表于 07-01 09:23

    arm架构芯片有哪些

    arm架构芯片有哪些一、芯片架构模式原文冯诺依曼架构自己理解,不需要执行的程序存储在硬盘/F
    发表于 07-21 08:47

    ARM芯片架构

    ARM芯片ARM 历史ARM架构 (Advanced RISC Machine)64/32位架构
    发表于 07-28 08:16

    ARM架构

    ARM架构ARM架构如图所示,ARM公司只提供内核技术,而其他外设则为芯片商设计并使用,
    发表于 08-04 06:18

    ARM架构芯片讲解其相关的指令集

    汇编和处理器架构、指令集有什么关系呢?ARM架构芯片有哪些相关的指令集呢?
    发表于 11-29 06:28

    什么叫arm架构_X86架构ARM架构有什么区别

    本文首先介绍了arm架构的概念,其次介绍了ARM架构图与ARM的技术实现,最后介绍了X86架构
    发表于 04-24 08:45 8.7w次阅读
    什么叫<b class='flag-5'>arm</b><b class='flag-5'>架构</b>_X86<b class='flag-5'>架构</b>与<b class='flag-5'>ARM</b><b class='flag-5'>架构</b>有什么区别

    ARM架构是什么 限制ARM对华为的影响

    成立于1990年,ARM是全球最大的移动IP提供商,ARM本身是不制造计算机芯片的,主要是对外授权其半导体技术,把相关技术和工具打包售卖,而这个技术就是大名鼎鼎的ARM
    的头像 发表于 08-14 15:29 7982次阅读

    巨头加速切换ARM架构,芯片行业格局将"改朝换代"?

    近日有外媒透露,AMD实际上已经研制出与苹果M1处理器对标的ARM芯片。而且该芯片的原型共有两款,一款采用集成RAM,另一款则没有。 凑巧的是,此前双十一凌晨,苹果才发布了首款采用了ARM
    的头像 发表于 12-07 18:06 1928次阅读

    (网盘)国嵌ARM架构嵌入式培训视频

    (网盘)国嵌ARM架构嵌入式培训视频(嵌入式开发工程师需要学什么)-(网盘)国嵌ARM架构嵌入式培训视频
    发表于 08-04 12:33 14次下载
    (网盘)国嵌<b class='flag-5'>ARM</b><b class='flag-5'>架构</b>嵌入式培训<b class='flag-5'>视频</b>

    阿里Arm架构服务器芯片或于近期发布

    近日,根据知情人士的报道消息,阿里研发已久的Arm架构服务器芯片或于近期发布,Arm架构服务器芯片
    的头像 发表于 10-18 10:43 3519次阅读

    Arm架构科普解读 Arm架构的底层逻辑和Arm架构的顶层设计

    本文主要探讨了 Arm 架构的底层逻辑,介绍了Arm 架构的顶层设计;以处理器核心架构为基础,以系统架构
    的头像 发表于 02-06 05:33 6235次阅读
    <b class='flag-5'>Arm</b><b class='flag-5'>架构</b>科普解读  <b class='flag-5'>Arm</b><b class='flag-5'>架构</b>的底层逻辑和<b class='flag-5'>Arm</b><b class='flag-5'>架构</b>的顶层设计

    介绍三大主流芯片架构:X86、ARM、RISC-V

    我们主要应用的三大芯片架构:X86、ARM和RISC-V架构
    发表于 07-25 09:35 4.2w次阅读
    介绍三大主流<b class='flag-5'>芯片</b><b class='flag-5'>架构</b>:X86、<b class='flag-5'>ARM</b>、RISC-V

    Arm v9芯片架构揭秘

    从中长期来看,随着单芯片 ARM 核数增加、基于 ARM 架构芯片数量的上升以及ARM 应用场景
    发表于 02-27 14:14 5523次阅读
    <b class='flag-5'>Arm</b> v9<b class='flag-5'>芯片</b>新<b class='flag-5'>架构</b>揭秘

    苹果M3芯片ARM架构

    苹果M3芯片采用的是ARM架构。这种架构具有高效能和低功耗的特点,使得M3芯片在提供出色性能的同时,也能保持较低的能耗。
    的头像 发表于 03-08 16:03 2166次阅读