0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

三重压缩技术应对PowerVR图片方案

工程师兵营 2018-08-30 09:48 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

作者:Robin Britton

由于屏幕分辨率的提高以及越来越复杂的渲染管道,使得游戏和其他应用对于带宽的要求也越来越高,大量的数据需要从内存拷贝或者写入。现在用户普遍认为在无其他特殊情况下设备应该能够支持2K的屏幕分辨率,高端游戏则具有更大的几何复杂性,真正在屏幕上显示图像之前渲染管道通常要涉及多个中间渲染目标。即使一些休闲类游戏也可能具有一些全屏后的处理效果,需要帧缓存数据从片外存储器中读取和写入。内存访问是非常消耗功率的,占用带宽越大功耗则越高,这对于功率预算紧张的嵌入式系统尤其是个棘手的问题。

PowerVR GPU采用 PVR3C三重压缩技术来解决这个问题,这三重压缩解决方案包括纹理压缩(涉及PVRTC和ASTC)、几何压缩(PVRGC)和本文的主题图像压缩(PVRIC)。

PowerVR图片压缩(PVRIC)

如上文所说,在现代实时图形应用中内存带宽的最大压力之一就是生成高质量图像所需的大量中间渲染对象。一个明显的例子就是创建立方体环境贴图( cube maps),通常用于反射效果。这包括从一个不动点向六个方向渲染一个场景,最后结果会形成一个立方体的贴图纹理,然后对场景中的对象进行类似反射的采样。其他示例包括分辨率缩放、渲染小地图或其他场景视点、渲染平面反射贴图,更不用说无尽的屏幕空间和后期处理效果了,比如可分离模糊处理、 SSAO、 景深效果以及色调映射等。


一个立方体贴图的六个面可用于汽车上的近似反射,在汽车的窗户上可以看到天空的倒影。

PVRIC通过高效、无损的压缩方案大大降低了内存带宽成本,这种压缩方案通常会使得图像大小减少50%(依赖于很多元素)。前文提到的目标渲染在写入GPU之前就进行了压缩,然后从内存中读取时会被解压,因为这种压缩是无损的,所以可以从解压数据中重构得到完美的原始图像,这也意味着图像的质量不会降低。


上图展示了与GPU的所有交互,但更有利的是这有可能会将PVRIC技术集成到SoC级别的显示管道中,使得最终的渲染图像在写入内存之前会进行压缩,然后在显示控制器中进行解压,这将更有效地节省总体带宽。

在许多移动游戏和App中,纹理资源通常都会采用众所周知的格式进行压缩,比如 ETC、PVRTC等,但是开发者会选择保留一部分未经压缩的纹理资源,比如字体或UI纹理,这些纹理在缩放时需要保持清晰和不失真。PVRIC方案的另一个好处是它允许将相同的无损压缩应用到任何未经压缩的纹理上,然后上传给GPU(如果纹理使用的是多种被支持的格式之一),根据不同的应用,这可能会带来更大幅度的带宽减少。

应用带宽分析

我们在Synaptics BG5CT板卡(集成 PowerVR Series8XE GE8310 GPU,它采用了最新一代的PVRIC技术——PVRICv3)上运行API trace测试了多款流行的应用,我们看到了这种压缩方案所带来的性能提升,尤其是带宽消耗的显著降低。

下面的表格展示了不同应用的测试结果,需要注意的是,在这款器件上PVRIC并没有集成到SoC的显示管道中,如果集成了那么我们将会看到最后的帧缓存图像会有更好的压缩效果,正如前文所述。因为我们使用的是安卓平台,帧缓存压缩会应用到最终的渲染操作,Android SurfaceFlinger会将这些压缩帧写入内存,读取到GPU中。如果是这样,那么SoC显示管道也将受益于SurfaceFlinger的最终合成结果,。

那么这些结果到底意味着什么?这些数字可能有点儿误导人。我们可以清楚的看到所有应用占用的总带宽都有所减少,但有些应用比其他应用带宽的降低程度要大得多,正如上文所提到的PVRIC技术涵盖了纹理的渲染和解压缩,但这只是总带宽的一部分,几何图形、着色器等等也会占用一定的带宽,但是它们并不会受PVRIC操作的影响,所以对于整体带宽的占用情况我们能做的只是降低,虽然系统范围内的数据保持在较高的水平,但是我们想隔离受PVRIC影响的相关带宽参数,借助我们的内部分析工具可以让我们更精确的完成这些操作(虽然我们不能消除一切——比如纹理压缩)。

在这里,我们隔离的只是GPU在执行渲染操作时占用的带宽,而忽略了贴图操作所需要的几何处理。为了简化这一过程,测试平台上已经禁止了这些任务的重复。我们还能够识别和忽略其他进程的任务,现在我们需要分析为什么有些app会那样运行,这需要我们了解app是如何在图形API层工作的,不妨深入了解一下PVRTrace。

《minecraft》(《我的世界》)


我们使用PVRTrace对Minecraft这款应用进行分析,我们发现总体带宽节省率比较低(大约2.42%),但是隔离图片/纹理带宽方面显示带宽节省率则更高(大约17.76%)。Minecraft采用的是完全未压缩的纹理技术,因此PVRIC的效果比较显著,尽管这与典型场景中几何图形的数量(大约13万4千个三角形)相比非常的少,更不用说很多纹理的尺寸非常的小,PVRIC只是完成了它所能实现的,但是对于Minecraft并没有太多的事情可以做。请记住:通过集成到显示管道中,我们可以看到发送给显示控制器的帧缓存更好的优化效果。

《愤怒的小鸟 2》


在愤怒的小鸟 2这款应用中,几何图形(1万6千个三角形)和纹理内容各自占用的带宽比例则更协调一些,因此我们能够更加清晰的看到PVRIC所带来的好处,系统整体带宽节省43%,隔离带宽节省56%。这款游戏既采用了压缩的纹理格式也采用了一些未压缩的纹理格式,因此PVRIC非常起作用。此外,整个场景在进行最终的展示之前会采用渲染中间件的形式(很多应用都使用这种技术来处理分辨率缩放或后续处理操作),这两种因素的结合对于PVRIC技术是很好的展示。

《真实赛车 3》


真实赛车3是另一款使用大量几何图形(测试时显示16万个三角形)的应用,而且纹理/曲面也占用了相当一部分的带宽。纹理压缩技术(PowerVR的PVRTC技术)在这款应用中被广泛采用,这非常棒,但是还有很多未压缩的纹理需要借助PVRIC技术来处理,此外还涉及一组512 x 512的立方体环境贴图和全屏幕纹理渲染。最后的百分比可能不太明显,但是这很好的展示了PVRIC与PVRTC相结合所带来的好处,PVRTC可用于处理大部分的纹理,PVRIC则用于处理其他内容。

从这些工作负载中可以看出,无论图像数据是否占用应用程序的大部分带宽,采用PVRIC技术后都会带来显著的影响,在很大程度上减少了图像占用的带宽。

功耗分析

为了能够更清楚的了解PVRIC技术和降低带宽对于功耗的影响,我们修改了平台,使其支持功耗分析并连接了数据采集设备从而可以收集一些功耗数据,下面的图表就是我们的发现:


在愤怒的小鸟2同一段5秒的运行过程中,我们发现:使用PVRIC时内存的功耗会更低一些,采用两组数据之间的差值并进行平滑处理,我们发现内存功耗降低了18%。这个效果非常的显著,对于采用电池驱动的设备比如移动手机可以在充电之前使用更长的时间,当然对于功耗和电池寿命的影响还有很多其他因素,而且不同设备之间也会有所差别。

总结

总而言之,PVRIC技术是PVR3C压缩策略关键的组成部分,对于使用的带宽来说其压缩比可高达(有时甚至超过)2:1。这会对设备存储器的功耗产生实质性的影响,通过对我们纹理和几何压缩方案的测试,很明显可以得出PVR3C是全面的带宽效率方案,能够从整体上提高系统的效率,从而让我们能够实现更加全面的低功耗解决方案。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • gpu
    gpu
    +关注

    关注

    28

    文章

    5271

    浏览量

    136070
  • Power
    +关注

    关注

    1

    文章

    504

    浏览量

    70235
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    LTC1061高性能三重通用滤波器构建模块:特性、应用与设计指南

    LTC1061高性能三重通用滤波器构建模块:特性、应用与设计指南 在电子工程师的日常工作中,滤波器的设计和应用是一个关键领域。今天我们要深入探讨的是Linear Technology
    的头像 发表于 04-02 09:55 110次阅读

    微电网总体架构设计原则:安全、高效、灵活的三重导向

    价值;灵活是支撑,适配复杂多变的运行工况。坚守三重导向,既是微电网总体架构设计的核心准则,也是实现其高质量运行、规模化推广的关键前提。本文围绕三重导向,系统阐述其设计内涵、核心要求与实操路径,为微电网总体架构设计提供理论支撑与实操参考。
    的头像 发表于 03-27 14:12 277次阅读
    微电网总体架构设计原则:安全、高效、灵活的<b class='flag-5'>三重</b>导向

    宏展百级洁净真空烘箱三重控温算法解析:精准控温的核心技术揭秘

    局限,采用PID+PWM+SSR三重控温算法,解决了传统设备控温滞后、精度不足、温度波动大等痛点,成为设备适配严苛工艺需求的核心技术支撑。本文将聚焦这一单一技术,从原
    的头像 发表于 03-25 09:54 188次阅读
    宏展百级洁净真空烘箱<b class='flag-5'>三重</b>控温算法解析:精准控温的核心<b class='flag-5'>技术</b>揭秘

    MAX5930A/MAX5931A/MAX5931B:低电压三重热插拔控制器的设计与应用

    MAX5930A/MAX5931A/MAX5931B:低电压三重热插拔控制器的设计与应用 在电子系统设计中,热插拔功能对于提高系统的可维护性和可靠性至关重要。今天,我们来深入探讨 MAXIM 公司
    的头像 发表于 03-21 17:10 637次阅读

    深入解析ADM13307:高性能三重处理器监控器的全面指南

    深入解析ADM13307:高性能三重处理器监控器的全面指南 作为电子工程师,在设计基于DSP和微处理器的系统时,电源监控是确保系统稳定运行的关键环节。今天,我们来深入探讨一款出色的电源监控芯片
    的头像 发表于 02-27 11:25 285次阅读

    MAX1940:具备自动复位和故障消隐功能的三重USB开关

    MAX1940:具备自动复位和故障消隐功能的三重USB开关 在电子设备的设计中,USB接口的应用极为广泛,而USB开关的性能对于保障设备的稳定运行至关重要。今天,我们就来详细探讨一下Maxim公司
    的头像 发表于 02-11 14:35 286次阅读

    低电压三重热插拔控制器/电源排序器/电压跟踪器:MAX5930的应用与设计

    低电压三重热插拔控制器/电源排序器/电压跟踪器:MAX5930/MAX5931的应用与设计 在电子设备的设计中,热插拔功能对于提高系统的可维护性和可靠性至关重要。今天我们将深入探讨MAXIM公司
    的头像 发表于 02-10 15:55 505次阅读

    深度解析MAX7232:三重 LCD 解码器/驱动器在电子设计中的应用

    深度解析 MAX7231/32/33/34:三重 LCD 解码器/驱动器在电子设计中的应用 在现代电子设备设计中,LCD 显示屏的应用无处不在。从便携式仪器到工业设备,从电信产品到医疗仪器,一款性能
    的头像 发表于 02-04 14:55 417次阅读

    LT3597:60V 三重降压 LED 驱动器的深度解析

    LT3597:60V 三重降压 LED 驱动器的深度解析 在当今的电子设备中,LED 照明应用无处不在,从 LED 广告牌到汽车显示屏,都对 LED 驱动技术提出了更高的要求。Linear
    的头像 发表于 02-02 11:40 355次阅读

    高速利器:AD8183三重 2:1 多路复用器深度解析

    高速利器:AD8183/AD8185 三重 2:1 多路复用器深度解析 在电子设计领域,对于高速且功能强大的多路复用器的需求日益增长。AD8183/AD8185 作为高速三重 2:1 多路复用
    的头像 发表于 01-24 15:05 691次阅读

    瞬态吸收光谱技术用于观测主客体间高效的三重态-三重态能量转移(TTET)过程与热激活反向TTET(rTTET)过程

    图1. “三重态能量陷阱”调控的掺杂体系室温磷光。 2024年,来自汕头大学和华南理工大学的李明德教授、苏仕健教授和党丽教授在《Angew. Chem. Int. Ed. 》上发表研究成果,提出由
    的头像 发表于 10-29 07:57 822次阅读
    瞬态吸收光谱<b class='flag-5'>技术</b>用于观测主客体间高效的<b class='flag-5'>三重</b>态-<b class='flag-5'>三重</b>态能量转移(TTET)过程与热激活反向TTET(rTTET)过程

    车载音响EMC整改:“滤波-屏蔽-接地”的三重

    车载音响EMC整改:“滤波-屏蔽-接地”的三重奏|南柯电子
    的头像 发表于 10-15 10:34 605次阅读

    ICT测试:SMT产品质量的“三重防线”​

    一站式PCBA加工厂家今天为大家讲讲ICT测试如何保障SMT产品质量?ICT测试为SMT加工品质构筑三重防线。在SMT(表面贴装技术)加工中,ICT(在线测试)通过电气性能验证、焊接质量监控、装配
    的头像 发表于 08-05 09:47 1628次阅读

    WAIC 直击|Arm 邹挺:突破基础设施、数据安全与人才三重挑战,释放 AI 发展新潜能

    WAIC 直击|Arm 邹挺:突破基础设施、数据安全与人才三重挑战,释放 AI 发展新潜能
    的头像 发表于 07-28 11:33 1331次阅读
    WAIC 直击|Arm 邹挺:突破基础设施、数据安全与人才<b class='flag-5'>三重</b>挑战,释放 AI 发展新潜能

    用于 GSM / GPRS(824-915 MHz 和 1710-1910 MHz)的 Tx 四频 / Rx 双频 BiFET iPAC™ FEM,带三重 WCDMA TRx 开关 skyworksinc

    电子发烧友网为你提供()用于 GSM / GPRS(824-915 MHz 和 1710-1910 MHz)的 Tx 四频 / Rx 双频 BiFET iPAC™ FEM,带三重 WCDMA TRx
    发表于 06-24 18:32
    用于 GSM / GPRS(824-915 MHz 和 1710-1910 MHz)的 Tx 四频 / Rx 双频 BiFET iPAC™ FEM,带<b class='flag-5'>三重</b> WCDMA TRx 开关 skyworksinc