0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

UWA平台支持PowerVR芯片,新增四大GPU模块分析

颖脉Imgtec 2022-10-19 11:18 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

日前,游戏和VR应用性能优化平台 UWA 宣布新的 GPU Counter 功能更新:增加了对 PowerVR 品牌 GPU 芯片的支持。针对 PowerVR GPUCounter,UWA提供了 GPU 负载、GPU 着色、GPU 带宽、GPU 图元 4 个模块的分析。最新的 UWA SDK 2.4.4 已发布,下载最新版 SDK,并使用搭载 PowerVR GPU IP 芯片的设备进行测试,即可在GOT Online Overview的GPU模块下查看到对应的数据,掌握GPU压力和性能消耗情况。

以下针对PowerVR GPU Counter,围绕UWA所提供的GPU 负载、GPU着色、GPU带宽、GPU图元4个模块的分析进行详细说明。


1、GPU负载

GPU Counter下的GPU负载包含Non Fragment Utilization和Fragment Utilization两个性能指标,分别代表非片段处理占整体GPU处理耗时百分比和片段处理开销占整体GPU处理开销百分比。

9ddd0478-4f29-11ed-b116-dac502259ad0.png

在GPU上运行的工作负载由作业管理器统一协调,该任务管理器负责将工作负载调度到GPU内部的各个处理单元上,它将两个FIFO工作队列,称为作业插槽。其中,一个插槽用于非片段工作负载,另一个插槽则用于片段着色工作负载。当出现GPU瓶颈时,正常情况下Non Fragment Utilization和Fragment Utilization至少有一个是接近100%,如果两者都低于100%,则有可能是Non Fragment和Fragment之间存在数据依赖关系。

当Non Fragment Utilization过高时,开发者可以从顶点数、复杂的Compute Shader的使用情况以及Geometry Shader、Tessellation Shader等角度着手进行优化。当Fragment Utilization过高时,则可以考虑项目中是否存在是否存在片段数目过多、片段Shader过于复杂。


2、GPU着色

包含Overdraw和Cycles/Pixel两个指标。

9df65c16-4f29-11ed-b116-dac502259ad0.png

Overdraw(过度绘制)

该项表示项目运行过程中,单帧中整个屏幕被填充的倍数。倍数越高,则GPU的压力越大。在游戏运行过程中,场景中半透明物体的重合会使得同一个像素点在一帧中会被绘制多次,造成Overdraw过高的情况。如下图所示,UI和粒子特效层叠导致容易出现Overdraw。9e0b3a28-4f29-11ed-b116-dac502259ad0.png

Cycles/Pixel

表示平均每个像素耗费的GPU时钟周期。一般来说,Shader复杂度会极大地影响GPUCycles占用的情况。当画面的Shader复杂度过高时,GPU需要消耗大量的时钟周期对Shader进行运算,容易造成GPU耗时变高,造成卡顿。

因此,通过查看GPU着色模块,就可以快速定位高Overdraw和高Cycles的场景,判断这个场景的GPU压力较高是Overdraw还是Shader复杂度过高造成的,进行有针对性的优化。


3、GPU带宽

CPU一样,GPU带宽也是芯片耗电的重要指标。当GPU持续进行高负载外部读写时,掉电就会过快。

UWA的GPU带宽模块统计了测试过程中单帧的读写带宽总量,通过查看GPU带宽模块,可以快速定位测试过程中带宽较高的场景和原因,并进行进一步测试优化。9e3ef5e8-4f29-11ed-b116-dac502259ad0.png


4、GPU图元处理渲染面是产生GPU压力的重要因素之一,我们可以通过 Overview 模式里的 Triangle 指标来查看和分析哪些画面的渲染面较多。

9e4bc48a-4f29-11ed-b116-dac502259ad0.png

渲染面过多,一方面可能是模型过于复杂,一般可以通过 LOD、HLOD 等常用技术来简化远距离的模型,在不影响画质的情况下显著降低渲染面;另一方面,可能是地形、大建筑物等大面积模型没有进行适当的拆分,导致进入视域体的面片可能不多,但提交GPU的渲染面依然很多。对于第二种情况,我们可以通过新功能“GPU图元”来进行初步的判断。

9e798d84-4f29-11ed-b116-dac502259ad0.png

总图元数:提交到GPU端的图元总数,该数值基本等同于引擎端统计的渲染面片总数。可见图元数:在GPU端通过各种裁剪之后,留下的参与渲染的三角面。可见图元不包括:因为在视域体外而被裁剪的三角面,因为朝向而被裁剪的三角面。因此,在3D场景中,比较理想的情况下,可见图元的数量应该接近或高于 50%(对于大部分模型,有一半三角面会因为朝向被裁剪)。如果某些角度下,可见图元的比例非常低,则很可能存在上文提到的第二种情况,从而可以针对性地检查和优化场景中,这个角度下,被提交到GPU的大面积模型。

GPU图元处理数量过多会对设备的带宽和能耗造成较大的影响,应尽量在程序端完成剔除,并减小送往GPU的图元数。

需要注意的是,基于架构不同,同一参数在不同品牌芯片上的推荐值也会存在差异,不同设备间横向对比的意义不大,更推荐大家在相同的设备上进行纵向对比。同时,由于同品牌芯片的架构之间也会存在差异,UWA目前仅支持部分芯片的GPU Counter数据采集,具体支持设备列表可通过下图或登录UWA官网对“Mali/Power VR/Adreno GPUCounter支持设备”列表进行查询:

https://www.uwa4d.com/main/supported.html9ec4f774-4f29-11ed-b116-dac502259ad0.png以上就是这次关于搭载 PowerVR GPU IP 芯片的新功能介绍了,希望会对开发者们在 GPU 优化上和项目的整体性能监控上有所帮助。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 芯片
    +关注

    关注

    463

    文章

    54463

    浏览量

    469549
  • vr
    vr
    +关注

    关注

    34

    文章

    9694

    浏览量

    157550
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    技术干货 | 锂电池保护芯片工作原理详解:四大机制守护电池安全

    锂电池为何“娇贵”?保护芯片如何24小时防止过充、过放和短路?本文深入浅出解析锂电池保护IC的四大核心职责与技术原理。
    的头像 发表于 03-20 10:54 588次阅读
    技术干货 | 锂电池保护<b class='flag-5'>芯片</b>工作原理详解:<b class='flag-5'>四大</b>机制守护电池安全

    PowerVR:推动开源 Zink 与 OpenGL ES 支持的发展路径

    我很高兴能和大家分享本周实现的一项重要成就:PowerVR开源Vulkan驱动(自Mesa26.1起)现已支持Zink。借助这一能力,该驱动可以支持更为庞大的应用程序库。Zink:https
    的头像 发表于 03-18 10:05 622次阅读
    <b class='flag-5'>PowerVR</b>:推动开源 Zink 与 OpenGL ES <b class='flag-5'>支持</b>的发展路径

    Visionfive 2 缺少文件img-gpu-powervr-bin-1.17.6210866.tar.gz怎么解决?

    您好,我开始按照 SDK 快速入门指南构建镜像。 我失败了 WGEThttp://sources.buildroot.net/img-gpu-powervr
    发表于 03-11 07:08

    什么是OVP芯片?深度解析DC9336V过压保护的四大核心技术原理

    电路保护的关键是什么?本文从技术底层深度剖析热芯科技DC9336V OVP芯片。详细解读高精度电压监测、超快响应、自动恢复及宽压ESD保护四大机制,帮助工程师理解如何防止电压浪涌烧毁后端电路。
    的头像 发表于 02-26 11:40 243次阅读
    什么是OVP<b class='flag-5'>芯片</b>?深度解析DC9336V过压保护的<b class='flag-5'>四大</b>核心技术原理

    从“可见”到“可控”:工业物联网平台如何重塑四大核心场景价值

    工业物联网平台的价值,绝非漂浮于概念层面,它必须根植于具体的业务场景,解决真实的生产经营难题。数之能深入行业实践,聚焦于设备管理、生产执行、能源管控与安全运维四大核心领域,将平台能力转化为可量化、可
    的头像 发表于 01-12 15:26 213次阅读
    从“可见”到“可控”:工业物联网<b class='flag-5'>平台</b>如何重塑<b class='flag-5'>四大</b>核心场景价值

    我司正式加入UWA联盟:以芯赋能视界,共筑超高清产业新生态

    服务创造新的价值空间! 一、UWA联盟:全球超高清产业的重要平台        世界超高清视频产业联盟 (UHD World Association,缩写为UWA)是于2022年在北京成立的国际性、非营利的开放性技术合作组织,是
    的头像 发表于 12-24 15:24 213次阅读
    我司正式加入<b class='flag-5'>UWA</b>联盟:以芯赋能视界,共筑超高清产业新生态

    和而泰发布四大自研核心技术平台

    从智能家电到工业机器人,从新能源汽车到低空经济,和而泰的四大技术平台正在重新定义智能设备的"生命系统"。
    的头像 发表于 10-13 16:08 1454次阅读

    【上新速递】RF02机架式媒体平台新增款功能卡板

    RF02机架式媒体平台自上市以来,凭借模块化设计和全流程媒体处理能力,赢得广泛客户认可。为进一步提升RF02在各类场景下的制作效率,本次新增款功能卡板:FXC-A8800计算卡|一卡
    的头像 发表于 09-25 14:21 835次阅读
    【上新速递】RF02机架式媒体<b class='flag-5'>平台</b><b class='flag-5'>新增</b><b class='flag-5'>四</b>款功能卡板

    普迪飞 Exensio®数据分析平台| FDC领航者,提升良率的关键钥匙!

    ProcessControl(E-PC)是Exensio数据分析平台四大主要模块之一。作为一款在行业内处于领先地位的实时控制和分析工具,它
    的头像 发表于 08-19 13:53 1056次阅读
    普迪飞 Exensio®数据<b class='flag-5'>分析</b><b class='flag-5'>平台</b>| FDC领航者,提升良率的关键钥匙!

    Imagination GPU 全面支持 Vulkan 1.4 和 Android 16

    Imagination最新发布的驱动(DDK25.1RTM2)支持最新版本Android操作系统,同时增强了OpenCL扩展集及Android平台上Vulkan1.4支持。Vulkan
    的头像 发表于 08-14 11:18 2481次阅读
    Imagination <b class='flag-5'>GPU</b> 全面<b class='flag-5'>支持</b> Vulkan 1.4 和 Android 16

    四大核心要素驱动汽车智能化创新与相关芯片竞争格局

    当下,功能安全、高效高灵活性的算力、产品生命周期,以及软件生态兼容性这“四大核心要素”,已成为衡量智能汽车AI芯片创新力和市场竞争力的核心标准。
    的头像 发表于 07-01 14:49 810次阅读

    【「算力芯片 | 高性能 CPU/GPU/NPU 微架构分析」阅读体验】+NVlink技术从应用到原理

    前言 【「算力芯片 | 高性能 CPU/GPU/NPU 微架构分析」书中的芯片知识是比较接近当前的顶尖芯片水平的,同时包含了
    发表于 06-18 19:31

    Tx-Rx 前端模块,用于频 GSM/ GPRS/ EDGE,支持 4 频天线开关 skyworksinc

    电子发烧友网为你提供()Tx-Rx 前端模块,用于频 GSM/ GPRS/ EDGE,支持 4 频天线开关相关产品参数、数据手册,更有Tx-Rx 前端模块,用于
    发表于 06-04 18:33
    Tx-Rx 前端<b class='flag-5'>模块</b>,用于<b class='flag-5'>四</b>频 GSM/ GPRS/ EDGE,<b class='flag-5'>支持</b> 4 频天线开关 skyworksinc

    Tx-Rx 前端模块,用于频 GSM / GPRS,支持 4 频天线开关 skyworksinc

    电子发烧友网为你提供()Tx-Rx 前端模块,用于频 GSM / GPRS,支持 4 频天线开关相关产品参数、数据手册,更有Tx-Rx 前端模块,用于
    发表于 05-29 18:29
    Tx-Rx 前端<b class='flag-5'>模块</b>,用于<b class='flag-5'>四</b>频 GSM / GPRS,<b class='flag-5'>支持</b> 4 频天线开关 skyworksinc

    iTOP-3588S开发板核心架构GPU内置GPU可以完全兼容0penGLES1.1、2.0和3.2。

    ,8GB内存,32GBEMMC。 核心架构GPU内置GPU可以完全兼容0penGLES1.1、2.0和3.2。 内置NPU RK3588S内置NPU,支持INT4/INT8/INT1
    发表于 05-15 10:36