0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

搭载 PowerVR GPU IP 芯片的新功能介绍

Dbwd_Imgtec 来源:Imagination Tech 作者:Imagination Tech 2022-10-17 14:57 次阅读

日前,游戏和VR应用性能优化平台 UWA 宣布新的 GPU Counter 功能更新:增加了对 PowerVR 品牌 GPU 芯片的支持。针对 PowerVR GPUCounter,UWA提供了 GPU 负载、GPU 着色、GPU 带宽、GPU 图元 4 个模块的分析。 最新的 UWA SDK 2.4.4 已发布,下载最新版 SDK,并使用搭载 PowerVR GPU IP 芯片的设备进行测试,即可在GOT Online Overview的GPU模块下查看到对应的数据,掌握GPU压力和性能消耗情况。

以下针对PowerVR GPU Counter,围绕UWA所提供的GPU 负载、GPU着色、GPU带宽、GPU图元4个模块的分析进行详细说明。

1、GPU负载

GPU Counter下的GPU负载包含Non Fragment Utilization和Fragment Utilization两个性能指标,分别代表非片段处理占整体GPU处理耗时百分比和片段处理开销占整体GPU处理开销百分比。

91e6c744-4dc6-11ed-a3b6-dac502259ad0.png

在GPU上运行的工作负载由作业管理器统一协调,该任务管理器负责将工作负载调度到GPU内部的各个处理单元上,它将两个FIFO工作队列,称为作业插槽。其中,一个插槽用于非片段工作负载,另一个插槽则用于片段着色工作负载。 当出现GPU瓶颈时,正常情况下Non Fragment Utilization和Fragment Utilization至少有一个是接近100%,如果两者都低于100%,则有可能是Non Fragment和Fragment之间存在数据依赖关系。

当Non Fragment Utilization过高时,开发者可以从顶点数、复杂的Compute Shader的使用情况以及Geometry Shader、Tessellation Shader等角度着手进行优化。当Fragment Utilization过高时,则可以考虑项目中是否存在是否存在片段数目过多、片段Shader过于复杂。

2、GPU着色

包含Overdraw和Cycles/Pixel两个指标。

921a7ec2-4dc6-11ed-a3b6-dac502259ad0.png

Overdraw(过度绘制)

该项表示项目运行过程中,单帧中整个屏幕被填充的倍数。倍数越高,则GPU的压力越大。在游戏运行过程中,场景中半透明物体的重合会使得同一个像素点在一帧中会被绘制多次,造成Overdraw过高的情况。如下图所示,UI和粒子特效层叠导致容易出现Overdraw。 92493866-4dc6-11ed-a3b6-dac502259ad0.png

Cycles/Pixel

表示平均每个像素耗费的GPU时钟周期。一般来说,Shader复杂度会极大地影响GPUCycles占用的情况。当画面的Shader复杂度过高时,GPU需要消耗大量的时钟周期对Shader进行运算,容易造成GPU耗时变高,造成卡顿。

因此,通过查看GPU着色模块,就可以快速定位高Overdraw和高Cycles的场景,判断这个场景的GPU压力较高是Overdraw还是Shader复杂度过高造成的,进行有针对性的优化。

3、GPU带宽

CPU一样,GPU带宽也是芯片耗电的重要指标。当GPU持续进行高负载外部读写时,掉电就会过快。

UWA的GPU带宽模块统计了测试过程中单帧的读写带宽总量,通过查看GPU带宽模块,可以快速定位测试过程中带宽较高的场景和原因,并进行进一步测试优化。 93496c0e-4dc6-11ed-a3b6-dac502259ad0.png

4、GPU图元处理 渲染面是产生GPU压力的重要因素之一,我们可以通过 Overview 模式里的 Triangle 指标来查看和分析哪些画面的渲染面较多。

9361d974-4dc6-11ed-a3b6-dac502259ad0.png

渲染面过多,一方面可能是模型过于复杂,一般可以通过 LOD、HLOD 等常用技术来简化远距离的模型,在不影响画质的情况下显著降低渲染面;另一方面,可能是地形、大建筑物等大面积模型没有进行适当的拆分,导致进入视域体的面片可能不多,但提交GPU的渲染面依然很多。 对于第二种情况,我们可以通过新功能“GPU图元”来进行初步的判断。

939e87fc-4dc6-11ed-a3b6-dac502259ad0.png

总图元数:提交到GPU端的图元总数,该数值基本等同于引擎端统计的渲染面片总数。 可见图元数:在GPU端通过各种裁剪之后,留下的参与渲染的三角面。 可见图元不包括:因为在视域体外而被裁剪的三角面,因为朝向而被裁剪的三角面。因此,在3D场景中,比较理想的情况下,可见图元的数量应该接近或高于 50%(对于大部分模型,有一半三角面会因为朝向被裁剪)。如果某些角度下,可见图元的比例非常低,则很可能存在上文提到的第二种情况,从而可以针对性地检查和优化场景中,这个角度下,被提交到GPU的大面积模型。

93baad4c-4dc6-11ed-a3b6-dac502259ad0.png

GPU图元处理数量过多会对设备的带宽和能耗造成较大的影响,应尽量在程序端完成剔除,并减小送往GPU的图元数。

需要注意的是,基于架构不同,同一参数在不同品牌芯片上的推荐值也会存在差异,不同设备间横向对比的意义不大,更推荐大家在相同的设备上进行纵向对比。同时,由于同品牌芯片的架构之间也会存在差异,UWA目前仅支持部分芯片的GPU Counter数据采集,具体支持设备列表可通过下图或登录UWA官网对“Mali/Power VR/Adreno GPUCounter支持设备”列表进行查询:

93e76d64-4dc6-11ed-a3b6-dac502259ad0.png   以上就是这次关于搭载 PowerVR GPU IP 芯片的新功能介绍了,希望会对开发者们在 GPU 优化上和项目的整体性能监控上有所帮助。  

审核编辑:彭静
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 芯片
    +关注

    关注

    447

    文章

    47816

    浏览量

    409191
  • 模块
    +关注

    关注

    7

    文章

    2485

    浏览量

    46543
  • gpu
    gpu
    +关注

    关注

    27

    文章

    4424

    浏览量

    126722
  • SDK
    SDK
    +关注

    关注

    3

    文章

    966

    浏览量

    44718

原文标题:UWA平台支持PowerVR芯片,新增四大GPU模块分析

文章出处:【微信号:Imgtec,微信公众号:Imagination Tech】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    STM32G4芯片怎么使用最新功能三角函数?

    求助各位大佬: STM32G4芯片怎么使用最新功能三角函数?
    发表于 04-15 08:17

    嘉楠基于RISC-V的端侧AIoT SoC采用了芯原的ISP IPGPU IP

    信号处理器(ISP)IP ISP8000、畸变矫正(DeWarp)处理器IP DW200,以及2.5D图形处理器(GPUIP GCNanoV。该合作极大地优化了高精度、低延迟的端侧A
    的头像 发表于 03-14 10:20 178次阅读

    嘉楠基于RISC-V的端侧AIoT SoC采用了芯原的ISP IPGPU IP

    了芯原的图像信号处理器 (ISP) IP ISP8000、畸变矫正 (DeWarp) 处理器IP DW200,以及2.5D图形处理器 (GPU) IP GCNanoV。
    的头像 发表于 03-14 09:03 171次阅读

    苹果M3芯片有哪些升级?最高搭载40核GPU

    据悉,M3 系列芯片采用 3nm 制程工艺,在 CPU 和 GPU 方面都有了重大改进。这三款 3nm 制程芯片能满足不同用户的需求。
    发表于 11-02 14:59 229次阅读
    苹果M3<b class='flag-5'>芯片</b>有哪些升级?最高<b class='flag-5'>搭载</b>40核<b class='flag-5'>GPU</b>

    苹果A系列芯片进化史

    A4芯片是苹果公司在2010年4月发布的第一款自主研发芯片搭载于iPad第一代和iPhone 4等产品中。A4芯片采用了ARM Cortex-A8核心和
    发表于 10-25 12:38 1016次阅读

    英诺达EnCitius® SVS新功能发布,加速芯片验证流程

    /ITC)等。这些新功能旨在帮助客户加速设计验证,实现云端资源的灵活调度,提高效率。 当前的芯片规模越来越大,开发周期日益紧迫。
    发表于 08-28 16:15 198次阅读
    英诺达EnCitius® SVS<b class='flag-5'>新功能</b>发布,加速<b class='flag-5'>芯片</b>验证流程

    芯片设计中IP设计和SOC设计的区别

    功能集成在一个芯片上,实现高性能、低功耗和低成本。但是,它们在设计流程、设计难度、设计风格和技术要求等方面存在一些不同之处。本文将详细介绍这些相同点和不同点,并通过案例分析进行说明。 相同点 高集成度
    的头像 发表于 08-24 10:10 2242次阅读

    UWA推出全新GPU性能测评工具,支持多款PowerVR芯片优化

    移动设备GPU性能优化对玩家游戏体验至关重要。侑虎科技UWA一直专注于游戏和VR应用的性能优化,移动设备GPU优化是其关注的重点,为了更好地满足开发者针对不同GPU芯片的性能测评与优化
    的头像 发表于 08-14 10:13 704次阅读
    UWA推出全新<b class='flag-5'>GPU</b>性能测评工具,支持多款<b class='flag-5'>PowerVR</b><b class='flag-5'>芯片</b>优化

    芯片行业的IP是什么?芯片 IP 公司到底是做什么的?

    在过去很多行业展会或论坛上,我们总会遇到有不少人疑问:IP 公司是做什么的?跟行业头部的 GPU 芯片公司有什么不一样?其实不难理解,尽管芯片行业被越来越多的大众讨论,但由于整个产业链
    的头像 发表于 08-08 08:40 3663次阅读
    <b class='flag-5'>芯片</b>行业的<b class='flag-5'>IP</b>是什么?<b class='flag-5'>芯片</b> <b class='flag-5'>IP</b> 公司到底是做什么的?

    Bifrost GPU可编程核心的顶级布局、优势和着色器核心功能

    本指南介绍了典型的马里Bifrost GPU可编程核心(第三代马里GPU)的顶级布局、优势和着色器核心功能。Bifrost家族包括Mali-G30、Mali-G50和Mali-G70系
    发表于 08-02 17:52

    为什么我们是RISC-V的首选 GPU

    谈起 GPU,很容易想到 Imagination。毫无疑问,鉴于Imagination 在图形处理领域的积累,也成为 RISC-V 的首选 GPU。 凭借 30 多年的 PowerVR GPU
    的头像 发表于 06-08 16:55 501次阅读
    为什么我们是RISC-V的首选 <b class='flag-5'>GPU</b>

    GPU Render Engine详细介绍

    并行运算的 GPU 也被广泛应用于训练和推理, 大量的服务器开始搭载 GPU 做计算任务。当前 GPU 包含多个引擎,包含渲染,计算,编解码,显示, DMA(Designated Ma
    发表于 05-30 09:54 682次阅读
    <b class='flag-5'>GPU</b> Render Engine详细<b class='flag-5'>介绍</b>

    下一代天玑旗舰移动芯片将采用 Arm 最新 CPU 与 GPU IP

    MediaTek 下一代天玑旗舰移动芯片将采用 Arm 最新 CPU 与 GPU IP — Cortex-X4、Cortex-A720 以及Immortalis-G720 GPU,通过
    的头像 发表于 05-29 22:30 460次阅读

    vivo Y78 开售,搭载天玑7020 采用 Imagination GPU IP

    日前,vivoY78正式上市,该手机搭载天玑7020处理器,其中GPU则采用了Imagination的B系列GPUIP:IMGBXM-8-256。vivoY78产品图vivoY78产品
    的头像 发表于 05-18 10:00 949次阅读
    vivo Y78 开售,<b class='flag-5'>搭载</b>天玑7020 采用 Imagination <b class='flag-5'>GPU</b> <b class='flag-5'>IP</b>

    vivo Y78 开售,搭载天玑7020 采用 Imagination GPU IP

    日前,vivoY78 正式上市,该手机搭载天玑 7020 处理器,其中 GPU 则采用了 Imagination 的 B 系列GPU IP:IMGBXM-8-256。 vivo Y78
    的头像 发表于 05-16 12:30 821次阅读
    vivo Y78 开售,<b class='flag-5'>搭载</b>天玑7020 采用 Imagination <b class='flag-5'>GPU</b> <b class='flag-5'>IP</b>