0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

Imagination D系列GPU:关于2D 双速率纹理处理

颖脉Imgtec 2025-02-08 14:28 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

对于每一代 GPU,Imagination 内部的性能团队都会运行广泛的测试内容,分析并理解不同类型的工作负载及其瓶颈。作为分析的一部分,数据显示许多现代游戏在执行后处理算法上花费了越来越多的时间,以实现景深、光晕、模糊等效果。

大多数这些后处理过程都是以纹理采样为主的过滤效果,它们对算术逻辑单元 (ALU) 的要求不高,但受限于纹理处理单元 (TPU) 的吞吐率。解决这个问题的一种方法是简单地改变 TPU 单元与 USC/ALU 比例。然而,我们的分析表明这并非一个好策略,原因有以下几点。

首先,在常规渲染过程中,D系列 GPU 中 ALU 与 TPU 的比例已经是最佳的,增加更多的 TPU 并不会带来任何好处,因为工作负载受限于 ALU。同时,其他处理过程是 TPU 密集型的,同时也是带宽密集型的,因此增强 TPU 并不会有帮助,因为没有足够的带宽来满足额外的 TPU 吞吐量,因此性能不会得到提升。

我们的团队发现后处理工作负载以及计算图像处理工作负载具有以下特点:

  • 在一个区域内进行规则的处理/采样,有大量的采样点重复利用,这些采样点命中纹理缓存;

  • 对单一渲染目标/纹理进行2D采样,不涉及层次细节 (LOD) 和透视。

上述两个特性促使我们在 D系列 GPU 中实现了新的 TPU 模式,可以使性能翻倍,但仅当硬件检测到这些特性时才生效。第一个特性是重要的,因为常规的采样加上样本重复利用率高(例如,移动窗口滤波器)可以避免带宽限制。第二个特性也是重要的,因为它使我们能够保持重复逻辑的数量较低,避免所有 TPU 逻辑均翻倍的前提下,提供峰值吞吐率翻倍的效果。

这种方法的结果是适度增加了TPU 的大小,但在策略生效的情况下性能翻倍,同时保持与总体特性相平衡。IMG D 系列 GPU 实现了真正的加速,并避免了 ALU 和/或带宽瓶颈情况,这些情况下 TPU 已经足够快。这意味着对于某些类型的处理,DXT-48-1536 将有效地表现出等同 DXT-96-1536的性能,每时钟处理双倍数量的双线性滤波纹理样本,与前代 CXT-48-1536 相比则可提供两倍的执行速率。

作为示例,下图显示了一个典型的手机游戏及其渲染过程。顶部的条形图从左边开始,显示了各种 Vulkan 渲染过程,其中包含几个预处理过程,通常用于阴影贴图,对深度测试单元造成很大压力。渲染的第二阶段是主场景,本例中是一个 GBuffer 渲染过程和一个光照过程。我们可以看到,这是帧处理时间的主要部分,ALU和 TPU 的负载相对均衡;这通过红色曲线(TPU 负载)和绿色曲线(ALU 负载)表示。我们可以看到,随着时间的推移,两者都显示出平均利用率,这对于主场景来说是典型的,其中 ALU 和 TPU 工作的混合比例平衡。

f9d6ec80-e5e5-11ef-9434-92fbcf53809c.png

最让我们感兴趣的渲染过程是最后一组,即后处理过程。通常,这是在之前的主渲染过程之上应用光晕、模糊等许多 HDR 风格后处理效果的地方。在这个区域值得注意的是,红色的 TPU 曲线在很多情况下都升高,而绿色的 ALU 曲线却非常低。这表明 TPU 单元造成了处理瓶颈——而这正是 2D 双速率 TPU 设计要解决的问题。它为这些工作负载将 TPU 的速度翻倍,从而将渲染时间减少了一半,加快了帧渲染的速度。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • gpu
    gpu
    +关注

    关注

    28

    文章

    5321

    浏览量

    136212
  • TPU
    TPU
    +关注

    关注

    0

    文章

    176

    浏览量

    21734
  • imagination
    +关注

    关注

    1

    文章

    627

    浏览量

    63553
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    英伦科技2D/3D可切换显示技术未来应用场景深度解析

    科技推出的2D/3D可切换显示技术,打破了传统显示“非此即彼”的局限——用户无需额外设备,即可在高清2D画质与沉浸式3D体验间一键切换。这不仅是显示技术的升级,更
    的头像 发表于 05-08 16:08 170次阅读
    英伦科技<b class='flag-5'>2D</b>/3<b class='flag-5'>D</b>可切换显示技术未来应用场景深度解析

    英伦科技:2D/3D可切换显示技术未来应用场景有哪些?

    首先,第一性原理要求我们回归技术的本质特性:2D/3D可切换显示技术的核心价值在于视觉体验的灵活性与场景适配性,既保留了传统2D显示的清晰、低功耗优势,又能按需切换至3D模式,提供沉浸
    的头像 发表于 05-08 15:44 216次阅读
    英伦科技:<b class='flag-5'>2D</b>/3<b class='flag-5'>D</b>可切换显示技术未来应用场景有哪些?

    TechWiz LCD 2D:液晶透镜模拟

    TechWiz Ray 2D进行光程差和焦距的计算,并进行高级LC分析,包括LC指向矢随外加电压的分布。 1. 建模任务 1.1 模拟条件 模拟区域:0~200 边界条件:Periodic 偏移角度:0° 单位
    发表于 03-20 08:56

    TechWiz LCD 2D应用:单畴IPS仿真

    对于IPS、FFS等结构来说,其像素电极和公共电极在同一平面,因此不能用TechWiz LCD 1D软件来仿真,需要至少能进行2维模拟的软件,本案例使用TechWiz LCD 2D来模拟一下单畴
    发表于 03-19 08:38

    TMAG511x系列2D双通道高灵敏度霍尔效应锁存器技术解析

    TMAG511x系列2D双通道高灵敏度霍尔效应锁存器技术解析 在电子设备的设计中,传感器的性能和适用性对整个系统的功能起着至关重要的作用。今天我们要深入探讨的是德州仪器(TI)的TMAG5110
    的头像 发表于 02-11 15:25 646次阅读

    XS5018C:高性能2D/3D降噪ISP-TX 2K芯片电路图资料

    HDcctv/CVBS, 支持多种制式 960H/720P/960P/1080P, ISP 最高支持 1080P@30FPS, 高性能 2D 降噪、 3D 降噪, 支持无极降帧。
    发表于 01-28 16:50 1次下载

    2D、2.5D与3D封装技术的区别与应用解析

    半导体封装技术的发展始终遵循着摩尔定律的延伸与超越。当制程工艺逼近物理极限,先进封装技术成为延续芯片性能提升的关键路径。本文将从技术原理、典型结构和应用场景三个维度,系统剖析2D、2.5D及3D封装
    的头像 发表于 01-15 07:40 1475次阅读
    <b class='flag-5'>2D</b>、2.5<b class='flag-5'>D</b>与3<b class='flag-5'>D</b>封装技术的区别与应用解析

    浅谈2D封装,2.5D封装,3D封装各有什么区别?

    集成电路封装技术从2D到3D的演进,是一场从平面铺开到垂直堆叠、从延迟到高效、从低密度到超高集成的革命。以下是这三者的详细分析:
    的头像 发表于 12-03 09:13 1573次阅读

    ICCAD 2025:Imagination展示E系列GPU创新技术与多元生态应用

    与计算领域的创新成果,特别是新一代E系列GPU的强大性能与广泛应用前景。一主题演讲:E系列GPU引领AI与图形融合新纪元在展会同期技术论坛上,Ima
    的头像 发表于 11-24 18:14 838次阅读
    ICCAD 2025:<b class='flag-5'>Imagination</b>展示E<b class='flag-5'>系列</b><b class='flag-5'>GPU</b>创新技术与多元生态应用

    【CPKCOR-RA8D1】3、2D绘图引擎(D/AVE)DRW

    一、前言 D/AVE 2D是 Renesas 微控制器中的硬件模块,主要用于2D图形加速。 硬件加速的2D图形绘制操作 支持矩形填充、线条绘制、位图传输等 比软件实现快得多的图形渲染速
    发表于 10-11 12:09

    如何使用MA35D1上的硬件2D加速功能?

    如何使用MA35D1上的硬件2D加速功能?
    发表于 09-03 07:46

    Imagination GPU 全面支持 Vulkan 1.4 和 Android 16

    Imagination最新发布的驱动(DDK25.1RTM2)支持最新版本Android操作系统,同时增强了OpenCL扩展集及Android平台上Vulkan1.4支持。Vulkan
    的头像 发表于 08-14 11:18 2564次阅读
    <b class='flag-5'>Imagination</b> <b class='flag-5'>GPU</b> 全面支持 Vulkan 1.4 和 Android 16

    2D 到 3.5D 封装演进中焊材的应用与发展

    2D 到 3.5D 封装的演进过程中,锡膏、助焊剂、银胶、烧结银等焊材不断创新和发展,以适应日益复杂的封装结构和更高的性能要求。作为焊材生产企业,紧跟封装技术发展趋势,持续投入研发,开发出更高效、更可靠、更环保的焊材产品,将是在半导体封装市场中保持竞争力的关键。
    的头像 发表于 08-11 15:45 2044次阅读
    从 <b class='flag-5'>2D</b> 到 3.5<b class='flag-5'>D</b> 封装演进中焊材的应用与发展

    TechWiz LCD 2D应用:不同结构下的VT曲线

    我们可以在TechWiz LCD 2D软件中调整电极的宽度,锥度,厚度和位置。 1. 案例结构 2. 建模过程 2.1在TechWiz LCD 2D中创建结构 2.2将com电极两个掩膜的宽度均
    发表于 06-13 08:44

    Techwiz LCD 2D应用:二维LC透镜建模分析

    Techwiz LCD 2D新的Lens掩膜结构 1. 摘要 Techwiz LCD 2D新增Lens掩膜结构,可以方便快捷的对LC 透镜进行建模分析。LC透镜由于体积小、焦距可变等优点,被认为是
    发表于 05-30 08:47