0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

针对于高端移动通信和汽车市场的四集群设计

电子设计 来源:互联网 作者:佚名 2018-04-03 09:13 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

作者:Benny Har-Even

去年Imagination推出了最新的图形架构Furian,自2012年来首次对PowerVR进行了重大更新。这意味着在满足越来越多的器件性能需求方面迈出了重要的一步,尤其对于一些新的应用场景比如AR、VR和AI,这使得PowerVR在嵌入式GPU中保持最高的功效和性能。

Furian在设计之初就考虑到了可扩展性,无论着色处理单元(SPUs)的数量如何都能确保性能和面积效率的一致性。在这篇文章中,我们将特别关注该架构的功效,以及是如何确保在每瓦特性能方面领先于其他竞争对手。

继Furian架构之后我们推出了第一个基于Furian的处理器核并且提供授权——PowerVR GT8525,现在我们又推出了PowerVR GT8540——这是一款针对于高端移动通信和汽车市场的四集群设计。

与目前高端智能手机和平板电脑上的多核设计相比, PowerVR GT8525中包含了双集群的单一着色处理单元(SPU),作为第一款用于授权的Furian架构GPU来说是一个相当合适的选择。然而它不应该被低估,这款单SPU设计的性能已证明了Furian架构对游戏的影响。

作为技术发烧友我们致力于开发领先的图形设计,Imagination的高端产品一直拥有大量粉丝。事实上我们很多人口袋中都装着性能强大的高端设备。然而这类设备在价格上无疑是昂贵的,而且越来越多的人认为对于大多数人来说成本低、价格合适、有足够功能的产品更加的适用,这在很大程度上要精确到GPU,我们推出的PowerVR GT8525正适合这样的“超级中端”市场。

对于很多人来说,一款价格合理的设备能够提供足够的性能来处理日常任务,比如网页浏览、查看社交媒体以及流畅的操作一些复杂的视觉游戏。它们甚至足以让用户体验一些新的应用,比如基于AR、VR和AI的应用。更重要的是中端市场的SoC传统上并不会采用先进的制造工艺,这将限制它们可用的功耗预算,因此采用更小型的GPU更可取。正是因为如此,这使得PowerVR GT8525的发布成为SoC供应商理想的GPU,这得益于它在性能和效率之间的理想平衡。

架构效率

然而在功效方面真正使我们能够保持领先优势是因为建立在Rogue基础上的Furian架构所带来的变化和提升。这些变化为的是优化内部效率,能够在给定的功耗要求下提供更多的性能。

PowerVR Series8XT:将功效提升到一个新的水平

更高效的SPU

其中一个变化是在着色处理单元(SPU),它被重构建以更高效的使用算数逻辑单元(ALU)。正如上图所示纹理单元已经有自己的缓存,确保在访问数据时不需要与统一着色集群(USCs)发生竞争——结果就是使用更低的功耗同时提高吞吐量效率。纹理单元目前具有双倍的填充效率,每个时钟处理8个像素单元,仅在面积上略有增加。

2D Data Master(数据管理)

另一个提升是关于2D的数据管理(2D Data Master),2D Data Master第一次引入是在Series7XT,在这个有了进一步的提升。现在它完全采用异步处理,内核利用率和功效更高。它允许独立提交2D工作任务,绕过所有Tile(贴片)的工作开销(比如调用3D来处理2D任务时),这使得像创建UIs等场合的效率大大提高——而且最重要的是这有助于降低功耗。

管道流加倍

另一个提高整体效率的主要原因是对主要ALU管道的改变(见下图)。管道数据位宽进行了加倍,从16增加到32——每个时钟的吞吐量也加倍了。但关键的是由于内部设计的精简和更多的共享控制逻辑,它并不会占用两倍的硅面积。在Rougue架构中这个管道包括两个乘加功能模块(MADs)。然而在仔细分析了开发人员编写的着色器和内核代码之后,很明显的发现这两个MADs很少被充分利用,因为对于编译器来说同时使用两个MADs是很困难的。

PowerVR Series8XT:将功效提升到一个新的水平

因此在Furian架构中我们实现了一个MAD和一个MUL,在实际情况中能够提供更多的性能,同时控制硅面积的成本在严格的范围内。在一些场景可能需要两个MAD操作,Furian采用的双倍带宽管道能够提供匹敌Rogue架构的性能(16×2 MADs = 32×1 MAD),因此在这个意义上说即使在最坏的情况下我们也并没有失去什么,大多数情况下带来的是吞吐量的显著提升。

减少延迟

变化还不止于此,现在GPU驱动程序和GPU之间的函数调用不再需要通过OS(操作系统)内核层了,采用的是“用户模式队列”直接进行通信,降低了开销和延迟,从而再次降低了功耗。

PowerVR Series8XT:将功效提升到一个新的水平

除此之外,现在GPU支持对更多本地内存地址的同步访问,这意味着每个ALU管道都可以直接访问它们所需的内存区域而不需要停机。

PowerVR Series8XT:将功效提升到一个新的水平

结论

那么这些变化的结果是什么呢?从下图中我们可以看到采用目前流行的行业标准Kishonti GFXBench Manhattan 3.0 benchmark进行测试,Series8XT GT8525比PowerVR GT7450提供更多的fps/W参数,我们上一代等效GPU与之前的15fps相比可以达到35fps(fps(每秒帧数)指的是游戏在设备上运行的流畅程度,数字越大表示终端用户的体验越好)。更小的硅片面积(如下图更小的圈所示)也是另一个优势。

PowerVR Series8XT:将功效提升到一个新的水平

PowerVR GT8525 vs GT7450 – Manhattan 3.0 FPS vs FPS/W 和面积

尽管功效是GPU的一个重要的综合测量指标,但同样重要的是绝对功耗,移动设备的SoC功耗一般被限制在3—3.5W,其中GPU占功率消耗的30%—50%。估计在35fps/W的情况下,Series8XT GT8525采用中端SoC制造工艺TSMC 10FF能够实现一个合适的功耗值,GPU的功耗控制在1.5W以下。

为了更直观的展现,针对我们上一代的Series7XT,我们期望在实现相同性能指标(iso性能)的基础上,Series8XT GT8525比Series7XT GT7450降低60%的功耗,这意味着性能功耗比将达到令人难以置信的75%!对于终端用户来说,这意味着他们的设备将能够持续使用更长的时间,尤其对于一些使用场景比如玩游戏。

当然我们业界领先的功效特性是基于我们的TBDR(分块延迟渲染)技术,我们只需要渲染屏幕上能够看到的像素,这也是Furian架构所采用的的技术。如果你想了解更多,请查看我们之前的博客文章:深入探究TBDR。

总结

正如你所看到的,Furian架构所引入的这些变化使得PowerVR Series8XT GT8525具有非常高的性价比,提高了大部分市场的器件门槛。我们已经向关键客户授权了我们的首款Series8XT内核,我们期待在2018年提供更多选择。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • gpu
    gpu
    +关注

    关注

    28

    文章

    5099

    浏览量

    134447
  • powervr
    +关注

    关注

    0

    文章

    98

    浏览量

    31503
  • imagination
    +关注

    关注

    1

    文章

    617

    浏览量

    63091
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    全球交流充电桩市场洞察与海外交流电能表推介

    中国作为全球最大的新能源汽车市场,其充电基础设施建设和市场规模,也持续领先。
    的头像 发表于 09-19 11:10 975次阅读
    全球交流充电桩<b class='flag-5'>市场</b>洞察与海外交流电能表推介

    要不要接着造电车,车企站在十字路口

    汽车市场恰如逆水行舟,不进则退
    的头像 发表于 07-24 11:39 267次阅读
    要不要接着造电车,车企站在十字路口

    比亚迪海豹05DM-i为欧洲轿车市场带来全新变革

    近日,比亚迪海豹05DM-i在波兰和斯洛伐克上市,正式来到欧洲。作为比亚迪在欧洲推出的第二款插电式混合动力汽车,海豹05DM-i精致设计、宽敞空间与领先新能源技术于一体,凭借舒适性、丰富的智能配置、超低油耗及超长续航表现,为欧洲轿车市
    的头像 发表于 06-20 15:43 724次阅读

    Arm 公司面向汽车市场的 ​Arm Zena​ 深度解读

    面向汽车市场的 ​ Arm Zena ​ 深度解读 Arm Zena 是 Arm 公司面向智能汽车领域推出的核心计算平台,属于其“平台优先”战略的关键布局。作为 Arm 计算子系统(CSS)在
    的头像 发表于 05-29 09:51 2072次阅读

    福田汽车持续领跑商用车市场

    2025年,我国经济总体保持扩张,产需两端加快释放。一系列提振汽车消费政策措施得以延续并加速落地,消费市场提质向好,消费者信心增强,商用车市场呈现回暖趋势,新能源汽车产销继续快速增长。
    的头像 发表于 04-22 11:39 659次阅读

    Arm Kleidi扩展到汽车市场 Arm Kleidi实现性能自动优化

    Arm 控股有限公司(纳斯达克股票代码:ARM,以下简称“Arm”)近日宣布将 Arm Kleidi 技术扩展到汽车市场。Arm Kleidi 是一项广泛的软件及软件社区参与计划,旨在加速人工智能
    的头像 发表于 03-14 15:36 1330次阅读

    比亚迪荣获2024年汽车市场“三冠王”

    2025年伊始,各大车企纷纷揭晓了2024年度的销量成绩单,其中比亚迪的表现尤为抢眼。作为新能源汽车行业的领军者,比亚迪再次以卓越的成绩震撼了全球汽车市场。 在2024年全年,比亚迪凭借出色的市场
    的头像 发表于 02-10 09:22 901次阅读

    2024中国新能源汽车市场十大亮点

    中国新能源汽车市场快速增长,已成为中国汽车产业发展的引擎。2024年以来,国家和地方层面相继推出了一系列政策措施,旨在加速汽车产业转型升级、鼓励消费、以旧换新,彰显了国家对新能源产业发展的坚定决心
    的头像 发表于 02-08 11:23 2930次阅读
    2024中国新能源<b class='flag-5'>汽车市场</b>十大亮点

    立讯精密重投8.8亿,加码新能源汽车市场

    被称为“果链之王”的立讯精密正加大力度开拓新能源汽车市场,连接器头部大厂的8.8亿元投注预示着什么? 近日,已成为汽车Tier1厂商的立讯精密再朝新能源汽车市场投掷两枚棋。  去年年底,立讯精密工业
    的头像 发表于 01-17 15:08 1071次阅读
    立讯精密重投8.8亿,加码新能源<b class='flag-5'>汽车市场</b>

    比亚迪日本纯电销量超丰田,市场年首降

    在2024年,比亚迪在日本纯电动汽车市场的表现尤为亮眼,其销量首次超越了长期占据主导地位的丰田汽车。这一成就标志着比亚迪在日本市场的强劲增长势头,同时也反映了全球电动汽车市场的快速变革
    的头像 发表于 01-16 15:16 739次阅读

    2024年12月乘用车市场强劲增长

    据联分会近日发布的“车市扫描”报告初步统计,2024年12月乘用车市场表现亮眼。在12月1日至31日期间,乘用车市场零售量达到了262.2万辆,与2023年12月相比增长了11%,较上月也增长了9
    的头像 发表于 01-09 16:05 1008次阅读

    AN84-线性技术杂志电路,第一卷第四集

    电子发烧友网站提供《AN84-线性技术杂志电路,第一卷第四集.pdf》资料免费下载
    发表于 01-09 14:21 0次下载
    AN84-线性技术杂志电路<b class='flag-5'>集</b>,第一卷第<b class='flag-5'>四集</b>

    英国超越德国,成2024年欧洲最大纯电动汽车市场

    近日,最新数据显示,英国在2025年迎来了纯电动汽车市场的显著增长,成功超越了德国,成为2024年欧洲最大的纯电动汽车(BEV)市场。 据统计,2025年英国共注册了近38.2万辆纯电动汽车
    的头像 发表于 01-08 14:45 1139次阅读

    2025年电动汽车市场前景乐观

    近日,根据标普全球移动(S&P Global Mobility)的最新分析,尽管当前电动汽车市场面临一些挑战,如部分车企正在调整电动汽车目标以及美国7500美元联邦税收优惠的不确定性,但2025年
    的头像 发表于 01-06 14:01 1104次阅读

    中国汽车市场份额占全球41%

    近日,乘联会秘书长崔东树发表文章指出,中国在2024年11月的全球汽车市场中占据了举足轻重的地位。数据显示,该月中国已占世界汽车份额的41%,彰显了其在全球汽车产业中的强大影响力。 具体来看
    的头像 发表于 01-02 15:09 1036次阅读