0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

突破图形和计算性能的极限!面向最新应用的旗舰型嵌入式GPU

Dbwd_Imgtec 来源:YXQ 2019-06-20 16:21 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

面向嵌入式应用的GPU的持续快速发展是不争的事实。随着PowerVR-9XE系列,PowerVR-9XMP系列,以及PowerVR-9XTP系列 GPU的推出,Imagination再次突破了图形和计算性能的极限。

这三个系列涵盖了入门级、中档和高端产品,代表了我们有史以来最好的产品线,通过优化和不断提升使得这些产品能够提供更出色的单位面积性能并保持低功耗。此外我们还推出了面向神经网络推理的PowerVR3NX加速器,还有全新的Ensigma定位IP,这也代表了我们在2019年全面的产品供应。

PowerVR Series9XEP:

满足人们应用的需求

下面我们介绍一些更有意义的内容,先从入门级产品开始:PowerVR Series9XEP系列。这款IP是基于Rogue架构,主要面向对物理尺寸和成本(二者之一或全部)敏感的应用市场,像机顶盒和低端智能手机,这类产品会优先考虑流畅的呈现复杂且高分辨率的用户界面,而不是满足3D游戏的性能需求。当然这并不是说不能够在PowerVR 9XEP系列上运行游戏。相比去年的9XE系列,9XEP通过架构的调整使整体性能提升了10%。最重要的是优化后端设计使最高时钟频率提升了额外的10%。

Series9XEP系列一个关键的提升是支持PVRIC4,即我们在今年早些时候宣布的最新的图像压缩技术。这样做的好处是可以保证系统带宽和内存占用降低50%,同时这意味着SoC设计人员可以进一步降低设计难度,并且有助于减少功耗。当然我们所有新的Series9XEP系列的GPU器件中都支持这一特性。除了PVRIC4特性外,其他的设计改进和面积优化都确保了9XEP系列维持在XE族GPU中的领先地位。

PowerVR Series9XEP将会根据SoC设计人员的需求和面积、功耗预算来提供一系列的不同配置的IP核,可选范围覆盖1-8 pixel/clk以及16-64 flop/clk。

PowerVR Series9XMP:

主导中端应用市场

同样是基于Rogue架构,PowerVR Series9XMP相比Series9XM的改进则更为显著,并且在性能密度方面特别的明显。比如一个具有双16通道的ALU和两个纹理处理单元(TPU)的部分现在可以用一个32通道的ALU和TPU来实现,从而显著降低了器件尺寸。总的来说Series9XMP在集群密度上提升了45%,采用更小的面积满足相同的性能,这在成本和功耗节省方面是非常有意义的。

图像质量也得到了很大的提升,通过增加专用的纹理缓存,获得了两倍的反向滤波性能提升。更强大的反向滤波性能意味着图像会变得更加的清晰,是游戏玩家更能够察觉到画质上的显著提升。

当然还有一些其他的改进,比如降低核心管理单元的开销和带宽,并将系统缓存的大小增加一倍,此外对于缓存、原子操作、数据控制的建立速率,计算负载和其它负载重叠方面也进行了改进,优化和加强了数据通路。

当然PVRIC4技术在这个系列中也是支持的,在配置方面Series9XMP更侧重于计算方面,在四像素/时钟的情况下能够提供128 FP32 ops/秒的操作性能。

这使它完美的适用于高性价比的中端游戏或AI设备,比如中端智能手机。

PowerVR Series9XTP

满足高端市场的顶级性能

对于高端的性能需求我们提供了PowerVR Series9XTP系列,它是基于更新型的Furian架构,相比Rogue架构有重大的改进,从而能够增强灵活性,提升性能上限,打破性能瓶颈,同时又更高的功效。大家可以访问我们关于Furian架构的博客,了解它能够给我们的影响,但是这里我想说Series9XTP在几个关键领域得到了进一步的增强。

我们快速回顾一下,Furian架构中着色器处理单元(SPU)包含两个统一的着色器集群(USC),在这些USC内部是重新设计的算术逻辑单元(ALU),这部分逻辑在GPU核心部分负责执行复杂的算术运算。与Series8XT系列一样,这个ALU单元的每条流水线可以在每个时钟内执行一个MAD和一个MUL操作,并且是首次采用32bit位宽的pipeline设计。

Series9XTP系列对两个方面进行了显著的增强,首先是可达40pipeline宽度的ALU单元,因此可以同时完成更多的工作。其次是每个SPU单元可以指定三个USC单元,具有更高的GLOPS参数。这一设计使得核心能够提供高达360 FP32 FLOPS/clock性能,并且填充率可达8PPC,完全可以满足高端市场的性能需求。两个SPU单元联合,性能可以双倍达到16PPC以及720 FP32 FLOPS/clock,从而实现一个性能非常强大但仍然是节能的核心。

Series9XTP系列进行了各方面的优化,比如缓存优化以及微架构的增强。相同面积下,PowerVR Series9XTP相比Series8XT速度提升了50%,并提供更高的FLOPS密度,和以及更好的Manhattan场景测试的表现。

PVRIC4技术带来的50%的系统带宽和内存占用的降低,为其他的优化手段创造了空间,使得PoverVR9XT系列相比于PoverVR8XT系列,可以进一步降低成本。

PowerVR Series9XTP系列继承了Series8XT系列所有的核心特性,比如支持所有最新的相关API,比如OpenGL ES 3.2和Vulkan 1.1。在Series9XEP和Series9XMP系列平台上同样支持我们开发的独特的硬件虚拟化技术,支持多个操作系统独立运行,而且保证相互间的隔离和数据安全,它们之间可以实现快速的上下文切换确保不会造成性能损失。

总结

第二代PowerVR Series9提供了一系列IP核,根据SoC设计人员的设计需求为他们提供广泛的选择。在给定的面积和功耗范围内能够实现填充率和浮点运算性能的完美平衡,无论是一款经济实惠的智能手机,还是可装入口袋的移动穿戴设备,或是车载娱乐系统,PowerVR-9系列GPU都可以覆盖您的设计需求。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 嵌入式
    +关注

    关注

    5209

    文章

    20656

    浏览量

    337028
  • gpu
    gpu
    +关注

    关注

    28

    文章

    5271

    浏览量

    136069

原文标题:面向最新应用的旗舰型嵌入式GPU

文章出处:【微信号:Imgtec,微信公众号:Imagination Tech】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    嵌入式人工智能课程(华清远见)

    嵌入式 AI 编译器优化:华清远见课程,解锁极致端侧性能 随着人工智能从云端全面向边缘侧和终端侧下沉,“万物智联”的时代已经悄然到来。然而,在这股浪潮背后,隐藏着一个巨大的技术鸿沟:在算力受限
    发表于 04-16 18:47

    成功案例:象帝先计算技术与Imagination合作——面向现代图形计算工作负载的专业GPU

    为专业计算设计桌面GPU桌面GPU不仅用于游戏,还能加速从专业可视化、高级模拟到数据密集计算在内的多种现代工作负载。专业用户需要能在多种应
    的头像 发表于 03-09 09:17 451次阅读
    成功案例:象帝先<b class='flag-5'>计算</b>技术与Imagination合作——<b class='flag-5'>面向</b>现代<b class='flag-5'>图形</b>与<b class='flag-5'>计算</b>工作负载的专业<b class='flag-5'>GPU</b>

    虹科 owa5X 无线嵌入式计算机 工业级边缘计算终端与车载网关优选

    从工业级边缘计算终端到车载高性能边缘计算网关,从工业级嵌入式计算机到边缘智能解决方案,虹科 owa5X 无线嵌入式计算机以高
    的头像 发表于 02-10 17:08 243次阅读
    虹科 owa5X 无线<b class='flag-5'>嵌入式计算</b>机 工业级边缘<b class='flag-5'>计算</b>终端与车载网关优选

    AMD锐龙AI嵌入式P100系列处理器产品简介

    AMD 锐龙 AI 嵌入式 P100 系列处理器代表了 AMD 在车规级(通过 AECQ 100 认证)和工业级(宽温)嵌入式处理器领域的下一阶段演进。该系列产品面向需要高性能、确定性
    的头像 发表于 01-23 09:19 2524次阅读
    AMD锐龙AI<b class='flag-5'>嵌入式</b>P100系列处理器产品简介

    Amphenol Rugged SOM:超紧凑嵌入式计算机模块的卓越之选

    Amphenol Rugged SOM:超紧凑嵌入式计算机模块的卓越之选 在嵌入式计算机模块领域,Amphenol Rugged SOM 以其独特的设计和强大的功能脱颖而出。今天,我们就来详细
    的头像 发表于 12-10 14:15 491次阅读

    一个面向单片机、事件驱动的嵌入式开发平台介绍

    EventOS,是一个面向单片机、事件驱动的嵌入式开发平台。它主要有两大技术特色:一是事件驱动,二是超轻量。EventOS以及其母项目EventOS,目标是开发一个企业级的嵌入式开发平台,以事件总线
    发表于 12-05 06:26

    瑞萨电子携手LVGL PRO推进嵌入式图形用户界面开发

    随着嵌入式设备对用户体验要求的不断提升,图形用户界面(GUI)成为产品开发越来越重要的一环。作为目前最流行的开源嵌入式图形库之一的LVGL,最近就推出了自己的商业化专业UI编辑器LVG
    的头像 发表于 11-21 10:23 1848次阅读
    瑞萨电子携手LVGL PRO推进<b class='flag-5'>嵌入式</b><b class='flag-5'>图形</b>用户界面开发

    嵌入式和FPGA的区别

    嵌入式系统与FPGA的核心差异:软件定义功能VS硬件可重构。嵌入式适合通用计算,开发门槛低;FPGA凭借并行处理实现纳秒级响应,但成本高、开发难。二者融合的SoC器件正成为未来趋势,平衡性能
    发表于 11-19 06:55

    飞凌嵌入式FCU3501嵌入式控制单元:工业级边缘AI计算的“硬核担当”

    边缘计算设备的性能与稳定提出了更加严苛的要求。飞凌嵌入式推出的FCU3501嵌入式控制单元,正是为这类场景量身打造的“工业级AI计算引擎”。
    的头像 发表于 09-19 08:03 7531次阅读
    飞凌<b class='flag-5'>嵌入式</b>FCU3501<b class='flag-5'>嵌入式</b>控制单元:工业级边缘AI<b class='flag-5'>计算</b>的“硬核担当”

    AMD 2025.1版嵌入式软件和工具的新增功能

    AMD 2025.1 版嵌入式软件和工具是面向新一代嵌入式系统开发而打造的综合平台,全面加速概念构想到部署落地。
    的头像 发表于 08-15 15:32 1438次阅读

    盘点嵌入式就业所需要的技能有哪些?

    基础,能够进行高性能计算和数据处理。 - 了解自动驾驶技术的基本原理,如传感器融合、路径规划等。 - 具备良好的沟通能力和团队合作精神,能够与不同领域的工程师协作。 2.智能手机行业: - 熟悉嵌入式编程
    发表于 08-11 15:43

    性能国产嵌入式芯片的典范

    中高端市场的SoC,凭借出色的计算性能、低功耗设计及丰富的外设接口,成为国产嵌入式芯片的典型代表。   一、RK3506核心架构与性能优势       RK3506基于ARM Cort
    的头像 发表于 07-08 16:36 1343次阅读

    聚徽智控——从嵌入式到边缘计算:平板工控电脑的技术进化论

    演进、场景变革与生态重构三个维度,解析平板工控电脑的技术进化路径。 一、技术演进:从嵌入式到边缘计算的范式突破 1. 嵌入式时代:功能单一化与硬件固化 早期的平板工控电脑以
    的头像 发表于 06-13 13:48 1013次阅读

    ARM Mali GPU 深度解读

    ARM Mali GPU 深度解读 ARM Mali 是 Arm 公司面向移动设备、嵌入式系统和基础设施市场设计的图形处理器(GPU)IP
    的头像 发表于 05-29 10:12 4918次阅读