0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

突破图形和计算性能的极限!面向最新应用的旗舰型嵌入式GPU

Dbwd_Imgtec 来源:YXQ 2019-06-20 16:21 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

面向嵌入式应用的GPU的持续快速发展是不争的事实。随着PowerVR-9XE系列,PowerVR-9XMP系列,以及PowerVR-9XTP系列 GPU的推出,Imagination再次突破了图形和计算性能的极限。

这三个系列涵盖了入门级、中档和高端产品,代表了我们有史以来最好的产品线,通过优化和不断提升使得这些产品能够提供更出色的单位面积性能并保持低功耗。此外我们还推出了面向神经网络推理的PowerVR3NX加速器,还有全新的Ensigma定位IP,这也代表了我们在2019年全面的产品供应。

PowerVR Series9XEP:

满足人们应用的需求

下面我们介绍一些更有意义的内容,先从入门级产品开始:PowerVR Series9XEP系列。这款IP是基于Rogue架构,主要面向对物理尺寸和成本(二者之一或全部)敏感的应用市场,像机顶盒和低端智能手机,这类产品会优先考虑流畅的呈现复杂且高分辨率的用户界面,而不是满足3D游戏的性能需求。当然这并不是说不能够在PowerVR 9XEP系列上运行游戏。相比去年的9XE系列,9XEP通过架构的调整使整体性能提升了10%。最重要的是优化后端设计使最高时钟频率提升了额外的10%。

Series9XEP系列一个关键的提升是支持PVRIC4,即我们在今年早些时候宣布的最新的图像压缩技术。这样做的好处是可以保证系统带宽和内存占用降低50%,同时这意味着SoC设计人员可以进一步降低设计难度,并且有助于减少功耗。当然我们所有新的Series9XEP系列的GPU器件中都支持这一特性。除了PVRIC4特性外,其他的设计改进和面积优化都确保了9XEP系列维持在XE族GPU中的领先地位。

PowerVR Series9XEP将会根据SoC设计人员的需求和面积、功耗预算来提供一系列的不同配置的IP核,可选范围覆盖1-8 pixel/clk以及16-64 flop/clk。

PowerVR Series9XMP:

主导中端应用市场

同样是基于Rogue架构,PowerVR Series9XMP相比Series9XM的改进则更为显著,并且在性能密度方面特别的明显。比如一个具有双16通道的ALU和两个纹理处理单元(TPU)的部分现在可以用一个32通道的ALU和TPU来实现,从而显著降低了器件尺寸。总的来说Series9XMP在集群密度上提升了45%,采用更小的面积满足相同的性能,这在成本和功耗节省方面是非常有意义的。

图像质量也得到了很大的提升,通过增加专用的纹理缓存,获得了两倍的反向滤波性能提升。更强大的反向滤波性能意味着图像会变得更加的清晰,是游戏玩家更能够察觉到画质上的显著提升。

当然还有一些其他的改进,比如降低核心管理单元的开销和带宽,并将系统缓存的大小增加一倍,此外对于缓存、原子操作、数据控制的建立速率,计算负载和其它负载重叠方面也进行了改进,优化和加强了数据通路。

当然PVRIC4技术在这个系列中也是支持的,在配置方面Series9XMP更侧重于计算方面,在四像素/时钟的情况下能够提供128 FP32 ops/秒的操作性能。

这使它完美的适用于高性价比的中端游戏或AI设备,比如中端智能手机。

PowerVR Series9XTP

满足高端市场的顶级性能

对于高端的性能需求我们提供了PowerVR Series9XTP系列,它是基于更新型的Furian架构,相比Rogue架构有重大的改进,从而能够增强灵活性,提升性能上限,打破性能瓶颈,同时又更高的功效。大家可以访问我们关于Furian架构的博客,了解它能够给我们的影响,但是这里我想说Series9XTP在几个关键领域得到了进一步的增强。

我们快速回顾一下,Furian架构中着色器处理单元(SPU)包含两个统一的着色器集群(USC),在这些USC内部是重新设计的算术逻辑单元(ALU),这部分逻辑在GPU核心部分负责执行复杂的算术运算。与Series8XT系列一样,这个ALU单元的每条流水线可以在每个时钟内执行一个MAD和一个MUL操作,并且是首次采用32bit位宽的pipeline设计。

Series9XTP系列对两个方面进行了显著的增强,首先是可达40pipeline宽度的ALU单元,因此可以同时完成更多的工作。其次是每个SPU单元可以指定三个USC单元,具有更高的GLOPS参数。这一设计使得核心能够提供高达360 FP32 FLOPS/clock性能,并且填充率可达8PPC,完全可以满足高端市场的性能需求。两个SPU单元联合,性能可以双倍达到16PPC以及720 FP32 FLOPS/clock,从而实现一个性能非常强大但仍然是节能的核心。

Series9XTP系列进行了各方面的优化,比如缓存优化以及微架构的增强。相同面积下,PowerVR Series9XTP相比Series8XT速度提升了50%,并提供更高的FLOPS密度,和以及更好的Manhattan场景测试的表现。

PVRIC4技术带来的50%的系统带宽和内存占用的降低,为其他的优化手段创造了空间,使得PoverVR9XT系列相比于PoverVR8XT系列,可以进一步降低成本。

PowerVR Series9XTP系列继承了Series8XT系列所有的核心特性,比如支持所有最新的相关API,比如OpenGL ES 3.2和Vulkan 1.1。在Series9XEP和Series9XMP系列平台上同样支持我们开发的独特的硬件虚拟化技术,支持多个操作系统独立运行,而且保证相互间的隔离和数据安全,它们之间可以实现快速的上下文切换确保不会造成性能损失。

总结

第二代PowerVR Series9提供了一系列IP核,根据SoC设计人员的设计需求为他们提供广泛的选择。在给定的面积和功耗范围内能够实现填充率和浮点运算性能的完美平衡,无论是一款经济实惠的智能手机,还是可装入口袋的移动穿戴设备,或是车载娱乐系统,PowerVR-9系列GPU都可以覆盖您的设计需求。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 嵌入式
    +关注

    关注

    5186

    文章

    20145

    浏览量

    328763
  • gpu
    gpu
    +关注

    关注

    28

    文章

    5099

    浏览量

    134447

原文标题:面向最新应用的旗舰型嵌入式GPU

文章出处:【微信号:Imgtec,微信公众号:Imagination Tech】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    一个面向单片机、事件驱动的嵌入式开发平台介绍

    EventOS,是一个面向单片机、事件驱动的嵌入式开发平台。它主要有两大技术特色:一是事件驱动,二是超轻量。EventOS以及其母项目EventOS,目标是开发一个企业级的嵌入式开发平台,以事件总线
    发表于 12-05 06:26

    瑞萨电子携手LVGL PRO推进嵌入式图形用户界面开发

    随着嵌入式设备对用户体验要求的不断提升,图形用户界面(GUI)成为产品开发越来越重要的一环。作为目前最流行的开源嵌入式图形库之一的LVGL,最近就推出了自己的商业化专业UI编辑器LVG
    的头像 发表于 11-21 10:23 938次阅读
    瑞萨电子携手LVGL PRO推进<b class='flag-5'>嵌入式</b><b class='flag-5'>图形</b>用户界面开发

    嵌入式和FPGA的区别

    嵌入式系统与FPGA的核心差异:软件定义功能VS硬件可重构。嵌入式适合通用计算,开发门槛低;FPGA凭借并行处理实现纳秒级响应,但成本高、开发难。二者融合的SoC器件正成为未来趋势,平衡性能
    发表于 11-19 06:55

    AMD 2025.1版嵌入式软件和工具的新增功能

    AMD 2025.1 版嵌入式软件和工具是面向新一代嵌入式系统开发而打造的综合平台,全面加速概念构想到部署落地。
    的头像 发表于 08-15 15:32 1030次阅读

    盘点嵌入式就业所需要的技能有哪些?

    基础,能够进行高性能计算和数据处理。 - 了解自动驾驶技术的基本原理,如传感器融合、路径规划等。 - 具备良好的沟通能力和团队合作精神,能够与不同领域的工程师协作。 2.智能手机行业: - 熟悉嵌入式编程
    发表于 08-11 15:43

    性能国产嵌入式芯片的典范

    中高端市场的SoC,凭借出色的计算性能、低功耗设计及丰富的外设接口,成为国产嵌入式芯片的典型代表。   一、RK3506核心架构与性能优势       RK3506基于ARM Cort
    的头像 发表于 07-08 16:36 720次阅读

    聚徽智控——从嵌入式到边缘计算:平板工控电脑的技术进化论

    演进、场景变革与生态重构三个维度,解析平板工控电脑的技术进化路径。 一、技术演进:从嵌入式到边缘计算的范式突破 1. 嵌入式时代:功能单一化与硬件固化 早期的平板工控电脑以
    的头像 发表于 06-13 13:48 597次阅读

    ARM Mali GPU 深度解读

    ARM Mali GPU 深度解读 ARM Mali 是 Arm 公司面向移动设备、嵌入式系统和基础设施市场设计的图形处理器(GPU)IP
    的头像 发表于 05-29 10:12 2983次阅读

    Neousys宸曜发布支持酷睿200S的强固无风扇嵌入式计算平台

    强固嵌入式计算平台厂商Neousys宸曜科技发布了新的无风扇嵌入式计算平台Nuvo-11000系列。Nuvo-11000系列搭载了新的英特
    的头像 发表于 04-23 16:52 641次阅读
    Neousys宸曜发布支持酷睿200S的强固<b class='flag-5'>型</b>无风扇<b class='flag-5'>嵌入式</b><b class='flag-5'>计算</b>平台

    嵌入式主板的概述与发展

    未来发展趋势进行深入探讨。嵌入式主板的基本概念嵌入式主板是指为嵌入式系统设计的电路板,它通常集成了微处理器、内存、输入输出接口等关键组件。与一般的计算机主板相比,嵌
    的头像 发表于 01-13 16:30 1184次阅读
    <b class='flag-5'>嵌入式</b>主板的概述与发展

    新手怎么学嵌入式?

    基本的概念。嵌入式系统是一种将计算机技术嵌入到特定设备中的系统,它通常具有特定的功能和有限的资源。你需要学习一些计算机基础知识,如数据结构、操作系统、
    发表于 12-12 10:51

    芯原股份与LVGL达成战略合作,共推嵌入式图形处理能力

    近日,芯原股份宣布与嵌入式系统领域知名的开源图形库LVGL达成战略合作。此次合作的核心在于,芯原将在LVGL库中支持其低功耗3D和VGLite 2.5D GPU技术,为广泛的嵌入式应用
    的头像 发表于 12-11 14:29 1194次阅读

    什么是嵌入式人工智能

    嵌入式人工智能是指将人工智能技术应用于嵌入式系统中的一种技术。嵌入式系统是嵌入到其他设备或系统中的计算机系统,通常用于控制、监测或执行特定任
    的头像 发表于 12-11 09:23 1519次阅读
    什么是<b class='flag-5'>嵌入式</b>人工智能

    Neousys宸曜发布Alder Lake N紧凑可扩展嵌入式计算平台

    强固嵌入式计算平台厂商Neousys宸曜科技发布了一款紧凑可扩展嵌入式计算平台Nuvo-28
    的头像 发表于 12-10 14:54 775次阅读
    Neousys宸曜发布Alder Lake N紧凑<b class='flag-5'>型</b>可扩展<b class='flag-5'>嵌入式</b><b class='flag-5'>计算</b>平台