0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

详解3NX-NNA,升级5大核心带来哪些改变?

cMdW_icsmart 来源:lq 2018-12-22 16:15 次阅读

总结一下,此次发布会Imagination发布了针对AI和视觉的神经网络硬件加速器PowerVR 3NX NNA;同时还发布了三款新品GPU,分别是PowerVR 9XEP、9XMP、9XTP,基本上从低端到高端应用需求全覆盖。

详解3NX-NNA,升级5大核心带来哪些改变?

2018年可以说是AI芯片的爆发之年,以手机市场为例,芯片厂商对于AI能力的宣传力度已经逐渐超过了传统的CPU和GPU性能。不少业内专家认为,在手机性能过剩的当下,未来手机芯片的竞争焦点将是AI功能。

目前包括高通、华为、联发科、紫光展锐在内的手机芯片公司纷纷押宝AI功能,并在手机SOC中加入神经网络计算的硬件加速器。业界最大的两大知识产权(IP)供应商ARM和Imagination自然也不会缺席。

ARM此前就发布了其第一代机器学习处理器架构“Trillium”,将DeePhi神经网络压缩技术、FPGA的可编程性,以及DSP的低功耗处理能力聚合在一起。

而Imagination则在2017年就发布了全球第一款神经网络加速器PowerVR®2NX NNA(简称2NX),这是一个专门做人工智能硬件加速的IP。作为独立的神经网络加速器,2NX不需要跟CPU、GPU绑定,既可以辅助加速,也可以独立存在。

Imagination产品部资深总监Neal Forse透露,去年2NX发布后在业界反映非常好,目前已经有两家中国手机厂商签约采用这款IP。

从左到右依次为:

Kristof Beets, Imagination Technologies PowerVR产品管理和技术营销高级总监

Neal Forse,Imagination Technologies视觉和人工智能产品管理高级总监

David McBrien,Imagination Technologies销售和市场营销执行副总裁

刘国军(James Liu), Imagination Technologies副总裁兼中国区总经理

Graham Deacon,Imagination Technologies PowerVR图形处理商务运营副总裁

2018年12月4日,Imagination在深圳举行了一年一度的技术交流会。在此次交流会上,Imagination推出了几款具有新特性的IP,其中就包括基于2NX基础升级的PowerVR®3NX NNA(简称3NX)。以及三款新的GPU系列,包括PowerVR®9XEP、9XMP、9XTP。

据介绍,3NX主要针对四大应用市场,包括移动计算(手机、平板),智能安防,消费电子,汽车自动驾驶。其中自动驾驶将是3NX接下来发展的重点市场。

3NXAX3595的多核演进图

相比2NX,3NX有哪些性能上的提升呢?笔者总结了几点:

第一,IP核心数增加。相比2NX的AX2145和AX2185,3NX增加到了5个核,这带来了强大的性能提升。

这5个核心包括AX3145、AX3385、AX3365、AX3595以及一个低端核。其中AX3145的单核算力达到1.2TOPS,AX3385为5 TOPS,AX3365为2.4 TOPS,AX3595为10 TOPS,最低端核为0.6TOPS。

3NX在PPA上的提升

如同CPU、GPU的多核方式,3NX支持多核方式,多核方式带来的好处非常多。首先是性能上,通过多核方式,3NX最高可达到160TOPS的算力,如此高的算力将在汽车等高端应用上产生作用。

“和上一代相比,性能提升了70%,效率提升了40%。功耗降低了40%,带宽降低了35%。”Imagination Technologies视觉和人工智能产品管理高级总监Neal Forse表示,之所以能做到这一点,主要是因为采用了新的无损压缩算法

3NX-F 可编程的扩展性

3NX系列另外一个关键特性是可编程的拓展性,因此这里叫3NX-F,F代表灵活性。通过增加可编程的扩展性来优化硬件,这样做的目的是让客户实现差异化设计。比如可以让客户不断加入新的技术,如神经网络等,还可以构建一个Open CL的内核。

除了高性能之外,也别忘记了3NX还有一颗低端的0.6TOPS核,这颗核心使得3NX可以实现低功耗的物联网应用。对于一些对功耗和成本比较低的应用,如简单的人脸识别等。还有一些你可能想不到的应用,比如在国外有用3NX来检测街上的流浪汉,避免在冬天这些人被冻死。Neal Forse表示,对于帧率要求较低的IOT市场,以及低功耗、广域网的应用,功耗可以做到非常低,可以实现毫瓦级别的功耗。

作为独立的神经网络加速器,NNA也常被人拿来和寒武纪、地平线等提供XPU的算法公司进行比较。Neal Forse对此没有正面回应,只是表示“我们喜欢这样的竞争”。他同时认为,每家AI厂商的起点都不一样,竞争对手可能用可编程的架构、DSP做神经网络的方案,再加上指令集。而imagination的做法是通过计算优化的方案,看如何通过最优的计算引擎来把神经网络映射到硬件上。“我们的优化是来自线下的编译,而不是在线的执行。”

9X EP、9XMP、9XTP,不管玩什么游戏,总有一款GPU适合你

PowerVR®9XE9XM 9XT

前面说了这么多关于人工智能的新IP介绍,但不管怎么说Imagination毕竟以前专门给苹果提供GPU,GPU还是其主打的拳头产品。Imagination的GPU产品线包括PowerVR®XM、XE和XT系列,相比其他竞争对手,PowerVR®系列最大的优势是性能高、功耗低。

PowerVR®9XE9XM 9XT主要特性

2017年,Imagination推出了两款PowerVR®GPU产品Series 9XM与9XE,为价格低廉的产品也带来了绝佳的图像体验。此次新品发布会上,Imagination PowerVR®业务部副总裁 Graham Deacon介绍了三款新IP,包括PowerVR®9XEP、9XMP、9XTP,分别对应不同市场。

9XEP主要关注在低端手机以及数字电视市场,为硬件设备上的GUI以及HMI提供最佳体验,包括休闲游戏等应用。其特点是可在最小面积上提供最高的填充率。9XEP可以达到每个时钟1-8个像素填充率, 每个时钟16-64个FP32 OPS。

采用前代PowerVR®技术的数码相框产品

这个行业更看重用户界面而非游戏性能,要求更高的分辨率。另外数字电视也越来越多采用神经网络来进行语音识别、面部识别、安全特性等应用。机顶盒市场比较看重成本,预计整机价格在40~50美金左右,对于SOC的成本要求很高。

采用前代PowerVR®技术的车载中控产品

此外,9XEP还可以广泛应用于车载中控系统。现在高端汽车可能有5~6个显示屏,除了车载显示屏,在抬头显示、电子后视镜等领域都将开始采用显示屏。

采用前代PowerVR®技术的面部识别demo

以汽车中常见的应用为例,比如“车道偏离警示”大概需要10个GFLOPs,低性能GPU可以支持这样的性能要求;但是“行人预测”就需要很宽的性能要求,至少需要100个GFLOPS,这些都对GPU提出了更高要求。

▲图为采用9XMP与三星S9+以及华为Mate10 Pro游戏画面的对比,可以看到细节和对比度的差异

9XMP主要是关注游戏以及中端手机市场。其特性是在最低的面积有最好的计算能力,同时还保证成本。主要是关注游戏的性能密度和加了相关的特殊特性,它的处理数量是每时钟4-8个像素,128-256 FP32 Ops。和上一代相比,9XMP在性能密度方面提升了45%,通过增加性能密度的方式改善游戏性能,同时加入专用的纹理缓存以及视觉无损压缩技术(PowerVR®PVRIC4),确保带宽降低50%。

▲图为9XEP、9XMP、9XTP的画面细节对比

▲PowerVR®PVRIC4第四代视觉无损压缩技术

9XTP可以说是这次发布的旗舰型产品,主要关注最高端的游戏体验。9XTP每时钟可以超过192FP32 Ops,架构可扩展,可以在最低的面积实现更好的算力。

9XTP聚焦于高功效和高性能,有50%配置方面的改进。9XTP同时采用PVRIC4的压缩技术,可实现视觉无损压缩,可以保证内存的带宽降低50%。

9XEP和9XMP IP Core主要采用PowerVR®Rogue架构,这个架构在2010年推出,已经非常成熟和成功。

GPU需求和市场趋势

Imagination PowerVR®业务部副总裁 Graham Deacon认为,除了高端的GPU,其实客户对于低成本的嵌入式GPU需求量也很大。需要更高的性能和特性,但是要求系统成本更低,因此必须提供高密度、低带宽、低功耗、低SOC芯片面积的产品。Imagination的一大优势是可根据客户需求来定制GPU,同时提供更好的灵活性、可扩展性等差异化因素。

AI没想象中强大,GPU+AI更适合提升系统能力

值得一提的是,对于AI硬件加速器的需求增加,是否会对GPU的需求降低呢?Imagination如何在两种IP之间取得平衡?

对于这个话题,Neal Forse认为这两者是互补的,这也是为什么Imagination在发布GPU的同时也发布NNA。

比如一些低端的产品可能只需要通过GPU来进行一部分AI的计算,而一些高端的产品则采用专门的硬件加速器来做处理。

Neal Forse表示,在发展AI运算的过程中,异构性一直是Imagination拥抱的策略。他认为目前深度学习算法存在很大问题,只是做简单的感测识别,无法进行进一步的推理。未来神经网络的性能评价标准将不一定是计算效率的提升,而是机器学习效率的提升。

此外,传感器融合也是未来人工智能的一个发展方向。未来可能每个传感器都会对应一个NNA的引擎,再加上AI数据分析。这样可以大大降低终端的数据处理压力,进一步提升计算结果。

人工智能的未来将如何发展?其实从目前来看业界对于人工智能的关注度过高,但其实AI并没有预想中的那么强大。真正的强人工智能——机器拥有意识,并能够基于认知推理作出决策其实现在业界根本还没摸到边,并且未来技术发展有赖于5G通信技术的普及。

那么现在的弱人工智能,其实最大的用处是进一步用来增强系统的能力,而非将其作为有一个核心卖点。在现有的芯片封装密度下如何让其获得机器学习的能力?Imagination给出的方案显得比较靠谱,那就是同时提供高性能的GPU和神经网络加速器。

通过GPU来处理AI应用中的可视化操作,比如图像识别和排序、手势识别驱动接口以及实时视频分析等。而神经网络加速器NNA则用来为高级推理和边缘数据处理提供硬件加速。如此一来,客户可以根据自己的需求各取所需。

汽车行业“老司机”,Imagination能否对标Nvidia?

总结一下,此次发布会Imagination发布了针对AI和视觉的神经网络硬件加速器PowerVR 3NX NNA;同时还发布了三款新品GPU,分别是PowerVR 9XEP、9XMP、9XTP,基本上从低端到高端应用需求全覆盖。

另外,作为苹果曾经的GPU供应商,Imagination在手机移动领域的市场地位非常高,目前采用Imagination相关IP的手机客户每年发布上亿颗芯片,可以说与ARM和高通三分天下。

不过随着手机市场近些年的下滑趋势,Imagination也在积极开拓新的市场,比如汽车市场。

Imagination Technologies销售和市场营销执行副总裁David McBrien表示,Imagination多年来一直在为汽车行业提供各种IP模块,其实Imagination和TI瑞萨等合作伙伴在汽车仪表盘领域已经占据50%的市场份额。

2018年PowerVR®的汽车硬件产品之一是PowerVR®8XT-A GPU,它支持SoC设计人员所需的增强恢复和可靠性功能,以获得针对数字人机界面(HMI)和自动驾驶汽车的处理器的汽车安全认证(AVS)。Imagination打算通过量身定制的解决方案继续扩展其PowerVR®汽车硬件IP产品组合,除了明年会推出另一款汽车级GPU IP之外,还将提供支持ASIL的NNA,而这又可以与PowerVR®8XT-A GPU和其他处理模块混合搭配。

除此之外,Imagination还宣布推出PowerVR®Automotive完整产品套装,以促进汽车半导体行业的增长和加速。PowerVR®Automotive结合了硬件知识产权(IP)、软件、工具、文档和长期支持五大基本要素,随着汽车行业迈向全自动驾驶,其可支持市场中的现有客户和新进入者以满足行业的安全标准和性能要求。

很明显,Imagination未来在汽车领域对标的是Nvidia,其未来目标是将GPU和NNA放入更多tear 1的汽车供应商采购列表中。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • cpu
    cpu
    +关注

    关注

    68

    文章

    10451

    浏览量

    206582
  • 神经网络
    +关注

    关注

    42

    文章

    4575

    浏览量

    98775
  • 机器学习
    +关注

    关注

    66

    文章

    8134

    浏览量

    130580

原文标题:弱AI时代,为什么Imagination的“GPU+NNA”方案更靠谱?

文章出处:【微信号:icsmart,微信公众号:芯智讯】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    NX6411GH 数据表

    NX6411GH 数据表
    发表于 11-07 18:30 0次下载
    <b class='flag-5'>NX</b>6411GH  数据表

    【新品】紫光同创FPGA核心板PG2L50H|盘古50Pro核心板,器件全面升级,高性能FPGA核心板,应用场景丰富

    。 盘古50pro核心板背面,共有4个80pin高速扩展口J2/J3/J4/J5,pin间距0.5mm,FPGA的IO通过3个扩展口、与底板连接实现高速数据通信 *
    发表于 09-22 14:35

    STM32WB产品详解及FUS无线协议栈升级

    STM32WB产品详解及FUS无线协议栈升级2.4GHz无线双核STM32WB, 采用SoC单芯片设计,支持多协议射频。
    发表于 09-06 06:35

    iPhone 15何时会发布?又会带来哪些改变升级呢?

    随着苹果秋季发布会的临近,重头戏依旧是在iPhone上,那么本次的iPhone 15何时会发布?又会带来哪些改变升级呢?
    的头像 发表于 09-05 15:20 834次阅读

    核心升级后语音时延的问题处理

    某运营商核心升级后,通过大数据显示语音接通时延略有提升。
    的头像 发表于 08-29 10:47 450次阅读
    <b class='flag-5'>核心</b>网<b class='flag-5'>升级</b>后语音时延的问题处理

    NX6511GH 数据表

    NX6511GH 数据表
    发表于 08-02 18:31 1次下载
    <b class='flag-5'>NX</b>6511GH 数据表

    NX8571 系列 DS

    NX8571 系列 DS
    发表于 06-28 20:40 0次下载
    <b class='flag-5'>NX</b>8571 系列 DS

    NX8570 系列 DS

    NX8570 系列 DS
    发表于 06-28 20:40 0次下载
    <b class='flag-5'>NX</b>8570 系列 DS

    NX6508 系列DS

    NX6508 系列DS
    发表于 06-27 20:58 0次下载
    <b class='flag-5'>NX</b>6508 系列DS

    欧姆龙NX结构体应用方法

    欧姆龙NX结构体应用方法
    的头像 发表于 06-15 10:23 820次阅读
    欧姆龙<b class='flag-5'>NX</b>结构体应用方法

    NX8571 系列 DS

    NX8571 系列 DS
    发表于 05-11 20:16 0次下载
    <b class='flag-5'>NX</b>8571 系列 DS

    NX8570 系列 DS

    NX8570 系列 DS
    发表于 05-11 20:16 0次下载
    <b class='flag-5'>NX</b>8570 系列 DS

    NX6508 系列DS

    NX6508 系列DS
    发表于 05-09 19:36 0次下载
    <b class='flag-5'>NX</b>6508 系列DS

    NX5L2750CGU切换的时候5脚3.3v时3脚会有波形是怎么回事?

    NX5L2750CGU 切换的时候5脚3.3v时个别3脚会有波形,正常3脚不会有这种情况。图片黄线5脚3.3v,绿线是
    发表于 05-06 08:07

    NX3DV642GU芯片是否为单端信号布局?

    对于 NX3DV642GU,芯片是否为单端信号布局?即是否可以将此组件用于单端应用程序?
    发表于 05-04 06:17