0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

揭秘Arm人工智能战略:不仅CPU/GPU会支持,还有独立的AI产品线

cMdW_icsmart 来源:未知 作者:邓佳佳 2018-03-22 16:05 次阅读

随着智能手机需要处理的内容变得日益复杂,用户对当今主流和入门级移动设备的要求已越来越高。而人工智能技术的日益成熟,以及边缘计算的兴起,使得人工智能成为了提升智能手机体验的重要法宝。目前众多的高端智能手机都已经开始引入人工智能技术。去年,华为、苹果等厂商都推出了集成人工智能核心的手机处理器,而作为全球最大的移动芯片IP提供商,Arm自去年以来也在不断的加码人工智能。

日前,Arm正式发布了全新的DynamIQ技术,加入了针对人工智能的指令集和优化库,ARMV8.2版本的指令集开始支持神经网路卷积运算,极大的提升人工智能和机器学习的效率。随后在去年5月底,Arm发布了首款DynamIQ技术处理器Cortex-A75/A55。今年2月下旬,Arm又宣布了针对人工智能的ProjectTrillium项目,推出了多款独立的人工智能IP。

Arm在北京召开2018全球技术发布会,再次详细介绍了ProjectTrillium项目,同时Arm还正式发布了全新的面向主流市场的图形处理器Mali-G52,以及面向入门级的Mali-G31。特别值得一提的是,Mali-G52还首次加入了对于机器学习的支持,进一步加码人工智能。而且新的IP套件可与现有基于DynamIQ的CPU和其他Arm IP无缝集成。

ProjectTrillium:全新人工智能IP

ProjectTrillium是今年2月Arm公布的针对人工智能的Arm IP 套件。包括了全新的机器学习处理器IP、目标检测处理器IP和神经网络软件库。

得益于终端侧人工智能市场的快速增长,以及ARM在移动及物联网市场的巨大优势,ProjectTrillium项目目前主要针对的也是移动终端和物联网设备。

1、全新架构的机器学习处理器IP

根据Arm及研究机构的预计,到 2028 年,移动设备的数量将从现在的17亿台增长到 22 亿台,智能IP Camera将由现在的1.6亿台增长到13亿台。在终端侧具有人工智能的设备将会由现在的3亿台增长到32亿台。足见人工智能市场增长之迅速。而Arm的机器学习处理器IP的推出则是顺应了市场对于专用的人工智能加速芯片的需求。

据介绍,Arm的机器学习处理器IP依托于Arm多年的研究成果,采用的是全新的架构,可以为其CPU和GPU遇到的挑战提供解决方案。该架构还为16位整数运算进行了优化。

根据Arm公布的数据显示,其机器学习处理器IP的性能最高可以达到每平方毫米(芯片面积)超过4.6 TOPs的性能,而且在实际应用中,结合系统及应用优化,可以实现2-4倍提升。

那么Arm的机器学习处理器的4.6 TOPs/平方毫米的性能属于一个什么水平呢?我们拿华为麒麟970所集成的NPU来比较一下。

据华为介绍,麒麟970集成的NPU专用硬件处理单元,设计了HiAI移动计算架构,其AI性能密度大幅优于CPU和GPU。相较于四个Cortex-A73核心,处理相同AI任务,新的异构计算架构拥有约50倍能效,以及25倍性能优势,面积只有CPU的1/2,运算能力达到了1.92TOPs。

根据Arm的资料显示,Cortex-A73是采用ARMv8-A架构中核心最小的处理器,每核心面积在0.65平方毫米。四个Cortex-A73核心,面积至少应该是2.6平方毫米。那么华为麒麟970的NPU的面积应该是在1.3平方毫米左右。换算下来,麒麟970的NPU每平方毫米的性能约为1.48 TOPs。也就是说,Arm新推出的机器学习处理器IP的单位面积性能可能达到麒麟970的NPU的4倍,确实非常的强悍。

另外,对于移动设备和一些物联网设备,能效也是非常重要的,Arm的机器学习处理器IP在能效上可以实现3 TOPs/W,Arm认为3 TOPs/W将是移动AI芯片的一个“甜蜜点”。

在Arm看来,其目前的主要优势还是在移动市场,而且现在很多AI创新都是从移动端发生的。另外,Arm的业务模式主要是进行IP授权,这就需要体量比较大的市场来支撑,显然目前移动市场对于人工智能的需求量最最为庞大的。所以Arm的人工智能处理器会先从移动市场进行切入。

根据Arm的机器学习处理器的路线图也显示,移动市场将会是Arm的机器学习处理器首先切入的市场。Arm透露,其首款针对移动市场的机器学习处理器IP将会在2018年年中推向市场。

另外,Arm也表示,其机器学习处理器IP是具有高可扩展性、兼容性和可编程的,可以提供计算性能最低从2 GOPs到超过70 TOPs的产品。除了移动市场之外,Arm的机器学习处理器IP也将会开始向物联网、工业、汽车、网络以及服务器市场进军。

2、第二代的目标检测处理器

除了首次推出的机器学习处理器IP之外,Arm此次还针对安防监控市场带来了其第二代的目标检测处理器。其实早在2016年Arm就推出了其首款目标检测处理器Spirit,随后被其2016年收购的计算机视觉和图像处理器的公司Apical(其产品覆盖超过15亿设备)所采用,随后广泛的用于英国智能家居品牌Hive安防摄像头当中。如果说,Arm此前推出的目标检测处理器Spirit是一次试水,那么这次的第二代的目标检测处理器产品则将是Arm全面进军安防监控市场的开始。

根据Arm公布的数据显示,其第二代目标检测处理器可以支持全高清画质下60fps实时检测,支持50×60像素以上的无限数量的目标检测。其还提供了详细的人体模型提供了丰富的源数据,使人脸、方向、轨迹、姿势和动作检测成为可能。

Arm表示,其还可提供集成解决方案,采用其机器学习处理器+目标检测处理器,可以更高效的实现比如人脸、物体识别等应用。在实时目标识别任务中,目标检测处理器会首先分离出区域,比如人脸、物体。这样,机器学习处理器就能够分析更少的像素,以实现更快、更精细的结果。

3、神经网络软件库

Arm的神经网络库包括:CMSIS-NN,Compute Library和Object DetectionLibraries。

CMSIS-NN是Arm提供的神经网络推理运算库,根据Arm此前的数据,其对于运行时间/吞吐量将会有4.6倍的提升,而对于能效将有4.9倍的提升;Arm Compute Library是Arm公司去年发布的开源工具,旨在为图像/视频/多媒体/计算机视觉等领域的开发者提供Arm平台的硬件加速库;Object DetectionLibraries则是Arm针对其目前检测处理器的目标检测库。

据介绍,Arm的神经网络库可支持主流的神经网络框架,如TensorFlow、Caffe/Caffe2、mxnet等。此外,Arm的神经网络库还针对 Arm Cortex CPU、Mali GPU 和新的机器学习处理器和目标检测处理器进行了优化。通过以上这些主流框架,开发者可以轻松调用Arm的神经网络库API,从而发挥出Arm的AI/ML硬件IP的性能。

Mali-G52发布,Arm GPU首次加入了对于机器学习的支持

在3月6日的发布会上,Arm发布了两款全新的GPU产品:针对中端市场Mali-G52和针对入门级市场的Mali-G31。

其中,Mali G31是基于Arm此前只用于中高端产品线当中的Bifrost架构,是Arm目前最小的GPU,还加入了对于Vulkan的支持。可以说Mali-G31的推出是Arm首次将之前一些中高端产品的能力开始引入到入门级产品当中。

而Mali-G52则是Mali-G51的升级产品,不仅可从容应对更高的图形复杂度,允许在主流移动系统的功率和带宽限制内实现更多的机器学习功能。

根据Arm的资料显示,Mali-G52由于采用了更宽的执行引擎,相比前代产品的4线程,Mali-G52最多可提供8线程,可在相同芯片面积上,提供更高的图形性能,性能密度相对于Mali-G51提高了30%。另外,在能效方面,Mali-G52也提高了15%。这里需要指出的是,Mali-G52的面积是G51的1.2倍。

当然,更为值得关注的是Mali-G52首次加入了对于INT8数据类型的支持,再加上Mali-G52的执行引擎增加到了8个,使得其可以更加高效的进行进行针对人工智能的运算。

我们都知道,相对于CPU来说,采用GPU来做AI运算效率会更高一些。所以,我们看到Nvidia的人工智能计算卡主要也是基于GPU来运算的。

根据Arm公布的数据显示,与Mali-G51相比,在图形识别能力方面,Mali-G52的性能提升了3.6倍,在Yolonetwork卷积性能测试当中,性能提升了3.5倍。

近年来随着Arm GPU产品线的越来越强大,目前Arm的Mali系列GPU已经成为全球出货最多的GPU。根据资料显示,2017年Arm的Mali系列GPU出货超过12亿颗。随着此次,Arm首次使得其Mali-G52 GPU开始支持机器学习,相信后续将会有更多的新的Arm GPU也将会支持。

据了解,今年年中,Mali-G52 GPU就将会推向市场。

将人工智能带入到每一个设备当中

Arm认为机器学习正变得日益普及,可跨越多个设备,触达每一位用户。而Arm的愿景则是让将机器学习在更多智能设备中普及。

目前一些高端智能设备当中的人脸识别、物体识别、指纹识别、用户习惯学习等应用都有用到机器学习,有些厂商还在SoC上配置了独立的人工智能处理器来进行加速。但是对于目前的主流智能手机市场来说,都配备专门的人工智能处理器并不实际,所以这些任务可以交给SoC上的其他单元来进行 ,比如DynamIQ CPU和Mali-G52 GPU,以提升现有应用的机器学习性能。

Arm资深市场营销总监Ian Smythe先生也在会上表示:“对终端设备而言,支持丰富的多层用户界面以及一系列广泛的最新应用已成为必然趋势。更为重要的是,机器学习不再是高端智能手机的专有配置。各级用户都希望轻松使用配备机器学习功能的各类APP应用。”

当然,对于需要用到专用的人工智能处理器的设备和市场,Arm此次也推出了ProjectTrillium项目,推出了专用的独立的机器学习处理器IP和目标检测处理器IP。并且,Arm的机器学习和目标检测处理器IP是具有高可扩展性、兼容性和可编程的,可以覆盖更为广泛的市场。

另外值得一提的是,Arm此次推出的新的ProjectTrillium项目的IP套件可与现有基于DynamIQ的CPU、Mali-G52 GPU和其他Arm IP无缝集成。

根据IDC的研究数据显示,目前90%的具有人工智能能力的设备都是基于Arm的(主要是基于ARM的CPU/GPU)。而随着Arm将人工智能的能力带入其GPU产品,以及ProjectTrillium项目的推出,再加上去年就推出的针对人工智能优化的DynamIQ CPU,未来这一比例可能将进一步提升。

显然,从前面的一系列介绍,我们不难看出,现在的Arm已经开始全面拥抱AI,并希望通过AI获取更大的市场份额。

得益于Arm在移动CPU及GPU市场的领先地位和生态优势,随着ProjectTrillium的推出,Arm的人工智能IP或将成为Arm一条全新的产品线,而且随着人工智能在终端侧的快速发展,未来其有望成为与Cortex系列CPU、Mali系列多媒体IP并驾齐驱的第三大产品线。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • ARM
    ARM
    +关注

    关注

    134

    文章

    8615

    浏览量

    361326
  • AI
    AI
    +关注

    关注

    87

    文章

    26153

    浏览量

    263716
  • 人工智能
    +关注

    关注

    1773

    文章

    43373

    浏览量

    230136

原文标题:揭秘Arm人工智能战略:不仅CPU/GPU会支持,还有独立的AI产品线!

文章出处:【微信号:icsmart,微信公众号:芯智讯】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    创龙教仪基于瑞芯微3568的ARM Cortex A-55教学实验箱 适用于人工智能 传感器 物联网等领域

    采用ARM架构的通用型SoC,主要应用于智能硬件和工业应用。CPU采用四核A55架构处理器,集成Mali G52图形处理器和独立人工智能N
    发表于 03-22 14:29

    FPGA在深度学习应用中或将取代GPU

    ,并在运算速度和吞吐量方面提供了更高的性能。它们的使用寿命也更长,大约是 GPU 的 2-5 倍,并且对恶劣环境和其它特殊环境因素有更强的适应性。 有一些公司已经在他们的人工智能产品中使用了 FPGA
    发表于 03-21 15:19

    嵌入式人工智能的就业方向有哪些?

    。 国内外科技巨头纷纷争先入局,在微软、谷歌、苹果、脸书等积极布局人工智能的同时,国内的BAT、华为、小米等科技公司也相继切入到嵌入式人工智能的赛道。那么嵌入式AI可就业的方向有哪些呢? 嵌入式
    发表于 02-26 10:17

    ai人工智能机器人

    随着时间的推移,人工智能的发展越来越成熟,智能时代也离人们越来越近,近几年人工智能越来越火爆,人工智能的应用已经开始渗透到各行各业,与生活交融,成为人们无法拒绝,无法失去的一个重要存在
    发表于 09-21 11:09

    AI智能呼叫中心

    随着科技的飞速发展,人工智能(AI)已经成为了各行各业的关键技术,其中,AI智能呼叫中心的出现,给传统的呼叫中心带来了巨大的改变与创新,本文将探讨A
    发表于 09-20 17:53

    《通用人工智能:初心与未来》-试读报告

    作者给出的结论。整体读下来,可以给我们关于通用人工智能全面的了解。作者也反复强调了通用人工智能与专用智能的区别。尤其是人们错误的认为一堆专用智能堆砌起来就是通用
    发表于 09-18 10:02

    什么是人工智能ai

    什么是人工智能ai 人工智能AI是一种模拟人类思维和行为的智能技术,它是机器智能的一种。它能够自
    的头像 发表于 08-12 16:57 5603次阅读

    Ai 部署的临界考虑电子指南

    虽然GPU解决方案对训练,AI部署需要更多。 预计到2020年代中期,人工智能行业将增长到200亿美元,其中大部分增长是人工智能推理。英特尔Xeon可扩展处理器约占运行
    发表于 08-04 07:25

    AI 人工智能的未来在哪?

    人工智能AI智能大模型已经孵化;繁衍过程将突飞猛进,ChatGPT已经上线。 世界首富马斯克认为AI对人类是一种威胁;谷歌前CEO施密特认为AI
    发表于 06-27 10:48

    【书籍评测活动NO.16】 通用人工智能:初心与未来

    之后的达特茅斯研讨开始,用机器来模仿人类学习及其他方面的智能,即实现“人工智能”(Artificial Intelligence,AI)便成为计算机领域持续的研究热点。时至今日,以深
    发表于 06-21 14:41

    【EASY EAI Nano人工智能开发套件试用体验】EASY EAI Nano人工智能开发套件开箱及最快上手教程

    EASY EAI Nano人工智能开发套件简介 EASY EAI Nano是广州灵眸科技有限公司的旗舰级硬件产品。基于瑞芯微RV1126 处理器设计,具有四核CPU@1.5GHz与NPU@2Tops
    发表于 06-11 13:34

    【EASY EAI Nano人工智能开发套件试用体验】开箱视频及核心板介绍

    今天收到了EASY EAI Nano人工智能开发套件,趁着热乎给大家做个开箱视频,希望各位看官对EASY EAI Nano人工智能开发套件有一个简单的了解,后面也对核心板做一些介绍
    发表于 05-31 19:45

    【EASY EAI Nano人工智能开发套件试用体验】开箱后硬件了解及上电

    EAI Nano是灵眸科技的硬件产品。基于瑞芯微RV1126 处理器设计,具有四核CPU@1.5GHz与NPU@2Tops AI边缘计算能力。有丰富的软硬件开发资料,而且外设资源丰富,接口齐全,
    发表于 05-31 19:35

    【EASY EAI Nano人工智能开发套件试用体验】EASY EAI Nano人工智能开发套件开箱及硬件初体验

    及接线柱、12V 1A电源等。 EASY EAI Nano人工智能开发板用塑料盒和静电袋包装,里面有一根黑色的数据线。 EASY EAI Nano人工智能开发套件包装还是很不错的,用很多的黑色
    发表于 05-31 19:18

    机器学习和人工智能有什么区别?

    人工智能程序。他们需要编程才能发挥作用。事实上,他们似乎不可避免地从简单的 AI 程序开始,随着他们的理解和学习能力的发展,这些程序创建新代码。 
    发表于 04-12 08:21