0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

Arm迟迟推出全新NPU系列的原因是什么

独爱72H 来源:雷锋网 作者:佚名 2019-10-30 15:48 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

(文章来源:雷锋网)

Arm推出了一系列全新的IP,包括NPU、GPU以及DPU。NPU尤为值得关注,不仅因为NPU系列同时发布了N57和N37两款新品,还因为Arm的ML处理器(Machine Learning Processor)系列名称Ethos也正式公布。全新AI系列产品的亮相,意味着Arm的AI策略更加明晰。

实际上,Arm原计划在2019年第一季度发布首款ML处理器。之所以选择这个时间点,Arm ML事业群商业与营销副总裁Dennis Laudick去年11月接受雷锋网专访时表示:“最近我们已经看到机器学习技术正在稳定和成熟,市场需求也正在不断增加,我们认为现在是进入市场的最佳时机。”

不过,Arm首款ML处理器的发布时间是在今年5月,比计划略晚一些。Dennis上周再次接受雷锋网专访时表示,发布推迟有很多原因,产品开发是主要的问题。ML处理器开发的过程中面临很多挑战,其中一个很大的挑战就是数据移动处理不好就会消耗大量的电,另一个大的挑战就是如何权衡效率和灵活性。

虽然产品的开发影响了首款ML处理器发布的时间,但Arm并没有在首款ML产品发布时就公布其系列名称和型号。而是直到面向主流市场,提供性能、成本以及功耗均衡的N57和对成本极端敏感的N37发布,Arm才正式公布ML系列处理器的的名称——Ethos(中文可翻译为精神)。此时,外界也才清楚5月发布的首款ML处理器型号为Ethos-N77,定位高端,面向高性能需求的市场。

这是为什么?Dennis解释称,其实有很多原因,Arm内部也在重新思考命名系统,如果推出第一款机器学习产品就立刻发布新的产品系列名称,可能大家会把对这个系列品牌的印象和认知捆绑在这一款产品身上,我们不希望造成这样的效果。我们希望大家看到Ethos这个产品名下面的产品系列是广泛而丰富的,这就是为什么要等到有针对三个不同市场,三个不同档次的产品都出来了,才正式的对外公布产品系列的名称的主要原因。

但更为关键的是,市场上已经有众多竞争者,此时推出Ethos还有竞争力吗?Dennis表示,Arm的成功一直以来都得益于生态系统,对于NPU来说挑战并不是能够做出自己的NPU,而是NPU在市场上是不是真的好用。我们已经听到合作伙伴反馈说,希望在硬件上能够标准化,他们不想支持15种不同的硬件,所以,他们期待有一个标准化的软件平台能够支持。

以具体的产品看,Ethos-N57与Ethos-N37的设计理念包括一些基本原则,例如:针对Int8与Int16数据类型的支持性进行优化;先进的数据管理技术,以减少数据的移动与相关的耗电;通过Winograd技术的落地,使性能比其他NPU提升超过200%。

AI处理器支持的数据类型非常关键,随着算法和模型的逐步成熟,边缘端的AI芯片很多都只支持Int8的数据类型,但Arm还选择支持Int16。对此,Dennis表示,机器学习支持Int8数据类型基本就足够了,我们之所以选择也支持INT16是为了更好的应对涉及到图像处理的工作,因为通常来说像素是10到12位,牵扯到颜色,支持INT16就省略了很多的数据转换的工作,非常适合图像处理。

但为何又没有支持更高精度的FP16?“因为FP16对带宽的需求相当高,这就意味着处理器的整个处理量和功耗就会提升。但消耗这么多的功耗和带宽,准确率与INT8比较却没有多少提升。” Dennis如此解释。

虽然机器学习让处理器的设计面临着新的挑战,不过Dennis认为机器学习本身并没有改变最为根本的处理器的设计原则,只不过针对机器学习的处理器设计的重点可能和通用处理器有所不同。Arm一直强调的数据管理是我们的重点,还有并行计算、矩阵乘法都是我们关注的重点。

硬件的独特性之外,软件也同样重要,特别是在AI时代,软硬一体化的重要性更加突显。要实现理想的软硬结合,Dennis认为有两大挑战,一个还是权衡的问题,也就是多少工作让硬件完成以及多少工作给软件完成。另一个是ML框架的支持,因为这个领域还很新,还会出现不同的框架。

除了软硬一体化提升AI性能,在先进半导体制程越来越昂贵的背景下,通过异构系统提升处理器性能也受到了很大的关注。但异构的系统给软件带来的更大的挑战,此时,到底是用统一的软件API去分配硬件资源实现易用性,还是对每个硬件单独编程让系统更加高效?

Arm采用的在硬件之上有特别优化的Compute Library,它会把底层的硬件和驱动进行充分优化,根据算子的不同需求驱动硬件,可以提升几倍到十几倍的效率。再上一层是Arm nn,可以将TensorFlow、Caffe等神经网络框架转换成Compute Library可以执行的任务,让开发者不用关心底层的硬件,只需要使用标准架构进行开发就可以。

因此,Dennis表示Arm采用的方式是更加底层的方式,软件直接与CPU、GPU或NPU进行沟通,做最佳匹配。这其中最大的挑战还是平衡的问题,软件的架构要做到根据具体的应用,分配专用和通用的处理器,这个百分比还可以不断调整,这是最难做的。

在框架的支持上,Arm是希望其硬件可以让开发者不需要去特别选择需要用哪一个框架。NPU软硬件的独特性和优势只有获得市场的认可才能成功,那么首先得满足不同场景的算力需求。Ethos系列现有的三款ML处理器性能从1-4 TOP/s不等,但是即便是在边缘端,也会有更高的性能需求,更不用说高性能计算的场景。

但是,随着系统的复杂性增加,计算单元的增加并不意味着一直能够带来线性的性能提升。Arm如何应对?Dennis表示,这种组装确实有其局限性,到达某个性能后可能性能的提升就消失了,但Arm在GPU和CPU多处理器架构上有很好的架构设计,能够尽量实现比较长的线性性能提升。

为应对AIoT时代更激烈的竞争,特别是RISC-V的竞争,我们也看到Arm在本月初宣布推出全新的功能 Arm Custom instructions,允许客户在特定的 CPU 内核中加入自定义指令功能,能够加速特定的用例、嵌入式物联网应用程序。

Dennis表示,我们会认真的看待RISC-V在市场上的进展和动作,就像我们认真看待其他架构一样。Arm的优势在于我们能够提供最全面的、拥有灵活性、普遍性的解决方案和产品,与此同时,我们还拥有强大丰富的生态,能够更好的满足市场的需求。
(责任编辑:fqj)

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 处理器
    +关注

    关注

    68

    文章

    20149

    浏览量

    247243
  • ARM
    ARM
    +关注

    关注

    135

    文章

    9499

    浏览量

    388778
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    芯原与谷歌联合推出开源Coral NPU IP

    芯原股份近日宣布与谷歌联合推出面向始终在线、超低能耗端侧大语言模型应用的Coral NPU IP。
    的头像 发表于 11-13 11:24 290次阅读
    芯原与谷歌联合<b class='flag-5'>推出</b>开源Coral <b class='flag-5'>NPU</b> IP

    实战RK3568性能调优:如何利用迅为资料压榨NPU潜能-在Android系统中使用NPU

    《实战RK3568性能调优:如何利用迅为资料压榨NPU潜能-在Android系统中使用NPU
    的头像 发表于 11-07 13:42 229次阅读
    实战RK3568性能调优:如何利用迅为资料压榨<b class='flag-5'>NPU</b>潜能-在Android系统中使用<b class='flag-5'>NPU</b>

    Bourns推出全新Riedon PF2472系列功率电阻

    Bourns 推出全新 Riedon 系列功率电阻。此系列采用紧凑型 TO-247 封装,具备坚固耐用、高功率的厚膜电阻特性,能在搭配散热器时提供高达 100 W 的输出功率,并可承受
    的头像 发表于 09-17 14:37 595次阅读

    全新Arm Lumex CSS平台实现两位数性能提升

    Arm 控股有限公司(纳斯达克股票代码:ARM,以下简称 Arm)今日宣布推出全新 Arm Lu
    的头像 发表于 09-10 16:14 751次阅读
    <b class='flag-5'>全新</b><b class='flag-5'>Arm</b> Lumex CSS平台实现两位数性能提升

    TDK推出全新SmartMotion ICM-536xx系列高性能六轴IMU

    TDK株式会社(东京证券交易所代码:6762)重磅推出全新的SmartMotion® ICM-536xx系列高性能六轴IMU,并向特定客户开放供货。
    的头像 发表于 09-05 09:15 749次阅读

    搭载ARMNPU,FPGA三种核心的开发板—米尔安路DR1M90飞龙派

    板上市,是A股首家专注于FPGA业务的上市公司。 YM90X开发板用的就是安路的SALDRAGON1(飞龙1,以下简称 DR1)系列FPSoC。 FPSoC就是将ARMNPU和JPU处理器
    发表于 06-13 17:02

    ARMNPU,FPGA三种核心的开发板 — 米尔安路飞龙派开发板

    ,是A股首家专注于FPGA业务的上市公司。YM90X开发板用的就是安路的SALDRAGON1(飞龙1,以下简称DR1)系列FPSoC。FPSoC就是将ARMNPU
    的头像 发表于 06-13 08:03 1364次阅读
    有<b class='flag-5'>ARM</b>,<b class='flag-5'>NPU</b>,FPGA三种核心的开发板 — 米尔安路飞龙派开发板

    MDD辰达半导体推出全新SGT系列MOSFET

    在服务器电源、工业驱动及新能源领域,MOSFET的性能直接决定系统的能效与可靠性。为满足高密度、高效率需求,MDD辰达半导体推出全新SGT系列MOSFET,其中MDDG03R04Q(30V N沟道增强型MOS)凭借3.5mΩ低导
    的头像 发表于 05-21 14:04 1002次阅读
    MDD辰达半导体<b class='flag-5'>推出</b><b class='flag-5'>全新</b>SGT<b class='flag-5'>系列</b>MOSFET

    后摩智能NPU适配通义千问Qwen3系列模型

    近日,阿里云重磅推出Qwen3 系列开源混合推理模型。用时不到1天,后摩智能自研NPU迅速实现Qwen3 系列模型(Qwen3 0.6B-14B)在端边侧的高效部署。这一成果充分彰显了
    的头像 发表于 05-07 16:46 1127次阅读

    灵动微电子推出全新超值型MM32F0050系列MCU

    灵动微电子推出全新超值型MM32F0050系列MCU。2018年,灵动首次上市了其主打性价比的超值型MM32F00系列,目前已陆续推出了F0
    的头像 发表于 04-01 09:36 1367次阅读
    灵动微电子<b class='flag-5'>推出</b><b class='flag-5'>全新</b>超值型MM32F0050<b class='flag-5'>系列</b>MCU

    TDK推出全新FS160系列microPOL电源模块

    TDK公司宣布推出全新FS160*系列microPOL(uPOL)电源模块。FS160*系列uPOL直流-直流转换器全部配备全遥测技术,具有更高的性能、最小的尺寸以及不同于一般的功率密
    的头像 发表于 03-12 16:12 1413次阅读
    TDK<b class='flag-5'>推出</b><b class='flag-5'>全新</b>FS160<b class='flag-5'>系列</b>microPOL电源模块

    Arm推出GitHub Copilot新扩展程序

    Arm 控股有限公司(纳斯达克股票代码:ARM,以下简称“Arm”)宣布其已正式推出专为 GitHub Copilot 设计的新扩展程序。GitHub Copilot 是全球部署最广泛
    的头像 发表于 02-24 10:14 890次阅读

    天水华天推出全新CYX39系列注油芯体压力传感器

    天水华天传感器有限公司重磅推出全新一代CYX39系列注油芯体压力传感器,作为经典CYX19系列的3.0升级版本,CYX39在温漂性能、稳定性及适用场景上全面突破,为工业测量领域带来更优
    的头像 发表于 02-15 17:35 1450次阅读

    ADC的谐波产生的原因是什么?

    ADC的谐波产生的原因是什么
    发表于 02-08 08:25

    纳芯微推出全新NSM201x-P系列电流传感器

    近日,纳芯微推出全新车规级集成电流路径霍尔传感器NSM201x-P系列。该系列产品是对纳芯微已量产的NSM201x系列的完美升级与补充。基于
    的头像 发表于 01-21 13:54 1159次阅读
    纳芯微<b class='flag-5'>推出</b><b class='flag-5'>全新</b>NSM201x-P<b class='flag-5'>系列</b>电流传感器