0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

回顾驭势联合新加坡国立大学推出东风网络的理解

VtWH_驭势未 来源:djl 2019-09-19 11:02 次阅读

给定目标硬件,如何确定最优的速度-精度折衷边界?换言之:给定推断延时的限制,模型能达到的最高精度是多少?给定精度要求,模型所需的最短延时是多少?

回顾驭势联合新加坡国立大学推出东风网络的理解

为此,驭势科技AI研究院联合新加坡国立大学提出了偏序关系剪枝(Partial Order Pruning)方法,直接考虑模型在目标硬件上的延时,利用偏序关系假设对搜索空间进行剪枝,平衡模型的宽度与深度,以提高速度-精度折衷的边界。应用该方法所得的东风(DF)骨干网络,取得了目标硬件(TX2)上的最优速度-精度折衷。应用该方法于语义分割网络Decoder的结构搜索,所得的东风分割网络(DF-Seg)也取得了TX2/1080Ti上最优的速度-精度折衷。

在实际运用当中,具备多重实用价值,主要体现在以下几个方面:

(一)DF/DF-Seg网络的实用价值

(1)DF网络取得了目标硬件(TX2)上最优的速度-精度折衷。

回顾驭势联合新加坡国立大学推出东风网络的理解

(2)DF网络节约显存。以DF2A网络为例,其精度介于ResNet50/101之间,而仅需1/3至1/2的显存(以BVLC Caffe测试)。

回顾驭势联合新加坡国立大学推出东风网络的理解

(3)DF网络结构简单,仅使用基本的残差模块,相当于更“精耕细作”的ResNet。

回顾驭势联合新加坡国立大学推出东风网络的理解

(4)DF-Seg网络是TX2/1080Ti/Titan X(Maxwell)上速度-精度折衷最好的分割网络。

回顾驭势联合新加坡国立大学推出东风网络的理解

省时间、省显存、结构简单,使得DF/DF-Seg网络有助于在嵌入式设备TX2上部署高精度、低延时、多路图像并行处理的CNN模型;有助于高端GPU上的视频处理、大规模图像数据处理等任务的部署;有助于科研人员,尤其是计算资源不足的科研人员,节省计算资源,实现更复杂的算法

(二)偏序关系剪枝算法的实用价值

DF网络更适合GPU平台,我们也利用偏序关系剪枝算法,在骁龙845 CPU平台上进行了骨干网络结构与分割网络Decoder结构的搜索,所得语义分割网络得到了目前CPU平台上最好速度-精度折衷。

回顾驭势联合新加坡国立大学推出东风网络的理解

以下为该论文内容翻译:

一、偏序关系剪枝算法

(一)搜索空间设计与模型结构编码

回顾驭势联合新加坡国立大学推出东风网络的理解

图2(a)为本文的模型搜索空间,图2(b)为本文使用的残差模块结构。网络由6个Stage构成,Stage1~5均通过设步长为2降低输入特征的分辨率,Stage6通过全局池化与全连接层产生分类结果。本文的模型搜索不搜索基本模块的结构,而是在基本残差模块的基础上,对网络整体的宽度与深度进行平衡。在Stage3~5,模型分别包含L/M/N个残差模块,Stage s中的第i个残差模块的宽度记为,因此本文将一个结构表示为:

回顾驭势联合新加坡国立大学推出东风网络的理解

(二)模型延时估计与子搜索空间

图2(a)所表达的搜索空间记为s,实践中我们仅关心延时在中的子集,即。为估计各网络的延时,我们使用TensorRT提供的性能分析工具,在目标硬件TX2上,测量了不同的残差模块所需的延时,并建立一个查找表

回顾驭势联合新加坡国立大学推出东风网络的理解

。这里,分别是输入输出特征的通道数,而

回顾驭势联合新加坡国立大学推出东风网络的理解

是相应的空间尺寸。利用该查找表将各残差模块延时进行加和记为对一个网络延时的估计。在图3(a)中,我们对若干网络的估计延时与实际延时进行了比较,可见估计延时与实际延时基本一致。

回顾驭势联合新加坡国立大学推出东风网络的理解

回顾驭势联合新加坡国立大学推出东风网络的理解

(三)偏序关系假设

我们借用集合论中的偏序(Partial Order)关系来描述模型结构之间的联系:集合中的元素为不同的模型结构(见图2(a)),集合中的二元关系定义为:若x比y更浅且更窄,则称x是y的前序,记为。如此,整个搜索空间中的模型结构就满足了严格偏序关系,包括反自反性、反对称行、传递性。图4给出了若干模型结构间偏序关系的示意图。偏序关系假设为:若x是y的前序(意味着x比y更浅且更窄),则x的速度更快,精度更低。这可以写为:

回顾驭势联合新加坡国立大学推出东风网络的理解

回顾驭势联合新加坡国立大学推出东风网络的理解

在图3(b)中,我们基于已训练的模型,对偏序关系假设的合理性进行了验证,其中,

回顾驭势联合新加坡国立大学推出东风网络的理解

回顾驭势联合新加坡国立大学推出东风网络的理解

。可见,在本实验所关心的模型子空间中,偏序关系假设是合理的。

(四)偏序关系剪枝

基于偏序关系假设,我们可以在模型搜索中对搜索空间进行剪枝。图5是该剪枝过程的一个示意图。集合为已训练的模型结构,集合中的模型代表了当前迭代中所能达到的最优速度-精度折衷边界。对于一个非边界模型

回顾驭势联合新加坡国立大学推出东风网络的理解

,其任意前序模型

回顾驭势联合新加坡国立大学推出东风网络的理解

,应有:

回顾驭势联合新加坡国立大学推出东风网络的理解

而我们已有速度-精度折衷更好的边界点:

回顾驭势联合新加坡国立大学推出东风网络的理解

因此w的部分前序元素,延时将比高,而精度将比低,也即处于图5的阴影部分。这些中的模型结构无法提供更好的速度-精度折衷,可以据此对搜索空间进行剪枝:。如此反复迭代,在迭代中不断对搜索空间进行剪枝,直至速度-精度折衷的边界趋于稳定,如算法1所描述。

回顾驭势联合新加坡国立大学推出东风网络的理解

回顾驭势联合新加坡国立大学推出东风网络的理解

(五)语义分割网络的Decoder设计

本文中语义分割网络的结构设计如图6所示,在Stage 5中加入了pyramid pooling module,使用图6(b)所示的Fusion node融合不同分辨率的特征,其中Channel Controller(CC)为1x1卷积,用以控制Decoder在不同分辨率下的宽度。不同的,构成了不同复杂度的Decoder结构。这些Decoder结构之间也存在着偏序关系假设,因此也可以使用偏序关系剪枝算法对搜索空间进行剪枝。

回顾驭势联合新加坡国立大学推出东风网络的理解

二、实验数据

(一)TX2上的骨干网络搜索

我们在TX2上进行骨干网络的搜索,最终选取3个最有代表性的网络,记为3个东风(DF)骨干网络。如图7与表1所示,DF网络取得了TX2上最好的速度-精度折衷。

DF1网络FLOPs明显高于MobileNet于ShuffleNet等,但在TX2上实际延时更低。这是因为FLOPs作为间接指标,仅考虑了浮点计算量而没有考虑内存访问的延时。以ShuffleNetV2与DF1为例,其内存访问代价(也即中间层的特征),分别为4.9M与2.9M。

NASNet与PNASNet在网络结构搜索中均未考虑模型延时,所得模型结构复杂,内存访问量大,实际延时较高。有一些同期工作(ProxylessNAS/FBNet)也在模型搜索中考虑了模型延时,DF网络在速度-精度折衷上也优于这些模型。这是因为:一、这些模型未针对TX2平台进行模型搜索;二、这些网络均基于MobileNetV2的inverted bottleneck模块,相比本文使用的残差模块,内存访问量更高。

回顾驭势联合新加坡国立大学推出东风网络的理解

(二)TX2/1080Ti上的Decoder网络结构搜索

基于TX2上搜索的东风骨干网络,我们也在TX2/1080Ti上分别进行了Decoder结构搜索。如表3所示,东风分割网络(DF-Seg)是目前1080Ti上速度-精度折衷最好的语义分割网络。DF-Seg网络的速度(FPS)与精度(mIoU)均在1024x2048的分辨率下,使用TensorRT提供的性能分析工具在1080Ti上进行测试。为与ICNet公平对比,在FPS(Caffe)栏中使用“Caffe Time”工具,在Titan X(Maxwell)上进行速度测试。表4与表5分别为Titan X(Maxwell)/TX2上的速度测试,DF-Seg的速度大幅优于现有结果,能够在TX2上实现对720P分辨率图像的30FPS的语义分割。

回顾驭势联合新加坡国立大学推出东风网络的理解

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 算法
    +关注

    关注

    23

    文章

    4456

    浏览量

    90759
  • 网络
    +关注

    关注

    14

    文章

    7251

    浏览量

    87443
  • 结构
    +关注

    关注

    1

    文章

    116

    浏览量

    21471
收藏 人收藏

    评论

    相关推荐

    哈尔滨工业大学在微纳光学领域取得重要进展

    亚波长尺寸超表面生成高质量涡旋光。 从哈尔滨工业大学(深圳)获悉,该校科研团队与澳大利亚国立大学科研团队合作,在微纳光学领域取得重要研究进展,实现超表面能以亚波长横向尺寸生成高质量涡旋光,有望成为
    的头像 发表于 04-26 06:34 32次阅读
    哈尔滨工业<b class='flag-5'>大学</b>在微纳光学领域取得重要进展

    Living Well Digitally:由新加坡国立大学可信互联网和社区中心发起并由 DQ 提供支持的全球倡议

    新加坡2024年4月20日 /美通社/ -- 2024年4月17日,新加坡国立大学 (NUS) 可信互联网与社区中心 (CTIC) 启动了一项开创性的新计划,"Living Well
    的头像 发表于 04-21 23:12 100次阅读
    Living Well Digitally:由<b class='flag-5'>新加坡</b><b class='flag-5'>国立大学</b>可信互联网和社区中心发起并由 DQ 提供支持的全球倡议

    在CPU芯片领域,中国将迎来新型服务器的发展机遇,

      传感新品 【新加坡国立大学: 开发多功能超宽带、多波长压缩成像传感器】 为了寻求一种能够适应多种波长同时保持高分辨率的一体化成像传感器,新加坡国立大学刘小钢教授团队提出了一种普适性
    的头像 发表于 03-21 17:23 155次阅读
    在CPU芯片领域,中国将迎来新型服务器的发展机遇,

    华为与东风猛士科技将联手发布新车,或牵手岚图

    华为曾携手东风汽车旗下岚图实现战略合作,共同推进智能技术的商业化应用。因此,IT之家的读者朋友们可拭目以待明天具体的合作内容,特别是华为是否助力东风猛士推出硬派越野汽车。
    的头像 发表于 02-21 14:04 206次阅读

    中国制造走进海外名校!国仪量子EPR200M交付新加坡国立大学

    国仪量子EPR交付新加坡国立大学近日,国仪量子台式电子顺磁共振波谱仪EPR200M成功交付新加坡国立大学陈小元教授课题组。这是国产EPR产品首次进入
    的头像 发表于 12-22 08:24 205次阅读
    中国制造走进海外名校!国仪量子EPR200M交付<b class='flag-5'>新加坡</b><b class='flag-5'>国立大学</b>

    韩国研究团队开发了一种在石墨烯层上生长柔性GaN LED阵列的方法

    外媒消息,韩国首尔国立大学与成均馆大学的研究团队联合开发了一种在石墨烯层上生长柔性GaN LED阵列的方法,通过该技术研究团队生长出了LED微型阵列,并称作微盘阵列(Microdisks arrays)。
    的头像 发表于 12-18 10:07 553次阅读

    韩国开发了一种在石墨烯层上生长柔性GaN LED阵列的方法

    12月11日,外媒消息,韩国首尔国立大学与成均馆大学的研究团队联合开发了一种在石墨烯层上生长柔性GaN LED阵列的方法,通过该技术研究团队生长出了LED微型阵列
    的头像 发表于 12-13 16:06 439次阅读
    韩国开发了一种在石墨烯层上生长柔性GaN LED阵列的方法

    梦想人入选市级示范案例

    科技有限公司(MiXedReality)由国家级重大人才工程特聘专家、新加坡国立大学教授周志颖博士创立,是拥有核心自主知识产权并将技术应用与行业融合发展的高新技术企
    的头像 发表于 12-08 15:48 215次阅读
    梦想人入选市级示范案例

    报名即将截止!Imagination联合浙江大学举办2023国内首场RVfpga课程线下Workshop

    10月28日-29日,Imagination与浙江大学信息与电子工程学院将联合举办《RVfpga:深入理解计算机体系结构》课程培训活动。
    的头像 发表于 10-25 08:28 386次阅读
    报名即将截止!Imagination<b class='flag-5'>联合</b>浙江<b class='flag-5'>大学</b>举办2023国内首场RVfpga课程线下Workshop

    中红外波段超10μm宽的非互易热辐射特性实现

    近日,新加坡国立大学仇成伟教授、上海交通大学赵长颖教授团队联合电子科技大学毕磊教授、中国科学院上海微系统与信息技术研究所黎华研究员团队,通过
    的头像 发表于 08-27 11:32 761次阅读
    中红外波段超10μm宽的非互易热辐射特性实现

    百大案例 | 华为助力德国斯图加特大学打造宿舍楼无线局域网络,构建知识共享的平台

    始建于1829年的斯图加特大学是德国顶尖国立理工大学之一,历史悠久的校区宿舍楼急需先进的无线局域网络为师生打造更智慧的校园网络环境。因此华为
    的头像 发表于 08-18 18:15 437次阅读
    百大案例 | 华为助力德国斯图加特<b class='flag-5'>大学</b>打造宿舍楼无线局域<b class='flag-5'>网络</b>,构建知识共享的平台

    薄膜PMUT研究进展综述

    据麦姆斯咨询报道,近日,新加坡国立大学(National University of Singapore)和新加坡科技研究局(A*STAR)微电子研究所的研究人员组成的团队在Microsystems
    的头像 发表于 08-03 09:38 907次阅读
    薄膜PMUT研究进展综述

    德赛西威与湖南大学交互体验设计联合创新实验室正式授牌

    、科研成果与产品技术落地等方面开展更深入的对接。 成果回顾:用户视角的创意概念库 早在2018年,德赛西威就与湖南大学设计艺术学院启动了 “智能驾驶空间交互设计” 联合课程,并将产出的“3SPACE”概念设计转化为“冥想”应用,
    的头像 发表于 07-07 12:15 433次阅读
    德赛西威与湖南<b class='flag-5'>大学</b>交互体验设计<b class='flag-5'>联合</b>创新实验室正式授牌

    具有30年生命周期的铌-石墨烯电池

    这些电池正在新的CBMM-CA2DM先进电池实验室进行测试,该实验室由新加坡国立大学和CBMM于2023年5月23日启动,由新加坡国家研究基金会支持,连续三年联合投资了380万美元(5
    的头像 发表于 06-02 16:20 655次阅读

    新加坡国立大学(NUS)理学院:研发新型光场传感器 可助力自动驾驶汽车

    传感新品 【新加坡国立大学(NUS)理学院:研发新型光场传感器 可助力自动驾驶汽车】 据外媒报道,新加坡国立大学(NUS)理学院的一个研究团队在化学系教授 Liu Xiaogang 的
    的头像 发表于 05-16 08:41 423次阅读