0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

微软亚研院提出用于语义分割的结构化知识蒸馏

电子工程师 来源:lp 2019-03-18 10:15 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

今天跟大家分享一篇关于语义分割的论文,刚刚上传到arXiv的CVPR 2019接收论文《Structured Knowledge Distillation for Semantic Segmentation》,通讯作者单位为微软亚洲研究院。

作者信息:

作者分别来自澳大利亚阿德莱德大学、微软亚洲研究院、北航、Keep公司、三星中国研究院,该文为第一作者Yifan Liu在微软亚洲研究院实习期间的工作。

该文研究了在语义分割模型的知识蒸馏中引入结构化信息的损失函数,在不改变模型计算量的情况下,使用该方法在Cityscapes数据集上mIoU精度取得了最高达15.17%的提升。

什么是知识蒸馏?

顾名思义,知识蒸馏是把知识浓缩到“小”网络模型中。一般情况下,在相同的数据上训练,模型参数量较大、计算量大的模型往往精度比较高,而用精度高、模型复杂度高的模型即Teacher网络的输出训练Student网络,以期达到使计算量小参数少的小网络精度提升的方法,就是知识蒸馏。

知识蒸馏的好处是显而易见的,使用知识蒸馏后的Student网络能够达到较高的精度,而且更有利于实际应用部署,尤其是在移动设备中。

下面两幅图中,作者展示了使用该文提出的结构化知识蒸馏的语义分割模型在计算量和参数量不变的情况下,精度获得了大幅提升。

算法原理

知识蒸馏的目标是希望对于Teacher网络和Student网络给定相同的图像,输出结果尽量一样。

所以,知识蒸馏的关键,是如何衡量Teacher网络和Student网络输出结果的一致性,也就是训练过程中的损失函数设计。

该文中作者将语义分割问题看为像素分类问题,所以很自然的可以使用衡量分类差异的逐像素(Pixel-wise)的损失函数Cross entropy loss,这是在最终的输出结果Score map中计算的。

同时作者引入了图像的结构化信息损失,如下图所示。

如何理解图像的结构化信息?一种很显然的结构化信息即图像中局部的一致性。在语义分割中,可以简单理解为,预测结果中存在的自相似性,作者衡量这种结构化信息的方式是Teacher预测的两像素结果和Student网络预测的两像素结果一致。衡量这种损失,作者称之为Pair-wise loss(也许可以翻译为“逐成对像素”损失)。

另一种更高层次的结构化信息是来自对图像整体结构相似性的度量,作者引入了对抗网络的思想,设计专门的网络分支分类Teacher网络和Student网络预测的结果,网络收敛的结果是该网络不能再区分Teacher网络和Student网络的输出。作者称这块损失函数为Holistic loss(整体损失)。

仔细想想,作者设计的损失函数的三部分,逐像素的损失(Pixel-wise loss,PI)、逐像素对的损失(Pair-wise loss,PA)、整体损失(Holistic loss,HO)都很有道理,是不是?

作者使用ResNet18网络模型在Cityscapes数据集上研究了作者提出的损失函数各部分对结果的影响。(ImN代表用ImageNet预训练模型初始化网络)

结果如下图。

可知,作者提出的损失函数的各个部分都能使得Student网络获得精度增益,最高达15.17%!CV君发现逐像素对的损失(Pair-wise loss,PA)获得的增益最大。

实验结果

作者使用多个轻量级网络模型,在三个主流语义分割数据库上进行了实验。

下图为在Cityscapes数据集上的结果,使用该文方法知识蒸馏后Student网络精度获得了大幅提升!

下图为一些预测结果示例,视觉效果上改进明显。

下图为在CamVid数据集上的结果,同样改进明显。

CamVid数据集上的Student网络预测示例,视觉上也好了很多。

下图为在ADE20K数据集上的实验结果,同样所有网络模型的精度都获得了大幅提升!

目前还未发现该文作者公布代码。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 微软
    +关注

    关注

    4

    文章

    6752

    浏览量

    108079
  • 函数
    +关注

    关注

    3

    文章

    4422

    浏览量

    67834
  • 数据集
    +关注

    关注

    4

    文章

    1240

    浏览量

    26261

原文标题:微软亚研院提出用于语义分割的结构化知识蒸馏 | CVPR 2019

文章出处:【微信号:rgznai100,微信公众号:rgznai100】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    润和软件与国网湖南经深化技术交流

    (以下简称“润启数智”)与国网湖南省电力有限公司经济技术研究(以下简称“国网湖南经”)围绕开源鸿蒙与AI技术开展专项技术交流活动。润和软件数字能源板块苏晓东及相关业务负责人、国网湖南经
    的头像 发表于 03-23 15:37 440次阅读

    蚂蚁集团全模态代码算法团队自OpAgent技术框架

    为应对真实 Web 环境的非结构化复杂性、时序不稳定性与交互隐式逻辑等挑战,蚂蚁集团全模态代码算法团队提出了一套结合了多任务微调、在线强化学习与模块协作的综合解决方案:OpAgent。
    的头像 发表于 03-18 17:13 995次阅读
    蚂蚁集团全模态代码算法团队自<b class='flag-5'>研</b>OpAgent技术框架

    线性编程与结构化编程的不同点

    线性编程是将整个用户程序连续放置在一个循环程序块(OB1)中,按顺序执行的编程范式。这种结构与PLC所代替的硬接线继电器控制类似,CPU逐条地处理指令,体现了早期PLC编程的简单性和直观性。说白了就是一条路走到黑,所有功能从上往下写。
    的头像 发表于 03-16 16:58 509次阅读
    线性<b class='flag-5'>化</b>编程与<b class='flag-5'>结构化</b>编程的不同点

    锂离子电池高性能负极结构化复合集流体综述

    结构化集流体通过精心的表面与体相结构设计,为上述问题提供了系统性解决方案。Flexfilm探针式台阶仪可以实现表面微观特征的精准表征与关键参数的定量测量,精确测
    的头像 发表于 02-04 18:03 2198次阅读
    锂离子电池高性能负极<b class='flag-5'>结构化</b>复合集流体综述

    大模型实战(SC171开发套件V3)2026版

    部署案例----基于广和通自FiboSeg语义分割模型 4分22秒 https://t.elecfans.com/v/28533.html *附件:文档:自模型部署案例----基于
    发表于 01-15 12:05

    AI功能(SC171开发套件V3)2026版

    分割(deeplabv3)案例----基于SC171开发套件V3 8分02秒 https://t.elecfans.com/v/28529.html *附件:文档:图像语义分割(deeplabv3
    发表于 01-15 11:18

    【NPU实战】在迅为RK3588上玩转YOLOv8:目标检测与语义分割一站式部署指南

    【NPU实战】在迅为RK3588上玩转YOLOv8:目标检测与语义分割一站式部署指南
    的头像 发表于 12-12 14:30 6398次阅读
    【NPU实战】在迅为RK3588上玩转YOLOv8:目标检测与<b class='flag-5'>语义</b><b class='flag-5'>分割</b>一站式部署指南

    结构化布线中使用电缆标签的4个主要优势

    在现代通信和网络基础设施建设中,结构化布线系统扮演着至关重要的角色。它不仅确保了网络的高效传输和稳定运行,还为未来的扩展和维护提供了便利。而在结构化布线中,电缆标签的使用虽看似是一个小小的细节,却能
    的头像 发表于 11-24 10:34 421次阅读

    导远科技与中国移动上深化合作

    近日,导远科技与中移(上海)信息通信科技有限公司(简称“上”)在湖南株洲举办的第四届北斗规模应用国际峰会上宣布深化合作。双方将联合打造适配多种移动机器人的“IMU+GNSS模组+RTK服务”一体高精度定位解决方案。
    的头像 发表于 10-09 11:31 935次阅读

    北京迅为itop-3588开发板NPU例程测试deeplabv3 语义分割

    北京迅为itop-3588开发板NPU例程测试deeplabv3 语义分割
    的头像 发表于 07-22 15:51 1136次阅读
    北京迅为itop-3588开发板NPU例程测试deeplabv3 <b class='flag-5'>语义</b><b class='flag-5'>分割</b>

    智能体AI面临非结构化数据难题:IBM推出解决方案

    ,同时提供一个开放的混合数据基础架构和企业级的结构化和非结构化数据管理。 智能体AI面临非结构化数据难题:IBM推出解决方案 测试结果显示,与传统RAG相比,IBM watsonx.data的AI准确性
    的头像 发表于 07-02 09:40 674次阅读

    ModbusRTU转EtherCAT网关:蒸馏装置通信提速方案

    装置作为化工过程中重要的分离设备,其稳定运行对整个生产过程至关重要。在这类装置中,Modbus RTU通常被用于连接传感器、执行器等传统现场设备。它采用串行通讯方式,具有结构简单、成本低廉的特点,但传输速率较低,且难以构建大规模的网络。
    的头像 发表于 06-26 18:29 453次阅读

    【正点原子STM32MP257开发板试用】基于 DeepLab 模型的图像分割

    是谷歌团队提出的一种用于语义分割的深度学习模型,属于 DeepLab 系列模型的第三代版本。它在图像语义
    发表于 06-21 21:11

    DDN携手NVIDIA释放非结构化数据的AI价值

    DDN 通过与 NVIDIA AI 数据平台的合作,推出联合解决方案,简化了企业对非结构化数据的存储、访问和激活方式,助力客户释放生成式 AI 的巨大商业潜能。DDN 全球合作伙伴负责人
    的头像 发表于 06-10 10:31 1068次阅读

    深控技术的不需要点表网关的隐藏价值:工程师离职不再等于知识流失

    深控技术推出的无点表工业网关,通过配置信息云端知识资产自动沉淀,将离散的工程师经验转化为结构化数字资产,重新定义了工业知识管理范式。
    的头像 发表于 04-24 11:36 615次阅读
    深控技术的不需要点表网关的隐藏价值:工程师离职不再等于<b class='flag-5'>知识</b>流失