0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

TPAMI 2023 | 用于视觉识别的相互对比学习在线知识蒸馏

智能感知与物联网技术研究所 来源:未知 2023-09-19 10:00 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

本次文章介绍我们于 TPAMI-2023 发表的一项用于视觉识别的相互对比学习在线知识蒸馏(Online Knowledge Distillation via Mutual Contrastive Learning for Visual Recognition)工作,该工作是我们发表在 AAAI-2022 论文 Mutual contrastive learning for visual representation learning [1] 的扩展版本,论文讲解链接为:

https://zhuanlan.zhihu.com/p/574701719 摘要:无需教师的在线知识蒸馏联合地训练多个学生模型并且相互地蒸馏知识。虽然现有的在线知识蒸馏方法获得了很好的性能,但是这些方法通常关注类别概率作为核心知识类型,忽略了有价值的特征表达信息。 本文展示了一个相互对比学习(Mutual Contrastive Learning,MCL)框架用于在线知识蒸馏。MCL 的核心思想是在一个网络群体中利用在线的方式进行对比分布的交互和迁移。MCL 可以聚合跨网络的嵌入向量信息,同时最大化两个网络互信息的下界。这种做法可以使得每一个网络可以从其他网络中学习到额外的对比知识,从而有利于学习到更好的特征表达,提升视觉识别任务的性能。 相比于会议版本,期刊版本将 MCL 扩展到中间特征层并且使用元优化来训练自适应的层匹配机制。除了最后一层,MCL 也在中间层进行特征对比学习,因此新方法命名为 Layer-wise MCL(L-MCL)。在图像分类和其他视觉识别任务上展示了 L-MCL 相比于先进在线知识蒸馏方法获得了一致的提升。此优势表明了 L-MCL 引导网络产生了更好的特征表达。wKgZomUKAUeABfUfAAJfiDQnJmM755.png

论文地址:

https://arxiv.org/pdf/2207.11518.pdf

代码地址:

https://github.com/winycg/L-MCL

wKgZomUKAUeAboOzAAAl6LOgh3c565.png

引言

传统的离线知识蒸馏需要预训练的教师模型对学生模型进行监督。在线知识蒸馏在无需教师的情况下同时联合训练两个以上的学生模型。深度相互学习(Deep Mutual Learning,DML)[2]表明了模型群体可以从相互学习类别概率分布(图像分类任务最后的输出预测)中获益。每一个模型在同伴教授的模式下相比传统的单独训练效果更好。 现有的在线知识蒸馏方法通常仅仅关注结果驱动的蒸馏,但是忽略了在线蒸馏特征方面的应用。虽然先前的 AFD [3]尝试通过在线的方式在多个网络间对齐中间特征图,Zhang 等人[2]指出这种做法会减少群体多样性,降低相互学习能力。为了学习更有意义的特征嵌入,我们认为一个更好的方式是从视觉表征学习角度的对比学习。

wKgaomUOseuAHCKqAAM2USl54_8152.png

▲ 图1. 相互对比学习基本思想示意图 图中, 分别表示两个不同的网络, 是推理来自网络 和输入样本 产生的特征向量。虚线和箭头代表要逼近或者远离的方向。从图中可以看出,MCL 包含了朴素对比学习(Vanilla Contrastive Learning,VCL)和交互式对比学习(Interactive Contrastive Learning,ICL)。 相比于传统的 VCL,提出的 ICL 从两个不同网络间建模对比相似度分布。本文证明 ICL 的误差函数等价于最大化两个网络互信息的下界,这可以被理解为一个网络可以学习到另外网络额外的知识。 MCL 主要是发表于 AAAI-2022 的方法,期刊版本将 MCL 从卷积网络的最后一层扩展到多个模型的中间特征层,命名为 Layer-wise MCL。此外,传统的中间特征层蒸馏使用手工的匹配,本文则提出一个自适应的层匹配机制,然后通过元优化来训练该机制。

wKgZomUKAUiAUx54AAAuhh9-KLM583.png

方法

2.1. 相互对比学习MCL(AAAI-2022)

wKgaomUOsneANvyiAANja2j-FVo357.png

▲ 图2. 相互对比学习整体示意图

2.1.1 传统对比学习(Vanilla Contrastive Learning,VCL) 为了便于描述,本方法将 anchor 样本向量表示为 , 正样本向量表示为 个负样本向量表达 表示向量产生自网络 。这里,特征向量通过 标准化进行预处理。使用基于 InfoNCE 的交叉熵作为对比误差:wKgZomUKAUiAfLcVAABApOxJsHE674.png  对于总共 个网络来说,所有的对比误差表示为:

wKgZomUKAUiAKCIQAAArDByt5ss241.png

2.1.2 交互式对比学习(Interactive Contrastive Learning,ICL) VCL 不能建模跨网络的关系来进行联合学习,因为对比分布来自于网络自身的嵌入空间。ICL 的 anchor 样本与对比样本产生自不同的网络,但在误差形式上依旧与传统的对比学习误差相同:

wKgZomUKAUmAeXmWAABDzUNsmsE873.png

对于总共 个网络来说,所有的对比误差表示为:wKgZomUKAUmAHottAAA6ziYm6K4293.png理论分析: 相比于误差 ,最小化 等价于最大化网络 互信息 的下界:

wKgZomUKAUmAJPTeAAAyml4f5m0589.png

直觉上,当来自 的 anchor 特征向量已知时,互信息 衡量了来自 对比特征向量的不确定性,这可以理解为每一个网络可以从其他网络中学习到对比知识,从而更有利于表征学习。

2.1.3 基于在线相互迁移的软对比学习 收到深度相互学习(Deep Mutual Learning,DML)[1] 的启发,本方法利用 KL 散度来对齐网络间的对比分布,根据本文提出的两种对比学习方法 VCL 和 ICL 来进行对比分布的双向迁移:

2.1.3.1 Soft VCL: 对于产生 的分布 来说,其监督信号是其他网络产生的分利用 KL 散度使得 与其他分布接近:

wKgZomUKAUmATx-zAAA3kjsNkMY187.png

2.1.3.2 Soft ICL 给定两个网络 ,可以得到两个ICL对应的对比分布 ,使用 KL 散度的形式使得两个分布尽可能接近。对于 个网络来说,每两个网络进行对比分布的迁移:

wKgZomUKAUmARWnNAAA9miXxmxg021.png

2.1.4 MCL的整体误差 为了尽可能利用联合学习的优势,本方法将所有的对比误差项作为一个整体的误差训练 个网络:

wKgZomUKAUmAUCrKAABBz-kLkaA478.png

2.2 逐层的相互对比学习(Layer-wise MCL)

wKgZomUOspuAVn9JAAFqZvww3EU238.png

▲ 图3. 一对一匹配和加权的多对多匹配示意图 2.2.1 基础框架 给定网络群每一个网络具有 个阶段,原始的 MCL 在最后的特征嵌进行学习。Layer-wise MCL(L-MCL)进一步扩展相互对比学习到中间特征层和最后特征层,并且采用跨层的方式。wKgZomUKAUqAFi2ZAAA-leMt4VM032.png下一个章节,本文展示如何利用元网络 来优化匹配权重

2.2.2 训练元网络 2.2.2.1 交叉熵任务误差 使用交叉熵误差训练 个网络:wKgZomUKAUqAcww5AABCUHA4NyM973.png  将基础的任务误差和 L-MCL 误差相加作为总误差来进行特征层面的在线蒸馏误差:

wKgZomUKAUqAcLFWAABDIeiIkp4346.png

2.2.2.2 元优化 受到元学习的启发,本文采用交替优化的方式来训练学生网络和元网络: (1)更新 次最小化 (2)更新 来一次最小化 (3)衡量 并且更新 来最小化它。

2.2.2.3 元网络 结构元网络包含了两个线性转换 来对输入的特征向量 进行转换。转换之后,特征向量通过 正则化 来进行标准化。受到自注意力机制的启发,本文利用点乘得到匹配特征的相似性,从而衡量匹配层的相关性,然后引入 sigmoid 激活函数 来将输出值缩放到 作为层匹配权重 。整体的过程被规则化为:

wKgZomUKAUqAdFh7AABLnhROiyo613.png

wKgZomUKAUuAAB5HAAAtJ0fTuoM713.png

实验

在 ImageNet 上的实验结果如下所示,表 1 和表 2 分别展示了两个同构和异构网络利用相互对比学习的实验结果。

wKgZomUKAUuAIbuWAAUoQv-V7W8394.png

▲ 表1. 两个同构网络利用相互对比学习的实验结果wKgZomUKAUuAWyzaAAct8aoAeQw188.png▲表2. 两个异构网络利用相互对比学习的实验结果 实验结果表明本文提出的 L-MCL 相比于 baseline 以及先前流行的在线知识蒸馏方法都获得了显著的性能提升,表明在多个网络之间使用特征层面的对比学习蒸馏相比概率分布效果更好。在下游的目标检测和实例分割实验上表明了该方法相比先前的蒸馏方法引导网络学习到了更好的视觉表征,从而提升了视觉识别效果。

wKgZomUKAUyABytXAAD3uYhd4hI895.png

▲ 表3. 通过在线蒸馏的预训练网络迁移到下游的目标检测和与实例分割的实验

wKgZomUKAUyAHFsxAAAC0jQz1zo003.jpg

参考文献

wKgZomUKAUyAHFsxAAAC0jQz1zo003.jpg  [1] Yang C, An Z, Cai L, et al. Mutual contrastive learning for visual representation learning[C]//Proceedings of the AAAI Conference on Artificial Intelligence. 2022, 36(3): 3045-3053.[2] Zhang Y, Xiang T, Hospedales T M, et al. Deep mutual learning[C]//Proceedings of the IEEE conference on computer vision and pattern recognition. 2018: 4320-4328.[3] Chung I, Park S U, Kim J, et al. Feature-map-level online adversarial knowledge distillation[C]//International Conference on Machine Learning. PMLR, 2020: 2006-2015. ·


原文标题:TPAMI 2023 | 用于视觉识别的相互对比学习在线知识蒸馏

文章出处:【微信公众号:智能感知与物联网技术研究所】欢迎添加关注!文章转载请注明出处。


声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 物联网
    +关注

    关注

    2939

    文章

    47314

    浏览量

    407581

原文标题:TPAMI 2023 | 用于视觉识别的相互对比学习在线知识蒸馏

文章出处:【微信号:tyutcsplab,微信公众号:智能感知与物联网技术研究所】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    电能质量在线监测装置是如何实现对电压中断事件的识别的

    电能质量在线监测装置对电压中断事件的识别,是基于 **“国标定义 + 高保真采样 + 实时计算 + 多维度验证”** 的闭环技术体系,核心目标是 “无漏判、无误判”,精准捕捉符合 GB/T
    的头像 发表于 11-27 16:32 877次阅读
    电能质量<b class='flag-5'>在线</b>监测装置是如何实现对电压中断事件的<b class='flag-5'>识别的</b>?

    如何深度学习机器视觉的应用场景

    深度学习视觉应用场景大全 工业制造领域 复杂缺陷检测:处理传统算法难以描述的非标准化缺陷模式 非标产品分类:对形状、颜色、纹理多变的产品进行智能分类 外观质量评估:基于学习的外观质量标准判定 精密
    的头像 发表于 11-27 10:19 43次阅读

    UV紫外相机在工业视觉检测中的应用

    UV紫外相机通过捕捉紫外信号和激发荧光反应,解决常规相机无法识别的隐形缺陷和标记,广泛应用于工业视觉检测。
    的头像 发表于 10-21 09:45 165次阅读

    iTOF技术,多样化的3D视觉应用

    (CMOS)产品项目利用其在传统TOF(CCD)技术方面的专业知识,目标是在2023年12月之前量产。基于客户样本验证的初步反馈和沟通表明,与同类产品相比,这两项指标的表现均具有优异性,增强了我们对其
    发表于 09-05 07:24

    基于LockAI视觉识别模块:C++人脸识别

    基本知识讲解 1.1 人脸识别简介 人脸识别是一种利用人的脸部特征进行身份识别的生物识别技术。它通过检测图像或视频中的人脸,提取如眼睛、鼻
    发表于 07-01 12:01

    基于LockAI视觉识别模块:C++人脸识别

    本文基于RV1106做成的LockAI视觉识别模块,采用LZ-Picodet模型训练的人脸检测模型LZ-Face,以及ArcFace人脸识别模型,实现人脸识别系统。
    的头像 发表于 07-01 10:09 505次阅读
    基于LockAI<b class='flag-5'>视觉</b><b class='flag-5'>识别</b>模块:C++人脸<b class='flag-5'>识别</b>

    基于LockAI视觉识别模块:手写数字识别

    1.1 手写数字识别简介 手写数字识别是一种利用计算机视觉和机器学习技术自动识别手写数字的过程。它通过图像预处理、特征提取和模型训练来实现
    发表于 06-30 16:45

    基于LockAI视觉识别模块:手写数字识别

    手写数字识别是一种经典的模式识别和图像处理问题,旨在通过计算机自动识别用户手写的数字。本文将教会你如何使用基于RV1106的LockAI视觉识别
    的头像 发表于 06-30 15:44 844次阅读
    基于LockAI<b class='flag-5'>视觉</b><b class='flag-5'>识别</b>模块:手写数字<b class='flag-5'>识别</b>

    基于LockAI视觉识别模块:C++条码识别

    条码识别视觉模块经常使用到的功能之一,经常用于识别超市的货物信息。本文我们将演示如何基于瑞芯微RV1106的LockAI视觉
    发表于 05-27 10:26

    基于LockAI视觉识别模块:C++条码识别

    条码识别视觉模块经常使用到的功能之一,经常用于识别超市的货物信息。本文我们将演示如何基于瑞芯微RV1106的LockAI视觉
    的头像 发表于 05-27 09:32 509次阅读
    基于LockAI<b class='flag-5'>视觉</b><b class='flag-5'>识别</b>模块:C++条码<b class='flag-5'>识别</b>

    基于LockAI视觉识别模块:C++同时识别轮廓和色块

    1.项目简介1.1色块识别的重要性颜色特征提取:颜色是一种重要的视觉特征,尤其在背景较为单一的情况下,能够快速区分目标区域。应用场景:广泛应用于机器人导航、工业自动化、物体跟踪等领域。HSV颜色空间
    的头像 发表于 05-23 16:41 722次阅读
    基于LockAI<b class='flag-5'>视觉</b><b class='flag-5'>识别</b>模块:C++同时<b class='flag-5'>识别</b>轮廓和色块

    【「# ROS 2智能机器人开发实践」阅读体验】视觉实现的基础算法的应用

    部署,详细介绍了基于颜色阈值和深度学习的巡线方法。 二维码识别则广泛应用于机器人定位与任务触发,例如AGV(自动导引车)的路径规划。 深度学习在机器人
    发表于 05-03 19:41

    基于LockAI视觉识别模块:C++图像采集例程

    本文主要演示如何使用LockAI视觉识别模块进行视频流的读取,同时使用Edit模块进行图像传输。基础知识讲解1.1OpenCV简介OpenCV(OpenSourceComputerVisionLibra
    的头像 发表于 04-30 18:23 549次阅读
    基于LockAI<b class='flag-5'>视觉</b><b class='flag-5'>识别</b>模块:C++图像采集例程

    大连理工提出基于Wasserstein距离(WD)的知识蒸馏方法

    的机制,应用于中间层蒸馏时存在问题,其无法处理不重叠的分布且无法感知底层流形的几何结构。 为了解决这些问题,大连理工大学的研究人员提出了一种基于 Wasserstein 距离(WD)的知识蒸馏
    的头像 发表于 01-21 09:45 1001次阅读

    开源项目 ! 利用边缘计算打造便携式视觉识别系统

    扩展地构建这些系统。 边缘计算平台应运而生 —— 它是实现超快速、低延迟视觉识别的秘诀所在。通过在本地处理数据,边缘计算大幅削减了传输延迟,实现了实时响应,并提高了计算效率。对于那些分秒必争的应用场
    发表于 12-16 16:31