0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

跨图像关系型KD方法语义分割任务-CIRKD

科技绿洲 来源:地平线HorizonRobotics 作者:地平线HorizonRobot 2022-05-10 11:30 次阅读

语义分割任务作为计算机视觉中的基础任务之一,其目的是对图像中的每一个像素进行分类。该任务也被广泛应用于实践,例如自动驾驶和医学图像分割。现有流行的用于语义分割任务的模型,例如DeepLab和PSPNet系列,虽然获得了很好的分割精度,但是所需的算力成本较高。本文考虑使用知识蒸馏(Knowledge Distillation,KD)算法来缓解这个问题。KD作为模型压缩里的一项重要技术,其核心思想是将教师模型中学习的知识作为监督信号来训练学生模型,使得学生模型得到更好的性能。虽然现有的语义分割知识蒸馏方法能够对学生网络的性能进行提升,但是这些方法通常是从单张图像中提取知识,忽略了跨图像之间的关系信息也是一种有价值的知识。

最近,地平线-中科院提出了一种新颖的跨图像关系型KD方法用于语义分割任务-CIRKD。该方法尝试在语义分割任务中建模pixel-to-pixel和pixel-to-region这两种对比关系作为KD的监督信号。本文主要从方法介绍以及实验结果对提出的CIRKD进行讲解。

KD作为一种思想已被广泛应用,尤其是图像分类任务。但是先前的工作表明直接将图像分类KD方法直接迁移到语义分割任务是不可行的,因为它们没有考虑到语义分割的结构化信息。一些经典的语义分割KD工作于是去尝试捕捉到一些上下文信息来建模结构化知识,比如pixel相似度,pixel与region向量的相似度关系,但是这些方法通常在单张图像内部进行信息提取,难以捕捉到更加广泛的上下文依赖。

于是,我们提出一种跨图像的知识蒸馏方法来建模图像间的依赖,从而使得网络能够捕捉到更加丰富的结构化信息。具体地,本工作建模数据集中的全部图像之间建模pixel-to-pixel以及pixel-to-region的对比关系作为知识。动机在于一个好的教师模型可以产生更好的全局pixel依赖以及特征空间。CIRKD引导学生模型去模仿教师网络产生的更好的结构化语义关系,因此提升了语义分割表现。

具体方法

本方法分别从mini-batch和memory的角度对结构化关系进行建模。

1. 基于mini-batch的pixel-to-pixel蒸馏

首先是在batch中建模关系,将图像产生的特征图在spatial维度上进行分离,产生pixel-wise的特征向量。针对某一个pixel点的特征向量作为锚样本,其他pixel点特征向量(包括当前图像和其他图像)作为对比样本,可以得到相似度矩阵。基于此方法,在教师端和学生端都可以产生对应的相似度矩阵,然后通过KL散度进行逼近,使得学生可以学到教师的相似度矩阵:

poYBAGJ525qAV7JAAAAy64ChKUc424.png

一个batch内的图像进行两两之间的关系矩阵求取和迁移:

poYBAGJ527CAAyFHAAA1Stteods108.png

整个过程的示意图如下所示:

pYYBAGJ528GAQjDoAAHaRgVd67I107.png

2. 基于memory的pixel-to-pixel蒸馏

相对于基于mini-batch的对比性关系求取,这里采用一个memory bank来存储对比向量,使得每一个锚样本都可以得到充足的对比样本。针对某一个pixel点的特征向量作为锚样本,每次训练随机从memory bank中采样大量的pixel特征向量来构造对比样本,通过相乘分别得到教师和学生的相似度矩阵:

poYBAGJ529OAE_USAAAgpjlUVbo449.png

使用KL散度的误差形式将教师和学生的pixel-to-pixel相似度矩阵进行对齐:

poYBAGJ52-GADE-EAAAujL9aVrM879.png

3. 基于memory的pixel-to-region蒸馏

离散化的pixel特征向量不能充分在捕捉到图像内容,因此本方法利用memory对region向量进行存储。region向量产生自对来自相同类别的pixel向量做一个平均。针对某一个pixel点的特征向量作为锚样本,每次训练随机从memory bank中采样大量的region特征向量来构造对比样本,通过相乘分别得到教师和学生的相似度矩阵:

poYBAGJ52_CAABezAAAizUQO_X0194.png

使用KL散度的误差形式将教师和学生的pixel-to-region相似度矩阵进行对齐:

poYBAGJ53BOAQU98AAAvFu0ENzY799.png

基于memory进行KD的整体示意图如下所示:

pYYBAGJ53COAEmR9AADeNdVcI4Q457.png

最终的训练误差则是将以上3部分误差相加在一起:

pYYBAGJ53E2ACKp9AAA1ksZPZzw949.png

实验结果

实验在流行的Cityscapes场景分割数据集上进行,相比于其他流行的语义分割KD方法,CIRKD获得了一致最佳的表现。

pYYBAGJ53FaAKb6LAAFvt4MBG6g082.png

在一些case study上进行可视化,本方法能够得到最好的分割表现。
审核编辑:彭静

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 数据
    +关注

    关注

    8

    文章

    6511

    浏览量

    87589
  • 存储
    +关注

    关注

    12

    文章

    3854

    浏览量

    84652
  • 地平线
    +关注

    关注

    0

    文章

    306

    浏览量

    14633
收藏 人收藏

    评论

    相关推荐

    目标检测和图像语义分割领域性能评价指标

    目标检测和图像语义分割领域的性能评价指标
    发表于 05-13 09:57

    van-自然和医学图像的深度语义分割:网络结构

    可以有效反应目标的位置信息。语义分割任务同时进行语义识别和目标定位。作者提出的层连接结构(skip architecture),将低层的目
    发表于 12-28 11:03

    van-自然和医学图像的深度语义分割:网络结构

    可以有效反应目标的位置信息。语义分割任务同时进行语义识别和目标定位。作者提出的层连接结构(skip architecture),将低层的目
    发表于 12-28 11:06

    图像分割的基本方法解析

    本文详细介绍了图像分割的基本方法有:基于边缘的图像分割方法、阈值
    发表于 12-20 11:06 10.8w次阅读
    <b class='flag-5'>图像</b><b class='flag-5'>分割</b>的基本<b class='flag-5'>方法</b>解析

    基于内容的图像分割方法综述

    方法、基于像素聚类的方法语义分割方法这3种类型并分别加以介绍对每类方法所包含的典型算法,尤其
    发表于 01-02 16:52 2次下载
    基于内容的<b class='flag-5'>图像</b><b class='flag-5'>分割</b><b class='flag-5'>方法</b>综述

    聚焦语义分割任务,如何用卷积神经网络处理语义图像分割

    CNN架构图像语义分割 图像分割是根据图像内容对指定区域进行标记的计算机视觉
    发表于 09-17 15:21 442次阅读

    语义分割算法系统介绍

    图像语义分割图像处理和是机器视觉技术中关于图像理解的重要任务
    的头像 发表于 11-05 10:34 4729次阅读

    分析总结基于深度神经网络的图像语义分割方法

    随着深度学习技术的快速发展及其在语义分割领域的广泛应用,语义分割效果得到显著提升。对基于深度神经网络的图像
    发表于 03-19 14:14 21次下载
    分析总结基于深度神经网络的<b class='flag-5'>图像</b><b class='flag-5'>语义</b><b class='flag-5'>分割</b><b class='flag-5'>方法</b>

    基于深度神经网络的图像语义分割方法

    对应用于图像语义分割的几种深度神经网络模型进行简单介绍,接着详细阐述了现有主流的基于深度神经网络的图像语义
    发表于 04-02 13:59 11次下载
    基于深度神经网络的<b class='flag-5'>图像</b><b class='flag-5'>语义</b><b class='flag-5'>分割</b><b class='flag-5'>方法</b>

    基于SEGNET模型的图像语义分割方法

    使用原始 SEGNET模型对图像进行语义分割时,未对图像中相邻像素点间的关系进行考虑,导致同一目标中像素点类别预测结果不一致。通过在 SEG
    发表于 05-27 14:54 15次下载

    图像语义分割的概念与原理以及常用的方法

    (Graph partitioning segmentation methods),在深度学习(Deep learning, DL)“一统江湖”之前,图像语义分割方面的工作可谓“百花齐放”。
    的头像 发表于 04-20 10:01 2335次阅读

    语义分割数据集:从理论到实践

    语义分割是计算机视觉领域中的一个重要问题,它的目标是将图像或视频中的语义信息(如人、物、场景等)从背景中分离出来,以便于进行目标检测、识别和分类等
    的头像 发表于 04-23 16:45 523次阅读

    语义分割标注:从认知到实践

    随着人工智能技术的不断发展,语义分割标注已经成为计算机视觉领域的一个热门话题。语义分割是指将图像中的每个像素分配给一个预定义的
    的头像 发表于 04-30 21:20 767次阅读

    AI算法说-图像分割

    语义分割是区分同类物体的分割任务,实例分割是区分不同实例的分割
    的头像 发表于 05-17 14:44 876次阅读
    AI算法说-<b class='flag-5'>图像</b><b class='flag-5'>分割</b>

    PyTorch教程-14.9. 语义分割和数据集

    在 SageMaker Studio Lab 中打开笔记本 在 第 14.3 节-第 14.8 节讨论对象检测任务时,矩形边界框用于标记和预测图像中的对象。本节将讨论语义分割问题,
    的头像 发表于 06-05 15:44 412次阅读
    PyTorch教程-14.9. <b class='flag-5'>语义</b><b class='flag-5'>分割</b>和数据集