0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

使用自适应条形采样和双分支Transformer的DA-Net

jf_pmFSk4VX 来源:GiantPandaCV 作者:GiantPandaCV 2022-10-31 14:41 次阅读

文章目录

前言

概述

网络简介

DBTM:Local Patches Meet Global Context

ASUB block

实验

讨论

前言

这是 MICCAI 2022 上的第三篇阅读笔记了,之前两篇也都可以在 GiantPandaCV 公众号搜索到。如下图所示,目前的视网膜血管分割方法按照输入数据划分有两类:image-level 和 patches-level,每一种方法都有自己的优势,如何将两者结合起来是一个需要去解决的问题,这也是 DA-Net 这篇文章的贡献之一。此外,这篇文章还提出了一个自适应的条状 Upsampling Block,我们会在后面展开介绍。

概述

目前的视网膜血管分割方法根据输入类型大致分为 image-level 和 patches-level 方法,为了从这两种输入形式中受益,这篇文章引入了一个双分支 Transformer 模块,被叫做 DBTM,它可以同时利用 patches-level 的本地信息和 image-level 的全局上下文信息。视网膜血管跨度长、细且呈条状分布,传统的方形卷积核表现不佳,也是为了更好地捕获这部分的上下文信息,进一步设计了一个自适应条状 Upsampling Block,被叫做 ASUB,以适应视网膜血管的条状分布。

网络简介

下图是 DA-Net 的整体结构。共享 encoder 包含五个卷积块,DBTM 在 encoder 之后,最后是带 ASUB 的 decoder。首先,原眼底图像很常规的被分成 N^2 个 patches,N 为 patch 的大小,除此之外,将原眼底图像也下采样 N 倍,但是不做裁剪。将它们一起送入共享 encoder,分别得到相应的特征图 F(i) 和 F′,这里的共享指的是两个 encoder 分支的权重共享(那么你可以把它简单理解为用同一个卷积核扫描 N^1+1 个 patches,只不过其中 1 这个 patch 是完整的图像),两个分支可以通过合并批次并行操作,这意味着输入图像的编码可以在一次推理中完成,无需增加额外的参数和时间消耗。随后,这两个分支的输出通过 DBTM 进行通信,DBTM 可以向每个补丁广播长距离的全局信息。U 型网络中间还有普通的跨层连接,最后,再通过 ASUB 的 decoder后,得到预测的分割结果。

5219b27e-58d5-11ed-a3b6-dac502259ad0.png请添加图片描述

DBTM:Local Patches Meet Global Context

下面两部分,我们分别对 DBTM 和 AUSB block 展开介绍。

首先,将经过 flatten 和投影的特征图 F(i) 和 F′ 作为输入 tokens ,其中加入训练过的 position embeddings 以保留位置信息。然后,如下图所示,输入 tokens 被送入 Transformer Layer。不同的是,设计了一个特殊的 self-then-cross 的 pipeline,将两个分支的输入混合起来,称为双分支 Transformer 模块(看网络简介中的图)。第一个 Transformer Layer 作为 Q,第二个 Transformer Layer 作为 K 和 V。具体来说,首先,这两个分支的输入标记分别用自注意机制模拟 image-level 和 patches-level 的长距离依赖。然后,交叉注意机制被用于两个分支的 tokens 之间的通信。在交叉注意机制中,将 patches-level 的标记表示为查询 Q, image-level 分支的标记表示为下图中多头自我注意(MSA)层的键 Q 值 V。整体设计是很简单的,实现了”Local Patches Meet Global Context“。52423302-58d5-11ed-a3b6-dac502259ad0.png

ASUB block

视网膜血管的一些固有特征导致了其分割困难,比如视网膜血管的分支很细,边界很难区分,而且视网膜血管之间的关系很复杂。在这些情况下,视网膜血管周围的背景信息对视网膜血管的分割至关重要。如下图所示,传统的方形卷积核在正常的上采样块中不能很好地捕捉线性特征,并且不可避免地引入了来自邻近的不相关信息。为了更好地收集视网膜血管周围的背景信息,提出了 Adaptive Strip Upsampling Block(ASUB),它适合于长而细的视网膜血管分布。

525a3628-58d5-11ed-a3b6-dac502259ad0.png请添加图片描述

粗略看一下,在 (c) 中,一共有四种类型的条状卷积核,捕捉水平(S1)、垂直(S2)、左对角线(S3)和右对角线(S4)方向上的信息。接下来,我们仔细分析下 ASUB 的思路,首先,使用一个 1×1 的 Conv 来将特征图的维度减半,以减少计算成本。然后,利用四个带状卷积来捕捉来自不同方向的上下文信息。此外,做全局平均池化(GAP)来获得通道维度的特征图。在特征图的通道维度上获得特征向量,并使用全连接层来学习每个带状卷积的通道方向的注意立向量。之后,应用万能的 softmax 来产生通道融合权重Wi , i∈{1, 2, 3, 4}。最后,我们用学到的自适应权重对每个带状卷积 Fi 的输出进行加权,得到特征图,特征图是 4 个 Fi*Wi 求和。最后用 1×1 的 Conv 恢复维度,得到最终输出 Foutput。同时,这部分是会增加网络学习负担的。

5324e116-58d5-11ed-a3b6-dac502259ad0.png请添加图片描述

实验

首先是和其他 SOTA 方法的比较,包括 image-level 和 patches-level 两种,如下表。53560160-58d5-11ed-a3b6-dac502259ad0.png

接下来是消融实验的部分,其中的 Baseline 指 U-Net。注意到,FLOPs 和 参数量的增加是可以接受的。5378661a-58d5-11ed-a3b6-dac502259ad0.png

讨论

其实 ASUB 设置的条形采样方向也不一定与一些小血管的方向完全一致,这是可以进一步改进的地方。比如说尝试可变形卷积(Deformable ConvNetsV2)的方式。

审核编辑:彭静
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 数据
    +关注

    关注

    8

    文章

    6514

    浏览量

    87610
  • 编码
    +关注

    关注

    6

    文章

    835

    浏览量

    54458
  • 卷积
    +关注

    关注

    0

    文章

    95

    浏览量

    18412
  • Transformer
    +关注

    关注

    0

    文章

    130

    浏览量

    5899

原文标题:MICCAI 2022:使用自适应条形采样和双分支 Transformer 的 DA-Net

文章出处:【微信号:GiantPandaCV,微信公众号:GiantPandaCV】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    自适应天线原理_石镇

        自适应天线原理_石镇第一章传统天线第二章预备知识第三章主波束自适应控制  &
    发表于 06-16 17:25

    基于AccelDSP的自适应滤波器设计

    【作者】:袁江南;汤碧玉;陈辉煌;【来源】:《厦门大学学报(自然科学版)》2010年02期【摘要】:给出了一种自适应滤波器的设计和FPGA的实现方法.简要分析了最小均方误差(LMS)、归一化最小均方
    发表于 04-24 09:01

    自适应数字传感器设计

    信号,这样会使测试结果的分析造成偏差。自适应数字传感器在选择高量程加速度传感器的条件下,能够根据加速度信号的幅值自动调整测试增益,保持加速度信号的完整输出,拓宽了动态测试范围,实现了加速度传感器测量
    发表于 11-08 16:23

    双向同步自适应时钟技术

    会在工作时随之变化,从而保证传输数据能够随时被仿真器正确同步并采样。1.2 研究背景目前自适应时钟技术主要用于嵌入式处理器芯片的在线仿真器(In-Circuit Emulator,ICE),简称仿真器
    发表于 05-21 05:00

    如何提高自适应均衡器的性能?

    自适应电缆均衡器是什么?自适应均衡器设计面临哪些技术挑战?如何提高自适应均衡器的性能?
    发表于 05-18 06:04

    如何实现自适应测频?

    如何实现自适应测频?
    发表于 11-29 07:42

    自适应滤波器的相关资料推荐

    本题拟采用实时采样的方式来进行自适应滤波。学过数字信号处理都知道,频率分辨率是采样率除以采样点数,而这道题提高部分要求10Hz的分辨率,经过前期的分析,我们采用
    发表于 02-09 07:29

    自适应控制试题

    自适应控制理论试题
    发表于 08-21 12:41

    LabVIEW开发自适应降噪ANC

    LabVIEW开发自适应降噪ANC 在许多情况下,信号很嘈杂,必须消除噪声。自适应降噪(ANC)是可用于消除信号噪声的主要实时方法之一。可以使用LabVIEW自适应滤滤器工具包来设计ANC应用程序
    发表于 11-30 19:38

    一种新的结合非下采样Contourlet与自适应全变差的图像

    该文提出了一种新的结合非下采样Contourlet 变换(NSCT)和自适应全变差模型的图像去噪方法。首先通过NSCT 对含噪图像进行分解,根据高斯比例混合(GSM)模型建立图像模型;然后利用贝
    发表于 02-09 11:26 13次下载

    基于交互式多模型粒子滤波的相控阵雷达自适应采样

    为有效合理利用雷达资源和解决雷达测量值与运动状态间的非线性关系以及目标状态本身可能出现的非线性,提出了一种基于交互式多模型粒子滤波(IMMPF)的相控阵雷达自适应采样
    发表于 03-31 11:06 34次下载

    宽动态范围自适应采样率数据采集系统设计

    宽动态范围自适应采样率数据采集系统设计
    发表于 01-07 21:24 30次下载

    自适应的弱选择压缩采样匹配追踪算法

    针对实际中未知稀疏度信号的重建问题,提出了一种自适应的弱选择压缩采样匹配追踪算法.该算法将自适应思想、弱选择思想与CoSaMP算法相结合,在预选阶段后利用限制性弱选择策略对候选集进行二次筛选,通过
    发表于 11-10 09:55 3次下载

    视频压缩感知自适应改进

    线性动态系统的视频压缩感知( CS-LDS)是指从随机采样数据中直接估计出模型参数,然而对所有视频帧采取同样的采样方式,使得采样数据存在一定的时间冗余。针对这一问题,结合自适应压缩
    发表于 01-22 15:56 1次下载
    视频压缩感知<b class='flag-5'>自适应</b>改进

    什么是自适应控制_自适应控制基本原理

    自适应控制包括模型参考自适应控制和自校正控制两个分支。前者是20世纪50年代建立起来的,它是通过自适应机构来克服系统模型参数的不确定性;后者是瑞典学者Astrom1973年提出的,它是
    发表于 03-27 09:35 5.5w次阅读