0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

动态蛇形卷积(Dynamic Snake Convolution)用于管状结构分割

智能感知与物联网技术研究所 来源:未知 2023-07-30 22:35 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

65b6c6be-2ee5-11ee-815d-dac502259ad0.png

论文题目:Dynamic Snake Convolution based on Topological Geometric Constraints for Tubular Structure Segmentation

简介

管状结构(例如血管、道路)是临床、自然界等各领域场景中十分重要的一种结构,其的精确分割可以保证下游任务的准确性与效率。然而这并不是一个简单的任务,主要的挑战源于细长微弱的局部结构特征与复杂多变的全局形态特征。

本文关注到管状结构细长连续的特点,并利用这一信息在神经网络以下三个阶段同时增强感知:特征提取、特征融合损失约束。分别设计了动态蛇形卷积(Dynamic Snake Convolution),多视角特征融合策略与连续性拓扑约束损失。我们同时给出了基于 2D 和 3D 的方法设计,通过实验证明了本文所提出的 DSCNet 在管状结构分割任务上提供了更好的精度和连续性。

思考

在开始介绍工作之前,我想和读者讨论下在大模型时代下,专用分割方法的价值

随着 SAM(Segment Anything)[1]、Universal Model [2]等一众非常优秀的分割基础模型的提出,越来越多的分割目标只需要在大模型的基础上,直接测试或简单微调,就能够得到让人十分满意的结果。这不免让人感到迷茫,继续做专用分割工作是否还有价值?后续的研究方向是否是要去拼大模型?或者站在前人的肩膀上去研究如何将大模型微调到专用领域?

值得注意的是,仍存在一些复杂的领域,大模型还未能够很好的覆盖(也许只是时间问题)。例如伪装目标、非显著性目标,以及本文所关注的特殊管状结构(占比小、特征弱且分布广)等等。同时,当分割的对象上升到 3D 乃至 4D 的数据时,一些复杂的结构(3D 的血管、气管等)也困扰着大模型。当然,一些特殊的场景,需要非常高的精度,例如临床,1% 的误差对于诊断都有着非常大的危险。

因此,将专用模型与大模型相结合,会促进研究发展地更快、更好。大模型关注更多的是普适性,通用性和便捷性,在此基础上,大模型针对性地补充领域专有的特征信息,能够更加快捷地获得更高的精度。

挑战

65dd8772-2ee5-11ee-815d-dac502259ad0.png

▲ 图1. 上图:显示了三维心脏血管数据集和二维遥感道路数据集,这两个数据集都旨在提取管状结构,但由于脆弱的局部结构和复杂的全球形态,这项任务存在很多挑战。下图:标准卷积核旨在提取局部特征。在此基础上,可变形卷积核丰富其应用,并适应不同目标的几何形态,但针对细长的管状结构容易丢失关注

管状结构的精确提取仍然具有挑战:

细长且脆弱的局部结构。如图 1 所示,细长的结构仅占整个图像的一小部分,像素的组成有限。此外,这些结构容易受到复杂背景的干扰,因此模型很难精确分辨目标的细微变化,从而导致分割出现破碎与断裂。

复杂且多变的全局形态。图 1 显示了细长管状结构复杂多变的形态,即使在同一张图像中也是如此。位于不同区域的目标的形态变化取决于分支的数量、分叉的位置,路径长度以及其在图像中的位置。因此当数据表现出未曾见过的形态特征时,模型倾向于过拟合到已见过的特征,无法识别未见过的特征形态,从而导致泛化性较弱。

动机

受到 Deformable Convolution [3] 的启发,我们希望模型在学习特征的过程中,改变卷积核的形状,从而关注管状结构的核心结构特点。由此衍生出很多工作[4][5],并在视网膜血管的分割工作中得到了应用。然而在我们的初期实验中发现,由于管状结构所占比例较小,模型不可避免地失去对相应结构的感知,卷积核完全游离在目标以外。因此我们希望根据管状结构的特点来设计特定的网络结构,从而指导模型关注关键特征。

方法

665ae0f0-2ee5-11ee-815d-dac502259ad0.png

▲ 图2. 完整框架图

动态蛇形卷积核(DynamicSnakeConvolution,DSConv)

我们希望卷积核一方面能够自由地贴合结构学习特征,另一方面能够在约束条件下不偏离目标结构太远。在观察管状结构的细长连续的特征后,脑海里想到了一个动物——。我们希望卷积核能够像蛇一样动态地扭动,来贴合目标的结构。

我们观察一下形变卷积的操作核心 [3]

6666a700-2ee5-11ee-815d-dac502259ad0.png

▲ 图3. 可形变卷积中的偏置学习

我们会发现,操控单个卷积核形变的所有偏置(offset),是在网络中一次性全部学到的,并且阅读其核心代码会发现,对于这一个偏置只有一个范围的约束,即感受野范围(extend)。控制所有的卷积发生形变,是依赖于整个网络最终的损失约束回传,这个变化过程是相当自由的。

66902fee-2ee5-11ee-815d-dac502259ad0.png▲ 图4. 左图:DSConv 坐标的计算方法。右图:DSConv 的真实感受范围

完全的自由,容易让模型丢失占比小的细小结构特征,这对于细长管状结构分割任务来说,是一个巨大挑战。因此,如图 4 所示,我们以蛇来举例,蛇的连续移动,是其头带动身体,一节一节如同波浪一般。因此,我们将连续性约束加入卷积核的设计中。每一个卷积位置都由其前一个位置作为基准,自由选择摆动方向,从而在自由选择的同时确保感受的连续性。(具体的公式可以参考论文与代码)

这样的设计是否真的有用?我们进行了可视化验证:

670496c2-2ee5-11ee-815d-dac502259ad0.png

▲ 图5. 我们在每张图像上叠加 3 层的卷积核位置,共计 729 个点(红色),以显示给定点(黄色)的卷积核的位置和形状。底部:热图显示了每个卷积的感兴趣区域。

以 2D 的视网膜数据为例,无论血管的走向、粗细等,我们的蛇形卷积核确实能够更好地自适应到管状结构的细长结构,并且关注到核心特征。

多视角特征融合

6782817c-2ee5-11ee-815d-dac502259ad0.png

▲ 图6. 多视角特征融合策略

我们考虑到管状结构的走向与视角从来不是单一的,因此在设计中融合多视角特征也是必然的选择。然而,融合更多的特征带来的必然结果,就是更大的网络负载,且如此多的特征难免会出现冗余,因此我们在特征融合的训练过程中加入了分组随机丢弃的策略,一定程度上缓解了网络内内存的压力并避免模型陷入过拟合。

基于持续同调的拓扑连续损失(TCLoss)

67e2012e-2ee5-11ee-815d-dac502259ad0.png

▲ 图7. 基于持续同调的连续性拓扑约束

我们的目标是构建数据的拓扑结构,并提取复杂管状结构中的高维关系,也就是持续同源性(Persistence Homology, PH)。基于 PH 所设计的拓扑损失函数也有很多优秀的工作 [6][7] 已经采用,拓扑约束确实针对这类细长且占比小的结构非常有效,设计中所采用的推土机距离(Wasserstein Distance, WD)用来衡量点集的差异。简单描述,WD 用来衡量的是从一种离散分布,转变为另一种离散分布需要的代价。在 [6][7] 的方法中,利用这一算法来计算点与点的最佳匹配,点集中的离散点会被匹配到对角线(刚出现就消失的点聚集在对角线上),因此这些离散的点不会参与损失函数的计算与约束。

假设 PO 的上端存在着一个异常的离散点(横坐标表示出现的时间,纵坐标表示消失的时间),这表明存在一个构件直到最后才与其他构件获得连接从而消失。因此我们在本文中采用的是豪斯多夫距离(Hausdorff Distance, HD),HD 也是用于衡量点集相似度的一个重要算法,对离散点也非常敏感。

实验

文中,我们使用了三个数据集,包含两个公共数据集和一个内部数据来验证我们的方法。在 2D 中,我们评估了 DRIVE 视网膜数据集和 Massachusetts Roads 数据集。在 3D 中,我们使用了一个名为心脏 CCTA 数据的数据集(私有数据)。后续,我们也在 3D KIPA 公开数据上做了验证,并且正在致力于用该方法测试多组公开挑战赛数据集,实验结果会在后续逐步公布。

6802807a-2ee5-11ee-815d-dac502259ad0.png

▲图8. 可视化结果

从可视化结果可以发现,我们的方法确实对管状结构数据有着很好的分割效果,尤其是在遥感道路数据以及冠脉血管数据上。

68c2ade6-2ee5-11ee-815d-dac502259ad0.png

▲ 图9. 量化结果

总结

我们提出的框架针对细长管状结构进行了相应设计,并成功地将形态学特征与拓扑学知识融为一体,以共同指导模型自适应的分割。然而,其他形态学结构的目标是否也有类似的范式,并能够通过这一方法获得更好的性能仍然是一个有趣的话题。同时,我们也正在尝试将其进一步优化,能够作为基础大模型中的一个通用框架,为这类特征难以鉴别的结构提供一种可行的范式。


原文标题:动态蛇形卷积(Dynamic Snake Convolution)用于管状结构分割

文章出处:【微信公众号:智能感知与物联网技术研究所】欢迎添加关注!文章转载请注明出处。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 物联网
    +关注

    关注

    2939

    文章

    47338

    浏览量

    408177

原文标题:动态蛇形卷积(Dynamic Snake Convolution)用于管状结构分割

文章出处:【微信号:tyutcsplab,微信公众号:智能感知与物联网技术研究所】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    ‌深入解析TE Connectivity Dynamic Ultra连接器系统:技术特性与应用实践

    TE Connectivity (TE) Dynamic Ultra连接器系统是一款微型线对板互连系统,具有多个接触点,可在严苛的环境中实现可靠性能。该连接器系统除了用于电缆包装和压接的传统端子选项
    的头像 发表于 11-02 16:40 891次阅读
    ‌深入解析TE Connectivity <b class='flag-5'>Dynamic</b> Ultra连接器系统:技术特性与应用实践

    CNN卷积神经网络设计原理及在MCU200T上仿真测试

    CNN算法简介 我们硬件加速器的模型为Lenet-5的变型,网络粗略分共有7层,细分共有13层。包括卷积,最大池化层,激活层,扁平层,全连接层。下面是各层作用介绍: 卷积层:提取特征。“不全
    发表于 10-29 07:49

    卷积运算分析

    卷积运算的基础运算是乘加运算(MAC,Multiplication and Accumulation),本文设计了基本运算单元PE模块来实现MAC运算。对于卷积运算而言,一次性至少处理一个感受域规模
    发表于 10-28 07:31

    德州仪器Dynamic Z-Track算法的特性和优势

    本应用手册介绍了德州仪器 (TI) 电池电量监测算法的简短历史,说明了负载电流频繁、快速变化时电池电量监测计运行时的挑战,并详细介绍了应用于动态负载电流应用的 Dynamic Z-Track (IT-DZT) 算法的特性和优势。
    的头像 发表于 09-20 11:39 2691次阅读
    德州仪器<b class='flag-5'>Dynamic</b> Z-Track算法的特性和优势

    手机板 layout 走线跨分割问题

    初学习layout时,都在说信号线不可跨分割,但是在工作中为了成本不能跨分割似乎也非绝对。 在后续工作中,跨分割的基础都是相邻层有一面完整的GND参考,跨分割发生在相邻的另外一层。 但
    发表于 09-16 14:56

    慧能泰DPS动态电源参考方案

    USB-IF的ECN for USB Power Delivery Specification Revision 3.2 提出了DPS(Dynamic Power Sources动态电源)概念。本次
    的头像 发表于 08-15 14:38 1803次阅读
    慧能泰DPS<b class='flag-5'>动态</b>电源参考方案

    动态BGP与静态BGP的区别?

    BGP(边界网关协议,Border Gateway Protocol) 是互联网中用于自治系统(AS)之间路由信息交换的核心协议。在实际部署中,BGP 可分为静态 BGP和动态 BGP两种方式,二者
    发表于 06-24 06:57

    【正点原子STM32MP257开发板试用】基于 DeepLab 模型的图像分割

    是谷歌团队提出的一种用于语义分割的深度学习模型,属于 DeepLab 系列模型的第三代版本。它在图像语义分割任务中表现优异,能够高效地捕获图像的多尺度上下文信息,并生成高分辨率的分割
    发表于 06-21 21:11

    LASCAD应用:动态多模分析和调Q运转模拟

    的所有计算证实了DMA编码用于多模竞争的动态分析和Q开关都是一个非常好用的工具。该工具可以计算与时间相关一系列单个横模的相互作用,光束质量,激光输出功率,横模结构的强度分布,连续波和脉冲泵浦的脉冲外形,脉冲波峰强度等。因此它给激
    发表于 05-19 08:52

    如何使用MATLAB实现一维时间卷积网络

    本文对一维卷积操作进行介绍,包括一维扩展卷积和一维因果卷积,以及 MATLAB 对一维卷积的支持情况。在最后通过一个实例演示如何在 MATLAB 中将一维
    的头像 发表于 03-07 09:15 1701次阅读
    如何使用MATLAB实现一维时间<b class='flag-5'>卷积</b>网络

    BP神经网络与卷积神经网络的比较

    BP神经网络与卷积神经网络在多个方面存在显著差异,以下是对两者的比较: 一、结构特点 BP神经网络 : BP神经网络是一种多层的前馈神经网络,通常由输入层、隐藏层和输出层组成,其中隐藏层可以有一层或
    的头像 发表于 02-12 15:53 1328次阅读

    国地中心将推出人形机器人“Deep Snake”2.0版本

    国家地方共建人形机器人创新中心的具身智能训练场在上海浦东正式启用。在启用仪式上,国地中心首席科学家江磊宣布将推出人形机器人2.0版本“Deep Snake”。 江磊表示,人形机器人产业增长迅猛
    的头像 发表于 01-22 17:15 856次阅读

    TE Dynamic Ultra连接器产品亮点

    TE Connectivity(以下简称“TE”)Dynamic 系列一直是适用于电池管理系统的明星产品,能够为储能电池管理系统应用提供不同的小型化板载连接方案,同时确保高可靠性、坚固耐用,和高接插安全性。
    的头像 发表于 01-17 09:20 1127次阅读

    ATA-2041高压放大器在叉指形电极管状压电元件电极制备中的应用

    实验名称:叉指形电极管状压电元件电极制备与极化研究 测试目的:目前,已有学者对叉指形电极的管状压电元件进行了一系列研究,通过静力学方程完成理论推导,建立有限元分析模型,对该压电元件的静态驱动性能
    的头像 发表于 12-25 11:26 768次阅读
    ATA-2041高压放大器在叉指形电极<b class='flag-5'>管状</b>压电元件电极制备中的应用

    AI模型部署边缘设备的奇妙之旅:目标检测模型

    更多物体。与此同时,所有除了1 × 1 卷积外的卷积层都使用深度可分离卷积(Depthwise Separable Convolution)。深度可分离
    发表于 12-19 14:33