0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

新型transformer模型实现3D医学图像分析最新基准

星星科技指导员 来源:NVIDIA 作者:NVIDIA 2022-08-15 15:01 次阅读

计算机视觉和模式识别会议( CVPR )上, NVIDIA 研究人员发表了 35 多篇论文。这包括对 移动窗口 UNEt TRansformers ( Swin-UNETR )的研究,这是第一个基于变压器的预训练框架,专为 3D 医学图像分析中的自我监督任务而设计。这项研究是创建用于数据注释的预训练、大规模和自监督三维模型的第一步。

作为一种基于 transformer 的计算机视觉方法, Swin UNETR 采用了 MONAI ,这是一种开源的 PyTorch 框架,用于深入学习医疗成像,包括放射学和病理学。使用这种预训练方案, Swin UNETR 为各种医学图像分割任务设定了新的最先进的基准,并一致证明了其有效性,即使只有少量的标记数据。

Swin UNETR 模型培训

Swin UNETR 模型在 NVIDIA DGX-1 集群 使用八个 GPUAdamW 优化算法。对 5050 张来自健康和不健康受试者不同身体部位的公开 CT 图像进行预训练,以保持数据集的平衡。

对于 3D Swin transformer 编码器的自我监督预训练,研究人员使用了各种借口任务。随机裁剪的标记使用不同的变换(如旋转和剪切)进行增强。这些标记用于掩蔽体修复、旋转和对比学习,用于编码器学习训练数据的上下文表示,而不会增加数据注释的负担。

pYYBAGL571-AKsH1AALchbVmfMI713.png

图 1 :。预培训框架概述。输入的 CT 图像被随机裁剪成子体积,并通过随机内部剪切和旋转进行增强,然后作为输入馈送到 Swin-UNETR 编码器

Swin UNETR 背后的技术

Swin Transformers 采用分层视觉 transformer ( ViT )进行非重叠窗口的局部自我注意计算。这打开了为大型公司创建医疗专用 ImageNet 的机会,消除了创建医疗 AI 模型需要大量高质量注释数据集的瓶颈。

与 CNN 体系结构相比, ViT 在从未标记数据(数据集越大,预训练主干越强)进行全局和局部表示的自监督学习方面表现出非凡的能力。用户可以在下游任务(例如,分割、分类和检测)中使用极少量的标记数据微调预训练模型。

这种体系结构在本地窗口中计算自我注意,与 ViT 相比表现出更好的性能。此外, Swin Transformers 的层次性使其非常适合需要多尺度建模的任务。

继领先的 UNETR 模型成功使用直接使用 3D 补丁嵌入的基于 ViT 的编码器之后, Swin UNETR 使用了具有金字塔结构的 3D Swin transformer 编码器。

在 Swin UNETR 的编码器中,由于计算简单的全局自我注意对于高分辨率特征地图是不可行的,因此在本地窗口中计算自我注意。为了增加局部窗口以外的感受野,使用窗口移位来计算不同窗口的区域相互作用。

Swin UNETR 的编码器通过跳过连接以五种不同的分辨率连接到剩余的类似 UNet 的解码器。它可以为密集的预测任务(如医学图像分割)捕获多尺度特征表示。

Swin UNETR 模型性能

在对 CT 中的 13 个腹部器官和 医学分段十项全能( MSD ) 数据集中的分割任务使用 超越颅穹窿( BTCV )分割挑战 进行微调后,该模型在公共排行榜上达到了最先进的精度。

BTCV

在 BTCV 中, SwinUnetr 的平均骰子数为 0.918 ,优于其他排名靠前的模型。

pYYBAGL572iAYS0KAAFJcNkiNbo915.png

图 2 :。 BTCV 挑战多器官分割排行榜骰子结果

对于较小的器官,如脾静脉和门静脉( 3.6% )、胰腺( 1.6% )和肾上腺( 3.8% ),与之前的最先进方法相比,有了改进小器官数据标签分割对于放射科医生来说是一项极其困难的任务。

通讯簿标签

在 MSD 中, Swin UNETR 在脑肿瘤、肺、胰腺和结肠方面取得了最先进的表现。心脏、肝脏、海马、前列腺、肝血管和脾脏的结果具有可比性。总的来说, Swin UNETR 在所有 10 项任务中的平均骰子率为 78.68% ,是最好的,并在 MSD 排行榜上排名第一。

pYYBAGL573OASYJ5AAUqdCVicy0245.png

图 4 :。使用 MSD 数据集进行肝血管分割任务的定性输出。你可以看到, Swin UNETR 比 SOTA DiNTS 跑赢了 3% 。这一变化很重要,因为它会导致更准确的分段输出

与DiNTS(一种用于医学图像分割的强大AutoML方法)相比,Swin UNETR使用更少的训练时间,显示出更好的分割性能。例如,肝血管分割任务的定性分割输出证明了Swin UNETR能够更好地建模长期空间依赖性。

pYYBAGL574GAYNO0AAIuPO-qS8I870.png

图 5 :。 Swin UNETR 模型体系结构由一个 Swin transformer 编码器组成,该编码器使用 3D 补丁,并通过不同分辨率的跳过连接连接到基于 CNN 的解码器

结论

Swin UNETR 体系结构在使用变压器的医疗成像方面提供了急需的突破。鉴于医学成像需要快速构建准确的模型, Swin UNETR 体系结构使数据科学家能够对大量未标记数据进行预训练。这减少了放射科医生、病理学家和其他临床团队进行专家注释的成本和时间。这里我们展示了用于器官检测和自动体积测量的 SOTA 分割性能。

审核编辑:郭婷

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 编码器
    +关注

    关注

    41

    文章

    3354

    浏览量

    131419
  • 计算机
    +关注

    关注

    19

    文章

    6629

    浏览量

    84345
收藏 人收藏

    评论

    相关推荐

    包含具有多种类型信息的3D模型

    三维视图。事实上,AE可以在将3D BIM模型元素与时间因素联系起来后创建4D模型,从而更广泛地进行产品的可视化预览,更精确地分析建筑项目的
    发表于 03-28 17:18

    友思特C系列3D相机:实时3D点云图像

    3D相机
    虹科光电
    发布于 :2024年01月10日 17:39:25

    PADS VX2.7 下载安装及3D模型导入的注意事项

    ://mentor.mr-wu.cn/ 安装方式按照安装包内的指导完成即可。 破解注意事项:1.用最新版馒头破解 2.必须关闭杀毒软件,否则破解后不可用! 二:3D模型导入 1.从3D模型
    发表于 11-22 17:54

    88个电子元器件3D模型合集

    整合88个国外网站下载的电子元器件3D模型,省去逐一下载的麻烦。
    发表于 09-25 07:47

    深度学习在医学图像分割与病变识别中的应用实战

    地观察和分析。然而,医学图像常常具有复杂的结构、噪声干扰和不同的病变特征,使得传统的图像处理方法难以取得令人满意的结果。基于深度学习的方法通过学习大量数据中的特征表示,能够更好地应对这
    发表于 09-04 11:11

    光学3D表面轮廓仪可以测金属吗?

    测量金属制品的长度、宽度、高度等维度参数。 除了测量金属表面的形状和轮廓外,光学3D表面轮廓仪还可以生成三维点云数据和色彩图像,用于进一步分析和展示: 1、三维点云数据可以用于进行CAD模型
    发表于 08-21 13:41

    实时3D艺术最佳实践-纹理技术解读

    纹理贴图获取2D曲面图像并将其映射到3D多边形上。 本指南涵盖了几种纹理优化,可以帮助您的游戏运行得更流畅、看起来更好。 在本指南的最后,您可以检查您的知识。您将了解有关主题,包括纹理图谱
    发表于 08-02 06:12

    2D Transformer 可以帮助3D表示学习吗?

    预训练的2D图像或语言Transformer:作为基础Transformer模型,具有丰富的特征表示能力。作者选择了先进的2D Transforme
    的头像 发表于 07-03 10:59 435次阅读
    2D <b class='flag-5'>Transformer</b> 可以帮助<b class='flag-5'>3D</b>表示学习吗?

    STEP与WRL 3D模型的区别

    “ KiCad 7支持两种格式的3D模型:STEP和WRL。本文简述了STEP与WRL的区别,以及这两种格式在哪些场合应用更合理。 ” 简介 这两种格式在本质上是不同的。wrl格式是一种细分的表面
    发表于 06-16 11:26

    求分享8MPLUS-BB的3D cad模型吗?

    以下是我的请求列表, 你能分享 8MPLUS-BB 的 3D cad 模型吗? 我可以请求共享 8MPLUS-BB 的 Altium 设计文件吗? 我们已经采购了 EVM 板,并计划设计一个外壳。
    发表于 06-05 13:37

    云台和摄像头图传#云台#图传项目完成后会把详细文档还有3D模型放上来

    3D模型
    学习电子知识
    发布于 :2023年05月30日 22:31:04

    视觉处理,2d照片转3d模型

    首先,太阳高度是恒定的。 照片每像素的亮度可求。我们只需要求出太阳与眼睛到物体的夹角就能求出3d模型。 最多就是各种物质的反射率。 英伟达的oir芯片就是做汽车视觉的,大家去取取经。 有时,2-3张位置不同的照片,可以快速生成
    发表于 05-21 17:13

    请问有没有ESP8266-DevKitC-02U-F的Eagle/Proteus的3D模型和封装库文件?

    请问有没有ESP8266-DevKitC-02U-F的Eagle/Proteus的3D模型和封装库文件? 如果有人可以分享它会很棒。
    发表于 05-16 09:07

    是否可以获得HVQFN148 SOT2111-1封装的3D STEP模型

    是否可以获得HVQFN148 SOT2111-1封装的3D STEP模型
    发表于 05-12 07:21

    求分享MIMX8MM5DVTLZAA的3D模型

    需要 MIMX8MM5DVTLZAA 的 3D 模型(步骤文件)
    发表于 04-23 07:39