0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

新型transformer模型实现3D医学图像分析最新基准

星星科技指导员 来源:NVIDIA 作者:NVIDIA 2022-08-15 15:01 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

计算机视觉和模式识别会议( CVPR )上, NVIDIA 研究人员发表了 35 多篇论文。这包括对 移动窗口 UNEt TRansformers ( Swin-UNETR )的研究,这是第一个基于变压器的预训练框架,专为 3D 医学图像分析中的自我监督任务而设计。这项研究是创建用于数据注释的预训练、大规模和自监督三维模型的第一步。

作为一种基于 transformer 的计算机视觉方法, Swin UNETR 采用了 MONAI ,这是一种开源的 PyTorch 框架,用于深入学习医疗成像,包括放射学和病理学。使用这种预训练方案, Swin UNETR 为各种医学图像分割任务设定了新的最先进的基准,并一致证明了其有效性,即使只有少量的标记数据。

Swin UNETR 模型培训

Swin UNETR 模型在 NVIDIA DGX-1 集群 使用八个 GPUAdamW 优化算法。对 5050 张来自健康和不健康受试者不同身体部位的公开 CT 图像进行预训练,以保持数据集的平衡。

对于 3D Swin transformer 编码器的自我监督预训练,研究人员使用了各种借口任务。随机裁剪的标记使用不同的变换(如旋转和剪切)进行增强。这些标记用于掩蔽体修复、旋转和对比学习,用于编码器学习训练数据的上下文表示,而不会增加数据注释的负担。

pYYBAGL571-AKsH1AALchbVmfMI713.png

图 1 :。预培训框架概述。输入的 CT 图像被随机裁剪成子体积,并通过随机内部剪切和旋转进行增强,然后作为输入馈送到 Swin-UNETR 编码器

Swin UNETR 背后的技术

Swin Transformers 采用分层视觉 transformer ( ViT )进行非重叠窗口的局部自我注意计算。这打开了为大型公司创建医疗专用 ImageNet 的机会,消除了创建医疗 AI 模型需要大量高质量注释数据集的瓶颈。

与 CNN 体系结构相比, ViT 在从未标记数据(数据集越大,预训练主干越强)进行全局和局部表示的自监督学习方面表现出非凡的能力。用户可以在下游任务(例如,分割、分类和检测)中使用极少量的标记数据微调预训练模型。

这种体系结构在本地窗口中计算自我注意,与 ViT 相比表现出更好的性能。此外, Swin Transformers 的层次性使其非常适合需要多尺度建模的任务。

继领先的 UNETR 模型成功使用直接使用 3D 补丁嵌入的基于 ViT 的编码器之后, Swin UNETR 使用了具有金字塔结构的 3D Swin transformer 编码器。

在 Swin UNETR 的编码器中,由于计算简单的全局自我注意对于高分辨率特征地图是不可行的,因此在本地窗口中计算自我注意。为了增加局部窗口以外的感受野,使用窗口移位来计算不同窗口的区域相互作用。

Swin UNETR 的编码器通过跳过连接以五种不同的分辨率连接到剩余的类似 UNet 的解码器。它可以为密集的预测任务(如医学图像分割)捕获多尺度特征表示。

Swin UNETR 模型性能

在对 CT 中的 13 个腹部器官和 医学分段十项全能( MSD ) 数据集中的分割任务使用 超越颅穹窿( BTCV )分割挑战 进行微调后,该模型在公共排行榜上达到了最先进的精度。

BTCV

在 BTCV 中, SwinUnetr 的平均骰子数为 0.918 ,优于其他排名靠前的模型。

pYYBAGL572iAYS0KAAFJcNkiNbo915.png

图 2 :。 BTCV 挑战多器官分割排行榜骰子结果

对于较小的器官,如脾静脉和门静脉( 3.6% )、胰腺( 1.6% )和肾上腺( 3.8% ),与之前的最先进方法相比,有了改进小器官数据标签分割对于放射科医生来说是一项极其困难的任务。

通讯簿标签

在 MSD 中, Swin UNETR 在脑肿瘤、肺、胰腺和结肠方面取得了最先进的表现。心脏、肝脏、海马、前列腺、肝血管和脾脏的结果具有可比性。总的来说, Swin UNETR 在所有 10 项任务中的平均骰子率为 78.68% ,是最好的,并在 MSD 排行榜上排名第一。

pYYBAGL573OASYJ5AAUqdCVicy0245.png

图 4 :。使用 MSD 数据集进行肝血管分割任务的定性输出。你可以看到, Swin UNETR 比 SOTA DiNTS 跑赢了 3% 。这一变化很重要,因为它会导致更准确的分段输出

与DiNTS(一种用于医学图像分割的强大AutoML方法)相比,Swin UNETR使用更少的训练时间,显示出更好的分割性能。例如,肝血管分割任务的定性分割输出证明了Swin UNETR能够更好地建模长期空间依赖性。

pYYBAGL574GAYNO0AAIuPO-qS8I870.png

图 5 :。 Swin UNETR 模型体系结构由一个 Swin transformer 编码器组成,该编码器使用 3D 补丁,并通过不同分辨率的跳过连接连接到基于 CNN 的解码器

结论

Swin UNETR 体系结构在使用变压器的医疗成像方面提供了急需的突破。鉴于医学成像需要快速构建准确的模型, Swin UNETR 体系结构使数据科学家能够对大量未标记数据进行预训练。这减少了放射科医生、病理学家和其他临床团队进行专家注释的成本和时间。这里我们展示了用于器官检测和自动体积测量的 SOTA 分割性能。

审核编辑:郭婷

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 编码器
    +关注

    关注

    45

    文章

    3903

    浏览量

    141445
  • 计算机
    +关注

    关注

    19

    文章

    7764

    浏览量

    92682
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    技术资讯 I 图文详解 Allegro X PCB Designer 中的 3D 模型映射

    本文要点面对市面上的一切要将PCB板放进一个盒子里的产品的设计都离不开3D模型映射这个功能,3D协同设计保证了产品的超薄化、高集成度的生命线;3D
    的头像 发表于 10-17 16:16 556次阅读
    技术资讯 I 图文详解 Allegro X PCB Designer 中的 <b class='flag-5'>3D</b> <b class='flag-5'>模型</b>映射

    玩转 KiCad 3D模型的使用

    “  本文将带您学习如何将 3D 模型与封装关联、文件嵌入,讲解 3D 查看器中的光线追踪,以及如何使用 CLI 生成 PCBA 的 3D 模型
    的头像 发表于 09-16 19:21 1.1w次阅读
    玩转 KiCad <b class='flag-5'>3D</b><b class='flag-5'>模型</b>的使用

    TechWiz LCD 3D应用:FFS仿真

    建模任务 堆栈结构 建模过程 2.1使用TechWiz Layout绘制各层掩模版平面图 2.2创建堆栈结构,并生成3D结构 2.3 使用TechWiz LCD 3D进行各项参数计算 3. 结果
    的头像 发表于 07-14 14:08 447次阅读
    TechWiz LCD <b class='flag-5'>3D</b>应用:FFS仿真

    答疑|3D打印能打印立体字母吗?

    最近有朋友留言问:3D打印能打印那种立体字母吗?会不会很难实现? JLC3D小编来解答:当然可以!无论是单独的字母,还是组合成单词或句子,3D打印都可以
    发表于 05-21 16:17

    一种以图像为中心的3D感知模型BIP3D

    在具身智能系统中,3D感知算法是一个关键组件,它在端侧帮助可以帮助智能体理解环境信息,在云端可以用来辅助生成3D场景和3D标签,具备重要的研究价值。现有主流算法主要依赖于点云作为输入
    的头像 发表于 03-17 13:44 960次阅读
    一种以<b class='flag-5'>图像</b>为中心的<b class='flag-5'>3D</b>感知<b class='flag-5'>模型</b>BIP<b class='flag-5'>3D</b>

    使用海尔曼太通/HellermannTyton 3D CAD 模型进行快速高效的设计

    提供 3D 和 2D CAD 数据,可供免费下载。 直接嵌入三维设计环境的模型下载功能 在海尔曼太通官网上点击【产品】选项,工程师现在可以查看和下载众多产品的 3D CAD
    发表于 03-14 16:55

    3D打印可以打印那种柔韧性好,能随意变形的模型吗?

    当然可以! 一般来讲,市面上常见的树脂材料是比较脆的,一旦受力过大就很容易断裂,因此不能随意掰折或扭曲,这就导致很多人对3D打印的认知还停留在它只能制造硬性模型。 但3D打印其实是可以打印出柔韧性好
    发表于 03-13 11:41

    Techwiz LCD 3D应用:衍射效率分析

    Techwiz LCD 3D现在可以分析远场的衍射效率。 不仅可以分析具有各种折射率或重复图案的光栅结构的衍射特性,还可以分析由液晶行为引起的相位光栅的衍射特性。 *以上测量结果参
    发表于 03-12 09:40

    超景深3D检测显微镜技术解析

    技术的核心在于其能够实现比传统显微镜更广阔的景深范围,同时保持高分辨率的成像能力,从而为用户提供更为清晰和立体的微观世界视图。 超景深3D检测显微镜的实现依赖于先进的光学设计和复杂的图像
    发表于 02-25 10:51

    腾讯混元3D AI创作引擎正式发布

    的AI技术,能够根据用户提供的提示词或图片,直接生成高质量的3D模型。这一功能极大地降低了3D内容创作的门槛,使得即使是缺乏专业3D建模技能的用户也能轻松创作出令人惊叹的
    的头像 发表于 01-23 10:33 980次阅读

    腾讯混元3D AI创作引擎正式上线

    或上传一张图片,该引擎便能迅速生成与之对应的3D模型。这一功能极大地降低了3D内容创作的门槛,使得更多用户能够轻松涉足这一领域。 除了基础的3D模型
    的头像 发表于 01-22 10:26 956次阅读

    Techwiz LCD 3D应用:基板未对准分析

    当在制造LCD设备的过程中TFT基板 和公共电极基板未对准时,LCD设备的显示质量会受到不利影响。可使用Techwiz LCD 3D来进行基板未对准时的光绪分析
    发表于 01-21 09:50

    ​ SLA立体光固化成型:一项实现3D打印领域高精度数字模型实体化的先锋技术

    ) 选择性地照射液态光敏树脂,使材料在激光照射下迅速发生光聚合反应,由液态转变为固态,以此逐层构建出三维实体结构。其打印工艺流程从数字模型开始,首先,把3D模型文件导入专用切片软件,将其切分为多个薄层并转
    发表于 01-09 18:57

    AN-1249:使用ADV8003评估板将3D图像转换成2D图像

    电子发烧友网站提供《AN-1249:使用ADV8003评估板将3D图像转换成2D图像.pdf》资料免费下载
    发表于 01-08 14:28 0次下载
    AN-1249:使用ADV8003评估板将<b class='flag-5'>3D</b><b class='flag-5'>图像</b>转换成2<b class='flag-5'>D</b><b class='flag-5'>图像</b>

    uvled光固化3d打印技术

    说到UVLED光固化3D打印技术,那可是当下3D打印领域的一股清流啊!这项技术利用紫外线和光固化树脂来制造3D打印模型,原理简单又高效。UVLED光固化
    的头像 发表于 12-24 13:13 1165次阅读
    uvled光固化<b class='flag-5'>3d</b>打印技术