0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

使用NVIDIA DALI加速医学图像处理

星星科技指导员 来源:NVIDIA 作者:NVIDIA 2022-04-13 16:24 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

深度学习模型需要大量数据才能产生准确的预测,随着模型规模和复杂性的增加,这种需求日益迫切。即使是大型数据集,例如拥有 100 多万张图像的著名 ImageNet ,也不足以在现代计算机视觉任务中实现最先进的结果。

为此,需要使用数据增强技术,通过对数据引入随机干扰(如几何变形、颜色变换、噪声添加等),人为地增加数据集的大小。这些干扰有助于生成预测更稳健的模型,避免过度拟合,并提供更好的精度。

医学成像任务中,数据扩充至关重要,因为数据集最多只包含数百或数千个样本。另一方面,模型往往会产生需要大量 GPU 内存的大激活,特别是在处理 CT 和 MRI 扫描等体积数据时。这通常会导致在小数据集上进行小批量的培训。为了避免过度拟合,需要更精细的数据预处理和扩充技术。

然而,预处理通常对系统的整体性能有重大影响。这在处理大输入的应用程序中尤其如此,例如体积图像。由于 NumPy 等库的简单性、灵活性和可用性,这些预处理任务通常在 CPU 上运行。

在某些应用中,例如医学图像的分割或检测,由于数据预处理通常在 CPU 中执行,因此训练期间的 GPU 利用率通常不理想。解决方案之一是尝试完全重叠数据处理和训练,但并不总是那么简单。

这样的性能瓶颈导致了鸡和蛋的问题。由于性能原因,研究人员避免在他们的模型中引入更高级的增强,并且由于采用率较低,库不会将精力放在优化预处理原语上。

GPU 加速解决方案

通过将数据预处理卸载到 GPU ,可以显著提高具有大量数据预处理管道的应用程序的性能。 GPU 在此类场景中通常未得到充分利用,但可用于完成 CPU 无法及时完成的工作。其结果是更好的硬件利用率,最终更快的培训。

就在最近, NVIDIA 在 MICCAI 2021 脑肿瘤分割挑战中获得 10 个顶级排名中的 3 个 ,包括获胜的解决方案。获胜的解决方案通过加快系统的 preprocessing pipeline 速度,使 GPU 利用率高达 98% ,并将总训练时间减少了约 5% ( 30 分钟)(图 1 )。

pYYBAGJWiOuAFbNCAACGWtQuEdI631.png

图 1 。 U-Net3D BraTS21 训练性能比较

当你查看NVIDIA 提交的[VZX333 ]时,这种差异变得更加显著。它使用了与BraTS21获奖解决方案相同的网络体系结构,但具有更复杂的数据加载管道和更大的输入量(KITS19数据集)。与本机管道相比,性能提升是令人印象深刻的2倍端到端培训加速(图2)。

poYBAGJWiPOAV-lAAAB-o7jgWoo280.png

图 2 。 U-Net3D MLPerf 训练 1.1 训练性能比较

这是由 NVIDIA 数据加载库( DALI ) 实现的。 DALI 提供了一组 GPU 加速构建块,使您能够构建完整的数据处理管道,包括数据加载、解码和扩充,并将其与所选的深度学习框架集成(图 3 )。

poYBAGJWiP2AY1jkAAFZV_6RYsU472.png

图 3 。 DALI 概述及其应用 在 DL 应用程序中用作加速数据加载和预处理的工具

体积图像操作

最初, DALI 是作为图像分类和检测工作流的解决方案开发的。后来,它被扩展到其他数据域,如音频、视频或体积图像。有关体积数据处理的更多信息,请参阅 3D Transforms 或 NumPy 读卡器 .

DALI 支持多种图像处理操作员。有些还可以应用于体积图像。以下是一些值得一提的例子:

Resize

Warp affine

Rotate

随机对象边界框

为了展示上述的一些操作,我们使用了来自 BraTS19 数据集的一个样本,该样本由标记为脑肿瘤分割的 MRI 扫描组成。图 4 显示了从脑 MRI 扫描体积中提取的二维切片,其中较暗的区域表示标记为异常的区域。

poYBAGJWiUKAOOy8AAEFVQww9A0412.png


图 4 。来自 BraTS19 数据集样本的切片

调整大小运算符

Resize通过插值输入像素将图像放大或缩小到所需形状。可以分别为每个维度配置“高比例”或“低比例”,包括选择插值方法。

Warp affine通过线性变换将像素坐标从源映射到目标,应用几何变换。

latex.php?latex=Out%28x%2Cy%2Cz%29%3DIn%28xsrc%2Cysrc%2Czsrc%29&bg=ffffff&fg=000&s=1&c=20201002latex.php?latex=Out%28x%2Cy%2Cz%29%3DIn%28xsrc%2Cysrc%2Czsrc%29&bg=ffffff&fg=000&s=1&c=20201002

Warp affine可用于一次性执行多个变换(旋转、翻转、剪切、缩放)。

旋转运算符

Rotate允许您绕任意轴旋转体积,该轴作为矢量和角度提供。它还可以选择性地扩展画布,使整个旋转图像包含在其中。

随机对象边界框操作符

随机对象边界框是一种适合于检测和分段任务的运算符。如前所述,医疗数据集往往相当小,目标类别(如异常)占据的区域相对较小。此外,在许多情况下,输入容量远大于网络预期的容量。如果要使用随机裁剪窗口进行训练,则大多数窗口不会包含目标。这可能导致训练收敛速度减慢或使网络偏向假阴性结果。

此运算符选择可能偏向于对特定标签采样的伪随机作物。连接组件分析是在标签图上执行的一个预步骤。然后,以相同的概率随机选择一个连接的 blob 。通过这样做,操作符可以避免过度呈现较大的斑点。

您还可以选择将选择限制为最大的 K 个 blob 或指定最小 blob 大小。选择特定 blob 时,将在包含给定 blob 的范围内生成随机裁剪窗口。图 8 显示了这个裁剪窗口选择过程。

图 8 。想象 the随机对象边界框对具有一组属于三个不同类别(每个类别用不同颜色高亮显示)的对象的人造 2D 图像的操作

学习速度的提高是非常显著的。在 KITS19 数据集上, nnU Net 在使用随机对象边界框运算符的测试运行时段中, 2134 达到与 3222 个随机裁剪时段相同的精度。

通常,查找连接组件的过程很慢,但数据集中的样本数可能很小。操作员可以配置为缓存连接的组件信息,以便仅在培训的第一个历元中计算。

关于作者

Janusz Lisiecki 是 NVIDIA 的深度学习经理,致力于快速数据管道。他过去的经验涵盖从面向大众消费市场的嵌入式系统到高性能硬件软件数据处理解决方案。

Joaquin Anton Guirao 是 NVIDIA 深度学习框架团队的高级软件工程师,专注于 NVIDIA DALI

Pablo Ribalta 是 NVIDIA 的深度学习算法经理,致力于 2D 和体积数据的基于图像的模型。他的研究经验包括启发式、元启发式、优化以及深度学习的不同应用,如医学和卫星图像。

Michal Futrega 是 NVIDIA 的软件工程师,致力于医学图像分割的神经网络和药物发现的图形神经网络。他获得了华沙大学理学硕士学位和计算机科学理学士学位。

Michał Marcinkiewicz 是 NVIDIA 深度学习软件组的高级 CUDA 算法工程师,专注于医学图像分析的计算机视觉。米莎从法国蒙彼利埃大学获得博士学位,从事拓扑相变研究。获得博士学位后,他完全转向机器学习

审核编辑:郭婷

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • NVIDIA
    +关注

    关注

    14

    文章

    5696

    浏览量

    110144
  • 数据集
    +关注

    关注

    4

    文章

    1240

    浏览量

    26264
  • 深度学习
    +关注

    关注

    73

    文章

    5610

    浏览量

    124660
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    使用PicoScope示波器测试DALI信号

    数字可寻址照明接口(DALI)是一种专用于数字照明控制的协议。它旨在促进构建稳健、可扩展且灵活的照明网络。DALI通过控制器、照明灯具和镇流器之间的双向通信,实现了对楼宇照明系统的智能管理。
    的头像 发表于 04-22 11:43 6983次阅读
    使用PicoScope示波器测试<b class='flag-5'>DALI</b>信号

    综合图像处理硬件平台设计资料:2-基于6U VPX的双TMS320C6678+Xilinx FPGA K7 XC7K420T的图像信号处理

    FPGA光纤, XCVU9P板卡, 高速图像采集, 基带信号处理, 加速计算卡, 无线仿真平台, 图像信号处理
    的头像 发表于 03-30 14:39 168次阅读
    综合<b class='flag-5'>图像</b><b class='flag-5'>处理</b>硬件平台设计资料:2-基于6U VPX的双TMS320C6678+Xilinx FPGA K7 XC7K420T的<b class='flag-5'>图像</b>信号<b class='flag-5'>处理</b>板

    Oracle和NVIDIA合作加速向量搜索和企业数据处理

    Oracle 和 NVIDIA 正在与客户合作,将 GPU 加速的向量索引构建应用于实际工作负载。Oracle Private AI Services Container 初期支持 CPU 执行,现
    的头像 发表于 03-23 15:26 470次阅读

    NVIDIA携手微软加速机器人和物理AI的发展

    在 GTC 大会上,微软宣布了其代理式和物理 AI 系统统一平台的更新,加速从实验到生产落地的进程。将 Microsoft Foundry 与 NVIDIA 开放模型和加速计算相结合,创建了统一的软件栈,在满足严格的数据主权要求
    的头像 发表于 03-23 15:21 1010次阅读

    NVIDIA携手全球工业软件巨头构建AI智能体加速设计与工程开发流程

    GTC — NVIDIA 今日宣布,正与包括 Cadence、达索系统、PTC、西门子和新思科技等在内的全球领先工业软件厂商合作,将 NVIDIA CUDA-X™、NVIDIA Omniverse
    的头像 发表于 03-19 15:39 454次阅读

    NVIDIA加速计算平台助力从地球到太空的AI应用

    NVIDIA 今日宣布,其最新一代加速计算平台正在开启太空创新的新时代,将为轨道数据中心 (ODC)、地理空间信息收集以及自主太空运行提供 AI 算力。
    的头像 发表于 03-18 14:44 583次阅读

    利用NVIDIA Cosmos开放世界基础模型加速物理AI开发

    NVIDIA 最近发布了 NVIDIA Cosmos 开放世界基础模型(WFM)的更新,旨在加速物理 AI 模型的测试与验证数据生成。借助 NVIDIA Omniverse 库和 Co
    的头像 发表于 12-01 09:25 1494次阅读

    NVIDIA推出NVQLink高速互连架构

    NVIDIA 推出 NVIDIA NVQLink,这是一种开放式系统架构,可将 GPU 计算的极致性能与量子处理器紧密结合,以构建加速的量子超级计算机。
    的头像 发表于 11-03 14:53 917次阅读

    DALI数字照明控制的解决方案

    NDA102 DALI数字照明控制解决方案基于数字照明接口联盟(DiiA)开发的数字可寻址照明接口(DALI)技术。该解决方案包括新唐构建的IEC 62386库。新唐是DiiA准会员,拥有DALI
    发表于 09-08 06:29

    MATLAB 助力香港中文大学解决生物医学图像处理挑战

    Processing Toolbox™ 加速了生物医学图像处理工作流程。借助 MathWorks 的软件,研究人员高效地对万亿体素级别的图像
    的头像 发表于 08-28 15:07 728次阅读

    NVIDIA RTX AI加速FLUX.1 Kontext现已开放下载

    NVIDIA RTX 与 NVIDIA TensorRT 现已加速 Black Forest Labs 的最新图像生成和编辑模型;此外,Gemma 3n 现可借助 RTX 和
    的头像 发表于 07-16 09:16 2222次阅读

    NVIDIA全栈加速代理式AI应用落地

    在近期举办的 AWS 中国峰会上,NVIDIA 聚焦于“NVIDIA 全栈加速代理式 AI 应用落地”,深入探讨了代理式 AI (Agentic AI) 技术的前沿发展以及在企业级应用中的深远影响。本文将为您详细介绍此次分享的技
    的头像 发表于 07-14 11:41 1488次阅读

    NVIDIA Isaac Sim与NVIDIA Isaac Lab的更新

    在 COMPUTEX 2025 上,NVIDIA 宣布了机器人仿真参考应用 NVIDIA Isaac Sim 和机器人学习框架 NVIDIA Isaac Lab 的更新,以加速各种形态
    的头像 发表于 05-28 10:06 2447次阅读

    NVIDIA携手微软加速代理式AI发展

    代理式 AI 正在重新定义科学探索,推动各行各业的研究突破和创新发展。NVIDIA 和微软正通过深化合作提供先进的技术,从云到 PC 加速代理式 AI 应用的发展。
    的头像 发表于 05-27 14:03 1259次阅读

    借助NVIDIA技术加速半导体芯片制造

    NVIDIA Blackwell GPU、NVIDIA Grace CPU、高速 NVIDIA NVLink 网络架构和交换机,以及诸如 NVIDIA cuDSS 和
    的头像 发表于 05-27 13:59 1303次阅读