0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

要实现高质量AI诊断,需要大量的高质量标注图像进行前期的算法训练

ss 来源:动脉网 作者:动脉网 2021-01-28 15:28 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

近年来,深度神经网络的出现一定程度上颠覆了医学影像行业的发展路径,人工智能介入下,影像相关科室繁杂重复的工作逐渐由算法接替,医生资源短缺这一问题似乎出现了解决的希望。

AI亦有其限制。从当前发展情况看,有效的人工智能算法大多聚集于存在大量标准化数据的病种,毕竟要实现高质量AI诊断,需要大量的高质量标注图像进行前期的算法训练。

这一数据相关的特质限制了医学AI的广泛应用。现实之中,罕见病和疑难杂症的数据较少,囿于患者隐私、数据安全等问题,数据收集行为的开展也较为困难。此外,医学图像的标注过程成本较高,对于不同的标注内容往往需要开发特殊的标注工具并交由有经验的医生进行。多方面原因协同下,某些医学图像问题的高标注质量医学图像数据集非常稀缺,其AI自然也难以孕育。

好在AI面临的困境并非没有解法。回想起来,人类只需通过极少的样本就能辨别新的事物,那么机器是否能以复制人类的这一能力呢?答案或许是可以的。最近医学AI领域兴起的一系列小数据学习方法便是以模仿人类的判别能力为目标,尝试通过减少需要的数据量,实现特定目标图像的识别,最终克服医学领域数据量少、标准缺乏的问题。

以先验知识为基础的小样本学习

要实现小样本学习(few-shot learning)必须要具备一些特定条件,譬如模型学习前已经吸收了一定类别的大量资料后,再加之新类别的极少量数据,最终实现小样本模型的形成。因此,小样本学习的关键是在算法中纳入合适的先验知识。

具体到医疗领域之中,很多医学图像模态中广泛存在器官的位置先验信息,例如CT图像中肝脏主要位于腹腔的右上位置,而脾则在腹腔的左上部分,这些位置先验信息对于AI识别特定类别的器官有非常大的帮助。

体素科技在顶级会议ISBI2021上发表的论文《Location Sensitive Local Prototype Network For Few-shot Medical Image Segmentation》便提出了一种基于位置先验信息的局部原型网络(location sensitive local prototype network,见图1)。该论文以肝和脾影像数据构建训练集,再将其收获先验信息的算法加入少量肾部影像分割任务,实现基于小样本学习的AI模型训练。

图一:基于位置先验信息的局部原型网络框架

在公开的CT器官分割数据集Visceral进行试验后,其结果表明,论文提出的新框架比目前的最好方法在Dice Score指标上提高了10%,显著推进了小样本下的器官分割这一领域的技术进展。

利用极端变化一致性来提高数据不足情况下医学图像分割的鲁棒性

除了数据获取困难这一问题外,研究人员在训练时还会遭遇数据来源不统一的问题。

由于医学图像的拍摄设备和拍摄环境和方式多样,各个医院和体检中心之间的人群分布差异明显,因此很难收集和标注足量的训练数据充分涵盖不同来源的图像特征。如果训练数据和实际测试数据存在明显的的分布差异(domain shift),生成的模型往往性能不佳。

体素科技在顶级会议MICCAI2020上发表的《Extreme Consistency: Overcoming Annotation Scarcity and Domain Shifts》为解决这一问题提供了方向。具体而言,该论文提出了极端一致性(extreme consistency)的概念,核心思想是在训练数据中加入极端的图像变换(比如大量强烈的亮度,对比度, 旋转, 尺寸变换),以增加训练数据的多样性,并假设这些极端的图像变换并不影响图像的语义含义。举例来说,眼底图像中的血管在经过极端的旋转和亮度对比度等变换后,依然能够对应血管本身。

为了实现这一构想,论文设计了一种半监督算法(semi-supervised learning, 见图2), 迫使模型遵守极端变化前和变化后的语义一致性这一约束,进而提高模型对于分布差异的鲁棒性。该论文在皮肤病变分割数据集(ISIC)和两个眼底血管分割数据集 (HRF和STARE)上进行了测试,展现了在数据不足和分布差异较大情况下,算法的鲁棒性和准确性的优势。

图2:左边是基于极端一致性的半监督学习方法的伪代码,右边是网络结构示意图。

少标注和弱标注情况下医学图像分割如何解决?

除了数据的来源问题,对已有数据进行分割标注同样需要研究人员付出大量成本。在中国,影像数据标注非常昂贵,尤其是像素级别的医学图像分割标注,人力支出更为巨大。因此,近期大量的研究工作试图解决不完善医学图像分割数据集中的两类典型问题:

· 标注稀缺。数据集中只有极稀少的图像数据有分割标注。

· 弱标签。数据集中的图像数据只有部分标注、或者标注带有噪声、或者只有图像级的类别标签没有逐像素的分割标注。

对于这两问题,体素科技发表在顶级期刊《Medical Image Analysis》中的文章《Embracing Imperfect Datasets: A Review of Deep Learning Solutions for Medical Image Segmentation》系统性地对现有方案进行了详细的回顾和分类总结(见图3所示)。根据医学图像分割数据集的不同缺陷,论文对这些方案的选择给出了实际的指导建议。

图3:医学分割图像数据集数据集缺陷问题及相应训练策略总结

近年来,体素科技和交大科研团队合作参与了多个医学AI挑战赛并获得佳绩。体素科技团队在ISBI2020学术会议上举办的ADAM比赛黄斑定位任务上获得了第三名的成绩。ADAM比赛是由百度灵医智慧和中山大学中山眼科中心联合举办,包含了黄斑定位等四个任务,吸引了来自20多个国家的近400支参赛队伍。

黄斑区域是眼底的一个特别重要的功能区域,精确定位黄斑对于进一步的辅助诊断很有帮助。该任务一大难点是,很多严重影响视力的眼底疾病都发生在黄斑区域,使其外观和正常黄斑相比有较大变化,导致现有常见深度学习模型对于病变黄斑的定位不够鲁棒。体素科技团队创新性的设计了一个双流网络融合眼底图像和对应的血管分割信息,可以借助于眼底血管形状和走向信息来估计黄斑的位置,大大提高了严重病变的黄斑区域定位效果。该模型在ADAM比赛决赛中平均黄斑定位误差为25个像素(排名第3), 体现了一定的临床可用性。

除此之外,体素科技团队在COVID-19 Lung CT Lesion Segmentation Challenge - 2020(“肺部CT新冠肺炎分割2020”国际挑战赛)中获佳绩,在肺炎分割关键指标Dice Score上排名第2,所有指标加权排名第3。

COVID-19-20国际挑战赛是由Children‘s National Hospital联合英伟达(NVIDIA)、美国国立卫生研究院(NIH)和国际医学图像计算和计算机辅助干预协会(MICCAI)举办的国际竞赛,设置了分割和量化由SARS-CoV-2感染引起的肺部病变(主要是毛玻璃影)的挑战任务,旨在探究基于深度学习的肺炎病灶分割模型用于COVID-19 CT 影像定量分析的可行性,为COVID-19 鉴别诊断提供帮助。COVID-19-20国际挑战赛吸引了来自29个国家的200多支参赛队伍。

此次获奖的新冠肺炎分割模型采用目前在各类医学图像分割任务中均表现突出的深度学习模型nn-Unet 框架进行肺炎病灶分割,对图像分割中的各个环节,包括图像预处理,网络架构和学习过程等都进行了自动化的优化和参数估计。同时为了解决噪声标注带来的模型优化方向偏离以及在医学影像中普遍存在的前景背景类别不平衡的问题,体素科技团队选取了Noise-Robust Dice Loss作为模型的优化损失。最终该模型在同源测试集上Dice Score为0.6581(排名第2)。

责任编辑:xj

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 数据
    +关注

    关注

    8

    文章

    7314

    浏览量

    93971
  • AI
    AI
    +关注

    关注

    89

    文章

    38090

    浏览量

    296533
  • 影像
    +关注

    关注

    0

    文章

    146

    浏览量

    14940
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    广电计量创新服务体系助力商业航天高质量发展

    近日,国家航天局正式印发《推进商业航天高质量安全发展行动计划(2025—2027年)》(以下简称《行动计划》),明确将商业航天纳入国家航天发展总体布局,提出到2027年实现产业规模显著壮大、创新活力
    的头像 发表于 11-27 17:22 895次阅读

    研华AI智能体推动储能产业高质量发展

    储能行业正面临海量数据处理与AI应用挑战。研华科技推出软硬件一体化控制方案,实现整站交付效率提升90%。该方案打通从数据采集到AI智能体构建的全链路,推动储能系统向智能化升级,为产业高质量
    的头像 发表于 11-02 15:43 643次阅读

    PCBA工程师必看:高质量BOM的5个‘隐形规则’

    仅是元器件采购、生产排程、成本核算的基础,更是质量追溯、工艺适配和供应链协同的关键依据。以下从BOM的核心要素、管理规范及实践技巧三方面,解析如何通过规范清单实现生产零失误。 一、高质量BOM的5大核心要素 信息完整性:杜绝模糊
    的头像 发表于 10-17 09:18 401次阅读

    跃昉科技出席2025横琴粤澳深度合作区企业高质量发展大会

    8月29日,横琴粤澳深度合作区企业高质量发展大会暨“育苗培优”计划启动仪式在横琴隆重举行。
    的头像 发表于 09-02 16:15 694次阅读

    索尼重载设备的高质量远程制作方案和应用(2)

    索尼的远程制作可以被称之为制作级的高质量远程制作,或重载设备的高质量远程制作,远程设备结合常规系统设备,提供和本地制作类似的制作级高质量图像,延续电视台/制作公司的设备特点和优势。
    的头像 发表于 08-21 15:56 873次阅读
    索尼重载设备的<b class='flag-5'>高质量</b>远程制作方案和应用(2)

    索尼重载设备的高质量远程制作方案和应用(1)

    最近的各地体育活动中,索尼提供了多种产品和系统方案进行测试和使用,其中将摄像机用于转播场地的集中式远程制作方式是常用方式。索尼专业解决方案突出制作级质量的优势,具有图像高质量,低码率,
    的头像 发表于 08-21 15:55 721次阅读
    索尼重载设备的<b class='flag-5'>高质量</b>远程制作方案和应用(1)

    大模型时代,如何推进高质量数据集建设?

    高质量数据集,即具备高价值、高密度、标准化特征的数据集合。 在AI领域,高质量数据集地位举足轻重,如同原油经炼化成为汽油驱动汽车,海量原始数据需转化为高质量数据集,才能助力大模型精准掌
    的头像 发表于 08-21 13:58 524次阅读

    从芯片到主板,科技创新实现高质量发展

    数字化时代,科技的迅猛发展深刻影响着各个领域。从芯片到主板的集成,生动展现了科技创新如何成为推动高质量发展的核心动力。
    的头像 发表于 07-26 16:26 652次阅读

    新能源变革之路,建在“高质量”的路基上

    高质量”是能源革命的前提与基座
    的头像 发表于 06-24 11:42 2254次阅读
    新能源变革之路,<b class='flag-5'>要</b>建在“<b class='flag-5'>高质量</b>”的路基上

    浅析:数字经济时代,高质量数据集对AI产业带来哪些新的变化

    大模型技术不断取得突破,其中大规模高质量训练数据的投入,起到了关键作用,也进一步将 “以数据为中心的人工智能” 推向一个新阶段。从早期简单的图像识别、语音识别,到如今复杂的自然语言处理、智能决策系统,
    的头像 发表于 05-09 15:10 732次阅读

    高质量 HarmonyOS 权限管控流程

    高质量 HarmonyOS 权限管控流程 在 HarmonyOS 应用开发过程中,往往会涉及到 敏感数据 和 硬件资源 的调动和访问,而这部分的调用就会涉及到管控这部分的知识和内容了。我们需要对它有
    的头像 发表于 04-02 18:29 1754次阅读
    <b class='flag-5'>高质量</b> HarmonyOS 权限管控流程

    电动工具EMC测试整改:迈向高质量生产的必由之路

    深圳南柯电子|电动工具EMC测试整改:迈向高质量生产的必由之路
    的头像 发表于 02-27 09:37 727次阅读
    电动工具EMC测试整改:迈向<b class='flag-5'>高质量</b>生产的必由之路

    广汽集团召开高质量发展大会

    春回大地,万象更新。近两日广东省、广州市聚焦“建设现代化产业体系”主题,相继召开“新春第一会”——高质量发展大会,吹响奋进号角。广汽集团党委书记、董事长冯兴亚作为省市重点产业高质量发展代表参加会议,与产学研各界代表共聚一堂,共绘广东、广州
    的头像 发表于 02-07 10:18 1014次阅读

    电动工具EMC测试整改:迈向高质量生产的必经之路

    深圳南柯电子|电动工具EMC测试整改:迈向高质量生产的必经之路
    的头像 发表于 01-14 14:29 790次阅读
    电动工具EMC测试整改:迈向<b class='flag-5'>高质量</b>生产的必经之路

    借助谷歌Gemini和Imagen模型生成高质量图像

    在快速发展的生成式 AI 领域,结合不同模型的优势可以带来显著的成果。通过利用谷歌的 Gemini 模型来制作详细且富有创意的提示,然后使用 Imagen 3 模型根据这些提示生成高质量图像,您可
    的头像 发表于 01-03 10:38 1335次阅读
    借助谷歌Gemini和Imagen模型生成<b class='flag-5'>高质量</b><b class='flag-5'>图像</b>