0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

Ariza部署了一个WebApp利用图像分析技术诊断患者是否患有疟疾

zhKF_jqr_AI 来源:未知 作者:李倩 2018-11-08 09:11 次阅读

编者按:机器学习本质上是门工程学,把实验室里的算法、技术带入实际应用,这是很多科研人员、数据科学家的梦想。美国湾区有一个培训机构insight,它专门招收名校PhD,通过短期强化课程把初出茅庐的学生培养成符合企业需求的数据工作者,而在这个过程中,这些接收培训的学生也留下了一些非常有价值的应用。

本文介绍的Carlos Atico Ariza是2018年秋季的insight health研究员,在加入insight之前,他在一家公司担任数据科学顾问,负责构建端到端机器学习解决方案,比如无需人为监督的异常检测系统。虽然从事的是数据方面的工作,但Ariza在大学获得的学位是化学和生物工程博士,他一直想为医学领域作出贡献。

在insight培训期间,Ariza部署了一个WebApp,能利用图像分析技术诊断患者是否患有疟疾,并列出治疗优先等级。这个应用成功让临床医生的疟疾诊断工作量降低了85%。

微小而致命的敌人

对世界上超过半数的人来说,蚊子远不仅仅是一种滋扰:除了会引发皮肤瘙痒、敏感和失眠,它们也是疟疾、登革热等疾病的传播媒介。以疟疾为例,这是一种由疟原虫引起传染病,当感染子孢子经蚊虫叮咬进入人体血液后,它们会在肝细胞内进行裂体增殖,然后释入血液感染红细胞……借助蚊子强大的繁殖能力,2015年,全球已经有2亿多人新感染疟疾,每年因此死亡的人数超过40万!

疟疾诊断的瓶颈

在诸多疟疾诊断方法中,镜检法是许多医院的支柱,它的具体流程是先把患者血液涂抹在载玻片上,用造影剂染色以区分血红细胞内的寄生虫,然后经专业训练的临床医生再在100倍的显微镜下,从5000个细胞里一个个计数包含寄生虫的血红细胞数(WHO方案)。

厚血涂片制作流程

可以想象,手动计数5000个细胞绝对会是个缓慢的过程,这对医疗人员来说也是个沉重的负担,尤其是在疟疾爆发的地区。面对这种情况,Ariza认为图像分析和机器学习会有很大的应用前景。

什么是F-beta

考虑到医疗领域对检测准确率的严格要求,如果机器要自动化疟疾诊断过程,它绝不能从看似不含寄生虫的样本中遗漏哪怕一个寄生虫。为了降低误诊(假阴性)人数,Ariza希望模型在输出最终结果前,能重复进行三次检查:如果第一遍没发现,每隔8小时再采集一份厚血涂片并计数细胞数;如果三次都没发现寄生虫,则判定患者未受感染。

现在,这个任务就有了一个很直接的目标:减少假阴性。

事实上,假阴性不止能被作为降低误诊率的一个度量,它也能充当监督机器的指标。试想一下,如果我们训练了一个模型,它在实际进行图像分析时准确率奇低,这时医生就不得不需要抽更多时间来手动检查机器预测结果。在机器学习领域,我们有一些能评估分类器分类性能优劣的指标,这里我们先回顾两个概念:

精确率(Precision):被分类器判定为正类的样本中,真正属于正类样本的比例

召回率(Recall):被分类器正确判定为正类的样本数占正类样本总数的比例

精确率越高,召回率越低;反之,召回率越高,精确率越低。而平衡精确率和召回率的指标就是F-beta(Fβ)。这里β的取值意味着两者在分类器性能评估中的相对重要性,在疟疾诊断这个问题中,Ariza设β=2,即最小化假阴性的重要性是假阳性的2倍。

细胞开源数据

这个WebApp能成功的关键是Ariza幸运地找到了一个优质数据集,里面包含27,558幅经医学专家手动注释的单细胞图像,感染的/未感染的各占一半。这些细胞来自200名患者,每四名患者中有三名患有疟疾。图像都分割自显微镜视野原始图像,而且都是手机拍摄,没有用需要连接到显微镜的特制相机。

数据集地址:ceb.nlm.nih.gov/repositories/malaria-datasets/

可解释的特征工程

有了任务目标,有了数据集,之后就是大家常常忽视的特征工程环节。提到构建图像分类器,每一个学过机器学习的人都知道CNN是最好的。但是在实际应用中,构建模型的正确做法是先从一个简单的模型开始,然后根据模型性能快速迭代。

所以Ariza首先做的是着眼于视觉上的显着特征,用一个简单模型测量特征与整体分类的相关性。

利用OpenCV API提取Blob特征:染色的寄生虫为Blob

他设计了一系列能指示细胞颜色、面积、凸度和圆度的特征,还创建了一些用来确定寄生虫是否在细胞中可见的特征。由于寄生虫的颜色和细胞质不一样,这时它们可以被看作是图像中的Blob。由于一个细胞内可能有多个寄生虫,每个细胞包含的Blob数可以被记入特征集。

所谓Blob,指的是图像中的一组连接像素,它们共享一些共同属性(例如灰度值)。OpenCV提供了一种检测Blob的便捷方法,能按颜色、大小和形状过滤我们想要的Blob类型,只需设置相应参数

构建模型

完成特征工程后,Ariza保留了20%的数据用于测试,并对剩余的80%进行了3折交叉验证。之后,他又比较了四个机器学习分类器,从中选了一个F2得分为0.8的随机森林模型。

流程:从感染(蓝)和未感染(橙)单细胞图像中提取特征—训练模型—比较模型—选择

但这不是最终结果。之前我们提到了,CNN模型在图像分类上的性能是最好的。Blob检测虽然操作方便,但性能却很一般,如下图所示,它在细胞边缘和周边位置表现很差。再加有些寄生虫可能没有被造影剂彻底染色,这时它们和细胞的颜色差异微乎其微,会影响分类器的输出结果。

被模型错误分类的感染细胞(假阴性),其中中间细胞的右下角有一个未被彻底染色的寄生虫

此外,一些受感染的细胞在图像上本身就难以表征。比如下面这幅图,在人类专家眼里,左侧这个细胞很可能被感染了,因为上面有很多奇怪的白色突起(蓝圈),它们可能是感染细胞上才有的黏连结节(knob)。

但无论是不是黏连结节,当前这个简单分类器都难以提取这些指示寄生感染的微妙特征。于是Ariza放弃继续手动添加特征,转而用CNN生成特征。

让事情变得更复杂

他选取的CNN是Inception v3。我们都知道,初始Inception v3已经在ImageNet数据集上经过训练,能分辨什么是人,什么是狗,但它肯定没法分类疟疾感染细胞。为了进行重新设计,Ariza删除了分类层,为每个图像生成了2048个特征,之后又用PCA把特征降维到100个。在经过3折交叉验证训练、测试和比较四种ML分类器后,他最后得到了一个F2得分为0.92的logistic regression分类器(L2正则)。这相比初代的随机森林模型显然是个巨大进步,而性能提升的关键就是用CNN做后端。

把CNN提取的图像特征用于模型训练

把模型变成WebApp

最后就是模型的部署——Ariza把它称为“疟疾英雄”。这个WebApp的潜在用户是临床医生和患者,所以当他们上传单个细胞图像后,APP要返回每个细胞被归类为感染或未感染的结果。我们可以用三个正则表达式从每个图像中提取元数据,包括患者ID号,然后将结果按患者分组并根据感染率分类。

“疟疾英雄”界面

根据Ariza的个人体验(在校期间培养干细胞时的数细胞经验),“疟疾英雄”可以在诊断疟疾时,为临床医生节省85%的诊断用时。这意味着按照朝九晚五的工作时长,每个医生每月可以多接诊1400名患者。

手动、自动速度对比

由于结果是根据感染率进行分类的,模型产生的结果也能帮助临床医生根据感染率对患者进行优先排序,加快对病情加重的患者的治疗。

考虑到疟疾多发地都是经济欠发达区域,优质医疗资源非常受限,而“疟疾英雄”使用的数据集图像都是手机拍摄的,这个APP其实也为“移动问诊”提供了可能性。只要临床医生能拍摄足够清晰的单细胞图像,他就能随时随地高效诊断。同时,一些新临床医生也能利用模型的结果,进一步提高自己的镜检水平。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 机器学习
    +关注

    关注

    66

    文章

    8096

    浏览量

    130522
  • 数据集
    +关注

    关注

    4

    文章

    1176

    浏览量

    24340
  • 图像分析
    +关注

    关注

    0

    文章

    80

    浏览量

    18561

原文标题:疟疾WebApp:用深度学习加快疟疾诊断

文章出处:【微信号:jqr_AI,微信公众号:论智】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    机器学习能诊断病情,还能预测患者出院后的情况?

    行业应用AI也比较火热,比如利用AI检测癌症、驱动新药发现引擎、基因检测等。而脓毒症(Sepsis)是种医疗行业常见的并发症,本文将使用机器学习预测脓毒症患者的出院后情况。 脓毒症是指因感染因素
    发表于 05-07 15:29

    医疗治病,人工智能解决什么问题?

    利用深度学习分析医学图像也是人工智能技术在医疗领域的重要应用之。在这方面英特尔已经与业界合作伙伴合作,
    发表于 10-23 06:21

    利用电表诊断数据发挥部署AMI的全部潜能

    供出色的投资回报率。领先的电力公司在考虑部署新电表时需要考虑,在下代电表中增加电表内诊断功能是否能提升其投资回报率。借助支持mSure的电表和ADI
    发表于 10-25 09:57

    人工智能机器学习程序可分析患者肺癌肿瘤影像

    美国纽约大学医学院研究者报告的种新的美国纽约大学医学院研究者报告的种新的人工智能/机器学习程序可分析患者肺癌肿瘤影像,判定肿瘤类型,甚至可以判断驱动基因异常。研究发现,人工智能判断
    发表于 11-08 06:45

    三项颠覆性技术将改变牙科

    。新的先进技术改变了我们的日常生活,也使牙科发生了革命性变化。技术有可能自动化现有牙科治疗决策工作流程,帮助牙医做出精确诊断,也让患者得到适当的牙科护理。 以下是
    发表于 12-20 06:18

    利用符号模拟技术优化错误诊断方法

    模型可以被扩展来定位多错误,并且可以用于解决时序电路的错误诊断。Shi-Yu Huang提出了利用符号模拟来优化拜占庭式错误诊断的过程。Boppana介绍
    发表于 07-05 08:05

    如何利用CMOS图像通道设计超声诊断仪?

    1 引言随着医疗诊断仪器小型化、便携化的进程,高性能32位微处理器正在越来越多地应用于各类小型医疗影像设备中,但是如何利用这些微处理器传送和处理实时图像,却是
    发表于 07-31 06:25

    如何利用RFID技术减少医疗差错?

    患者从就诊到得到治疗需要经过3步骤:医生检查患者得出初步诊断后开具医嘱,护士将医嘱转抄到输液或治疗卡上并准备执行,护士实施治疗方案。这3
    发表于 08-07 07:16

    再见疟疾!全球首款自动显微疟疾诊断设备面世

    Sight Diagnostics公司的龙头产品Parasight平台是全球首款自动显微疟疾诊断设备,选择了Trinamic的TMCM6110步进模块来搭建Parasight平台。
    的头像 发表于 07-14 11:29 5125次阅读

    类似折纸的传感器能帮助乌干达农村地区诊断疟疾

    偏远地区的诊断是抗击疟疾的挑战之一。疟疾的症状可能与其他疾病相似,如果没有适当的诊断患者可能会接受昂贵且不必要的治疗。此前有通过刺血进行的
    发表于 02-22 09:02 134次阅读

    俄罗斯专家开发神经网络诊断系统 通过咳嗽声实时判断患者是否患有新冠

    1月19日消息 据俄媒 Vesti 报道,俄罗斯专家开发了一种神经网络诊断系统,能够通过咳嗽声实时判断患者是否患有新冠肺炎。目前基于该诊断
    的头像 发表于 01-19 13:28 1580次阅读

    科学家开发可诊断疟疾的新型磁性技术

    据外媒报道,要确定一个人是否患有疟疾是很困难的,以至于许多甚至没有患病的人最终都要接受治疗。然而,一种新的技术可以使诊断变得更加容易和可靠。
    的头像 发表于 02-19 11:30 1265次阅读

    【世说芯品】Trinamic步进电机控制模块助力抗击疟疾

    疟疾是世界上最致命的传染病之一。这种疾病在亚洲、非洲和南美洲的热带地区十分常见,越早诊断,越能有效治疗。标准疟疾检测需要由训练有素的技术人员在显微镜下检测血液样本,以确认
    的头像 发表于 06-28 11:21 224次阅读
    【世说芯品】Trinamic步进电机控制模块助力抗击<b class='flag-5'>疟疾</b>

    影像诊断技术包括哪些 影像诊断和影像技术的区别

    影像技术是用于获取和生成医学影像的各种技术和设备;而影像诊断利用医学影像来诊断疾病、评估病情和指导治疗的过程。影像
    发表于 07-21 15:11 1562次阅读

    利用电表诊断数据发挥AMI部署的全部潜能

    电子发烧友网站提供《利用电表诊断数据发挥AMI部署的全部潜能.pdf》资料免费下载
    发表于 11-27 09:29 0次下载
    <b class='flag-5'>利用</b>电表<b class='flag-5'>诊断</b>数据发挥AMI<b class='flag-5'>部署</b>的全部潜能