0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

基于人工智能技术对疾病的判断与预测及医治

深度学习自然语言处理 来源:云孚科技北京有限公司 作者:哈工大SCIR 王昊淳 2021-03-30 15:39 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

1.介绍

人工智能技术飞速发展的当下,基于人工智能方法的智慧医疗系统也逐渐吸引了大量研究人员的目光,计算机辅助的分诊、诊断等应用可以一定程度地缓解部分地区的医疗条件紧张问题,同样可以为医生的决策提供辅助参考。在数字化医疗系统的普及下,与病患相关的医疗数据,如电子医疗记录、医嘱、生物化学检测结果以及基因组信息也已经基本实现电子化[1],因此,通过数据挖掘、深度学习等方法对上述电子化信息进行学习,进而得到患者与患者之间的相似程度,是实现疾病判断、病情预测以及精准医疗(precision medicine)等应用的重要的前提条件,且上述过程也受启发于实际临床中医生的诊疗过程。病患相似度度量方法的流程大致如图1,首先根据患者的数据信息进行数据抽象化,并选择合适算法与度量方法对抽象化结果进行相似度评估,进而将相似度结果应用于相应的下游任务中。

27be60ea-8e8f-11eb-8b86-12bb97331649.png

图1 病患相似度分析工作的基本流程[3]

2.病患数据

病患相关数据是天然多模态(multi-modal)且异构(heterogeneous)的,可能涵盖文本信息(如病历)、图像信息(如CT影像)、时序信号信息(如心电图)和数值信息(如血常规检查结果)等等,从病患相似度的历史研究中所包括的类型来看,一般可将病患数据分为以下五类[2]:

临床数据 Clinical data

分子数据 Molecular data

图像与生物信号 Imaging and bio signals

实验室结果 Lab results

病患所述结果 Patient-reported outcomes

临床数据包括电子病历信息、医保数据等;分子数据包括DNA信息、蛋白质序列信息等;图像与生物信号包括CT、MRI、心电图等;实验室结果包括血液检测结果、核酸抗体检测结果等;病患所述结果包括患者出院后的回访信息以及相关口述信息等。从形式上看,病患数据等的医学相关数据都属于纵向数据(longitudinal data),即数据来源于不同个体在不同时间节点测得的数据。

根据以上信息可知,病患数据特征一般有着较多的维度,每维特征的采样次数与分辨率有所不同,且数据完备程度也不一样[3],因此病患数据中大多存在噪声、异常数据以及数据缺失等问题。同时,由于患者在患病就医后,病症的减轻或加重都会导致患者的多次来访和复检,因此病患数据多为纵向数据,即数据来源于每个个体在不同时间点上的观测值[4]。

3.病患相似度度量相关数据

3.1 UCI 数据集[5]

UCI数据集是机器学习社区中使用率很高的领域丰富的数据集仓库,其中也涵盖与医学健康相关的数据集,相关数据也为病患相似度度量工作的数据来源,包括帕金森氏症数据集[6]、心脏病数据集[7]、糖尿病数据集[8]、癌症数据集[9]等等。

3.2 ADNI数据集[10]

ADNI(Alzheimer‘s Disease Neuroimaging Initiative)是一个通过生物标记与临床数据追踪阿尔兹海默症发展过程的纵向研究计划,数据内容包括临床诊断、生物样本、药物使用历史、基因组数据以及脑补成像数据,疾病的诊断工作每数月进行一次并持续数年,研究对象被分为三组,分别为正常对照组、中度认知障碍(MCI, Mild Cognitive Impairment)和阿尔兹海默症患者(AD, Alzheimer’s Disease)。

3.3 SOF数据集[11]

SOF(Study of Osteoporotic Fracture)是一个长达二十余年的针对年长白人女性骨质疏松病症的医院来访纵向研究,研究旨在分析高龄白人女性患骨质疏松的风险因素,研究对象被分为正常对照组、骨质减少(osteopenia)以及骨质疏松(osteoporosis)。

3.4 MIMIC数据集[12]

MIMIC-III(Medical Information Mart for Intensive Care III)是大规模的匿名化健康数据库,包括了十余年间超过四千名患者在危重症监护病房的相关记录,包括患者个人信息、生命体征监测数据、实验室监测数据、图像报告等多种病患数据信息。

3.5 ICD-9-CM 编码集[13]

ICD-9-CM(The international classification of disease, ninth revision, clinical modification) 是在临床中将诊断结果编码表示的一种官方标准,包括疾病编码列表,疾病类型分类以及手术、诊断、诊疗手段分类系统。

4.深度病患相似度学习[14]

27d23188-8e8f-11eb-8b86-12bb97331649.png

图2 患者数据样例(横轴为病患来访医院序列,纵轴为医疗事件对应的ICD9编码)

Suo等人[14]于2018年在IEEE TRANSACTIONS ON NANOBIOSCIENCE上发表了一种基于深度学习的病患相似度学习方法,模型分为两个模块,分别是表示学习和相似度学习。病患数据是由代表医疗相关事件对应的ICD编码形成的独热编码矩阵,如图2,每名患者对应一个矩阵,横轴代表患者来访医院的时间序列,纵轴为医疗事件对应的ICD9编码,若患者患有疾病或有相关症状,则矩阵对应位置为1。在表示学习中,作者通过全连接层将患者的高维稀疏独热向量矩阵映射到低维稠密空间,并依托卷积神经网络捕捉病患信息的连续的时序特征;对于相似度学习,作者使用基于softmax的有监督分类方法并通过triplet loss使每两个患者对相似的患者距离更近而不相似的患者距离更远,以此在患者聚类任务上实现较好的效果。

282f0f2a-8e8f-11eb-8b86-12bb97331649.png

图3 模型结构

5.病患相似度度量的可解释性

在各种病患相似度度量方法被初步探索后,在真实的使用场景下,医疗相关从业人员在关注模型的性能的同时,更加关注模型输出结果过程中的透明度和可解释性。Huai等人[15]因此在BIBM 2020提出了一种为所学习到的病患相似度模型行为提供全局解释的模型无关的方法。一般来说,病患相似度的研究工作可能包括数十种特征,作者认为通过筛选选择众多特征中数量最少且足以解释模型判断结果的特征子集作为解释模型判断的依据可以很好地为实际场景下的相关人员提供参考。对于数据集中的患者个体,每两个患者间即可计算一次相似度,相似度结果一般为相似或相异,而当随机减少数据集中的特征数量后重新计算每两个患者间的相似度,结果会产生一定的变化,而通过量化评估这一变化即可评价去除的特征的重要性,并以此作为该特征在度量病患间相似度时的贡献程度。

6.病患数据安全

在数据驱动的病患相似度度量方法不断发展的同时,方法背后所使用数据的安全性也逐渐成为了患者、医疗机构以及相关监管部门关心的话题,同时很多医疗机构出于对患者个人信息的保护,不愿将敏感的医疗相关数据对研究人员开放,在这种背景下,在不访问所有人数据的前提下进行模型学习成为了解决这一数据安全问题的前提。Huai等人[16]在SDM 2018上,在提出不相关特征提取模型的前提下,还考虑了上述数据安全问题,进而提出了分布式病患相似度度量模型,即分布在不同地点的数据在进行度量模型学习时,只将学习得到的参数上传学习器,而学习器通过对全局参数进行优化迭代将结果回传至每个节点进行迭代直至全局收敛。Xu等人[17]在AAAI 2019的工作中将联邦学习(Federated Learning)方法引入病患相似度度量工作,实现在数据本地保存的同时完成模型的训练,并通过最小化相似度留存损失以及异质信息损失进而同时保留同类与异类数据间的关系。
编辑:lyn

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 人工智能
    +关注

    关注

    1819

    文章

    50289

    浏览量

    266826
  • 数据挖掘
    +关注

    关注

    1

    文章

    406

    浏览量

    25123
  • 深度学习
    +关注

    关注

    73

    文章

    5603

    浏览量

    124609

原文标题:【赛尔笔记】病患相似度度量简述

文章出处:【微信号:zenRRan,微信公众号:深度学习自然语言处理】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    中科曙光万卡超集群为“人工智能+”提供底层动力

    马年春晚,人工智能技术的多元创新应用惊艳全国观众,尽显科技与文化融合的时代风采;春节过后,各地“新春第一会”相继召开,人工智能成为高频关键词。
    的头像 发表于 03-04 14:15 486次阅读

    浅谈人工智能(2)

    接前文《浅谈人工智能(1)》。 (5)什么是弱人工智能、强人工智能以及超人工智能? 弱人工智能(Weak AI),也称限制领域
    的头像 发表于 02-22 08:24 321次阅读
    浅谈<b class='flag-5'>人工智能</b>(2)

    物联网新手小白,求前辈推荐一款学习用开发板

    我是新手小白,想自学物联网和人工智能技术,希望前辈们能推荐一款适合进行初级到中级知识学习、实验和项目开发的开发板兼顾性价比,包括具体的品牌和型号。
    发表于 12-25 18:44

    成都华微出席人工智能技术创新能力供需对接活动

    近日,成都华微电子科技股份有限公司受邀参加了由成都市科技局主办,四川省人工智能行业协会、四川省人工智能研究院承办的“科创天府·智汇蓉城”成都市人工智能技术创新能力供需对接活动。作为西南地区集成电路
    的头像 发表于 12-10 16:17 677次阅读

    微软与新思科技分享智能人工智能技术的行业影响

    (Agentic AI)技术的行业影响,以及未来跨界合作的前景。此次圆桌讨论不仅展现了双方的战略协同,以及他们在开发市场领先解决方案方面的共同努力,也勾勒出人工智能是如何驱动工程、电信、制药等行业变革的新蓝图。
    的头像 发表于 11-30 09:48 506次阅读

    航天宏图人工智能技术深度赋能社会治理现代化

    航天宏图多年来持续重点投入技术研发,尤其专注人工智能深度探索。航天宏图多以自主研发“天权大模型” 是一款基于多模态大模型技术的遥感解译专用AI大模型,它以人工智能为底座,提供遥感影像
    的头像 发表于 09-06 10:35 1302次阅读
    航天宏图<b class='flag-5'>人工智能技术</b>深度赋能社会治理现代化

    重磅来袭!2026全球人工智能终端展暨第七届深圳人工智能展览会

    深圳国际人工智能展深耕六载,始终紧跟国家人工智能发展方向,通过搭建人工智能技术与行业对话的展示平台,致力于人工智能产业链上下游的深度联动与资源精准对接,为创新成果从研发到生产再到消费端
    的头像 发表于 08-26 18:02 867次阅读

    中科创达旗下创通联达即将举办RUBIK Pi 3端侧人工智能技术巡演

    人工智能技术加速向端侧渗透,驱动产业智能化转型的战略机遇期,全球领先的智能物联网产品和解决方案提供商Thundercomm(创通联达)将于2025年9月至10月期间,携手Atlantik
    的头像 发表于 08-15 15:56 1377次阅读

    挖到宝了!人工智能综合实验箱,高校新工科的宝藏神器

    的深度学习,构建起从基础到前沿的完整知识体系,一门实验箱就能满足多门课程的学习实践需求,既节省经费又不占地 。 五、代码全开源,学习底层算法 所有实验全部开源,这对于想要深入学习人工智能技术的人来说
    发表于 08-07 14:30

    挖到宝了!比邻星人工智能综合实验箱,高校新工科的宝藏神器!

    的深度学习,构建起从基础到前沿的完整知识体系,一门实验箱就能满足多门课程的学习实践需求,既节省经费又不占地 。 五、代码全开源,学习底层算法 所有实验全部开源,这对于想要深入学习人工智能技术的人来说
    发表于 08-07 14:23

    达实智能人工智能智能制造专业委员会委员

    近日,达实智能收到来自深圳上市公司协会颁发的证书,凭借在人工智能技术研发与应用领域的实践成果,当选深上协“人工智能智能制造专业委员会”委员。
    的头像 发表于 07-29 16:36 1042次阅读

    人工智能技术的现状与未来发展趋势

    人工智能技术的现状与未来发展趋势     近年来,人工智能(AI)技术迅猛发展,深刻影响着各行各业。从计算机视觉到自然语言处理,从自动驾驶到医疗诊断,AI的应用场景不断扩展,推动社会向智能
    的头像 发表于 07-16 15:01 2266次阅读

    CES Asia 2025同期低空智能感知与空域管理技术论坛即将启幕

    的最新进展,探讨如何打破系统间的壁垒,实现不同系统之间的信息共享与协同工作,为未来城市空中交通的大规模商业化运营奠定基础。 人工智能技术的飞速发展,为空域动态管理带来了新的机遇。在这一议题下,与会者将深入探讨
    发表于 07-10 10:16

    最新人工智能硬件培训AI 基础入门学习课程参考2025版(大模型篇)

    人工智能大模型重塑教育与社会发展的当下,无论是探索未来职业方向,还是更新技术储备,掌握大模型知识都已成为新时代的必修课。从职场上辅助工作的智能助手,到课堂用于学术研究的智能工具,大模
    发表于 07-04 11:10

    中科曙光亮相2025全球人工智能技术大会

    此前,6月7日-8日,2025全球人工智能技术大会(GAITC 2025)在杭州举办。中科曙光携全栈AI基础设施多项核心成果深度参与本次大会,并携手中国人工智能学会成功举办“大模型时代的AI基础设施”专题活动,全方位展示在智能
    的头像 发表于 06-10 16:19 1378次阅读