0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

基于人工智能技术对疾病的判断与预测及医治

深度学习自然语言处理 来源:云孚科技北京有限公司 作者:哈工大SCIR 王昊淳 2021-03-30 15:39 次阅读

1.介绍

人工智能技术飞速发展的当下,基于人工智能方法的智慧医疗系统也逐渐吸引了大量研究人员的目光,计算机辅助的分诊、诊断等应用可以一定程度地缓解部分地区的医疗条件紧张问题,同样可以为医生的决策提供辅助参考。在数字化医疗系统的普及下,与病患相关的医疗数据,如电子医疗记录、医嘱、生物化学检测结果以及基因组信息也已经基本实现电子化[1],因此,通过数据挖掘、深度学习等方法对上述电子化信息进行学习,进而得到患者与患者之间的相似程度,是实现疾病判断、病情预测以及精准医疗(precision medicine)等应用的重要的前提条件,且上述过程也受启发于实际临床中医生的诊疗过程。病患相似度度量方法的流程大致如图1,首先根据患者的数据信息进行数据抽象化,并选择合适算法与度量方法对抽象化结果进行相似度评估,进而将相似度结果应用于相应的下游任务中。

27be60ea-8e8f-11eb-8b86-12bb97331649.png

图1 病患相似度分析工作的基本流程[3]

2.病患数据

病患相关数据是天然多模态(multi-modal)且异构(heterogeneous)的,可能涵盖文本信息(如病历)、图像信息(如CT影像)、时序信号信息(如心电图)和数值信息(如血常规检查结果)等等,从病患相似度的历史研究中所包括的类型来看,一般可将病患数据分为以下五类[2]:

临床数据 Clinical data

分子数据 Molecular data

图像与生物信号 Imaging and bio signals

实验室结果 Lab results

病患所述结果 Patient-reported outcomes

临床数据包括电子病历信息、医保数据等;分子数据包括DNA信息、蛋白质序列信息等;图像与生物信号包括CT、MRI、心电图等;实验室结果包括血液检测结果、核酸抗体检测结果等;病患所述结果包括患者出院后的回访信息以及相关口述信息等。从形式上看,病患数据等的医学相关数据都属于纵向数据(longitudinal data),即数据来源于不同个体在不同时间节点测得的数据。

根据以上信息可知,病患数据特征一般有着较多的维度,每维特征的采样次数与分辨率有所不同,且数据完备程度也不一样[3],因此病患数据中大多存在噪声、异常数据以及数据缺失等问题。同时,由于患者在患病就医后,病症的减轻或加重都会导致患者的多次来访和复检,因此病患数据多为纵向数据,即数据来源于每个个体在不同时间点上的观测值[4]。

3.病患相似度度量相关数据

3.1 UCI 数据集[5]

UCI数据集是机器学习社区中使用率很高的领域丰富的数据集仓库,其中也涵盖与医学健康相关的数据集,相关数据也为病患相似度度量工作的数据来源,包括帕金森氏症数据集[6]、心脏病数据集[7]、糖尿病数据集[8]、癌症数据集[9]等等。

3.2 ADNI数据集[10]

ADNI(Alzheimer‘s Disease Neuroimaging Initiative)是一个通过生物标记与临床数据追踪阿尔兹海默症发展过程的纵向研究计划,数据内容包括临床诊断、生物样本、药物使用历史、基因组数据以及脑补成像数据,疾病的诊断工作每数月进行一次并持续数年,研究对象被分为三组,分别为正常对照组、中度认知障碍(MCI, Mild Cognitive Impairment)和阿尔兹海默症患者(AD, Alzheimer’s Disease)。

3.3 SOF数据集[11]

SOF(Study of Osteoporotic Fracture)是一个长达二十余年的针对年长白人女性骨质疏松病症的医院来访纵向研究,研究旨在分析高龄白人女性患骨质疏松的风险因素,研究对象被分为正常对照组、骨质减少(osteopenia)以及骨质疏松(osteoporosis)。

3.4 MIMIC数据集[12]

MIMIC-III(Medical Information Mart for Intensive Care III)是大规模的匿名化健康数据库,包括了十余年间超过四千名患者在危重症监护病房的相关记录,包括患者个人信息、生命体征监测数据、实验室监测数据、图像报告等多种病患数据信息。

3.5 ICD-9-CM 编码集[13]

ICD-9-CM(The international classification of disease, ninth revision, clinical modification) 是在临床中将诊断结果编码表示的一种官方标准,包括疾病编码列表,疾病类型分类以及手术、诊断、诊疗手段分类系统。

4.深度病患相似度学习[14]

27d23188-8e8f-11eb-8b86-12bb97331649.png

图2 患者数据样例(横轴为病患来访医院序列,纵轴为医疗事件对应的ICD9编码)

Suo等人[14]于2018年在IEEE TRANSACTIONS ON NANOBIOSCIENCE上发表了一种基于深度学习的病患相似度学习方法,模型分为两个模块,分别是表示学习和相似度学习。病患数据是由代表医疗相关事件对应的ICD编码形成的独热编码矩阵,如图2,每名患者对应一个矩阵,横轴代表患者来访医院的时间序列,纵轴为医疗事件对应的ICD9编码,若患者患有疾病或有相关症状,则矩阵对应位置为1。在表示学习中,作者通过全连接层将患者的高维稀疏独热向量矩阵映射到低维稠密空间,并依托卷积神经网络捕捉病患信息的连续的时序特征;对于相似度学习,作者使用基于softmax的有监督分类方法并通过triplet loss使每两个患者对相似的患者距离更近而不相似的患者距离更远,以此在患者聚类任务上实现较好的效果。

282f0f2a-8e8f-11eb-8b86-12bb97331649.png

图3 模型结构

5.病患相似度度量的可解释性

在各种病患相似度度量方法被初步探索后,在真实的使用场景下,医疗相关从业人员在关注模型的性能的同时,更加关注模型输出结果过程中的透明度和可解释性。Huai等人[15]因此在BIBM 2020提出了一种为所学习到的病患相似度模型行为提供全局解释的模型无关的方法。一般来说,病患相似度的研究工作可能包括数十种特征,作者认为通过筛选选择众多特征中数量最少且足以解释模型判断结果的特征子集作为解释模型判断的依据可以很好地为实际场景下的相关人员提供参考。对于数据集中的患者个体,每两个患者间即可计算一次相似度,相似度结果一般为相似或相异,而当随机减少数据集中的特征数量后重新计算每两个患者间的相似度,结果会产生一定的变化,而通过量化评估这一变化即可评价去除的特征的重要性,并以此作为该特征在度量病患间相似度时的贡献程度。

6.病患数据安全

在数据驱动的病患相似度度量方法不断发展的同时,方法背后所使用数据的安全性也逐渐成为了患者、医疗机构以及相关监管部门关心的话题,同时很多医疗机构出于对患者个人信息的保护,不愿将敏感的医疗相关数据对研究人员开放,在这种背景下,在不访问所有人数据的前提下进行模型学习成为了解决这一数据安全问题的前提。Huai等人[16]在SDM 2018上,在提出不相关特征提取模型的前提下,还考虑了上述数据安全问题,进而提出了分布式病患相似度度量模型,即分布在不同地点的数据在进行度量模型学习时,只将学习得到的参数上传学习器,而学习器通过对全局参数进行优化迭代将结果回传至每个节点进行迭代直至全局收敛。Xu等人[17]在AAAI 2019的工作中将联邦学习(Federated Learning)方法引入病患相似度度量工作,实现在数据本地保存的同时完成模型的训练,并通过最小化相似度留存损失以及异质信息损失进而同时保留同类与异类数据间的关系。
编辑:lyn

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 人工智能
    +关注

    关注

    1773

    文章

    43372

    浏览量

    230134
  • 数据挖掘
    +关注

    关注

    1

    文章

    405

    浏览量

    24020
  • 深度学习
    +关注

    关注

    73

    文章

    5206

    浏览量

    119804

原文标题:【赛尔笔记】病患相似度度量简述

文章出处:【微信号:zenRRan,微信公众号:深度学习自然语言处理】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    智能运维技术的发展和设计资料

    智能运维技术,就是利用当下的虚拟现实技术(VirtualReality、VR)增强现实技术(AugmentedReality,AR)、人工智能技术
    发表于 09-21 07:18

    如何将人工智能应用到效能评估系统软件中去解决

    ,我们可以将其应用到效能评估系统中,进一步提高效能评估的准确性和实用性。   华盛恒辉可以利用人工智能技术,通过对大量数据的分析,来识别和评估各个业务环节的表现,从而对效能进行评估和监测。此外,我们还可
    发表于 08-30 12:58

    人工智能技术应用好不好

    人工智能技术应用好不好 近年来,在人类社会的各个领域,人工智能技术正越来越广泛地应用。这种技术旨在让机器具备类似人类的思维能力,使它们能够像人一样完成复杂的任务,甚至在某些方面比人要更强大。但是
    的头像 发表于 08-17 12:37 281次阅读

    人工智能技术应用是干什么的

    人工智能技术应用是干什么的 人工智能技术应用是指将人工智能算法与计算机技术相结合,构建出具有智能的应用程序或者系统,以实现各种
    的头像 发表于 08-17 11:46 2025次阅读

    人工智能技术应用学什么

    人工智能技术应用学什么 随着科技的不断发展,人工智能技术(Artificial Intelligence,AI)已经成为了人们关注的焦点。AI是一种模拟人类智能技术,可以自主地学习、
    的头像 发表于 08-17 11:46 769次阅读

    人工智能技术应用是干什么的

    人工智能技术应用是干什么的 随着科技的发展,人工智能技术应用已经逐渐渗透到我们的生活中,大大方便了人们的生活和工作。从互联网搜索引擎到自动化机器人,从智能家居到自动驾驶汽车,人工智能技术
    的头像 发表于 08-17 11:46 777次阅读

    人工智能技术及应用学什么

    人工智能技术及应用学什么 随着科技的发展和人类对智能的需求不断增长,人工智能(AI)成为热门话题。人工智能是一种通过计算机程序模拟人类智能
    的头像 发表于 08-15 16:07 943次阅读

    人工智能技术应用是干嘛的

    的应用越来越广泛,为我们的生产生活带来了革命性的变化。下面就让我们来了解一下人工智能技术的应用是干嘛的。 一、医疗保健 人工智能技术在医疗保健方面的应用逐渐成为热门话题。它可以帮助医生和患者更好地管理疾病和健康,从而提高医疗水平
    的头像 发表于 08-15 16:04 1173次阅读

    al人工智能技术是什么

    机器学习是人工智能技术的核心,它是指通过计算机程序自动学习模式,从而实现预测、分类、聚类等任务的一种方法。机器学习模型通过输入数据进行“训练”,根据数据的规律不断优化自身,以达到更加准确的预测
    的头像 发表于 08-14 15:21 5514次阅读

    什么叫人工智能技术

    人工智能技术的核心就在于“智能”,因此它的定义也因时代和不同的应用场景而不同。在一些传统的计算机任务中,人工智能被称为人工神经网络或机器学习。随着时间的推移,这种
    的头像 发表于 08-13 16:52 2176次阅读

    如何看待人工智能的前景

    目前,人工智能在各个领域都有广泛应用。例如,在医疗领域,人工智能技术被应用于疾病预测、病案分析、医学影像诊断等方面,可以大大提高医疗水平。
    的头像 发表于 08-13 16:50 1290次阅读

    什么是人工智能技术

    什么是人工智能技术 人工智能技术指的是一系列基于人工智能原理与方法的技术人工智能技术通过巨大的数据挖掘和分析,让计算机实现像人类一样的
    的头像 发表于 08-12 16:58 1527次阅读

    人工智能技术是什么

    人工智能技术是什么 人工智能技术是一种模拟人类智能技术,其中包含了许多不同的领域和应用,如机器学习、自然语言处理、计算机视觉、智能代理、知
    的头像 发表于 08-12 16:48 2026次阅读

    人工智能技术有哪些

    的几种主要类型以及它们的应用。 第一,机器学习。机器学习是一种人工智能技术,它利用算法让计算机能够从数据中自动学习,并通过这些学习提高预测准确性。它可以在许多领域应用,如大规模数据分析、自然语言处理、图
    的头像 发表于 08-12 16:37 1057次阅读

    【书籍评测活动NO.16】 通用人工智能:初心与未来

    已经变得越来越复杂而强大,但计算机科学还远未创造出通用人工智能(General AI)。作者结合人类自然智能的认知机理以及人工智能发展的初心与使命,带我们从不同方面细致分析了当前人工智能技术
    发表于 06-21 14:41