0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

Healthbox报告:如何利用大数据?利用大数据需要注意什么?

电子工程师 来源:lp 2019-03-05 16:48 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

“大数据”、“人工智能”和“物联网”是医疗行业使用越来越频繁的术语。

“人工智能(AI)”一词诞生于1956年,但近年来,由于数据量的显著增加、先进算法使机器能够像人类一样“思考、工作和反应”,以及计算能力和存储能力的提高,“人工智能”一词的受欢迎程度急剧上升。

大数据的概念出现在20世纪90年代,它描述的数据集太大或太复杂,即使是在低延迟的情况下,传统数据库或数据处理应用软件也无法在合理的时间内捕获、管理和处理数据。

促成大数据积累的是物联网(IoT),这个术语自1999年首次被用作“物联网”(Internet for Things)以来一直在演变,当时射频识别(RFID)是物联网的概念核心。

如今,物联网涵盖了与互联网相连的一切,包括传感器智能手机、医疗设备、可穿戴设备等,所有这些都是实时采集和上传的,健康相关大数据也在快速积累。

近日,创新咨询与基金管理服务公司Healthbox发布了《利用大数据》(Harnessing Big Data)报告,报告旨在研究医疗行业与大数据的关系。主要内容有:

背景:大数据是什么?

前景:如何利用大数据?

分析:利用大数据需要注意什么?

应用程序:大数据的现实应用

以下是编译的该报告的主体内容:

背景:大数据是什么?

大数据简史

随着时间的推移,“大数据”、“物联网”和“人工智能”这三个词被分别创造出来。今天,它们在快速发展的技术世界中形成了独特的聚合,影响着我们收集、感知和分析健康相关数据的方式。

1956年:“人工智能”(AI)一词由计算机科学家John McCarthy首创,他曾就此问题举行过学术会议。

1990-1999年:大数据作为一个术语出现,用来描述对于传统数据库来说太大或太复杂而无法处理的数据集。

1999 - 2008年:物联网的概念在这一时期发展起来,最初是指通过射频识别技术获取数据。

今天,人类在人工智能方面的能力正在迅速扩张,人工智能是收集和分析每秒通过物联网创建的大量数据的关键组成部分,包括所有连接到互联网的数据。

医疗领域的大数据机遇看似无穷无尽,但也存在许多值得思考的问题:

我们收集哪些类型的数据?

这个数据的来源是什么?

我们已经拥有的数据中存在哪些空白,我们如何填补这些空白?

目前这些数据如何被使用,潜在的其他应用程序是什么?

我们如何保护这些数据以防止网络入侵、数据安全损失和其他形式的网络安全风险?

大数据的四个“V”

医疗大数据的四个“v”包括容量(volume)、速度(velocity)、多样性(variety)和有效性(validity)。由于电子病历(EMR)的广泛采用、精准医学决定因素的加速发现,以及可穿戴生物传感器的迅速发展,个人数据来源的增长,导致了健康数据的绝对数量激增。

图片来源:Healthbox

收集和利用大数据

传感器、智能手机、医疗设备、可穿戴设备等实时采集和上传信息的进化,导致了大数据的积累。正在收集的数据具有数量大、速度快和多样性的特点,为利用和确保其有效性,使其造福于人类,大数据向基于证据的精准医学提出了挑战。

除了传统的生物康测量方法,还有大量的社会人口学、地理位置学和非医学元数据,这些元数据都有意义地相互作用,以确定个人或多人的健康状况。

在传统数据系统之间创建互操作性的挑战多种多样。

如今,我们需要跨不同的筒仓数据源集成更广泛的数据。如果要让大数据有意义地塑造护理决策,关键是要确定所有这些不同测量方法的有效性和准确性、它们的派生推论以及我们从这些数据中推断出的可操作结论。

前景:如何利用大数据?

在向基于价值的医疗服务转型过程中利用大数据

尽管这可能看起来令人生畏,但这四个“v”实际上很好地契合了医疗服务转型的需求,即从按服务收费的行业向以信息为基础,以及价值驱动的医疗服务提供模式转变。获取用于描述人群特征的全面数据,以及用于根据个人需求定制决策的精确数据,将至关重要地为医疗策略提供信息并确定优先级,指导针对特定个人的精确医疗决策。

对预防干预的日益重视,对不断演变的患者病情的治疗的不断个性化,以及在整个患者过程中护理的协调,使得获取、解释和持续分析患者病情变得十分必要。它还需要对大量数据进行及时的处理。

健康的社会决定因素是健康结果的重要潜在驱动力,因此需要综合各种各样的数据输入以做出可采取行动的决定,这种数据输入正在迅速扩大。但是,如何从这些数据中形成可执行的决策?

从海量数据中提取信号

人类无法衡量现有的海量数据,也无法独自得出有意义的结论。谷歌脑人工智能研究小组(Google Brain AI Research Group)产品经理、医学博士Lily Peng指出,虽然人类智能最适合整合少量非常“大影响”的因素,但人工智能尤其擅长梳理和识别大量非常“小影响”或模糊因素的模式。这是机器学习和人工智能作为人类智能不可或缺的合作伙伴可以发挥的补充作用,它们可以帮助医疗保健提供者应对来自各个方向的海量、快速和多样的数据。

从这些海量的数据中得出有效的结论,需要重新设计现有的决策过程,将机器学习与人类直觉和领域专业知识结合起来,做出有效的临床决策,提高护理价值。如果适当考虑到将其纳入护理提供和决策的不断发展的模式中,大数据和人工智能可以成为有益变革的有效推动者和催化剂,而不仅仅是给执业临床医生工作流程增加不必要的复杂性。

病人的私人临床医生作为真理的单一来源的日子一去不复返了。无论是谈论心脏病发作、中风、创伤、癌症,还是复杂的急性后护理,决策都是在一组人的共同考虑下做出的,更不用说患者自己的选择和对其病情的研究了。

当我们从应用广泛的人群规范和通用的护理标准,转向根据特定个体的定制需求定制护理时,将需要人工智能分析支持的广泛经验数据来定义与给定患者相关的个体规范。虽然在确定的人群中,进行随机对照临床试验的目的是控制混杂因素,并在实验环境中隔离测试干预的影响,但实际的测试对象很少能准确地反映现实世界中遇到的个体的广泛和多样性。

从实用主义的角度来看,我们不可能根据现实世界中所有细微差别和个性化的遭遇,来设计直接提供护理的试验。因此,人工智能对大数据的解析和分析将在指导个性化现实决策方面发挥重要作用。

利用大数据进行临床决策

如果大数据和人工智能要有效地支持临床决策,就需要克服四个潜在的挑战:

1. 消除数据收集中的偏差;

2. 承认匿名性和特殊性之间的内在冲突;

3.对收集到的数据进行有意义的验证;

4. 理解潜在的因果关系。

分析:利用大数据需要注意什么?

1 克服数据收集中的偏见

医疗数据杂乱无章。在最基本的层面上,尽管我们努力规范医学术语、诊断编码等,但在个体提供者如何描述、概念化和阐明他们对患者的观察方面存在很大差异。通常,对所有数据进行的探索、发现和分析,其有效性和价值仅与底层数据集的清晰性和有效性相同。这些问题只与收集的数据的数量和速度有关,必须对这些数据进行解释。

标准化、语义分类和公认的概念本体是“数据清理”中的一些必要步骤,在大数据集准备好接受人工智能技术的有用分析之前,这些步骤是为大数据集制定标准所必需的。

除了这些考虑之外,每个研究者对大数据的不同也产生了固有的偏见。偏差可以包括评估的数据类别以及如何收集这些数据(例如,对哪些人群进行了抽样,以及使用了哪些抽样工具,可以有选择地包括或排除数据集中的显示)。

假设高维数据的威力存在于数据中未公开的混杂因素下。不幸的是,这一假设远未成为人们放弃的结论,并对人工智能技术从大数据中得出的结论的有效性构成了威胁。例如,如果人们不考虑度量一个变量,而该变量是期望结果的重要驱动因素,那么将明显的结论应用于与混淆者的协变量关系发生变化的情况,则可能是不正确和具有误导性的。

这触及了人类领域经验与人工智能交叉的根源,以及人类大脑处理的“大影响”,而机器正在检测的小影响因素可能会忽略这些“大影响”。

2 匿名性与特异性不一致

从理论上讲,利用大数据力量的过程中,应该允许通过匿名化个人数据点来源,来保护个人身份和健康信息的安全。现实世界中的大数据的价值在于,它可以被分析,从而为指导个体患者的个性化精准医疗决策提供洞见。大数据的广度包含了元数据元素,这些元数据元素有潜力实现个人身份的去匿名化。

最终,在开放共享大数据所产生的价值与重新识别数据源的有限风险(可能侵犯患者隐私)之间,存在一种平衡。人们必须采取适当的预防措施进行结构分析,以避免对患者身份进行反向工程(Reverse Engineering或Back Engineering)。

然而,值得注意的是,共享开放数据的好处超过了对个人不利因素的重新识别。社会将不得不在共享和开放获取数据的好处,以及通过对分割的数据进行反向工程来重新识别个人的有限但真实的可能性之间,进行道德权衡。解决这些问题需要的是人类的智慧,而不是人工智能。

3 创建可证明性

我们有理由假设,对患者及其病情进行更有力的高维描述,将有助于更好地理解驱动特定疾病过程的环境。然而,以这些数据和分析为指导的有效干预措施能否降低成本、提高满意度并改善消费者体验,还有待证明。

因此,我们必须将数据、人工智能获取的知识和知情的临床决策集成到临床流程和工作流中,并将其紧密地交织在一起,以推动患者护理的潜在效益。我们还需要进行适当的结构化临床试验,以证明数据驱动的护理过程带来的增量效益足以证明这些决策所产生的任何成本都是合理的。

4 相关性并不意味着因果关系

定义因果关系对于开始将数据中观察到的模式转换为知情干预至关重要,在知情干预中,假定的因果变量可以被改变,以实现拟议的结果。在这个过程中,最重要的是确保被分析的数据不会遗漏可能与测量结果有因果关系的混杂因素。领域专家和人类直觉总是需要与人工智能协同工作,以确认没有隐藏的混杂因素。

另一方面,高维数据提供了识别盲点的机会,而这些盲点是人类大脑没有考虑到的,它们可能与人类领域专业知识中固有的偏见,以及启发式假设导致的结果有因果关系。机器的使用可以帮助人类揭示这些未发现或未预料到的变量。

在智能软件能够处理大数据集并被编程成像人类一样思考之前,构造良好的随机对照试验,在过去和现在都被当做用来避免隐藏混杂因素的重要方法。然而,现实世界中的大数据并不总是被划分为干预组和对照组,而且往往存在巨大的差距。随机对照试验或队列研究并不总能解决谜题中缺失的那一块。

人工智能和机器学习现在可以提供统计工具来确定测量值,以填补数据空白,并综合构建“控件”,以便与真实世界的经验进行比较。这些工具提供了一条前进的道路,以便在没有干预的情况下,将来自给定干预的观察结果与预期结果进行比较,这样我们就可以模拟允许关于确定性和因果关系的假设的测试范式。

应用程序:大数据的现实应用

人工智能在研究中的潜在应用

GNS Healthcare的董事长、首席执行官兼联合创始人Colin Hill设想了一个因果机器学习过程,该过程首先通过检查高维数据中的关系,推断出潜在的因果机制。使用这些信息,“反向工程”就可以在模拟场景环境中测试可能的因果关系。这被称为“正向模拟”,它能使研究人员检验因果假设的有效性,而这些假设在现实世界中是不容易检验的。

在药物发现方面, Relay Therapeutics的首席科学官兼联合创始人Mark Murcko博士提出了一种理论,即如何利用药物到靶点相互作用的正向模拟来进行潜在药物的内硅筛选,以获得针对生物验证靶点的有效性。该模拟基于数据驱动的对药物使用时蛋白质运动和功能变化的理解。

这些理解因果关系的方法结合了人类领域的专业知识和应用于大量数据集的人工智能,以预测筛选的化合物与疾病过程的生物靶点之间的治疗相互作用。

大数据的现实应用

虽然将大数据应用于研究的理论机会很多,但人工智能和机器学习已经在医疗服务领域掀起了波澜。以下重点介绍利用大数据进行患者分流、诊断成像和预测实践变化、不良结果和治疗影响的驱动因素的公司。

例如,Twiage正在处理急诊医学,帮助医院跟踪指标、分配资源和改善反应时间,以显著影响中风、心脏病发作、败血症和创伤患者的预后。Buoy Health利用大数据和人工智能直接针对患者进行疾病分类,并将他们引导到合适的护理环境。患者可以使用在线应用程序与机器人聊天,描述他们的症状,并通过一系列类似于他们在物理护理环境中体验的问题进行指导。

随着医学成像技术的进步和需求的增加,Zebra medical Vision旨在帮助放射科医生更快地识别成像结果中的异常情况。该公司的人工智能算法可以识别医疗状况,充当第一组“眼睛”,提高放射科医生的工作速度。

GNS Healthcare将上述反向工程和正向模拟理论付诸实践,利用大数据和人工智能在临床试验中运行,了解药物在现实世界中如何发挥作用,并帮助确定针对个体患者的最佳干预方式和干预时机。

Agathos为卫生系统提供了一个分析平台,可以收集见解并向提供者提供反馈,使他们能够看到患者数据中的个性化和聚合趋势,帮助告知人员配置、舍入前处理和指导需求,以及其他改进临床工作流程和患者结果的需求。

PhysIQ和Pascal Metrics是针对患者的实时监控解决方案,它们使用机器学习来检测患者病情的细微变化,无论是急性发作后还是住院期间,并提醒其护理团队采取必要行动。

结论

那么,我们如何利用大数据与人工智能的关系来推动医疗创新呢?

大数据新应用的增长速度和数据本身一样快。随着我们不断开发将大数据融入人工智能的新方法,人们意识到以下需求至关重要:

1、“清除”所有收集到的可能存在偏见的数据;

2、标准化收集或统一数据的方法;

3、同意正确使用匿名信息;

4、避免落入相关性与因果关系的陷阱。

图片来源:Healthbox

为了充分利用人工智能的力量,我们必须接受与计算机协同工作。通过这种方式,我们既能从计算机的处理能力中获益,也能从人类智能中获益,从而充分利用大数据进行变革。

这些观点得到了英伟达CEO、总裁兼联合创始人黄延森的赞同,他也强调了“数据培训”的重要性,即从数字体验中学习的过程。与此同时,机器学习算法的能力正在迅速提高,人类必须学会更聪明地工作,并适应“新常态”,让机器自动化商品化的任务,并解放提供者,让他们能够执行人道关怀的人工任务。

通过这种方式,人类和人工智能可以协同工作,在数据分析、临床决策和医疗创新方面达到新的高度。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 物联网
    +关注

    关注

    2951

    文章

    48285

    浏览量

    419796
  • 人工智能
    +关注

    关注

    1821

    文章

    50538

    浏览量

    267858
  • 大数据
    +关注

    关注

    64

    文章

    9115

    浏览量

    144182

原文标题:Healthbox报告:利用人工智能进行医疗大数据变革

文章出处:【微信号:BIEIqbs,微信公众号:北京市电子科技情报研究所】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    腾讯云正式发布大数据智能体工作台DataBuddy

    近日,腾讯云正式发布大数据智能体工作台DataBuddy。这是Buddy家族继CodeBuddy、WorkBuddy之后的第三位成员,也是腾讯云在大数据领域落下的一枚重磅棋子。
    的头像 发表于 05-21 10:47 956次阅读

    ROS2 如何打通仿真与数据匿名化?#人工智能 #机器人 #大数据 #产品方案

    大数据
    康谋keymotek
    发布于 :2026年05月07日 16:55:44

    黑M-狂野大数据5期|网盘无密Mp4+大数据直播课-狂野大数据

    科技重构数据生产力:狂野大数据直播实战全解析 随着数字化时代的快速发展,大数据已经渗透到我们生活的方方面面。无论是商业、教育,还是医疗、政府服务,大数据的应用都在不断创造新的价值。而在
    的头像 发表于 04-06 11:13 291次阅读

    狂野大数据(六期)课程- 资源分享

      狂野大数据6期   如果用一个词来形容当下大数据领域的变革,我会选择“权力的转移”。过去,数据世界的权力掌握在少数“炼金术士”手中——那些精通算法、能调参、会写复杂脚本的数据科学家
    的头像 发表于 03-11 13:31 467次阅读

    大数据解决方案如何实施

    大数据解决方案实施的难点在于以下几点:  1.很少有优质可用的数据  在数聚股份看来,这几年数据交易机构如雨后春笋,“数据变现”成为很多拥有数据
    的头像 发表于 12-25 18:22 1231次阅读

    最受欢迎的大数据可视化工具

     在数聚股份看来,大数据可视化是进行各种大数据分析的最重要组成部分之一。 一旦原始数据流被以图像形式表示时,以此做决策就变得容易多了。 为了满足并超越客户的期望,大数据可视化工具应该具
    的头像 发表于 12-24 17:05 446次阅读
    最受欢迎的<b class='flag-5'>大数据</b>可视化工具

    大数据平台运营的基础是什么

    在数聚股份看来,越来越多的企业开始搭建自己的大数据平台体系,并倾注大量资源用于平台的迭代和运营。那么大数据平台作为越来越被关注的企业新兴价值点,它应该以何种方式看待,并且以什么样的方式去建设和运营
    的头像 发表于 12-23 16:07 426次阅读

    工业数据采集调研时需要注意什么

    在工业数据采集调研过程中,需从技术、管理、安全、合规等多个维度综合考量,以确保数据采集的准确性、完整性和可持续性。以下是具体注意事项及关键点: 一、明确数据采集目标与范围 业务需求驱动
    的头像 发表于 11-17 10:19 805次阅读

    湖北大数据集团到访维智科技参观交流

    近日,湖北大数据集团有限公司党委书记、董事长汪小波率队到访维智科技。双方围绕时空数据融合、公共数据授权运营及行业应用场景开发等议题展开深入探讨。
    的头像 发表于 11-03 10:02 849次阅读

    东软集团领跑中国医疗大数据解决方案市场

    近日,国际数据公司(IDC)权威发布《中国医疗大数据解决方案市场份额,2024:全域数据支撑》(Doc#CHC53739825,2025年9月)报告
    的头像 发表于 10-30 17:09 896次阅读

    组态大数据平台是什么?有什么功能?

    组态大数据平台是融合 组态技术 与 大数据处理能力 的综合性平台,通过图形化、可配置的方式实现数据采集、存储、分析、可视化及远程控制,适用于工业自动化、能源管理、楼宇监控等领域。其核心价值在于降低
    的头像 发表于 10-30 11:29 378次阅读
    组态<b class='flag-5'>大数据</b>平台是什么?有什么功能?

    御控工业物联网大数据解决方案:排水设备远程监控与大数据统计系统

    御控工业物联网推出排水设备远程监控与大数据统计系统,通过物联网、大数据、云计算等技术构建“感知-传输-分析-决策”闭环管理体系,助力排水行业数字化转型。
    的头像 发表于 09-12 10:04 894次阅读

    如何有效利用高光谱成像技术提升数据分析效率

    的光谱数据,有效解决了传统成像技术难以分辨细微物质差异的问题。根据市场研究报告,全球高光谱成像市场预计将以年均12.5%的速度增长,显示出广阔的发展前景。您是否想知道如何通过科学利用高光谱成像技术,优化
    的头像 发表于 09-11 16:13 1062次阅读
    如何有效<b class='flag-5'>利用</b>高光谱成像技术提升<b class='flag-5'>数据</b>分析效率

    维智科技亮相2025中国国际大数据产业博览会

    近日,全球大数据领域瞩目的盛会——2025中国国际大数据产业博览会隆重开幕。作为华为重要生态合作伙伴,维智科技作为时空人工智能与城市数字化领域的领先企业,受邀参加展览展示。
    的头像 发表于 09-04 18:03 1673次阅读

    在EZ串行的BLE“无响应写入”中, CAN一次通信中接收的最大数据包大小是多少?

    :所有数据都显示在与 ez-Serial 和 PUART 连接的 TeraTerm 上 [问题] (1)在 EZ 串行的 BLE“无响应写入”中, CAN 一次通信中接收的最大数据包大小是多少? (2
    发表于 07-07 07:33