0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

解决医疗大模型训练数据难题,商汤最新研究成果登「Nature」子刊

商汤科技SenseTime 来源:未知 2023-09-12 18:50 次阅读
生成式AI正为医疗大模型迭代按下加速键。 近日,商汤科技联合行业合作伙伴,结合生成式人工智能和医疗图像数据的多中心联邦学习发表的最新研究成果《通过分布式合成学习挖掘多中心异构医疗数据》(MiningMulti-Center Heterogeneous Medical Data with Distributed Synthetic Learning)登上国际顶级学术期刊Nature子刊《自然-通讯》(NatureCommunications)

《自然-通讯》主要发表自然科学各个领域的高质量研究成果,影响因子16.6。

wKgZomUAQ4aAXHpLAAG9kpKwPaA348.png研究成果提出一个基于分布式合成对抗网络的联邦学习框架DSL(DistributedSynthetic Learning),可利用多中心的多样性医疗图像数据来联合学习图像数据的生成。

该分布式框架通过学习得到一个图像数据生成器,可以更灵活地生成数据,进而可替代多中心的真实数据,用于下游具体机器学习任务的训练,并具备较强可扩展性。

伴随大模型快速发展,Model as a Service(MaaS,模型即服务)正成为一大趋势。MaaS的大模型需要从海量的、多类型的数据中学习通用特征和规则,从而具备较强的泛化能力。

DSL框架能在保护数据隐私的同时,巧妙解决医疗大模型训练中常见的数据量不足的瓶颈,有效赋能MaaS的大模型训练。

在这一技术支撑下,商汤“医疗大模型工厂”能够帮助医疗机构更高效、高质量地训练针对不同临床问题的医疗大模型,使大模型在医疗领域的应用半径得以延伸。

兼顾隐私保护和数据共享

创新联邦学习模式打造

“数据生产工厂”

深度学习模型需要大量且多样性的数据“喂养”。

医疗领域对用户隐私保护有着极高要求,使得模型训练的医疗数据在多样性和标注质量上都受到限制,也使多中心的医疗数据收集和医疗AI模型的开发迭代面临较大挑战。

如何调和隐私保护和数据共享协作的矛盾?

联邦学习提供了全新的解题思路。联邦学习是一种分布式机器学习方法, 可以在不共享数据的情况下对多中心的数据进行联合建模,联合学习某一特定应用模型。

与主流的联邦学习模式不同,DSL框架的学习目标是数据生成器,而非具体应用的任务模型。

该分布式架构由一个位于中央服务器的数据生成器和多个位于不同数据中心的数据鉴别器组成。

在学习过程中,中央生成器负责生成“假”的图像数据,并发送给各个数据中心,各个数据中心用本地的真实数据和“假”数据进行对比后将结果回传给中央服务器,并基于反馈结果训练中央生成器生成更仿真的图像数据。

分布式的合成学习结束后,中央生成器可作为“数据生产工厂”,根据给定的约束条件(标注)生成高质量仿真图像数据,从而得到一个由生成数据组成的数据库。

该数据库可替代真实数据,用于下游具体任务的学习,使下游模型的更新迭代不再受到真实数据可访问性制约。同时,该方法通过分布式架构和联邦学习方式保证中央服务器无需接触数据中心真实数据也不需要同步各中心的鉴别器模型,有效保障了数据安全和隐私保护

wKgZomUAQ4eAZkDSAAE1q9E-7O0726.jpg  DSL框架包含一个中央生成器和多个分布式鉴别器,每个鉴别器位于一个医疗实体中。经过训练的生成器可以作为“数据生产工厂”,为下游具体任务的学习构建数据库

赋能MaaS新生态

为医疗大模型开发迭代

按下加速键

DSL框架已通过多个具体应用的验证。

包括:大脑多序列MRI图像生成及下游的大脑肿瘤分割任务心脏CTA图像生成及下游的全心脏结构分割任务多种器官的病理图像生成及细胞核实例分割任务等。

在可扩展性方面,该方法还可支持多模态数据中缺失模态数据的生成、持续学习等不同场景。

wKgZomUAQ4iAFnoPAAmOOAsN7sg770.png  不同应用中生成数据示例:(a) 心脏CTA,(b) 大脑多模态MRI,(c) 病理图像;生成的数据构成大数据库可用于下游具体任务模型的学习,例如:(d) 全心分割,(e) 脑肿瘤分割,(f) 细胞核分割

DSL框架的构建,也有利于推动MaaS服务模式发展。

MaaS的医疗大模型在数据学习过程中,同样会遇到医疗数据隐私安全保护问题。基于DSL框架,可以有效地从多中心多样性数据中建立数据集仓库,通过生成数据,为大模型的开发迭代提供创新思路。

细化到具体应用场景,DSL框架可助力医疗机构高效开展跨中心、跨地域模型训练工作

不同区域医疗机构在疾病数据多样性方面存在明显地域性差异,过去受限于数据安全和隐私保护要求,使用跨中心医疗数据联合训练医疗模型难度大。而借助DSL框架,有望帮助医疗机构更加高效便捷地开展跨中心医疗模型训练。

在2023 WAIC世界人工智能大会上,商汤科技与行业伙伴合作推出医疗大语言模型、医疗影像大模型、生信大模型等多种垂类基础模型群,覆盖CT、MRI、超声、内镜、病理、医学文本、生信数据等不同医疗数据模态。并展示了融入医疗大模型的升级版“SenseCare智慧医院”综合解决方案,以及多个医疗大模型落地案例。

借助商汤大装置的超大算力和医疗基础模型群的坚实基础,商汤得以成为“医疗大模型工厂”,帮助医疗机构针对不同临床问题高效训练模型,甚至辅助机构实现模型自主训练。

wKgZomUAQ4mAH_JMAAKrxGSsCzI520.jpg  WAIC期间商汤科技展示大模型在医疗领域的多个落地应用案例

随着DSL框架的推出,医疗大模型训练将有望突破“数据孤岛”的桎梏,一定程度上降低医疗大模型的训练门槛,有助于加速模型开发迭代,使医疗大模型的应用范围得以覆盖更多临床医疗问题。

商汤科技将持续聚焦医疗机构的多样化需求,推动医疗大模型在更多医疗场景落地。 点击“阅读原文“查看论文详情

wKgZomUAQ4qAYHQEAAATzh3tzFA369.gif

相关阅读,戳这里

多场景落地!商汤打造“医疗模型工厂”引领智慧医疗持续创新》

《嘉会医疗与商汤科技达成战略合作》

wKgZomUAQ4qAT2AyAAC4LKEIjVg879.jpg


原文标题:解决医疗大模型训练数据难题,商汤最新研究成果登「Nature」子刊

文章出处:【微信公众号:商汤科技SenseTime】欢迎添加关注!文章转载请注明出处。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 商汤科技
    +关注

    关注

    8

    文章

    417

    浏览量

    35879

原文标题:解决医疗大模型训练数据难题,商汤最新研究成果登「Nature」子刊

文章出处:【微信号:SenseTime2017,微信公众号:商汤科技SenseTime】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    商汤科技新升级大模型,对标GPT-4 Turbo 

    昨日,商汤科技在沪举办技术交流日活动,公布了其“云、端、边”全栈大模型产品矩阵,并对“日日新SenseNova 5.0”大模型体系进行了全面升级。基于此,商汤科技还推出了包括日日新。商
    的头像 发表于 04-24 17:17 294次阅读

    商汤科技与库醇科技达成合作 为垂域大模型构建高质量大规模的领域微调数据

    数字化转型,为垂域大模型构建高质量大规模的领域微调数据。   本次合作将基于商汤通用大模型进行二次开发,给模型注入领域知识,
    的头像 发表于 01-10 09:46 481次阅读
    <b class='flag-5'>商汤</b>科技与库醇科技达成合作 为垂域大<b class='flag-5'>模型</b>构建高质量大规模的领域微调<b class='flag-5'>数据</b>

    再登Nature!DeepMind大模型突破60年数学难题,解法超出人类已有认知

    用大模型解决困扰数学家60多年的问题,谷歌DeepMind最新成果再登 Nature。 作者之一、谷歌DeepMind研究副总裁Pushmeet Kohli表示:
    的头像 发表于 12-24 21:40 338次阅读
    再登<b class='flag-5'>Nature</b>!DeepMind大<b class='flag-5'>模型</b>突破60年数学<b class='flag-5'>难题</b>,解法超出人类已有认知

    英特尔研究院将在NeurIPS大会上展示业界领先的AI研究成果

    市举办。 在NeurIPS 2023上,英特尔研究院将展示其最新AI研究成果,并和产业界、学术界分享英特尔“让AI无处不在”的愿景。大会期间,英特尔研究院将发表31篇论文,包括12篇主会场论文和19篇研讨会论文,并在405号展台
    的头像 发表于 12-08 19:15 350次阅读

    英特尔研究院将在NeurIPS大会上展示业界领先的AI研究成果

    英特尔研究院将重点展示31项研究成果,它们将推进面向未来的AI创新。        英特尔研究院将在NeurIPS 2023大会上展示一系列富有价值、业界领先的AI创新成果。面向广大开
    的头像 发表于 12-08 09:17 403次阅读

    天数智芯支持智源研究院首次完成大模型异构算力混合训练,突破异构算力束缚

    基于英伟达混合资源及天数智芯混合资源完成训练的大模型, 也是智源研究院与天数智芯合作取得的最新成果,再次证明了天数智芯通用 GPU 产品支持大模型
    的头像 发表于 11-30 13:10 1101次阅读
    天数智芯支持智源<b class='flag-5'>研究</b>院首次完成大<b class='flag-5'>模型</b>异构算力混合<b class='flag-5'>训练</b>,突破异构算力束缚

    百度蛋白大语言模型研究成果登上Nature子刊封面

    百度最新研究成果登上Nature子刊封面,文心生物计算大模型获国际顶刊认可!
    的头像 发表于 11-25 11:25 666次阅读
    百度蛋白大语言<b class='flag-5'>模型</b><b class='flag-5'>研究成果</b>登上<b class='flag-5'>Nature</b>子刊封面

    商汤医疗模型工厂”引领医院智慧影像升级丨2023全国放射学学术大会有看点

    均质化、普惠化医疗服务 。 高效挖掘临床数据价值, 提升医院科研创新管理业务质量 ,加速科研成果转化。 11月16日,在苏州国际博览中心召开的中华医学会第30次全国放射学学术大会(CCR2023)上,
    的头像 发表于 11-17 16:30 285次阅读

    商汤打出“数字中国”建设大模型组合拳

    提供宏观尺度的解译能力,“洞察地球奥秘”。 以 商汤琼宇SenseSpace高精实景三维重建平台 提供精细化建模能力,“还原真实世界”。 从 二维到三维的大模型组合拳 ,是商汤科技面向地理信息行业的最新
    的头像 发表于 11-09 13:35 338次阅读
    <b class='flag-5'>商汤</b>打出“数字中国”建设大<b class='flag-5'>模型</b>组合拳

    面向产业端正式提供服务,商汤重磅升级医疗健康大模型“大医”

    库查询总结等一系列个性化功能。 高质量训练、低门槛部署,医疗健康机构可根据实际需求打造专属医疗健康大模型。 目前 ,商汤已 与 郑州大学第一
    的头像 发表于 10-16 12:30 277次阅读
    面向产业端正式提供服务,<b class='flag-5'>商汤</b>重磅升级<b class='flag-5'>医疗</b>健康大<b class='flag-5'>模型</b>“大医”

    大语言模型(LLM)预训练数据集调研分析

    model 训练完成后,使用 instruction 以及其他高质量的私域数据集来提升 LLM 在特定领域的性能;而 rlhf 是 openAI 用来让model 对齐人类价值观的一种强大技术;pre-training dataset 是大
    的头像 发表于 09-19 10:00 570次阅读
    大语言<b class='flag-5'>模型</b>(LLM)预<b class='flag-5'>训练</b><b class='flag-5'>数据</b>集调研分析

    商汤日日新大模型全面升级,SenseCore可支持20个千亿参数量大模型同时训练

    将多方位全面升级,并宣布在该体系下一系列的大模型产品更新和落地成果。   “日日新SenseNova ”全面升级及应用落地   商汤科技发布的“商量”2.0版本,是一个千亿级参数的自然语言处理
    的头像 发表于 07-13 00:13 2459次阅读
    <b class='flag-5'>商汤</b>日日新大<b class='flag-5'>模型</b>全面升级,SenseCore可支持20个千亿参数量大<b class='flag-5'>模型</b>同时<b class='flag-5'>训练</b>

    多场景落地!商汤打造“医疗模型工厂”引领智慧医疗持续创新

    医疗领域,如何利用大模型为医生提供疾病诊疗的新工具、新方法,以改善疾病诊断、治疗和预防,是业内人士迫切关注的课题。 2023世界人工智能大会(WAIC)期间,商汤科技全方位展示了融入医疗
    的头像 发表于 07-11 14:45 283次阅读
    多场景落地!<b class='flag-5'>商汤</b>打造“<b class='flag-5'>医疗</b>大<b class='flag-5'>模型</b>工厂”引领智慧<b class='flag-5'>医疗</b>持续创新

    让大模型“百花齐放”,商汤大装置SenseCore提供一片沃土

    今天,“临港新片区智算大会”在上海成功举办。 商汤科技深度参与,在会上展示了多项以大装置赋能大模型的最新实践成果。 会上, 临港新片区智算产业联盟 正式成立 ,商汤作为联盟算力提供企业
    的头像 发表于 06-05 01:00 1138次阅读
    让大<b class='flag-5'>模型</b>“百花齐放”,<b class='flag-5'>商汤</b>大装置SenseCore提供一片沃土

    什么是预训练AI模型

    训练 AI 模型是为了完成特定任务而在大型数据集上训练的深度学习模型。这些模型既可以直接使用,
    的头像 发表于 05-25 17:10 634次阅读