0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

首个中文医学知识LLM:真正的赛华佗—华驼(HuaTuo)

OSC开源社区 来源:OSC开源社区 2023-05-08 11:30 次阅读

先划重点:中文医学知识,不是「中医」。

自从 Meta(原 Facebook)的 LLaMA 大语言模型发布以来,相信大家看到了许多以“驼类动物”命名的 LLM。比如斯坦福用了 Alpaca,伯克利用了 Vicuna,Joseph Cheung 等开发者团队用了 Guanaco。

d543e460-ed4c-11ed-90ce-dac502259ad0.jpg

据说南美洲的无峰驼类动物一共就是上图列出的 4 种 —— 已经被各家的大模型命名使用。

不得不承认这些以“驼类动物”命名的 LLM 都很厉害,但如果,我是说如果,我拿出下面这个 LLM,阁下又当如何应对?

d55439dc-ed4c-11ed-90ce-dac502259ad0.png

没错,正是「华驼」。

见名知意,华驼肯定跟医学有关——这是一个基于中文医学知识的LLaMA 微调模型。

说到这,这个 LLM 的命名很难不让人拍案叫绝,将神医华佗与基于“羊驼”的大语言模型巧妙地结合在一起。

此项目开源了经过中文医学指令精调 / 指令微调 (Instruct-tuning) 的 LLaMA-7B 模型。

通过医学知识图谱和 GPT 3.5 API 构建了中文医学指令数据集,并在此基础上对 LLaMA 进行了指令微调,提高了 LLaMA 在医疗领域的问答效果。

据介绍,医学知识库围绕疾病、药物、检查指标等构建,字段包括并发症,高危因素,组织学检查,临床症状,药物治疗,辅助治疗等。知识库示例如下:

{“中心词”: “偏头痛”, “相关疾病”: [“妊娠合并偏头痛”, “恶寒发热”], “相关症状”: [“皮肤变硬”, “头部及眼后部疼痛并能听到连续不断的隆隆声”, “晨起头痛加重”], “所属科室”: [“中西医结合科”, “内科”], “发病部位”: [“头部”]}

然后利用 GPT3.5 接口围绕医学知识库构建问答数据,并设置了多种 Prompt 形式来充分利用知识。指令微调的训练集数据示例如下:

“问题:一位年轻男性长期使用可卡因,突然出现胸痛、呕吐、出汗等症状,经检查发现心电图反映心肌急性损伤,请问可能患的是什么疾病?治疗方式是什么?” 回答: 可能患的是心肌梗塞,需要进行维拉帕米、依普利酮、硝酸甘油、ß阻滞剂、吗啡等药物治疗,并进行溶栓治疗、低分子量肝素、钙通道阻滞剂等辅助治疗。此外需要及时停用可卡因等药物,以防止病情加重。“

该项目提供模型的训练数据集共计八千余条,需要注意的是,虽然训练集的构建融入了知识,但是仍存在错误和不完善的地方。

基于相同的数据,项目团队还训练了医疗版本的 ChatGLM 模型:ChatGLM-6B-Med。

这些模型在医疗领域的问答效果得到了显著提升,下面是不同模型的效果对比:

d573ca86-ed4c-11ed-90ce-dac502259ad0.png

由此可见,指令微调在医疗领域具有很大的应用潜力。

同时,该项目还尝试将医学文献的【结论】融入多轮对话,在此基础上对 LLaMA 进行指令微调,以进一步提高模型的实用性。

目前,项目团队只开放针对”肝癌“单个疾病训练的模型参数。未来计划发布融入文献结论的医学对话数据集,并且会针对“肝胆胰”相关 16 种疾病训练模型。这将有助于广泛应用于更多疾病的诊断和治疗建议。

下面是训练样本的示例:

d58ccb08-ed4c-11ed-90ce-dac502259ad0.png

华驼项目团队称下一个发布的新模型会被命名为扁鹊 (PienChueh)。

审核编辑 :李倩

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 模型
    +关注

    关注

    1

    文章

    2704

    浏览量

    47697
  • 语言模型
    +关注

    关注

    0

    文章

    435

    浏览量

    10057
  • 知识图谱
    +关注

    关注

    2

    文章

    131

    浏览量

    7594
  • LLM
    LLM
    +关注

    关注

    0

    文章

    202

    浏览量

    233

原文标题:首个中文医学知识LLM:真正的赛华佗—华驼(HuaTuo)

文章出处:【微信号:OSC开源社区,微信公众号:OSC开源社区】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    Smarter跑步鞋:生物医学与健身设备的完美结合

    利用现代信息通讯技术(ICT),整合检测装置、控制保障、预防伤害以及生物医学知识,设计一款新型的“智能”(Smarter)跑步鞋。该项技术适应于包括Web2.0功能的移动互联网,为整合在跑步者中现行流行的基于智能手机的心脏速率检测器或全球导航定位系统提供了可能。
    发表于 01-25 09:18 998次阅读

    临床医学工程转折点

    以来,越来越多的理工人员进来了,如医学物理师、计算机软硬件人员、智能建筑设计人员等。未来的发展趋势是医生应学习理工技术,优秀的医学专家应非常熟悉理工知识。   从国家层面看,医疗器械在医疗卫生体系中
    发表于 05-17 07:42

    路过的大神给个答案,图中开发板的各个插口能给个中文指导吗?

    `路过的大神,请你停一停,能不能给这个开发版的各个插口给我一个中文指导`[attach]***[/attach]
    发表于 02-21 21:34

    中文编码的基础知识

    中文编码的基础知识:1.本文主要包括以下几个方面:编码基本知识,java,系统软件,url,工具软件等。在下面的描述中,将以"中文"两个字为例,经查表可以知道其GB2312编码
    发表于 07-11 06:45

    中国首个中文离线语音模块标准即将诞生

    2019年11月27日,全国家用自动控制器标准化委员会组织了全国一百多位专家,在福州市召开了五届三次工作年会,并对《家用及类似电器用中文离线语音识别控制模块技术规范》等六个团标和行标进行了审查
    发表于 12-18 16:35

    秋DFM 安装后是英文版,怎么切换为中文

    秋DFM有英文版和中文版,安装会跟随电脑语言变化。如果安装后是英文版怎么修改为中文版呢?1、在任务栏软件图标右击,选择“设置”。2、在“设置”里将软件语言切换为中文。3、重启软件后就
    发表于 07-13 18:11

    人类发现首个中等质量黑洞

    日前,美国和欧洲的天文学家宣布,他们首次探测到了一个中等质量的黑洞。这项由超过1500名研究人员参与的引力波探测研究显示,约70亿年前,质量分别为太阳的66倍和85倍的两个黑洞,在发生激烈碰撞后,形成了一个新的中等质量黑洞。这也是人类迄今探测到的首个中等质量黑洞。
    的头像 发表于 11-08 09:07 1366次阅读

    如何利用LLM做多模态任务?

    大型语言模型LLM(Large Language Model)具有很强的通用知识理解以及较强的逻辑推理能力,但其只能处理文本数据。虽然已经发布的GPT4具备图片理解能力,但目前还未开放多模态输入接口并且不会透露任何模型上技术细节。因此,现阶段,如何利用
    的头像 发表于 05-11 17:09 681次阅读
    如何利用<b class='flag-5'>LLM</b>做多模态任务?

    如何利用LLM做多模态任务?

    大型语言模型LLM(Large Language Model)具有很强的通用知识理解以及较强的逻辑推理能力,但其只能处理文本数据。虽然已经发布的GPT4具备图片理解能力,但目前还未开放多模态输入接口
    的头像 发表于 05-22 15:57 519次阅读
    如何利用<b class='flag-5'>LLM</b>做多模态任务?

    网络华佗 | 软SDN运维不用怕,iMaster NCE-FabricInsight网络华佗帮您忙

    往期 精彩 推荐 网络华佗 | “千人千面”的网络华佗,你爱了吗? 网络华佗|网购送达越来越快?是谁在为你保驾护航? 网络华佗|如何让球馆Wi-Fi网络体验狂飙? 点击“阅读原文”,了
    的头像 发表于 06-12 18:25 388次阅读
    网络<b class='flag-5'>华佗</b> | 软SDN运维不用怕,iMaster NCE-FabricInsight网络<b class='flag-5'>华佗</b>帮您忙

    基于医学知识增强的基础模型预训练方法

    对领域专业知识的高度依赖和其本身细粒度的特征,通用基础模型在医疗领域的应用十分有限。因此,如何将医疗知识注入模型,提高基础模型在具体诊疗任务上的准确度与可靠性,是当前医学人工智能研究领域的热点。   在此背景之下,上海交通大学与
    的头像 发表于 07-07 11:10 478次阅读
    基于<b class='flag-5'>医学知识</b>增强的基础模型预训练方法

    最新综述!当大型语言模型(LLM)遇上知识图谱:两大技术优势互补

    LLM 是黑箱模型,缺乏可解释性,因此备受批评。LLM 通过参数隐含地表示知识。因此,我们难以解释和验证 LLM 获得的知识。此外,
    的头像 发表于 07-10 11:35 1467次阅读
    最新综述!当大型语言模型(<b class='flag-5'>LLM</b>)遇上<b class='flag-5'>知识</b>图谱:两大技术优势互补

    Stability AI发布首个用于编程的生成式LLM AI产品—StableCode

    Stability AI 近日宣布了他们首个用于编程的生成式 LLM AI 产品 ——StableCode。该产品旨在帮助程序员完成日常工作,并为新手开发者提供实用的学习工具。
    的头像 发表于 08-24 11:27 596次阅读
    Stability AI发布<b class='flag-5'>首个</b>用于编程的生成式<b class='flag-5'>LLM</b> AI产品—StableCode

    网络华佗 | 大明星出行记

    往期 精彩 推荐 网络华佗 | 如何在茫茫人海中保障VIP的用网体验? 网络华佗 | 软SDN运维不用怕,iMaster NCE-FabricInsight网络华佗帮您忙 网络华佗 |
    的头像 发表于 10-24 16:05 198次阅读
    网络<b class='flag-5'>华佗</b> | 大明星出行记

    网络华佗 | iMaster NCE-FabricInsight带你玩转网络“迷宫”

    相关阅读 网络华佗 | 大明星出行记 网络华佗 | 如何在茫茫人海中保障VIP的用网体验? 网络华佗 | 软SDN运维不用怕,iMaster NCE-FabricInsight网络华佗
    的头像 发表于 11-29 18:15 271次阅读
    网络<b class='flag-5'>华佗</b> | iMaster NCE-FabricInsight带你玩转网络“迷宫”