0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

云知声山海大模型医疗专业能力全球第一

云知声 来源:云知声 2024-09-19 15:47 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

近日,由上海AI实验室和上海市数字医学创新中心联合推出的MedBench评测更新榜单,继4月份夺冠后,云知声山海大模型医疗行业版(UniGPT-Med)再次以综合得分82.2的优异成绩位列全球第一,各项指标全面超越GPT-4,充分展现出山海大模型在拥有业内一流的通用能力之外,更具备打造世界领先的行业大模型的能力。

MedBench致力于打造一个科学、公平且严谨的中文医疗大模型评测体系及开放平台,其基于医学权威标准,不断更新维护高质量的医学数据集,全方位多维度量化模型在各个医学维度的能力。

MedBench的五大评测维度——医学语言理解、医学语言生成、医学知识问答、复杂医学推理、医疗安全和伦理,构成了其专业评测框架的核心。这一框架吸纳了海量医学知识库和医院医学专家的丰富经验,涵盖8个公开数据集和12个自建数据集,总计约30万道中文医疗专业测评题目,覆盖了从医学考试题库到患者服务、医学问诊、病例分析以及病历生成等广泛的医学任务,致力为中文医疗大模型提供客观科学的性能评测参考。

今年5月,MedBench平台全面升级,不仅引入API评测方式,丰富了参评途径,还优化了开放域问答的评估指标。通过医学专家的精准标注,平台进一步提升了评测结果的公正性和专业性。同时,平台在数据集、评测方法和系统功能等方面也进行了升级,旨在为医疗大模型评测构建一个更加完善的社区环境,并提供更加丰富、真实的实践场景。

此次评测,云知声山海大模型医疗行业版(UniGPT-Med)通过API提交方式,不仅以82.2的综合得分刷新了MedBench评测记录,更是在各个维度上力压GPT-4,排名全球第一。这一成绩的取得,是山海大模型医疗专业能力的集中展现,也标志着其技术迭代和创新发展达到了一个新的高度。

目前,山海大模型通用能力已超越GPT-3.5,并在SuperCLUE 4月评测中跻身国内大模型Top10;与GPT-4的对战中,山海综合胜率与和率为75.55%。

在医疗专业能力上,山海大模型于2023年6月的MedQA任务中超越Med-PaLM 2,取得87.1%的优异成绩;在临床执业医师资格考试中以523分(总分600分)的优异成绩,超过99%的考生水平;其基于山海大模型孵化的医疗行业版大模型,也在CCKS 2023 PromptCBLUE医疗大模型评测中夺得通用赛道一等奖。

随着医疗行业对智能化、精准化服务需求的不断增长,云知声山海大模型医疗行业版(UniGPT-Med)有望在医疗健康领域扮演更加关键的角色,为提升医疗服务效率、优化患者体验、推动医疗科技进步提供强有力的支持。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 医疗
    +关注

    关注

    8

    文章

    2024

    浏览量

    61775
  • 云知声
    +关注

    关注

    0

    文章

    325

    浏览量

    9460
  • 大模型
    +关注

    关注

    2

    文章

    3747

    浏览量

    5268

原文标题:MedBench最新评测:山海大模型医疗专业能力全球第一,各项指标力压GPT-4

文章出处:【微信号:云知声,微信公众号:云知声】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    与AMD ROCm Lab签署战略合作协议

    3月25日,江苏科技有限公司(以下简称“”)与南京超威开源科技有限公司(以下简称“A
    的头像 发表于 04-01 11:21 796次阅读

    正式推出Unisound U1-OCR文档智能基础大模型

    就在刚刚,正式推出 Unisound U1-OCR 文档智能基础大模型。作为首个工业级文档智能基座,该模型凭借 “性能 SOTA、可信
    的头像 发表于 02-26 17:28 882次阅读
    <b class='flag-5'>云</b><b class='flag-5'>知</b><b class='flag-5'>声</b>正式推出Unisound U1-OCR文档智能基础大<b class='flag-5'>模型</b>

    声发布“山海·知音”大模型2.0,医疗AI加速落地驱动业绩高增长

    优势,也印证了其在垂直行业特别是智慧医疗领域的商业化能力正快速兑现。   “山海·知音”大模型2.0 : 极端场景下识别准确率突破90% “山海
    发表于 02-06 10:28 1102次阅读
    <b class='flag-5'>云</b><b class='flag-5'>知</b>声发布“<b class='flag-5'>山海</b>·知音”大<b class='flag-5'>模型</b>2.0,<b class='flag-5'>医疗</b>AI加速落地驱动业绩高增长

    与嘉会医疗达成战略合作

    2月5日下午,国内人工智能技术与服务领军企业智能科技股份有限公司(以下简称“”)与中
    的头像 发表于 02-06 09:05 2473次阅读

    山海知音大模型2.0重磅发布

    随着智能体时代到来,在“山海·Atlas”通用智算基座持续演进基础上,年前实现了“山海·
    的头像 发表于 01-27 14:08 318次阅读
    <b class='flag-5'>云</b><b class='flag-5'>知</b><b class='flag-5'>声</b><b class='flag-5'>山海</b>知音大<b class='flag-5'>模型</b>2.0重磅发布

    荣登MedAIBench优秀国产医疗模型榜单

    12月20日,国家人工智能应用中试基地(医疗)·浙江正式发布《MedAIBench测评榜(优秀国产医疗模型)》。在这具备行业权威性与临床导向性的严格测评中,
    的头像 发表于 12-29 14:36 918次阅读

    山海医疗模型问鼎MedBench4.0三项榜首

    12月16日,中文医疗模型权威评测平台MedBench4.0发布最新评测结果。自主研发的“山海
    的头像 发表于 12-29 14:35 3541次阅读
    <b class='flag-5'>云</b><b class='flag-5'>知</b><b class='flag-5'>声</b><b class='flag-5'>山海</b><b class='flag-5'>医疗</b>大<b class='flag-5'>模型</b>问鼎MedBench4.0三项榜首

    推出医疗领域专家大模型山海·医大模型5.0”

    刚刚,正式推出医疗领域专家级大模型全新力作——“山海
    的头像 发表于 12-24 18:12 4623次阅读

    入选2025中国AI大模型产业创新服务商TOP20榜单

    荣誉,(股票代码:09678.HK)凭借自主研发的山海模型在技术创新、产业落地与生态构建方面的卓越表现,成功入选 "2025 中国
    的头像 发表于 12-08 18:04 1890次阅读

    多项业务营收大涨

    依托山海模型不断开拓阵地,开发了面向东盟等海外市场和国内方言市场的语音大模型
    的头像 发表于 09-10 15:44 805次阅读

    在港交所成功上市

    近日,智能科技股份有限公司(以下简称“”)于香港联合交易所主板挂牌上市,股份代号:0
    的头像 发表于 07-03 17:41 1176次阅读

    AGI龙头企业港股上市,市值达147亿港元

    为147.44亿港元。   图:创始人董事长CEO黄伟博士在现场致辞表示:从今天起,我们将以香港为支点,将中国AGI产品带向全世界——用更敏捷的创新、更好的商业化和更开放的心胸,让人类智慧与机器智能共振
    的头像 发表于 06-30 11:44 3733次阅读
    AGI龙头企业<b class='flag-5'>云</b><b class='flag-5'>知</b><b class='flag-5'>声</b>港股上市,市值达147亿港元

    与商汤科技达成战略合作

    近日,智能科技股份有限公司(以下简称“”)与上海商汤智能科技有限公司(以下简称“商汤
    的头像 发表于 06-20 14:52 1120次阅读

    荣登甲子光年2025中国AI产业逐浪者榜单

    近日,由甲子光年主办的「AI共潮生·2025甲子引力X科技产业新风向」在上海工业智能中心成功举办。凭借山海模型的领先技术实力与多领域
    的头像 发表于 05-26 14:13 873次阅读

    再度登顶MedBench榜单

    近日,中文医疗模型权威评测平台MedBench公布最新自测榜单结果,基于山海
    的头像 发表于 05-20 10:12 910次阅读