0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

云知声山海大模型医疗行业版登顶上海AI实验室权威大模型评测榜

云知声 来源:云知声 2024-04-24 14:28 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

近日,上海AI实验室和上海市数字医学创新中心联合推出的MedBench评测更新榜单,云知声山海大模型医疗行业版(UNIGPT-MED) 以综合得分54.7的优异成绩登顶榜首,充分彰显其硬核医疗实力。

73b56c78-01fa-11ef-a297-92fbcf53809c.png

医疗领域中文大模型不断涌现,如何对它们进行专业、科学的评测成为行业眼下亟待解决的问题。在此背景下,上海AI实验室和上海市数字医学创新中心基于OpenCompass大模型开放评测体系,联合推出中文医疗大语言模型开放评测平台MedBench,吸引了蚂蚁、商汤、百川、智谱等诸多大模型企业和研究机构参与其中,共同推进医疗大语言模型全面、专业、互认的评测体系建设。

基于医学语言理解、医学语言生成、医学知识问答、复杂医学推理、医疗安全和伦理5大维度,MedBench设置15项任务、20个数据集及30万道题目,为中文医疗大模型提供了客观科学的性能评测参考。

此次云知声参与评测的医学行业版大模型UNIGPT-MED在山海大模型升级的基础上,通过多年深耕医疗行业所积累的海量行业数据进行增量训练,并结合RLHF和RLAIF方法,生成大量符合偏好的医学数据,显著提升了模型在医学领域的专业性能和准确性,使其在MedBench的多个评测维度中展现出出色的实力,并在医学知识问答、医学语言理解两大关键维度中拔得头筹。

73d8e40a-01fa-11ef-a297-92fbcf53809c.png

医学知识问答评测得分

73f32c84-01fa-11ef-a297-92fbcf53809c.png

医学语言理解评测得分

这一成绩的取得,是云知声在大模型赛道持续深耕、不断技术创新的成果体现。

作为中国AGI技术产业化的先行者,云知声于2016年开始打造Atlas人工智能基础设施,并以此为基础,构建云知大脑(UniBrain)技术中台——以山海(UniGPT)通用认知大模型为核心,结合多模态感知与生成、知识图谱、物联平台等智能组件,为云知声智慧物联、智慧医疗、智慧座舱、智慧交通等业务提供高效的产品化支撑,持续推动“U(云知大脑)+X(应用场景)”战略布局,致力推动千行百业的智慧化升级。

作为云知大脑的核心,山海大模型具备语言生成、语言理解、知识问答、逻辑推理、代码能力、数学能力、安全合规能力七项通用能力及插件扩展、领域增强、企业定制三项行业落地能力,且目前已由大语言模型升级至多模态大模型,拓展出文生图、文生视频、图片问答等多模态能力,能够满足更多场景的应用需求。

目前,最新版本的山海大模型通用大模型能力已超越GPT-3.5,并在上个月的OpenCompass大模型评测中排名国产大模型厂商第四、全球大模型厂商第六,其在中英文双语客观评测中的语言、知识、推理能力,在综合性中文主观评测中的创作能力更是超越了GPT-4,跻身通用大模型第一梯队。

在医疗专业能力上,山海大模型于2023年6月的MedQA任务中超越Med-PaLM 2,取得87.1%的优异成绩;在临床执业医师资格考试中提升至523(总分600分),超过99%的考生水平。其基于山海大模型孵化的医疗大模型,也在CCKS 2023 PromptCBLUE医疗大模型评测中夺得通用赛道一等奖。

此次登顶MedBench评测榜,再次证实了云知声山海大模型在医疗领域的突出实力,也将鞭策云知声持续迭代大模型技术底座,实现大模型技术在多领域场景下的渗透和应用,以技术创新为各行各业带来更多智能化变革。


审核编辑:刘清
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 人工智能
    +关注

    关注

    1821

    文章

    50366

    浏览量

    267038
  • GPT
    GPT
    +关注

    关注

    0

    文章

    374

    浏览量

    16984
  • 云知声
    +关注

    关注

    0

    文章

    330

    浏览量

    9478
  • 大模型
    +关注

    关注

    2

    文章

    3796

    浏览量

    5276

原文标题:登顶上海AI实验室权威大模型评测榜,云知声医疗专业能力再获认可

文章出处:【微信号:云知声,微信公众号:云知声】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    NVIDIA 成立由全球领先 AI 实验室组成的 Nemotron Coalition,推动开放前沿模型发展

    新闻摘要: ● NVIDIA Nemotron Coalition 是模型构建者和 AI 实验室的首个此类全球合作项目,致力于通过共享专业知识、数据和计算来推进开放前沿基础模型的发展。
    的头像 发表于 03-17 11:14 322次阅读
    NVIDIA 成立由全球领先 <b class='flag-5'>AI</b> <b class='flag-5'>实验室</b>组成的 Nemotron Coalition,推动开放前沿<b class='flag-5'>模型</b>发展

    CEO黄伟博士做客斯坦福“与AI同行”系列讲座

    近日,斯坦福成长创新圈联合斯坦福上海校友会举办的斯坦福“与AI同行”系列讲座马年首场线上活动圆满落幕,CEO黄伟博士作为特邀嘉宾,结合
    的头像 发表于 03-13 15:46 479次阅读

    正式推出Unisound U1-OCR文档智能基础大模型

    就在刚刚,正式推出 Unisound U1-OCR 文档智能基础大模型。作为首个工业级文档智能基座,该模型凭借 “性能 SOTA、可信
    的头像 发表于 02-26 17:28 909次阅读
    <b class='flag-5'>云</b><b class='flag-5'>知</b><b class='flag-5'>声</b>正式推出Unisound U1-OCR文档智能基础大<b class='flag-5'>模型</b>

    声发布“山海·知音”大模型2.0,医疗AI加速落地驱动业绩高增长

    优势,也印证了其在垂直行业特别是智慧医疗领域的商业化能力正快速兑现。   “山海·知音”大模型2.0 : 极端场景下识别准确率突破90% “山海
    发表于 02-06 10:28 1132次阅读
    <b class='flag-5'>云</b><b class='flag-5'>知</b>声发布“<b class='flag-5'>山海</b>·知音”大<b class='flag-5'>模型</b>2.0,<b class='flag-5'>医疗</b><b class='flag-5'>AI</b>加速落地驱动业绩高增长

    与嘉会医疗达成战略合作

    2月5日下午,国内人工智能技术与服务领军企业智能科技股份有限公司(以下简称“”)与中
    的头像 发表于 02-06 09:05 2558次阅读

    山海知音大模型2.0重磅发布

    随着智能体时代到来,在“山海·Atlas”通用智算基座持续演进基础上,年前实现了“山海·
    的头像 发表于 01-27 14:08 341次阅读
    <b class='flag-5'>云</b><b class='flag-5'>知</b><b class='flag-5'>声</b><b class='flag-5'>山海</b>知音大<b class='flag-5'>模型</b>2.0重磅发布

    荣登MedAIBench优秀国产医疗模型榜单

    12月20日,国家人工智能应用中试基地(医疗)·浙江正式发布《MedAIBench测评(优秀国产医疗模型)》。在这一具备行业
    的头像 发表于 12-29 14:36 935次阅读

    山海医疗模型问鼎MedBench4.0三项榜首

    12月16日,中文医疗模型权威评测平台MedBench4.0发布最新评测结果。
    的头像 发表于 12-29 14:35 3566次阅读
    <b class='flag-5'>云</b><b class='flag-5'>知</b><b class='flag-5'>声</b><b class='flag-5'>山海</b><b class='flag-5'>医疗</b>大<b class='flag-5'>模型</b>问鼎MedBench4.0三项榜首

    推出医疗领域专家大模型山海·医大模型5.0”

    刚刚,正式推出医疗领域专家级大模型全新力作——“山海
    的头像 发表于 12-24 18:12 4647次阅读

    入选甲子光年2025中国AI模型领域最具商业潜力

    12月3日,“2025甲子引力年终盛典”在北京举行,大会现场发布了【甲子100】与【甲子Cool Vendor】等榜单。(股票代码:09678.HK)凭借其在大模型领域扎实的技术
    的头像 发表于 12-12 16:39 1355次阅读

    入选2025中国AI模型产业创新服务商TOP20榜单

    荣誉,(股票代码:09678.HK)凭借自主研发的山海模型在技术创新、产业落地与生态构建方面的卓越表现,成功入选 "2025 中国
    的头像 发表于 12-08 18:04 1910次阅读

    商汤日日新V6.5多模态大模型登顶全球权威榜单

    根据权威评测平台OpenCompass多模态大模型学术榜单(Multi-modal Academic Leaderboard)最新数据显示,商汤「日日新 V6.5」(SenseNova-V6.5
    的头像 发表于 09-10 09:55 958次阅读

    与商汤科技达成战略合作

    近日,智能科技股份有限公司(以下简称“”)与上海
    的头像 发表于 06-20 14:52 1155次阅读

    荣登甲子光年2025中国AI产业逐浪者榜单

    近日,由甲子光年主办的「AI共潮生·2025甲子引力X科技产业新风向」在上海工业智能中心成功举办。凭借
    的头像 发表于 05-26 14:13 897次阅读

    再度登顶MedBench榜单

    近日,中文医疗模型权威评测平台MedBench公布最新自测榜单结果,
    的头像 发表于 05-20 10:12 940次阅读