0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

联影智能发布、开源医疗视频理解大模型 邀全球开发者共探技术上限

话说科技 来源:话说科技 作者:话说科技 2026-05-06 14:40 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

近日,联影智能在GitHub、Hugging face等国际知名开发者平台正式发布全球规模最大、性能最强的医疗视频理解大模型——元智医疗视频理解大模型(uAI-NEXUS-MedVLM ),同步首批开源由6245个视频-指令对构成的标准测试集和模型,并设立“医疗视频理解大模型榜单”,向全世界开发者发出打榜邀请,以期推动构建统一、可验证的技术评测体系。

当前,人工智能已在影像辅助诊断、智能问诊等场景实现落地应用,但在手术等复杂动态临床场景中仍面临显著技术瓶颈。相较于静态影像,医疗视频理解对空间精度、时序逻辑和临床语义提出了更高要求:既要精准识别毫米级器械位置与解剖结构,又要完整还原手术过程中的关键步骤与先后关系,还需以专业语言准确表述具体操作及其临床意义。在多重挑战叠加下,即便全球领先的通用大模型,也难以有效完成手术视频理解任务,长期以来都是医疗大模型研发的“技术深水区”。

元智医疗视频理解大模型汇聚53万余条视频-指令数据、整合8个专业医学数据集,覆盖内镜、腹腔镜、开放手术、机器人手术及护理操作等核心临床场景,模型参数达70亿规模。在视频摘要、关键安全视野评估、下一步操作预测等8项医疗视觉任务测试中,模型整体性能显著优于 GPT-5.4、Gemini-3.1 等通用大模型,多项指标实现数倍领先。同时,模型支持4B/7B参数规模灵活切换,可实现单卡部署,具备良好的临床应用潜力。相关研究成果已被人工智能领域最具影响力的顶级会议IEEE国际计算机视觉与模式识别会议(CVPR 2026)收录。

在具体任务表现上,元智医疗视频理解大模型在手术安全评估任务中准确率达到89.7%,显著高于GPT-5.4(16.4%)和Gemini-3.1(24.2%);在满分5分的视频报告生成任务中,评分达到4.2分,同样大幅领先于通用模型。此外,该模型不仅能够正确识别医疗器械与手术操作,还可进一步理解其空间位置及临床操作意图,可应用于手术引导、术中安全保障、手术记录、医学教学及具身智能手术设备研发等场景。

在开源方面,模型研发负责人吴子彦表示:“相较于‘闭门造车’式的单点创新,我们选择开源高质量数据集,就是希望能为手术视频分析、特定病种诊断等细分赛道提供一把 ‘公共标尺’,让全球研究者和开发者能在可复现、可验证的环境下开展协同创新。这不仅能持续驱动技术迭代与场景落地,也有望促进医疗视频理解领域从分散探索迈向体系化发展,推动形成一个开放、共享的全球创新生态,与全球开发者共同推动创造一个更智能化的医疗未来。

审核编辑 黄宇

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 开发者
    +关注

    关注

    1

    文章

    782

    浏览量

    18079
  • 大模型
    +关注

    关注

    2

    文章

    3804

    浏览量

    5280
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    2025全球开发者先锋大会开源项目与AI的双向赋能分论坛圆满举办

    12月12日,2025全球开发者先锋大会——开源项目与AI的双向赋能分论坛在上海张江科学会堂成功举行。论坛以“共生荣,智创未来”为主题,汇聚开放原子
    的头像 发表于 12-22 15:58 747次阅读

    开发者为核心驱动开源项目迈向成熟

    11月21-22日,以“一切为了开发者——AI智·开源共享”为主题的2025开放原子开源开发者大会在北京成功举办。大会聚焦人工
    的头像 发表于 12-04 10:09 809次阅读

    科技亮相2025开放原子开发者大会

    11月21-22日,以“AI智,开源共享”为主题的2025开放原子开发者大会在北京盛大举办。作为开源鸿蒙生态的核心共建力量,九科技旗下子
    的头像 发表于 11-27 15:04 550次阅读

    2025开源鸿蒙开发者激励计划正式启动

    11月21日,2025开放原子开发者大会盛大启幕,聚焦“AI智,开源共享”主题,吸引了来自全球开发者、企业
    的头像 发表于 11-27 14:44 858次阅读

    行业大咖齐聚2025开放原子开发者大会

    11月21-22日,2025开放原子开发者大会在北京举行。本届大会以“一切为了开发者——AI智·开源共享”为主题,汇聚来自产业、高校、科研机构的
    的头像 发表于 11-25 17:42 1362次阅读

    2025开放原子开发者大会成功举办

    11月21日,2025开放原子开发者大会在京开幕。大会以“一切为了开发者——AI智,开源共享”为主题,聚焦人工智能
    的头像 发表于 11-25 17:19 1070次阅读

    deepin社区亮相2025开放原子开发者大会

    近日,以“一切为了开发者——AI智,开源共享”为主题的2025开放原子开发者大会在京圆满落幕。大会聚焦人工智能
    的头像 发表于 11-25 09:19 1377次阅读

    深开鸿深度参与2025开放原子开发者大会:深扎技术之根,厚育生态之茂

    、学术专家及广大开发者智能时代操作系统的技术演进与生态创新。前瞻洞察:阐释开源鸿蒙生态发展格
    的头像 发表于 11-21 19:41 1255次阅读
    深开鸿深度参与2025开放原子<b class='flag-5'>开发者</b>大会:深扎<b class='flag-5'>技术</b>之根,厚育生态之茂

    2025开放原子开发者大会初创与高潜开源项目发展分论坛即将启幕

    开源生态蓬勃发展的当下,一批技术创新性强、成长潜力大的开源项目正崭露头角。为赋能更多“潜能之星”,传递可复用的解决方案与行动路径,2025开放原子开发者大会——初创与高潜
    的头像 发表于 11-20 11:39 860次阅读

    2025开放原子开发者大会开源育人新范式分论坛即将启幕

    命题。11月22日,2025开放原子开发者大会——开源育人分论坛,将以“开源育人新范式:高校开源教育的创新之路”为主题,汇聚行业力量
    的头像 发表于 11-20 11:37 866次阅读

    2025开放原子开发者大会AtomGit开源实践交流分论坛即将开启

    当前,全球开源生态正持续蓬勃发展,开发者协作模式与开源创新范式也随之经历深刻变革。在此趋势下,以开发者为中心的AtomGit,创新融合“
    的头像 发表于 11-17 16:32 1095次阅读

    2025开放原子开发者大会开源欧拉AI创新分论坛即将启幕

    智算浪潮席卷全球,操作系统正从“适配AI”向“原生AI”跨越,开源模式已成为技术突破与全球协作的核心引擎。聚焦AGI时代的算力需求与业务创新,11月21日,2025开放原子
    的头像 发表于 11-13 09:59 812次阅读

    润芯微科技亮相2025荣耀全球开发者大会

    10 月 23 日,2025 荣耀全球开发者大会暨 AI 终端生态大会在深圳盛大开幕。作为智能终端领域的重要参与,润芯微科技携核心产品与技术
    的头像 发表于 10-28 16:58 813次阅读

    华为与全球开发者赢昇腾生态

    在华为全联接大会2025期间,华为昇腾计算业务总裁张迪煊发表了“以开发者为中心,加速自主创新,赢昇腾生态”的主题演讲,宣布CANN技术指导委员会正式成立,并表示昇腾将持续聚焦开发者
    的头像 发表于 09-20 15:57 2191次阅读

    2025开源鸿蒙开发者大会圆满落幕

    近日,开源鸿蒙开发者大会2025(OHDC.2025,简称“大会”)在深圳隆重开幕。大会正式发布开源鸿蒙5.1 Release版本,举行了开源
    的头像 发表于 05-26 17:03 1543次阅读