0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

格灵深瞳多模态大模型荣登InfoQ 2025中国技术力量年度榜单

格灵深瞳 来源:格灵深瞳 2026-01-05 10:05 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

洞察AI变革,见证智能未来

2025中国技术力量年度榜单

AI开源明星项目TOP10

LLaVA-OneVision-1.5多模态大模型

灵感实验室联合LLaVA社区发布的多模态大模型LLaVA-OneVision-1.5,实现了训练数据、代码和模型权重的全链路开源,在多项公开多模态基准上表现优于同等规模的Qwen2.5-VL。

在创新性上,技术团队对“视觉编码器+投影层+大语言模型”的LLaVA架构进行模块升级:视觉编码器从CLIP替换为格灵深瞳自研Glint-ViT v1.5(RICE),大语言模型从Qwen2替换为Qwen3。

在训练数据方面,团队推出完整开放的85M预训练数据集(LLaVA-OV-1.5-Mid-Training-85M)与精筛22M指令数据集(LLaVA-OV-1.5-Instruct-22M),并且做到“概念均衡”——构建一个50万的词表,利用图像特征与词表特征碰撞,并控制每个词碰到的图片数,制作出一个不同于随机采样的概念均衡训练集。

除了数据集以外,LLaVA-OneVision-1.5 技术报告、代码、模型也已开源:

LLaVA-OneVision-1.5

技术报告:

https://arxiv.org/abs/2509.23661

代码:

https://github.com/EvolvingLMMs-Lab/LLaVA-OneVision-1.5

模型:

https://huggingface.co/lmms-lab/LLaVA-OneVision-1.5-8B-Instruct

Demo:

https://huggingface.co/spaces/lmms-lab/LLaVA-OneVision-1.5

数据集:

Pretrain Data:https://huggingface.co/datasets/lmms-lab/LLaVA-One-Vision-1.5-Mid-Training-85M

Instruct Data:https://huggingface.co/datasets/lmms-lab/LLaVA-OneVision-1.5-Insturct-Data

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 开源
    +关注

    关注

    3

    文章

    4325

    浏览量

    46427
  • 格灵深瞳
    +关注

    关注

    1

    文章

    95

    浏览量

    6011
  • 大模型
    +关注

    关注

    2

    文章

    3750

    浏览量

    5268

原文标题:LLaVA-OneVision-1.5多模态大模型入选InfoQ 2025中国技术力量年度榜单

文章出处:【微信号:shentongzhineng,微信公众号:格灵深瞳】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    元识金融模态智算平台全面融入企业级Agent操作系统DeepBot-OS

    随着年初Agent火爆出圈,如何让Agent高效自主工作、实现Agent稳定协作,成为打造AI原生基础设施的关键,也是不断探索的应
    的头像 发表于 04-13 09:49 368次阅读

    闻泰科技荣登2025中国上市公司品牌500强榜单

    日前,2025中国经济高峰论坛暨第二十三届经济人物年会在北京举行,活动现场正式发布“2025中国上市公司品牌500强”榜单。闻泰科技凭借深厚
    的头像 发表于 03-12 16:40 299次阅读

    2025年度关键词回顾

    过去一年,深耕视觉算法与模态模型,自研视
    的头像 发表于 02-24 17:17 1419次阅读

    入选多家媒体2025年度榜单

    岁末年初,多家媒体发布2025年度奖项评选结果,涵盖AI技术创新、产品应用、上市公司投关等多个领域。
    的头像 发表于 01-12 17:05 663次阅读

    联合氪信科技推出模态AI金融安全一体机

    12月26日,AI赋能千行百业超级联赛“A超之夜”在广西大学举行。自治区党委书记、自治区人大常委会主任陈刚出席并讲话。自治区主席韦韬出席。活动现场,联合氪信科技正式发布
    的头像 发表于 01-05 10:10 385次阅读

    荣获量子位2025人工智能年度领航企业

    12月10日,量子位发布“2025人工智能年度榜单”。
    的头像 发表于 12-17 15:23 667次阅读

    受邀参加百度世界2025大会

    11月13日,百度世界2025大会将在北京国家会议中心二期举行。在分论坛环节,灵感实验室负责人冯子勇、
    的头像 发表于 11-14 15:47 755次阅读

    邀您相约百度世界2025大会

    11月13日,百度世界2025大会将在北京国家会议中心二期举行,主题为“效果涌现 | AI In Action”。在公开课环节,副总
    的头像 发表于 11-12 16:57 1003次阅读

    视觉基础模型Glint-MVT的发展脉络

    此前,8月28-30日,2025百度云智大会在北京举办。在算力平台专题论坛上,技术副总裁
    的头像 发表于 09-05 17:13 1841次阅读
    <b class='flag-5'>格</b><b class='flag-5'>灵</b><b class='flag-5'>深</b><b class='flag-5'>瞳</b>视觉基础<b class='flag-5'>模型</b>Glint-MVT的发展脉络

    宏景智驾荣登2025中国隐形独角兽500强榜单

    2025中国隐形独角兽大会”在广州举办,会上发布《2025中国隐形独角兽500强榜单》,宏景智驾(衢州)科技有限公司(以下简称:宏景智驾)
    的头像 发表于 08-28 11:19 1469次阅读

    智慧体育产品全新升级

    智慧体育产品家族,近期迎来全新升级。
    的头像 发表于 08-14 11:51 1591次阅读

    视觉基础模型Glint-MVT升级

    近日,灵感实验室和华为伦敦研究所发布最新版视觉基础模型——Glint-MVT v1.5(RICE)。
    的头像 发表于 07-31 11:01 1611次阅读
    <b class='flag-5'>格</b><b class='flag-5'>灵</b><b class='flag-5'>深</b><b class='flag-5'>瞳</b>视觉基础<b class='flag-5'>模型</b>Glint-MVT升级

    与您相约WAIC 2025

    7月26-29日,2025世界人工智能大会(WAIC)将在上海世博中心和世博展览馆举行。将在第一现场,联合华为昇腾、百度、飞腾等生态
    的头像 发表于 07-26 16:14 1213次阅读

    六篇论文入选ICCV 2025

    近日,国际顶级会议ICCV 2025(计算机视觉国际大会)公布论文录用结果,团队共有6篇论文入选。
    的头像 发表于 07-07 18:23 1687次阅读

    亮相AICon 2025全球人工智能开发与应用大会

    此前,6月27-28日,由极客邦科技旗下InfoQ中国主办的“AICon全球人工智能开发与应用大会”在北京举办。作为行业领先的视觉AI公司,
    的头像 发表于 07-05 16:15 1581次阅读