0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

格灵深瞳亮相Create 2026百度AI开发者大会

格灵深瞳 来源:格灵深瞳 2026-05-16 10:58 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

5月13日-14日,Create 2026 百度 AI 开发者大会在北京国家会议中心二期举行。作为百度的生态伙伴,格灵深瞳在专题论坛和公开课上分享了最新的 AI 原生视觉智能产品:视觉智能工坊,以及新一代全开源多模态大模型LLaVA-OneVision-2.0。

同时,格灵深瞳还在展台展示了视觉智能工坊产品的多项功能。系统级 AI 助手DeepBot也在现场与观众们交流互动。

从多模态能力迭代到视觉应用升级,格灵深瞳持续深耕 AI 技术应用转化,不断打磨和沉淀产品化能力,打造自进化的 AI 原生产品矩阵,让 AI 真正走进现实业务场景,实现规模化应用落地。

视觉智能工坊:

三大核心能力,构建视觉AI落地闭环

在“AI+数据”专题论坛,格灵深瞳研发副总裁闫梓祯分享《智能数据赋能视觉 AI:Agent 驱动的视觉智能工坊实践》主题演讲,介绍新一代 AI 原生的视觉智能产品——视觉智能工坊。

格灵深瞳研发副总裁闫梓祯分享视觉智能工坊

现实业务场景和数据复杂多变,但传统模式下的 AI 项目往往是“一次性交付”,交付即结束,难以复用和持续迭代。这导致企业 AI 落地成本高企,且无法持续融入实际业务流程。面对企业 AI 落地需求和痛点,格灵深瞳推出一套具备完整工程化系统能力的视觉 AI 智能产品:视觉智能工坊。

视觉智能工坊搭载M-E-S 三大核心能力,具体包括:MENTOR 算法训练中心、EXPERT 算法运营中心、SENTINEL 边缘哨兵,覆盖算法的训练、运营、感知全周期。M-E-S 三层协同构建“数据采集-模型训练-算法运营-边缘部署-实时告警-数据回流-模型迭代”的产品能力闭环,形成可自进化的数据飞轮,让视觉模型越用越懂业务。

基于视觉智能工坊的产品能力,可将 AI 从一次性算法交付,转化为在业务现场持续进化的 AI 原生能力,赋能企业业务专家快速构建 AI 应用,让模型算法在业务现场真正用起来,实现 AI 在银行、政务、能源、园区、工厂等行业场景下的规模化落地。

LLaVA-OneVision-2.0:

多模态迈向全帧率视频理解时代

在 AI Infra 专题论坛,灵感实验室 Glint Lab 负责人冯子勇分享《LLaVA-OneVision-2.0:全开源全帧率多模态大模型的低成本突破》主题演讲,介绍新一代全开源多模态大模型 LLaVA-OneVision-2.0 和它的视觉模型基座 Glint-MVT v2.0 的技术创新性和行业应用价值。

灵感实验室负责人冯子勇分享LLaVA-OneVision-2.0

同时,在 AI 创意开放日公开课环节,灵感实验室 Glint Lab 核心成员谢尹分享《LLaVA-OneVision-2.0:首个视频全帧率理解的多模态模型》,介绍 LLaVA-OneVision-2.0 的技术细节和训练流程。

LLaVA-OneVision-2.0 是一款原生支持全帧率视频理解的全开源多模态大模型。新一代模型把优化对象从“模型规模”转向“模型看视频的方式”,在全帧率前提下重构视频理解路径。

在实现方式上,LLaVA-OneVision-2.0 通过引入升级后的视觉编码器Glint-MVT v2.0和有针对性的视频数据训练,获得视频高效分析的能力。用 Glint MVT 2.0 替代传统视觉编码方式,可更充分利用视频编码原有信息,在更少输入下保持理解能力。

从训练流程来看,LLaVA-OneVision-2.0 通过视频化引导-指令微调-长视频理解-适配 Codec(编解码)数据和空间理解数据,分四个阶段完成模型训练,实现从数据准备到测评发布的流程闭环。在任务表现方面,LLaVA-OneVision-2.0 8B 模型在 VideoMME(sub) 等 Benchmark 评测上超过同等规模的国内主流同类模型。

作为 LLaVA-OneVision-2.0 的技术基石,升级后的视觉基础模型 Glint-MVT v2.0 打破图像与视频编码“分而治之”的传统模式,将视频与图像统一在同一个编码器(Encoder),通过视频编码在压缩域进行高效分析,最大程度上可削减 90% 视频 Token,极大节约计算资源和成本。

从 Glint-MVT v2.0 到 LLaVA-OneVision-2.0,灵感实验室不断探索在全帧率前提下,让视频理解以更高效率、更低成本的技术路径真正走进业务现场。

DeepBot:

系统级 AI 助手,打个招呼就开工!

除了分享视觉智能工坊和 LLaVA-OneVision-2.0,格灵深瞳还在活动展区展示了系统级 AI 助手 DeepBot。现场观众可通过微信扫码进入对话框,体验与 DeepBot 的实时互动:向 DeepBot 打个招呼,便可收到来自大会现场的实时视频画面,以及 AI 对画面的智能分析结果。此外,还可以了解格灵深瞳的更多信息和展会动态。

DeepBot 是格灵深瞳灵感实验室开发的一款开源系统级 AI 助手,能够与企业现有系统深度结合,通过多 Agent 协作模式实现复杂业务流程的自动化。它支持多任务并行处理、定时任务、技能扩展等功能,同时通过严格的安全机制保护企业系统安全。

近期,DeepBot 进行了版本升级。新版支持企业微信与智能客服,可为企业微信创建多个 Tab,为每个 Tab 设置不同模型,并通过加强文件系统访问控制等方式强化安全保障。

大会落幕,但 AI 技术和产品进化的步履不停。未来,格灵深瞳将持续优化升级以视觉智能工坊为代表的 AI 原生自进化产品矩阵,不断沉淀产品化能力,加速打通 AI 商业化闭环,推动 AI 真正落地转化为企业生产力,赋能更多行业客户智能化升级。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • AI
    AI
    +关注

    关注

    91

    文章

    41834

    浏览量

    302983
  • 百度
    +关注

    关注

    9

    文章

    2400

    浏览量

    95352
  • 格灵深瞳
    +关注

    关注

    1

    文章

    102

    浏览量

    6027

原文标题:格灵深瞳亮相百度 Create 2026,打造新一代视觉 AI 技术产品

文章出处:【微信号:shentongzhineng,微信公众号:格灵深瞳】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    百度Create 2026发布“百度胜算”

    近期,百度Create 2026开发者大会如期召开,百度创始人李彦宏抛出一个足以撼动行业的新概念
    的头像 发表于 05-17 09:47 717次阅读

    百度智能云正式发布Hogee

    5月13日,在Create2026百度AI开发者大会上,百度智能云正式发布了一款全新的企业一站式
    的头像 发表于 05-15 09:18 695次阅读

    百度 Create 2026|启明云端分享 AI 产品落地新思路

    1AI定制方案解决你的烦恼“我有一个不错的想法,但不知道怎么把它做成产品。”这是很多企业进入AI领域时遇到的第一道难题。想法不缺,缺的是落地能力。在Create2026百度
    的头像 发表于 05-14 18:03 102次阅读
    <b class='flag-5'>百度</b> <b class='flag-5'>Create</b> <b class='flag-5'>2026</b>|启明云端分享 <b class='flag-5'>AI</b> 产品落地新思路

    利尔达作为“数据通道与硬件方案”核心伙伴亮相2026百度AI开发者大会

    5月13日,以“自我进化”为主题的Create2026百度AI开发者大会在北京国家会议中心二期盛大开幕。
    的头像 发表于 05-14 17:36 280次阅读
    利尔达作为“数据通道与硬件方案”核心伙伴<b class='flag-5'>亮相</b><b class='flag-5'>2026</b><b class='flag-5'>百度</b><b class='flag-5'>AI</b><b class='flag-5'>开发者</b><b class='flag-5'>大会</b>

    与您相约Create 2026百度AI开发者大会

    5月13日-14日,Create 2026 百度 AI 开发者大会将在北京国家会议中心二期举行。
    的头像 发表于 05-12 17:05 868次阅读

    亮相2026 ITES深圳工业展

    3月31日-4月3日,第27届ITES深圳工业展暨高端装备产业集群展在深圳宝安举行。在工创联企业家交流会圆桌环节,CEO吴一洲围绕主题“AI
    的头像 发表于 04-08 15:36 379次阅读

    亮相摩尔线程首届MUSA开发者大会

    12月20-21日,摩尔线程首届MUSA开发者大会(MDC 2025)在北京中关村国际创新中心举办。在分论坛上,
    的头像 发表于 12-26 14:52 576次阅读

    精彩亮相百度世界2025大会

    11月13日,百度世界2025大会在北京国家会议中心二期举办。活动期间,
    的头像 发表于 11-19 17:09 973次阅读

    受邀参加百度世界2025大会

    11月13日,百度世界2025大会将在北京国家会议中心二期举行。在分论坛环节,灵感实验室
    的头像 发表于 11-14 15:47 856次阅读

    邀您相约百度世界2025大会

    11月13日,百度世界2025大会将在北京国家会议中心二期举行,主题为“效果涌现 | AI In Action”。在公开课环节,
    的头像 发表于 11-12 16:57 1076次阅读

    视觉基础模型Glint-MVT的发展脉络

    此前,8月28-30日,2025百度云智大会在北京举办。在算力平台专题论坛上,技术副总裁
    的头像 发表于 09-05 17:13 1944次阅读
    <b class='flag-5'>格</b><b class='flag-5'>灵</b><b class='flag-5'>深</b><b class='flag-5'>瞳</b>视觉基础模型Glint-MVT的发展脉络

    智慧金融产品家族全新升级

    智能体时代,如何打造能用、好用、有持续成长性的智慧金融产品?这是探索 AI+金融深度融合的实践方向。
    的头像 发表于 08-19 17:53 1492次阅读

    与您相约WAIC 2025

    7月26-29日,2025世界人工智能大会(WAIC)将在上海世博中心和世博展览馆举行。将在第一现场,联合华为昇腾、
    的头像 发表于 07-26 16:14 1282次阅读

    六篇论文入选ICCV 2025

    近日,国际顶级会议ICCV 2025(计算机视觉国际大会)公布论文录用结果,团队共有6篇论文入选。
    的头像 发表于 07-07 18:23 1797次阅读

    亮相AICon 2025全球人工智能开发与应用大会

    此前,6月27-28日,由极客邦科技旗下InfoQ中国主办的“AICon全球人工智能开发与应用大会”在北京举办。作为行业领先的视觉AI公司,
    的头像 发表于 07-05 16:15 1647次阅读