0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

格灵深瞳六篇论文入选ICCV 2025

格灵深瞳 来源:格灵深瞳 2025-07-07 18:23 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

近日,国际顶级会议ICCV 2025(计算机视觉国际大会)公布论文录用结果,格灵深瞳团队共有6篇论文入选。

作为CV领域最具国际影响力的三大顶级会议之一,本届ICCV竞争十分激烈。据公开信息,今年大会共收到11239份有效投稿,数量为史上最多。经过评审后,仅接受2698篇论文,录用率为24%。

格灵深瞳此次入选的6篇论文,涉及视觉基座模型、人脸3D重建、文档几何校正、人体动作生成、鲁棒三维重建等多个视觉AI研究关键方向,展现了格灵深瞳深耕多年的核心技术积累和前沿创新实力,每一项成果都具有前瞻的科研价值和实际应用意义。

此次入选的6篇论文核心内容如下:

视觉基座模型

格灵深瞳与华为诺亚研究院合作的论文Region-based Cluster Discrimination for Visual Representation Learning中稿,其创新性在于,通过引入区域Transformer层和高效的区域聚类判别损失,有效提升视觉模型对局部区域信息的感知与表达能力,使其在OCR、目标检测和分割等密集视觉任务中表现突出。

同时,RICE采用大规模候选区域数据集,统一目标识别与OCR学习。在多项下游任务中,RICE均优于SigLIP2、AIMv2,无需显式语言监督,即可成为强大的多模态视觉大模型基座,展现出卓越的通用性和扩展潜力。

人脸3D重建、肤色估计

格灵深瞳与悉尼科技大学、浙江大学、帝国理工学院合作的HUST,方法创新性体现在:无需昂贵的光场采集数据,仅凭单张图片即可实现高保真、无偏见的人脸漫反射反照率重建。

该论文通过提出“反照率即去光照纹理”的新见解,结合VQGAN预训练和有限UV纹理微调,模型有效利用大规模高分辨率人脸数据。跨空间自适应与群体身份损失实现域迁移,提升了不同肤色的泛化能力。HUST在FAIR基准上取得了当前最优的准确性和公平性指标。

文档几何校正

格灵深瞳与360移动算法部合作的ForCenNet,其创新性体现在:提出了前景为中心标签生成方法和掩码机制,显著提升了对文档可读区域的几何校正能力。

同时,该论文方法设计了曲率一致性损失,有效约束线性结构的变形,提升了校正精度。实验结果表明方法在多个真实基准上均取得了新的最优表现。

人体动作生成

格灵深瞳与浙江大学合作的MotionStreamer,提出了一种全新的流式人体动作生成框架。通过在连续的因果潜空间中进行自回归,并使用扩散模型建模每个潜在变量的概率分布,实现高效的流式生成。

流式框架天然支持多轮交互式动作生成、长序列动作生成、动态动作组合等多种应用。

人体动作生成

格灵深瞳与浙江大学合作的Motion-2-to-3,创新性地使用大量的人类二维视频,以提升文本驱动的三维运动生成。研究通过解耦局部关节运动与全局运动,从二维数据高效学习局部运动先验。先在大规模文本-二维运动数据集上训练单视角生成器,再用三维数据微调为多视角生成器,预测视角一致的局部关节运动和根节点动态。

实验表明,该方法能高效利用二维数据,生成更广泛,更多类型的真实三维人体运动,为相关行业带来新机遇。

鲁棒三维重建

格灵深瞳与浙江大学合作的UniVerse,首次将视频扩散模型引入到鲁棒3D重建中,通过先把不一致的多视图图像转化为一致视频帧,再进行高质量神经场重建,有效解耦了“修复”和“重建”两大任务。

近年来,格灵深瞳大力投入视觉基础模型、多模态大模型等AI核心技术研发,积极与各大高校、企业开展研究合作,聚合产学研力量,促进学术深度交流。此次亮相国际顶级学术平台,是对团队科研实力与成果的检验和肯定。

未来,格灵深瞳将持续发力前沿技术创新研究,促进科研成果转化应用,引领行业共同发展进步。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 计算机
    +关注

    关注

    19

    文章

    7765

    浏览量

    92695
  • 模型
    +关注

    关注

    1

    文章

    3649

    浏览量

    51719
  • 格灵深瞳
    +关注

    关注

    1

    文章

    78

    浏览量

    5900

原文标题:格灵深瞳6篇论文亮相国际顶级学术舞台,涵盖视觉基座模型、人脸3D重建等领域

文章出处:【微信号:shentongzhineng,微信公众号:格灵深瞳】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    精彩亮相百度世界2025大会

    11月13日,百度世界2025大会在北京国家会议中心二期举办。活动期间,与百度进行深入交流,并围绕VLM、AI Infra、应用场景
    的头像 发表于 11-19 17:09 473次阅读

    受邀参加百度世界2025大会

    11月13日,百度世界2025大会将在北京国家会议中心二期举行。在分论坛环节,灵感实验室负责人冯子勇、
    的头像 发表于 11-14 15:47 395次阅读

    邀您相约百度世界2025大会

    11月13日,百度世界2025大会将在北京国家会议中心二期举行,主题为“效果涌现 | AI In Action”。在公开课环节,副总
    的头像 发表于 11-12 16:57 694次阅读

    亮相2025华为北京商业伙伴大会

    10月17日,华为北京商业伙伴大会·2025(第三届)在北京成功举办。作为华为的重要合作伙伴,现场展示了智慧金融整体解决方案,引发各
    的头像 发表于 10-22 18:07 853次阅读

    突破文本人物检索技术难题

    参与研究的GA-DMS框架,为攻破上述技术难题提供了全新解决方案。研究团队通过数据构建和模型架构的协同改进,推动CLIP在人物表征学习中的应用,显著提升了基于文本的人物检索效果
    的头像 发表于 09-28 09:42 423次阅读
    <b class='flag-5'>格</b><b class='flag-5'>灵</b><b class='flag-5'>深</b><b class='flag-5'>瞳</b>突破文本人物检索技术难题

    视觉基础模型Glint-MVT的发展脉络

    此前,8月28-30日,2025百度云智大会在北京举办。在算力平台专题论坛上,技术副总裁、算法研究院院长冯子勇分享了《视觉基座:通向
    的头像 发表于 09-05 17:13 1320次阅读
    <b class='flag-5'>格</b><b class='flag-5'>灵</b><b class='flag-5'>深</b><b class='flag-5'>瞳</b>视觉基础模型Glint-MVT的发展脉络

    加入海光产业生态合作组织

    近日,正式加入海光产业生态合作组织(简称“光合组织”),成为该组织成员单位。
    的头像 发表于 08-25 16:10 600次阅读

    智慧金融产品家族全新升级

    智能体时代,如何打造能用、好用、有持续成长性的智慧金融产品?这是探索 AI+金融深度融合的实践方向。
    的头像 发表于 08-19 17:53 1043次阅读

    智慧体育产品全新升级

    智慧体育产品家族,近期迎来全新升级。
    的头像 发表于 08-14 11:51 1197次阅读

    视觉基础模型Glint-MVT升级

    近日,灵感实验室和华为伦敦研究所发布最新版视觉基础模型——Glint-MVT v1.5(RICE)。
    的头像 发表于 07-31 11:01 1220次阅读
    <b class='flag-5'>格</b><b class='flag-5'>灵</b><b class='flag-5'>深</b><b class='flag-5'>瞳</b>视觉基础模型Glint-MVT升级

    与您相约WAIC 2025

    7月26-29日,2025世界人工智能大会(WAIC)将在上海世博中心和世博展览馆举行。将在第一现场,联合华为昇腾、百度、飞腾等生态
    的头像 发表于 07-26 16:14 963次阅读

    亮相AICon 2025全球人工智能开发与应用大会

    此前,6月27-28日,由极客邦科技旗下InfoQ中国主办的“AICon全球人工智能开发与应用大会”在北京举办。作为行业领先的视觉AI公司,受邀参会。
    的头像 发表于 07-05 16:15 1254次阅读

    理想汽车八论文入选ICCV 2025

    近日,ICCV 2025(国际计算机视觉大会)公布论文录用结果,理想汽车共有8论文入选,其中5
    的头像 发表于 07-03 13:58 846次阅读

    亮相Create2025百度AI开发者大会

    近日,Create2025百度AI开发者大会在武汉体育中心圆满落幕,作为全球首个AI开发者大会,Create2025百度AI开发者大会至今已举办6届,持续驱动科技革新,重塑行业格局。
    的头像 发表于 04-29 16:12 873次阅读

    入选量子位2025年AIGC双榜单

    4月16日,第三届中国AIGC产业峰会在京召开。大会由量子位主办,以“万物皆可AI”为主题,峰会C位焦点——“2025年值得关注的AIGC企业”与“2025年值得关注的AIGC产品”双榜单正式发布!
    的头像 发表于 04-18 09:20 791次阅读