0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

格灵深瞳六篇论文入选ICCV 2025

格灵深瞳 来源:格灵深瞳 2025-07-07 18:23 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

近日,国际顶级会议ICCV 2025(计算机视觉国际大会)公布论文录用结果,格灵深瞳团队共有6篇论文入选。

作为CV领域最具国际影响力的三大顶级会议之一,本届ICCV竞争十分激烈。据公开信息,今年大会共收到11239份有效投稿,数量为史上最多。经过评审后,仅接受2698篇论文,录用率为24%。

格灵深瞳此次入选的6篇论文,涉及视觉基座模型、人脸3D重建、文档几何校正、人体动作生成、鲁棒三维重建等多个视觉AI研究关键方向,展现了格灵深瞳深耕多年的核心技术积累和前沿创新实力,每一项成果都具有前瞻的科研价值和实际应用意义。

此次入选的6篇论文核心内容如下:

视觉基座模型

格灵深瞳与华为诺亚研究院合作的论文Region-based Cluster Discrimination for Visual Representation Learning中稿,其创新性在于,通过引入区域Transformer层和高效的区域聚类判别损失,有效提升视觉模型对局部区域信息的感知与表达能力,使其在OCR、目标检测和分割等密集视觉任务中表现突出。

同时,RICE采用大规模候选区域数据集,统一目标识别与OCR学习。在多项下游任务中,RICE均优于SigLIP2、AIMv2,无需显式语言监督,即可成为强大的多模态视觉大模型基座,展现出卓越的通用性和扩展潜力。

人脸3D重建、肤色估计

格灵深瞳与悉尼科技大学、浙江大学、帝国理工学院合作的HUST,方法创新性体现在:无需昂贵的光场采集数据,仅凭单张图片即可实现高保真、无偏见的人脸漫反射反照率重建。

该论文通过提出“反照率即去光照纹理”的新见解,结合VQGAN预训练和有限UV纹理微调,模型有效利用大规模高分辨率人脸数据。跨空间自适应与群体身份损失实现域迁移,提升了不同肤色的泛化能力。HUST在FAIR基准上取得了当前最优的准确性和公平性指标。

文档几何校正

格灵深瞳与360移动算法部合作的ForCenNet,其创新性体现在:提出了前景为中心标签生成方法和掩码机制,显著提升了对文档可读区域的几何校正能力。

同时,该论文方法设计了曲率一致性损失,有效约束线性结构的变形,提升了校正精度。实验结果表明方法在多个真实基准上均取得了新的最优表现。

人体动作生成

格灵深瞳与浙江大学合作的MotionStreamer,提出了一种全新的流式人体动作生成框架。通过在连续的因果潜空间中进行自回归,并使用扩散模型建模每个潜在变量的概率分布,实现高效的流式生成。

流式框架天然支持多轮交互式动作生成、长序列动作生成、动态动作组合等多种应用。

人体动作生成

格灵深瞳与浙江大学合作的Motion-2-to-3,创新性地使用大量的人类二维视频,以提升文本驱动的三维运动生成。研究通过解耦局部关节运动与全局运动,从二维数据高效学习局部运动先验。先在大规模文本-二维运动数据集上训练单视角生成器,再用三维数据微调为多视角生成器,预测视角一致的局部关节运动和根节点动态。

实验表明,该方法能高效利用二维数据,生成更广泛,更多类型的真实三维人体运动,为相关行业带来新机遇。

鲁棒三维重建

格灵深瞳与浙江大学合作的UniVerse,首次将视频扩散模型引入到鲁棒3D重建中,通过先把不一致的多视图图像转化为一致视频帧,再进行高质量神经场重建,有效解耦了“修复”和“重建”两大任务。

近年来,格灵深瞳大力投入视觉基础模型、多模态大模型等AI核心技术研发,积极与各大高校、企业开展研究合作,聚合产学研力量,促进学术深度交流。此次亮相国际顶级学术平台,是对团队科研实力与成果的检验和肯定。

未来,格灵深瞳将持续发力前沿技术创新研究,促进科研成果转化应用,引领行业共同发展进步。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 计算机
    +关注

    关注

    19

    文章

    7841

    浏览量

    93464
  • 模型
    +关注

    关注

    1

    文章

    3818

    浏览量

    52269
  • 格灵深瞳
    +关注

    关注

    1

    文章

    97

    浏览量

    6013

原文标题:格灵深瞳6篇论文亮相国际顶级学术舞台,涵盖视觉基座模型、人脸3D重建等领域

文章出处:【微信号:shentongzhineng,微信公众号:格灵深瞳】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    亮相2026 ITES深圳工业展

    3月31日-4月3日,第27届ITES深圳工业展暨高端装备产业集群展在深圳宝安举行。在工创联企业家交流会圆桌环节,CEO吴一洲围绕主题“AI的生产力在哪里”,分享AI技术如何与
    的头像 发表于 04-08 15:36 284次阅读

    与佳都科技达成授权合作协议

    3月27日,与佳都科技集团股份有限公司(简称“佳都科技”)达成授权合作协议,双方将围绕
    的头像 发表于 03-30 11:21 259次阅读

    2025年度关键词回顾

    过去一年,深耕视觉算法与多模态大模型,自研视觉基础模型Glint-MVT系列持续升级:MVT v1.5提升局部和文字特征表达能力,收获国际顶级学术会议
    的头像 发表于 02-24 17:17 1443次阅读

    入选多家媒体2025年度榜单

    岁末年初,多家媒体发布2025年度奖项评选结果,涵盖AI技术创新、产品应用、上市公司投关等多个领域。
    的头像 发表于 01-12 17:05 689次阅读

    受邀参加光合组织2025人工智能创新大会

    12月17-19日,光合组织2025人工智能创新大会(HAIC 2025)将在江苏昆山举行。
    的头像 发表于 12-17 15:26 840次阅读

    荣获量子位2025人工智能年度领航企业

    12月10日,量子位发布“2025人工智能年度榜单”。入选
    的头像 发表于 12-17 15:23 690次阅读

    受邀参加百度世界2025大会

    11月13日,百度世界2025大会将在北京国家会议中心二期举行。在分论坛环节,灵感实验室负责人冯子勇、
    的头像 发表于 11-14 15:47 774次阅读

    邀您相约百度世界2025大会

    11月13日,百度世界2025大会将在北京国家会议中心二期举行,主题为“效果涌现 | AI In Action”。在公开课环节,副总
    的头像 发表于 11-12 16:57 1020次阅读

    视觉基础模型Glint-MVT的发展脉络

    此前,8月28-30日,2025百度云智大会在北京举办。在算力平台专题论坛上,技术副总裁、算法研究院院长冯子勇分享了《视觉基座:通向
    的头像 发表于 09-05 17:13 1873次阅读
    <b class='flag-5'>格</b><b class='flag-5'>灵</b><b class='flag-5'>深</b><b class='flag-5'>瞳</b>视觉基础模型Glint-MVT的发展脉络

    智慧金融产品家族全新升级

    智能体时代,如何打造能用、好用、有持续成长性的智慧金融产品?这是探索 AI+金融深度融合的实践方向。
    的头像 发表于 08-19 17:53 1430次阅读

    智慧体育产品全新升级

    智慧体育产品家族,近期迎来全新升级。
    的头像 发表于 08-14 11:51 1616次阅读

    视觉基础模型Glint-MVT升级

    近日,灵感实验室和华为伦敦研究所发布最新版视觉基础模型——Glint-MVT v1.5(RICE)。
    的头像 发表于 07-31 11:01 1627次阅读
    <b class='flag-5'>格</b><b class='flag-5'>灵</b><b class='flag-5'>深</b><b class='flag-5'>瞳</b>视觉基础模型Glint-MVT升级

    与您相约WAIC 2025

    7月26-29日,2025世界人工智能大会(WAIC)将在上海世博中心和世博展览馆举行。将在第一现场,联合华为昇腾、百度、飞腾等生态
    的头像 发表于 07-26 16:14 1232次阅读

    理想汽车八论文入选ICCV 2025

    近日,ICCV 2025(国际计算机视觉大会)公布论文录用结果,理想汽车共有8论文入选,其中5
    的头像 发表于 07-03 13:58 1304次阅读

    亮相Create2025百度AI开发者大会

    近日,Create2025百度AI开发者大会在武汉体育中心圆满落幕,作为全球首个AI开发者大会,Create2025百度AI开发者大会至今已举办6届,持续驱动科技革新,重塑行业格局。
    的头像 发表于 04-29 16:12 1201次阅读