0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

传音多媒体团队揽获CVPR NTIRE 2025两项挑战赛冠亚军

传音控股 来源:传音控股 2025-06-24 16:08 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

近日,在计算机视觉领域最具影响力的国际竞赛 CVPR NTIRE 2025中,传音多媒体团队与上海交通大学图像所MediaLab联合团队分别斩获高效超分辨率挑战赛(NTIRE 2025 Efficient Super-Resolution Challenge)第一名,短视频UGC图像超分辨率挑战赛(NTIRE 2025 Short-form UGC Image Super-Resolution Challenge)第二名,展现了传音在视频画质领域的深厚积累与领先实力。

56a65f68-50c1-11f0-b715-92fbcf53809c.jpg

56bafdce-50c1-11f0-b715-92fbcf53809c.jpg

CVPR NTIRE(New Trends in Image Restoration and Enhancement)是计算机视觉顶会CVPR(Conference on Computer Vision and Pattern Recognition)旗下极具影响力的国际学术竞赛,素有“影像算法奥林匹克”之称。该赛事聚焦视频复原、图像增强、生成技术及质量评估等底层视觉任务,旨在推动技术突破并解决实际应用难题。今年的赛事设置了多项挑战赛,吸引了全球顶尖科研与产业队伍参与。

传音深耕非洲、南亚等新兴市场多年,始终围绕用户需求进行本地化创新。近年来数字媒体飞速发展,传音洞察到用户对智能手机图像和视频素质提出了更高的要求。据Dataspark的数据显示,2024年非洲用户月均在社交、视频类App上花费约52小时,然而非洲用户观看视频在线播放网速平均不到10M/S,观看体验较差。面对非洲等目标市场存在的网速慢、流量贵等现实问题,传音持续投入资源,与上海交通大学图像所MediaLab深入合作,研发轻量化、低功耗、高性能的画质增强技术,让更多用户在有限条件下也能享受高清视觉体验。

▍技术成果一

高效图像超分辨率中的蒸馏监督下的卷积低秩适应

在高效超分辨率挑战赛中,传音多媒体团队和上海交通大学图像所MediaLab提交的论文“高效图像超分辨率中的蒸馏监督下的卷积低秩适应(Distillation-Supervised Convolutional Low-Rank Adaptation for Efficient Image Super-Resolution)”提出DSCLoRA技术,其借鉴大语言模型中的低秩适应并结合知识蒸馏策略,在不增加计算成本的前提下显著提升了高效超分辨率模型的性能。

多个基准数据集上的实验结果表明DSCLoRA在模型复杂度和性能表现之间实现了出色的均衡。在不增加模型体积和计算开销的前提下,DSCLoRA能够大幅提升图像超分辨率效果,提升弱网环境下视频通话与流媒体播放清晰度,同时具备推理速度快、功耗低等优点。通过将该算法集成至手机影像引擎,用户在在线视频播放、视频通话、图像放大、数码变焦拍摄等场景中,均可体验更高分辨率、更锐利自然的画面。

56ea4318-50c1-11f0-b715-92fbcf53809c.png

模型架构总览

▍技术成果二

用于短视频UGC图像超分辨率的增强语义提取与引导

在短视频UGC图像超分辨率挑战赛中,传音多媒体团队和上海交通大学图像所MediaLab提交的论文“用于UGC图像超分辨率的增强语义提取与引导(Enhanced Semantic Extraction and Guidance for UGC Image Super Resolution)”,提出一种基于 Diffusion 的新型模型以处理短视频平台 UGC 场景下低分辨率退化图片,有助于实现更稳健、感知可信和实际适用的图像修复。

该模型通过制作特定数据集,消除现实 UGC 场景下图片退化类型和合成退化之间存在的差异。其次,通过引入语义提取模块,利用 SAM2 预训练模型提取高层次的上下文信息,协助模型进行图像重建任务。最后,针对不同的数据集进行参数微调,使模型在不同数据集上表现达到最优。

该项技术突破,将有效处理模糊、压缩、结构变形等常见失真问题,生成更自然、真实、语义一致的修复图像,极大提升用户在短视频截图、社交图片增强等场景中的视觉体验。

56f95dd0-50c1-11f0-b715-92fbcf53809c.png

模型架构总览

此次联合高校团队参加国际顶级竞赛体现传音对核心技术创新的重视与投入,也为后续画质增强功能的产品化奠定坚实基础。未来,传音将加速将画质增强技术部署到旗下手机产品中,构建起一套适应新兴市场特色、兼顾性能与体验的视频增强解决方案,为更多新兴市场用户带来更为高清、流畅的视觉体验。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 计算机视觉
    +关注

    关注

    9

    文章

    1716

    浏览量

    47773
  • 传音控股
    +关注

    关注

    1

    文章

    135

    浏览量

    8629

原文标题:传音多媒体团队揽获CVPR NTIRE 2025两项挑战赛冠亚军,推动视频画质升级

文章出处:【微信号:TranssionHoldings,微信公众号:传音控股】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    燧原科技连两项重要荣誉资质

    近期,燧原科技接连获得“2025年度上海市科技小巨人企业”和“上海市企业技术中心”两项重要企业荣誉资质,技术研发与创新能力得到上海市多部门的联合肯定。
    的头像 发表于 03-17 17:25 1117次阅读

    鸿利显示两项行业奖项

    在日前落幕的ISLE 2026国际智慧显示及系统集成展上,鸿利智汇集团旗下子公司鸿利显示凭实力斩获两项行业奖项!
    的头像 发表于 03-12 15:52 523次阅读

    思必驰斩获Interspeech 2026音频推理挑战赛智能体赛道亚军

    近日,国际语音与语言处理领域顶级赛事Interspeech 2026音频推理挑战赛结果正式揭晓。在这场首次将评估焦点从“答案正确性”转向“推理过程质量”的变革性赛事中,思必驰-上海交通大学联合实验室团队凭借创新的多智能体协同方案,在全球众多顶尖科研
    的头像 发表于 02-28 14:13 930次阅读

    第三届开放原子大赛OpenTenBase大赛圆满落幕

    2025年12月19日,由开放原子开源基金会主办,深圳市腾讯计算机系统有限公司承办的“OpenTenBase多模态分析开发挑战赛”与“OpenTenBase-TXSQL SQL改写优化挑战赛
    的头像 发表于 12-29 13:53 695次阅读

    西威连两项国际权威荣誉

    近日,德西威摘得“PMI(中国)年度项目大奖”、“PRINCE2企业最佳实践奖”两项国际权威荣誉,充分彰显德西威在AI时代下项目管理的国际领先实力!
    的头像 发表于 11-13 16:24 1014次阅读

    openDACS 2025 开源EDA与芯片 题七:基于大模型的生成式原理图设计

    1. 大赛背景 开放原子大赛是由开放原子开源基金会组织举办的面向开源领域的技术类赛事,目前大赛已成功举办届共发布100个,吸引8多万人报名参赛,覆盖1000多所院校,发放奖金超过2700万元
    发表于 11-13 11:49

    华普微物联之“芯”,一举斩获2025世界物联网博览会两项行业殊荣

    2025世界物联网博览会华普微两项殊荣,凭借创新技术荣获“产业先锋奖”和“SENSOR TOP 50”。
    的头像 发表于 11-09 16:56 1491次阅读
    华普微物联之“芯”,一举斩获<b class='flag-5'>2025</b>世界物联网博览会<b class='flag-5'>两项</b>行业殊荣

    西威连ESG领域两项荣誉

    “ESG先锋企业”。这两项来自国内权威媒体和行业机构的认可,充分体现了德西威在推动可持续发展与出行科技融合方面的系统实践与持续投入。
    的头像 发表于 11-08 17:12 2853次阅读

    TEX AI团队斩获ICCV 2025大型视频目标分割挑战赛双料亚军

    近日,国际计算机视觉大会(ICCV 2025)举办了第七届大型视频目标分割挑战赛(LSVOS Challenge),TEX AI团队凭借
    的头像 发表于 10-31 09:42 843次阅读
    <b class='flag-5'>传</b><b class='flag-5'>音</b>TEX AI<b class='flag-5'>团队</b>斩获ICCV <b class='flag-5'>2025</b>大型视频目标分割<b class='flag-5'>挑战赛</b>双料<b class='flag-5'>亚军</b>

    东风睿立达斩获NEVC 2025中国新能源商用车挑战赛大奖

    9月15日,NEVC2025第十届中国新能源商用车挑战赛颁奖盛典圆满落幕。东风睿立达以卓越表现横扫六大奖,包括“大面组全能金奖”及四关键单项冠军,成为本届赛事中最耀眼的新能源商用车
    的头像 发表于 09-16 16:57 1187次阅读

    2025 EDA精英挑战赛华大九天题发布

    中国研究生创“ 芯 ” 大赛·EDA精英挑战赛(以下简称EDA精英挑战赛)是由教育部学位管理与研究生教育司指导,中国学位与研究生教育学会、中国科协青少年科技中心主办的“ 中国研究生创‘芯 ’大赛
    的头像 发表于 08-26 15:00 2127次阅读
    <b class='flag-5'>2025</b> EDA精英<b class='flag-5'>挑战赛</b>华大九天<b class='flag-5'>赛</b>题发布

    2025 EDA精英挑战赛紫光同创题发布

    中国研究生创“ 芯 ” 大赛·EDA精英挑战赛(以下简称EDA精英挑战赛)是由教育部学位管理与研究生教育司指导,中国学位与研究生教育学会、中国科协青少年科技中心主办的“ 中国研究生创‘芯 ’大赛
    的头像 发表于 08-25 09:40 2066次阅读
    <b class='flag-5'>2025</b> EDA精英<b class='flag-5'>挑战赛</b>紫光同创<b class='flag-5'>赛</b>题发布

    地平线H-RDT模型斩获CVPR 2025冠军

    近日,在计算机视觉与模式识别领域顶级会议CVPR 2025举办的RoboTwin双臂机器人竞赛中,地平线机器人实验室与清华大学计算机系朱军团队联合提出的H-RDT凭强大性能和领先成功率,一举斩获真机
    的头像 发表于 08-21 10:02 860次阅读
    地平线H-RDT模型斩获<b class='flag-5'>CVPR</b> <b class='flag-5'>2025</b>大<b class='flag-5'>赛</b>冠军

    多媒体团队CVPR NTIRE 2025两项挑战赛冠亚军,推动视频画质升级

    近日,在计算机视觉领域最具影响力的国际竞赛CVPRNTIRE2025中,多媒体团队与上海交通大学图像所MediaLab联合
    的头像 发表于 06-24 17:03 1109次阅读
    <b class='flag-5'>传</b><b class='flag-5'>音</b><b class='flag-5'>多媒体</b><b class='flag-5'>团队</b><b class='flag-5'>揽</b><b class='flag-5'>获</b><b class='flag-5'>CVPR</b> <b class='flag-5'>NTIRE</b> <b class='flag-5'>2025</b><b class='flag-5'>两项</b><b class='flag-5'>挑战赛</b><b class='flag-5'>冠亚军</b>,推动视频画质升级

    西威深度参与两项国家标准制定工作

    近日,由国家相关标准管理机构主导的《轻型汽车前方视野辅助系统技术要求及试验方法》及《车载显示终端性能要求及试验方法》两项国家标准核心起草组2025年第二次会议在德西威成功召开。
    的头像 发表于 06-12 13:58 1172次阅读