0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

深度学习将对音频处理产生深远影响 亚马逊团队深度噪声抑制挑战赛中获胜

LiveVideoStack 来源:LiveVideoStack 作者:LiveVideoStack 2020-09-08 09:13 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

该团队的非实时系统是性能最好的,而它的实时系统在整个系统中排名第三,在实时系统中排名第二,尽管只使用了4%的CPU核心。

文 / Arvindh Krishnaswamy 原文链接: https://www.amazon.science/blog/amazon-team-takes-first-place-in-interspeech-2020-deep-noise-suppression-challenge

在电子语音通信中,噪音和混响不仅会损害语音清晰度,而且会导致听者在长时间努力理解低质量语音时感到疲劳。在COVID-19大流行期间,我们花在远程会议上的时间越来越多,这一问题比以往任何时候都更加重要。 在今年的Interspeech会议上的深度噪声抑制挑战便是为了帮助解决这个问题的一个尝试,分别在实时语音增强和非实时语音增强上进行比赛。在19个团队中,Amazon取得了最好的结果,在非实时赛道上获得了第一名(阶段1 |阶段2-final),在实时赛道上获得了第二名。

上面是一个有噪声的语音样本(上图) 下面是被研究者的系统抑制了噪声的同一个样本(下图) 为了满足真实世界的需求,我们将实时输入限制在CPU使用量的4%(在i7-8565U内核上测量),这远远低于竞赛所允许的最大限度。 然而,我们的实时输入非常接近(0.03平均意见分数)的第一名,并且击败了其他非实时的输入。 Amazon团队实时和非实时噪声抑制结果的音频示例可以在这里找到。 我们还发表了两篇论文(paper1-offline | paper2-real)来更详细地描述我们的技术方法。 在Interspeech中获胜的技术已经在Alexa通信公告和Drop in Everywhere功能中发布,并且从今天开始,我们的客户也可以通过使用Amazon Chime苹果macOS和微软Windows客户端来进行视频会议和在线会议。

优化的感知 传统的语音增强算法使用人工调整的语音和噪声模型,通常假设噪声是恒定的。 对于某些类型的噪音(例如汽车噪音),在噪音不太大或低混响的环境下,这种方法工作得相当好。不幸的是,它们经常在非平稳噪音上失败,比如键盘噪音和杂音。因此,研究人员转向了深度学习方法。

语音增强不仅需要从噪音和混响中提取原始语音,而且需要以一种人类耳朵感觉自然和愉快的方式进行。这使得自动回归测试变得困难,并使深度学习语音增强系统的设计复杂化。 我们的实时系统实际上通过直接优化了语音的感知特征(spectral envelope and voicing),利用了人类的感知因素同时忽略了与感知无关的方面。由此产生的算法产生了最先进的语音质量,同时保持非常高的计算效率。 对于非实时系统,我们采取了一种不妥协的方法,使用改进的U-Net深度卷积网络从增强的语音压缩每一点可能的质量,从而赢得了输入挑战。

一描绘经被允许使用的研究人员的实时系统的百分比中央处理器核心降噪后的一语音样本的平均意见分数(MOS)的变化的图像 在深度噪声抑制的挑战中,经过处理的音频示例被盲发送给人类听众,由他们对其进行评分,产生平均意见分数(MOS)。 在实时应用程序中,复杂性和质量之间总是需要权衡的。 右边的图显示了我们如何通过增加CPU需求来进一步提高实时提交的质量,或者通过牺牲一些质量来进一步节省CPU的使用。 红点表示提交挑战的实时系统,图像显示了MOS分数相对于不同CPU负载的变化。

人们普遍认为,深度学习最终将对音频处理产生深远影响。 虽然仍有很多挑战,比如数据增强,感知相关的损失函数或者处理看不见的情况,但未来依然非常令人兴奋。

原文标题:亚马逊团队在Interspeech 2020深度噪声抑制挑战赛中获得第一名

文章出处:【微信公众号:LiveVideoStack】欢迎添加关注!文章转载请注明出处。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • cpu
    cpu
    +关注

    关注

    68

    文章

    11216

    浏览量

    222912
  • MOS
    MOS
    +关注

    关注

    32

    文章

    1616

    浏览量

    99765
  • 噪音
    +关注

    关注

    1

    文章

    170

    浏览量

    24455
  • 亚马逊
    +关注

    关注

    8

    文章

    2720

    浏览量

    85434
  • 深度学习
    +关注

    关注

    73

    文章

    5590

    浏览量

    123899

原文标题:亚马逊团队在Interspeech 2020深度噪声抑制挑战赛中获得第一名

文章出处:【微信号:livevideostack,微信公众号:LiveVideoStack】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    传音TEX AI团队斩获ICCV 2025大型视频目标分割挑战赛双料亚军

    近日,国际计算机视觉大会(ICCV 2025)举办了第七届大型视频目标分割挑战赛(LSVOS Challenge),传音TEX AI团队凭借自主研发的创新技术方案,在复杂视频目标分割和语言指引视频
    的头像 发表于 10-31 09:42 285次阅读
    传音TEX AI<b class='flag-5'>团队</b>斩获ICCV 2025大型视频目标分割<b class='flag-5'>挑战赛</b>双料亚军

    2025 EDA精英挑战赛华大九天题发布

    中国研究生创“ 芯 ” 大赛·EDA精英挑战赛(以下简称EDA精英挑战赛)是由教育部学位管理与研究生教育司指导,中国学位与研究生教育学会、中国科协青少年科技中心主办的“ 中国研究生创‘芯 ’大赛
    的头像 发表于 08-26 15:00 1302次阅读
    2025 EDA精英<b class='flag-5'>挑战赛</b>华大九天<b class='flag-5'>赛</b>题发布

    2025 EDA精英挑战赛紫光同创题发布

    中国研究生创“ 芯 ” 大赛·EDA精英挑战赛(以下简称EDA精英挑战赛)是由教育部学位管理与研究生教育司指导,中国学位与研究生教育学会、中国科协青少年科技中心主办的“ 中国研究生创‘芯 ’大赛
    的头像 发表于 08-25 09:40 1256次阅读
    2025 EDA精英<b class='flag-5'>挑战赛</b>紫光同创<b class='flag-5'>赛</b>题发布

    传音多媒体团队揽获CVPR NTIRE 2025两项挑战赛冠亚军,推动视频画质升级

    近日,在计算机视觉领域最具影响力的国际竞赛CVPRNTIRE2025,传音多媒体团队与上海交通大学图像所MediaLab联合团队分别斩获高效超分辨率挑战赛
    的头像 发表于 06-24 17:03 746次阅读
    传音多媒体<b class='flag-5'>团队</b>揽获CVPR NTIRE 2025两项<b class='flag-5'>挑战赛</b>冠亚军,推动视频画质升级

    传音多媒体团队揽获CVPR NTIRE 2025两项挑战赛冠亚军

    近日,在计算机视觉领域最具影响力的国际竞赛 CVPR NTIRE 2025,传音多媒体团队与上海交通大学图像所MediaLab联合团队分别斩获 高效超分辨率挑战赛(NTIRE 202
    的头像 发表于 06-24 16:08 1431次阅读
    传音多媒体<b class='flag-5'>团队</b>揽获CVPR NTIRE 2025两项<b class='flag-5'>挑战赛</b>冠亚军

    ASML杯光刻「芯 」势力知识挑战赛正式启动

    ASML光刻「芯」势力知识挑战赛由全球半导体行业领先供应商ASML发起,是一项面向中国半导体人才与科技爱好者的科普赛事。依托ASML在光刻领域的技术积累与行业洞察,赛事致力于为参赛者打造一个深度探索光刻技术的知识竞技窗口,同时培养优秀科技「芯」势力,共同推动摩尔定律演进。
    的头像 发表于 06-23 17:04 1096次阅读
    ASML杯光刻「芯 」势力知识<b class='flag-5'>挑战赛</b>正式启动

    如何抑制电子电路噪声

    在电子电路的运行过程噪声如同不速之客,严重干扰信号的正常传输与处理,影响电路性能甚至导致系统故障。如何有效抑制电子电路
    的头像 发表于 05-05 10:04 1340次阅读

    兆易创新助力2025年“西门子杯”中国智能制造挑战赛

    全球智能制造浪潮奔涌向前,兆易创新(GigaDevice)作为半导体行业的领跑者,不断通过高校竞赛加速技术革新与人才培养。2025年,兆易创新深度参与CIMC “西门子杯”中国智能制造挑战赛,聚焦
    的头像 发表于 04-10 15:24 1467次阅读

    嵌入式AI技术之深度学习:数据样本预处理过程中使用合适的特征变换对深度学习的意义

      作者:苏勇Andrew 使用神经网络实现机器学习,网络的每个层都将对输入的数据做一次抽象,多层神经网络构成深度学习的框架,可以深度理解数
    的头像 发表于 04-02 18:21 1280次阅读

    e络盟社区联合 TDK 发起超声波传感器挑战赛

    安富利旗下社区 e络盟携手 TDK 发起新的设计挑战赛,诚邀工程师、创客及技术爱好者利用 TDK 防水超声波测距传感器开发创新项目,供实际应用使用。
    的头像 发表于 03-11 10:09 855次阅读
    e络盟社区联合 TDK 发起超声波传感器<b class='flag-5'>挑战赛</b>

    平头哥半导体亮相AICAS 2025挑战赛技术研讨会

    近日,历时两个多月,600余支参赛队伍激烈角逐,AICAS 2025全球技术挑战赛初赛阶段赛程已顺利结束,中技术研讨于2月22日在杭州圆满召开。本次研讨会作为AICAS全球技术挑战赛的重要环节,在初赛和复赛之间架起桥梁,为参赛
    的头像 发表于 02-25 11:23 1097次阅读

    军事应用深度学习挑战与机遇

    人工智能尤其是深度学习技术的最新进展,加速了不同应用领域的创新与发展。深度学习技术的发展深刻影响了军事发展趋势,导致战争形式和模式发生重大变化。本文将概述
    的头像 发表于 02-14 11:15 818次阅读

    BP神经网络与深度学习的关系

    ),是一种多层前馈神经网络,它通过反向传播算法进行训练。BP神经网络由输入层、一个或多个隐藏层和输出层组成,通过逐层递减的方式调整网络权重,目的是最小化网络的输出误差。 二、深度学习的定义与发展 深度
    的头像 发表于 02-12 15:15 1339次阅读

    芯华章持续助力EDA精英挑战赛

    日前,2024国研究生创“芯”大赛·EDA精英挑战赛(以下简称EDA竞赛)决赛在南京江北新区举办。今年EDA竞赛首次升级为国,在全国超过500个参赛队伍,来自华南理工大学的"ED
    的头像 发表于 12-17 15:47 1304次阅读

    EDA精英挑战赛果公布!思尔芯“战队”薪火相承斩获“麒麟杯”

    2024国研究生创芯大赛·EDA精英挑战赛12月7-8日,2024国研究生创芯大赛·EDA精英挑战赛(原“集成电路EDA设计精英挑战赛
    的头像 发表于 12-11 01:03 1400次阅读
    EDA精英<b class='flag-5'>挑战赛</b><b class='flag-5'>赛</b>果公布!思尔芯“战队”薪火相承斩获“麒麟杯”