0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

传统的音频降噪方式!通过AI识别场景,智能降噪

NJ90_gh_bee81f8 来源:未知 作者:李倩 2018-08-14 17:57 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

锤子科技在15日坚果TNT工作站发布之后,表情包们集体炸了。

嘘,你不要讲话,吵到我用TNT了

这个表情包吐槽的是9999元起的TNT工作站的工作场景,因为大部分操作需要用到触控+语音识别功能,在背景嘈杂的办公室,你很难让语音清晰识别到你的声音,在各种干扰下你的操作精度将会大打折扣。所以网上还有个段子表示,如果要用TNT工作站来设计,老板必须给每个设计师安排单独的隔音办公室。其实这种情况在目前普遍搭载人工语音智能的设备如手机、音箱中很难普遍,只要稍微有人声干预就会让你的siri识别率大跌。

不过噪音问题其实比你想象中的容易解决,对于罗永浩和锤子科技来说,或许欠缺的只是一颗小小的降噪芯片。

传统的音频降噪方式

目前智能手机中对于环境噪音的处理主要有两种方式:第一种是通过多MIC实现降噪功能。这种方式需要配备降噪MIC,对于用户的使用手势要求很高。如果降噪MIC刚好压住用户的脸部,或者在耳机模式下都无法获得降噪效果,在使用免提模式的时候也会有影响。

第二种是通过在终端设备内置场景降噪的软件,通过算法来实现降噪。这对于终端计算能力有很高要求,一方面对于环境噪声的样本数量有限,另一方面,噪声样本越多,终端的判断时间就会越长,最终影响用户体验。毕竟用户希望对话是能够迅速反应的。

这两种传统的降噪方式都具有各种缺陷,在具体的降噪效果上也是差强人意。

通过AI识别场景,智能降噪

更好的方式是采用独立的降噪芯片来进行降噪。来自***的意腾科技通过一颗搭载AI算法的降噪芯片来实现降噪功能。这种方式的好处是不再需要多个MIC来处理,只需要单MIC就能保证通话模式中实现清晰的语音。此外,这种方式也不需要对噪声样本进行搜索匹配。

这颗降噪芯片其中的核心是一颗专为语音降噪设计的AI处理器,通过3层深度学习网络(DNN网络)实现对原始声音的处理输出,其中每层网络拥有1028个节点。此外,这颗AI处理器的运算能力可以达到1012 ops/W,可以针对特别压缩的声音信号实现计算处理。

通过这颗降噪芯片,之所以不需要对噪声样本进行搜索匹配。主要是因为这颗AI处理器对超过4亿个语音资料样本(包括2亿外文语音样本)进行了机器学习,可通过DNN网络迅速自行找到每段音频最合适的模型和参数。可实现智能识别包括餐厅/集会场所、公交地铁火车站、风噪、音乐噪声等各个噪声场景。

降噪前后效果对比

通过智能场景识别实现的降噪功能有多牛逼?让我们来通过噪声处理前后的音频来实际对比一下:

一般来说,业界都采用SNR(信噪比)来判断降噪功能,SNR是按照国际标准ISO 4969-2检测的单值降噪值。设备的信噪比越高表明它产生的杂音越少。从图表对比中可以看到,经过降噪处理后的SNR实现了大幅度的提升。

据了解,目前意腾科技的降噪音频芯片一共四个型号,分别对应IG200、IG1201、IG1100、IG1102。目前实现的主要功能还是通话降噪和近距离唤醒。此外,目前实现的本地存储的关键词达到4组,预计到Q3会升到10组,通过是支持立体声AEC以及beamforming功能。预计到Q4会推出带声纹识别功能的降噪芯片,这样的话你就再也不用担心下面这个段子的情况会发生了:

“我悄悄来到卖力工作的设计师小王身后,说一句全部删除,小王的心血付之东流。”

最后介绍一下这颗芯片的供应商意腾科技。这家公司的CEO从事半导体行业30年+,之前创立的耀鹏科技曾是三星手机供应商。主要研发团队从2013年开始就研究AI语音降噪算法,目前意腾科技也获得了MTK的投资。值得注意的是,目前高通是采用将AI降噪算法植入到SOC的方式来实现降噪,但这对于SOC的性能和功耗要求颇高,未来是否会采用单独的AI芯片来进行处理,还有待观察。

最后,笔者认为未来语音交互将会成为一种重要的交互手段,TNT的构想在技术的进步之下未必不能实现。让我们对产品创新保持一定的宽容和好奇心。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • AI
    AI
    +关注

    关注

    90

    文章

    38241

    浏览量

    297151
  • 语音识别
    +关注

    关注

    39

    文章

    1804

    浏览量

    115584

原文标题:这颗芯片安利给罗永浩,再不用担心用TNT被吵到了

文章出处:【微信号:gh_bee81f890fc1,微信公众号:面包板社区】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    降噪黑科技 AP-0316:重新定义全场景语音交互新体验

    AP-0316 是一款高集成度 DSP 数字语音处理模组,凭借 AI ENC 智能降噪、AEC 消回音、双麦波束定向拾音三大核心技术,破解嘈杂环境语音交互难题。其 45-90dB 宽幅降噪可屏蔽各类干扰,100dB 消回音 +
    的头像 发表于 11-28 15:20 247次阅读
    <b class='flag-5'>降噪</b>黑科技 AP-0316:重新定义全<b class='flag-5'>场景</b>语音交互新体验

    重塑音频通话体验!A-29P AI 降噪回音消除模块赋能千行百业

    A-29P神经网络AI降噪回音消除模块创新突破音频处理技术瓶颈,融合DSP数字处理与AI降噪算法,实现100dB回音消除深度和45-90dB
    的头像 发表于 11-18 09:33 715次阅读
    重塑<b class='flag-5'>音频</b>通话体验!A-29P <b class='flag-5'>AI</b> <b class='flag-5'>降噪</b>回音消除模块赋能千行百业

    解读端侧AI降噪模组设计方案

    随着智能会议、直播和游戏语音交流的普及,高质量的音频输入设备变得越来越重要。专为语音收集和处理设计的USB AI降噪麦克风模组,这是一款基于XMOS XU316芯片和Codec芯片的专
    的头像 发表于 10-31 10:18 3147次阅读
    解读端侧<b class='flag-5'>AI</b><b class='flag-5'>降噪</b>模组设计方案

    LS67211_VC1:48KHz低延时AI降噪USB直播麦克风音频处理器

    LS67211_VC1是一款基于高性能XMOSXU316芯片架构的专业音频处理器,专为直播和实时音频应用开发。该产品搭载业界领先的AI深度降噪技术,能够
    的头像 发表于 10-17 14:34 327次阅读
    LS67211_VC1:48KHz低延时<b class='flag-5'>AI</b><b class='flag-5'>降噪</b>USB直播麦克风<b class='flag-5'>音频</b>处理器

    DNR65231_VC1:单通道超低延时AI深度降噪处理器产品介绍

    DNR65231_VC1是一款基于XMOS处理器架构的高性能AI深度降噪产品,专为音频设备制造商提供卓越的音频处理能力。产品集成两套独立优化的AI
    的头像 发表于 10-16 16:47 541次阅读
    DNR65231_VC1:单通道超低延时<b class='flag-5'>AI</b>深度<b class='flag-5'>降噪</b>处理器产品介绍

    DNR6521x_VC1:革新音频体验的AI降噪处理器

    在当今数字时代,高质量的音频处理需求日益增长。无论是直播、游戏、会议还是专业录音,都需要清晰、纯净的声音体验。DNR6521x_VC1作为一款基于XMOS处理器架构的AI深度降噪处理器,为这些应用
    的头像 发表于 10-15 16:59 1303次阅读
    DNR6521x_VC1:革新<b class='flag-5'>音频</b>体验的<b class='flag-5'>AI</b><b class='flag-5'>降噪</b>处理器

    飞利信AI降噪技术重塑会议音频体验新标准

    在现代会议环境中,空调运行声、键盘敲击声及远程参会者的环境噪声往往交织叠加,严重影响沟通效率与会议质量。为此,北京飞利信科技股份有限公司正式发布会议场景专用人工智能降噪算法及配套核心硬件,基于公司在
    的头像 发表于 10-09 15:01 590次阅读

    DNR65211-VC1单通道AI深度降噪处理器技术解析

    一、产品概述DNR65211-VC1是飞腾云音频推出的高性能AI音频处理方案,基于XMOS处理器架构设计,专为直播/会议/户外等场景提供智能
    的头像 发表于 10-08 15:32 351次阅读
    DNR65211-VC1单通道<b class='flag-5'>AI</b>深度<b class='flag-5'>降噪</b>处理器技术解析

    “一键静音”的声学魔法!移远AI音频降噪算法,让噪音瞬间“蒸发”

    让录音变成“无效数据“?针对多场景下的音频痛点,移远通信正式发布全新AI音频降噪算法,通过“信号
    的头像 发表于 08-20 19:04 925次阅读
    “一键静音”的声学魔法!移远<b class='flag-5'>AI</b><b class='flag-5'>音频</b><b class='flag-5'>降噪</b>算法,让噪音瞬间“蒸发”

    锐成芯微蓝牙射频IP赋能智能降噪领夹麦克风芯片

    智能音频设备快速迭代与边缘计算技术深度赋能的背景下,无线麦克风芯片持续向超低功耗、高集成度、智能降噪与高速无线传输演进。
    的头像 发表于 08-11 17:41 4439次阅读

    双麦阵列回音消除及降噪模块 A-47# 回声消除#智能降噪

    声音降噪
    深圳市声讯电子有限公司
    发布于 :2025年08月01日 16:04:21

    A-59U语音模块:多场景智能语音处理专家# #回声消除#智能降噪

    声音降噪
    深圳市声讯电子有限公司
    发布于 :2025年08月01日 11:24:49

    AP-0316 语音模组:不止是降噪神器,更是即插即用的 USB 声卡全能王

    。 声卡级性能,降噪消回音双开挂作为 USB 声卡,它的 “声音处理力” 堪称顶流: AI 降噪(最高 90dB):通过 USB 传输的声音,会先经过
    发表于 07-18 10:06

    AI神经网络降噪算法在语音通话产品中的应用优势与前景分析

    随着人工智能技术的快速发展,AI神经网络降噪算法在语音通话产品中的应用正逐步取代传统降噪技术,成为提升语音质量的关键解决方案。相比
    的头像 发表于 05-16 17:07 1137次阅读
    <b class='flag-5'>AI</b>神经网络<b class='flag-5'>降噪</b>算法在语音通话产品中的应用优势与前景分析

    XMOS人工智能降噪——AI降噪让极端嘈杂环境下的通话和拾音变得可能

    AI驱动的语音捕获功能,可在各种极具挑战性的环境中用深度神经网络(DNN)算法来降噪
    的头像 发表于 04-21 15:50 987次阅读
    XMOS人工<b class='flag-5'>智能降噪</b>——<b class='flag-5'>AI</b><b class='flag-5'>降噪</b>让极端嘈杂环境下的通话和拾音变得可能