0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

声加科技助力小米首款支持本地命令词语音唤醒TWS耳机上市

向上 来源:北国网 2019-09-26 15:00 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

9 月 24 日,小米新一代真无线蓝牙耳机 Air 2正式亮相,在外形和功能上都较一代有了非常大的变化。小米官方海报广告词宣称“智能真无线,轻松舒适戴”,并且将“智能语音唤醒,双麦克风降噪”作为其首条宣传卖点。目前该产品已在小米商城开放预约,9月27日正式上市。

小米Air2宣传海报,图片来源于小米官网

Air2的语音唤醒到底有多智能呢?据本次算法技术支持方案商——声加科技CEO邱锋海介绍,此次小米Air2采用了声加科技提供的耳机本地语音识别方案,与市面同类产品最大的不同是能直接在Air2耳机端完成多命令词语音识别,急速响应命令——用户在播放音乐时无需唤醒语音助手“小爱同学”,可直接向耳机发出语音指令“上一首/上一曲”,“下一首/下一曲”,迅速实现自由切歌,无需再等待语音助手唤醒手机进行响应,大大提高了用户使用体验。

小米Air2宣传海报,图片来源于小米官网

邱锋海表示,耳机搭载语音助手已经成为目前TWS耳机的主流趋势,但目前市面上绝大部分产品使用的还是以基于手机的语音识别方案,用户每一次的语音指令都要首先唤醒手机语音助手,造成响应速度较慢(切换歌曲需要等待5~6秒),不少用户因此放弃了语音唤醒功能,宁可使用手势或按键,甚至只能拿出手机进行操作,体验欠佳。其原因主要受限于耳机运算能力较弱以及电池续航时间短,给耳机端进行精确的语音识别造成了极高难度。而声加科技的小资源关键词唤醒(KWS)有限语音命令方案攻克了技术难点,可实现唤醒低功耗计算方案,KWS启动和手机语音交互,有限语音命令实现切歌、调音量等基本操作。在算法所需资源消耗上,低至30Mips, 50KBytes memory的唤醒词模型(m4f平台),模型规模可变,能根据产品计算资源快速调整模型,还能整合声加自有前端语音增强,优化整体性能。

除此之外,耳机使用场景复杂且运算资源受限,如果只依靠基于深度学习的小资源语音识别模型,在嘈杂环境下会存在误识率高、识别率低的问题。而Air2同时还搭载了声加科技的双麦SVE降噪技术,如定向拾音、环境降噪(尤其是风噪抑制)等,能有效降低通话时的环境噪声,即使身处嘈杂环境,也能保障高清晰的语音识别以及通话质量。

对小米Air2直接说“下一首”,迅速切换歌曲

据了解,声加科技成立于2018年1月,专注于通信声学核心技术,依托于中科院声学所雄厚的人才和科研资源,打造产学研一体化。其SVE(Soundplus Voice Enhancement)降噪技术可以广泛应用于耳塞式耳机、半入耳式耳机、入耳式耳机、头戴式耳机、挂耳式耳机等,是通过双麦克风阵列,精准计算通话者说话的方位,在保护主方向目标语音的同时,去除环境中的各种干扰噪声,例如其他人的讲话声、交通工具产生的噪音、风噪声等等,有效抑制90%的反向环境噪声,由此降低环境噪声最高可达30dB,保证高品质通话效果。让使用者无论身处何种嘈杂环境,都可细语轻聊,无惧干扰。其核心技术包括:

回声消除AEC:

支持单通道回声抵消、双通道立体声回声抵消,可在设备自身播放大音量时轻松唤醒,ERLE》30dB。

声源定位Direction of arrival estimation:

支持多源定位;可在强混响及噪声干扰情况下准确定位目标声源;工作信噪比可低至0db以下;DOA分辨率《10°。

波束形成Beamforming:

保护目标语音的同时,去除噪声干扰与散射噪声,大幅提高语音识别率;稳态噪声抑量》30dB,非平稳噪声印制量》24dB。

关键词唤醒、有限语音命令词识别Key word spotting、command

基于深度神经网络训练,根据前端算法进行深度优化,精确辨识关键词,超低误唤醒。消耗资源配置灵活(小模型超低资源占用;资源丰富时可实现高性能识别),可应用于耳机、手环、手表等可穿戴智能设备。5米唤醒率》93%,3米唤醒率》97%,误唤醒《2次/48H。

基于机器学习降噪/识别

已成功用于声学建模,与标准GMM模型相比语音识别率实现了大幅改进,DNN是全连接神经网络,解决了局部最优解的问题;卷积神经网络CNN降低模型体积,充分利用语谱中的局部信息;循环神经网络RNN可以对时间序列进行建模,适合处理语音信号。对动态/稳态噪声均有效(~30dB)同时保护语音成分,表现鲁棒。

音效:

EQ均衡:通过对各种不同频率的电信号的调节来补偿扬声器和声场的缺陷,补偿和修饰各种声源及其它特殊作用。

虚拟环绕声:在双声道立体声的基础上,不增加声道和音箱,把声场信号通过电路处理后播出,使聆听者感到声音来自多个方位。

SVE开启前后对比(公路噪声):

此外,作为智能听觉的创新公司,声加科技的耳机技术方案还应用在了华为Flypods、小米Air、小米Air2、万魔EM001、万魔EM004、京东京鱼座等产品上。目前,其团队凭借十余年的技术积累,可为B端客户提供复杂场景下的近场、中场、远场语音交互技术方案,以及从芯片、模组、PCBA到工业设计的一站式产品方案。其回声抵消、噪声抑制、声源定位、混响消除、波束形成、语音唤醒等性能在行业内均名列前位。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 小米
    +关注

    关注

    70

    文章

    14509

    浏览量

    151189
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    新品 | Module ASR,AI智能离线语音模块

    新的指令。内置AEC(回声消除),有效去除回声和噪声干扰,提升语音识别准确性。产品出厂时预设了53条英文唤醒词和反馈命令词,支持通过UART指令或
    的头像 发表于 12-05 18:15 51次阅读
    新品 | Module ASR,AI智能离线<b class='flag-5'>语音</b>模块

    MEMS硅麦克风在TWS耳机中的应用解析-技术揭秘

    深入探讨MEMS硅麦克风如何提升TWS耳机通话降噪与语音体验。了解华芯邦高性能MEMS传感器的核心技术优势,助力耳机实现高清音质与低功耗运行
    的头像 发表于 11-21 14:55 129次阅读

    戴着TWS耳机假装听不见老板叫你是靠什么进行通话?

    大多数TWS耳机至少有两个mems麦克风(一个在耳机柄上,一个在靠近耳道的位置)。 主麦克风(前馈麦克风): 通常位于耳机柄下部,主要负责采集你的说话
    的头像 发表于 11-12 14:53 237次阅读

    MCU单片机TWS耳机充电盒系统控制方案

    TWS(True Wireless Stereo,真无线立体耳机已成为主流音频设备,其充电盒系统设计对整体使用体验至关重要。由于耳机内部空间有限,无法容纳大容量电池及充电元件,因此
    的头像 发表于 11-05 09:22 191次阅读

    一句话,多个命令同时执行,AI语音模组也能多任务处理?

    、 Ai-WV02-32S   将语音识别、唤醒、语义理解等核心功能, 浓缩在一颗小小的模组中。 安信可AI语音模组支持 MCP 协议(Multi Command Processin
    的头像 发表于 10-31 14:45 242次阅读
    一句话,多个<b class='flag-5'>命令</b>同时执行,AI<b class='flag-5'>语音</b>模组也能多任务处理?

    今日看点丨小米AI眼镜来了,售价1999元起;曝长城欧拉战略大调整!进军中高端市场

    入口”,具备全天候佩戴能力,支持线上线下配镜服务。   该产品搭载1200万像素高清摄像头,支持第一人称拍照、视频录制、第三方App的视频通话与直播,主打“沉浸式拍摄”体验。此外,小米AI眼镜还可作为开放式
    发表于 06-27 10:52 2682次阅读

    爱普生FC2012SN晶振在TWS蓝牙耳机中的应用优势

    在无线音频技术飞速发展的今天,TWS(真无线立体)蓝牙耳机凭借其便捷性和出色的音质体验,成为人们日常生活中不可或缺的音频设备。耳机的稳定性、续航能力和空间设计成为关键竞争点。爱普生F
    的头像 发表于 05-08 17:30 538次阅读
    爱普生FC2012SN晶振在<b class='flag-5'>TWS</b>蓝牙<b class='flag-5'>耳机</b>中的应用优势

    TWS耳机行业洗牌加速,芯片技术重塑市场格局

    分析华芯邦芯片技术对TWS耳机行业的深远影响,包括推动产品高端化、加速品牌差异化竞争及促进产业链升级。
    的头像 发表于 05-08 16:06 702次阅读

    Wi-Fi音频传输+百倍AI性能飞跃!开放式耳机上新高度

    电子发烧友网报道(文/莫婷婷)继小米发布小米Buds 5 Pro入耳式耳机首发支持Wi-Fi技术之后,在近期Cleer也发布了旗下首Wi-
    的头像 发表于 04-28 00:14 3422次阅读
    Wi-Fi音频传输+百倍AI性能飞跃!开放式<b class='flag-5'>耳机上</b>新高度

    小米最强TWS:首发Wi-Fi音频传输,支持苹果生态

    将手机和耳机连接在一起,Wi-Fi音频传输突破传统TWS传输瓶颈,能够带来极高的传输速率、更好的干扰性能传输音质。搭配小米15 Ultra,带宽达到
    的头像 发表于 03-05 01:17 6101次阅读
    <b class='flag-5'>小米</b>最强<b class='flag-5'>TWS</b>:首发Wi-Fi音频传输,<b class='flag-5'>支持</b>苹果生态

    离线语音模组VC系列出厂固件使用教程——SDK开源?

    盒、玩具、灯具等需要语音操控的产品。 具体的性能: · 支持唤醒词自学习(意思是不用编程就可以增加唤醒词) · 支持中英文(不同固件) ·
    的头像 发表于 02-26 14:14 836次阅读
    离线<b class='flag-5'>语音</b>模组VC系列出厂固件使用教程——SDK开源?

    谷歌“减法”新动作:砍掉耳机按键唤醒朗读功能

    电子发烧友网报道(文/莫婷婷)近期,谷歌宣布将对耳机上的 Google Assistant语音助手功能进行调整,取消通过触控唤醒助理“自动朗读未读通知”的功能。谷歌表示,要想完成该功能可以通过
    的头像 发表于 02-22 22:56 2889次阅读
    谷歌“减法”新动作:砍掉<b class='flag-5'>耳机</b>按键<b class='flag-5'>唤醒</b>朗读功能

    应用方案|汤诚科技TWS耳机全套应用解决方案

    TWS耳机,作为真无线立体耳机的代表,正迅速风靡全球。从外观设计而言,它极为精巧,两个迷你耳机搭配小巧充电盒,能轻松放进口袋或背包,日常携
    的头像 发表于 01-17 14:57 1412次阅读
    应用方案|汤诚科技<b class='flag-5'>TWS</b><b class='flag-5'>耳机</b>全套应用解决方案

    理想MEGA首次亮相CES!全球支持杜比视界和杜比全景车型

    是杜比视界车载体验首次亮相CES。 沉浸式娱乐领域的领导者杜比实验室(Dolby Laboratories)以其在汽车领域的最新创新,在面向全球合作伙伴的技术展示中,向现场来宾演示了全球支持杜比视界和杜比全景
    的头像 发表于 01-09 19:02 1667次阅读

    智科技AI耳机有哪些功能

    登上科技热榜。在评测中,UP主对市面上五热门AI耳机进行了无广告评测,智AI耳机凭借其颜值、音质还有AI功能被翻牌,并成为最后UP主购买意向最高的
    的头像 发表于 01-06 13:33 2007次阅读