0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

语音唤醒技术的对比,语音唤醒技术哪家强

语音技术智能汇 来源:语音技术智能汇 作者:语音技术智能汇 2022-03-23 10:54 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

编辑导语:

随着语音交互技术的日渐成熟,越来越多的智能硬件都选择增加语音能力作为产品卖点之一。但是,设备在进入语音交互工作状态的时候,需要先进行唤醒操作。

常见的唤醒语音交互的操作有按键或者触屏形式,但是,为了进一步降低学习成本和操作复杂度,也有不少的智能硬件选择通过语音唤醒的方式来激活交互功能。

本文将综合对比市面上各家提供的语音唤醒技术相关指标,可以帮助你快速掌握语音唤醒技术的情况。

一、语音唤醒技术的相关核心指标

1、唤醒率

语音唤醒的主要目的既然是激活设备进入交互工作状态,那么,唤醒率的高低就显得额外重要了。理论上,最好的状态就是我只要说一次唤醒词,设备就能立即响应。不过,受说话人与设备距离、发音标准、噪声等各种各样的因素,实际工作中比较难达到次次响应的完美工作状态。

一般来说,在近距离的安静场景下,市面上的技术都能够做到唤醒率在95%以上。

不过,消费者的实际使用场景是较复杂的,因此,需要模拟不同的应用场景进行实测,才能得到最后的唤醒率指标。

2、误唤醒率

指设备被非唤醒词唤醒的概率,误唤醒率越高,效果越不好。

大家在日常生活中可能会经常碰到,放在家里的智能音箱,大晚上莫名其妙答一句“我在”,把人吓个半死;还有如果家里用的智能电视,唤醒手机语音助手的时候,不是同一个唤醒词,电视也会蹦出一句“我在”。

这就是典型的误唤醒场景,一般用24小时被误唤醒多少次来衡量。

3、响应时长

主要是指用户说完唤醒词后,设备给出反馈的耗时,一般越短越好。

而反馈的形式则比较多样,可以通过语音应答响应、也可以通过亮屏或者指示灯闪烁响应。统计来看,如果是亮屏或者指示灯闪烁响应,控制在200ms以内用户体验较好;如果是语音应答响应,太快反而体验不好,一般控制在500ms左右更佳。

4、功耗

主要是针对电池供电设备,理论上越低越好,这样,设备的使用时长不会受到太大的影响。

因为唤醒的工作原理是会持续检测声音中是否包含唤醒词的特定片段,所以,会持续耗电。

为了进一步降低功耗,部分产品也会采取DSP来完成语音唤醒,再通过AP层兜底的模式,保证唤醒和功耗的均衡。

总结:语音唤醒的技术指标,除了与算法相关之外,还与智能硬件的结构设计、芯片算力、使用场景等息息相关。最后的实际效果,则应以实际测试效果为准,参考下图:

二、语音唤醒技术对比

该对比信息均从互联网公开渠道获取,相关信息来源于提供商官网公开信息,如其官网有更新,请以更新信息为准。(PS:百度搜索关键词“语音唤醒”)

poYBAGI6i66AIXdTAAn5A2rKJxY710.png

三、唤醒词的区别

唤醒词的定义实际是比较广泛,至少包含了四种使用场景:品牌唤醒词(如,小飞小飞)、离线命令词(如,我要听周杰伦的歌)、云端命令词(如,我要听周杰伦的歌)、免唤醒词(如,下一首、暂停)。这些使用场景,实际上都是使用了唤醒词的原理,只是唤醒后执行不同的动作。

四、语音唤醒项目实施要点

1、唤醒词评估

大部分服务商都提供了唤醒词评估服务,不过,有部分服务商对唤醒词有一定的限制。因此,在选择唤醒词的时候,需要充分考虑品牌、发音特点、词语等因素,综合确定最终的唤醒词。

2、确认测试环境和工具

以以往交付的唤醒项目来看,主要测试的环境包括:外噪场景测试、自噪场景测试、安静场景测试和误唤醒测试。

3、声音采集

根据产品主要面向的使用人群,采集真人发音音频。

示例:【某某投影仪音频采集需求】

  • 采集人数200人,总音频2000句
  • 男女比=1:1
  • 一人10句
  • 语速快:中:慢=1:3:1
  • 年龄儿童:青年:中年=1:3:1
  • 区域:北上广深
  • 普通话

4、测试音频处理

包括去除破音的音频、去除时长>1.7s的测试音频、音频幅度归一化。

5、数据记录表

根据实测结果,如实填写表格中对应测试结果,完成项目验收。

如果需要更深入地咨询了解,可添加笔者V:HolaAI,详细交流。

审核编辑:符乾江

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 语音控制
    +关注

    关注

    5

    文章

    510

    浏览量

    29556
  • 语音交互
    +关注

    关注

    3

    文章

    339

    浏览量

    29063
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    智能语音识别控制器是什么?图形中文编程,多路设备控制

    智能语音识别控制器是一种融合语音识别技术、物联网通信技术与设备控制模块的智能终端设备,核心功能是将人类自然语言指令转化为设备可执行的电信号,实现对各类终端设备的
    的头像 发表于 12-03 16:35 390次阅读

    揭秘AI玩具“听得清”的秘密!这几款语音前端芯片撑起交互体验天花板

    、混响,而主控SoC的算力/功耗/实时性都扛不住这些7×24的AEC+NR+Beamforming+唤醒运算;前端芯片把“干净的人声”先截出来,再送给主控或云端,才能保证打断唤醒、低误触发、低功耗三样同时成立。   因此,目前AI玩具中,一款好的
    的头像 发表于 10-17 08:42 9635次阅读

    智能语音技术重新定义车载交互边界

    凭借自主研发的智能语音技术,为某国内头部车企提供的语音前处理、唤醒词、ASR、TTS等技术
    的头像 发表于 07-11 14:00 960次阅读

    智芯科超低功耗离线语音唤醒芯片的应用场景

    想让设备无需联网也能秒速响应语音指令?我们的超低功耗离线语音唤醒芯片正是答案!采用前沿技术,待机能耗近乎“休眠”,续航焦虑一扫而空,智能穿戴、智能家居等设备电量更持久。
    的头像 发表于 07-08 10:24 998次阅读

    告别 “起床气”!NV340D 语音芯片解锁电子闹钟唤醒新体验!

    在快节奏的现代生活中,电子闹钟作为我们每天清晨的“唤醒伙伴”,其重要性不言而喻。如今,随着科技的飞速发展,电子闹钟也在不断进化,功能日益丰富。而这背后,离不开关键技术——语音芯片的强力支持
    的头像 发表于 07-05 11:09 1071次阅读
    告别 “起床气”!NV340D <b class='flag-5'>语音</b>芯片解锁电子闹钟<b class='flag-5'>唤醒</b>新体验!

    芯知识|广州唯创电子WT2003H语音芯片:智能低功耗,唤醒随心控

    在电池供电或对功耗敏感的语音应用场景中,WT2003H语音芯片凭借其精心设计的双模式低功耗休眠架构,为开发者提供了灵活高效的节能解决方案,显著延长设备续航时间。核心低功耗模式解析深度休眠模式
    的头像 发表于 06-30 08:52 397次阅读
    芯知识|广州唯创电子WT2003H<b class='flag-5'>语音</b>芯片:智能低功耗,<b class='flag-5'>唤醒</b>随心控

    语音助手只能聊天?启明云端AI语音交互方案偷偷修炼了音乐才艺!

    设备演示:技术落地的全景呈现在实测场景中,搭载乐鑫科技ESP32-S3芯片的“赛博地平线”手办伴侣率先登场,响应指令。通过深度整合豆包大模型,用户通过唤醒词即可实现
    的头像 发表于 06-27 18:03 710次阅读
    <b class='flag-5'>语音</b>助手只能聊天?启明云端AI<b class='flag-5'>语音</b>交互方案偷偷修炼了音乐才艺!

    可编程SLIC语音芯片哪家好?

    在当今数字化快速发展的时代,语音芯片的应用越来越广泛,而可编程SLIC(用户线路接口电路)语音芯片更是凭借其独特的优势,受到众多行业的青睐。那么,面对众多的选择,哪家的可编程SLIC语音
    的头像 发表于 06-12 13:55 540次阅读
    可编程SLIC<b class='flag-5'>语音</b>芯片<b class='flag-5'>哪家</b>好?

    小安AI语音板,“广西表哥”强势上线!

    集成度、高性价比等特性,支持 离线语音唤醒语音打断 功能。 此款开发板结合 2W/8Ω 扬声器与双供电模式(Type-C + 电池),适用于快速部署语音交互能力的硬件创新场景,如
    的头像 发表于 06-10 17:30 616次阅读
    小安AI<b class='flag-5'>语音</b>板,“广西表哥”强势上线!

    芯资讯|基于广州唯创电子语音芯片的烟雾报警器语音方案技术解析

    了三大烟雾报警器语音方案,覆盖传统、高集成度与智能化需求,为不同场景提供灵活选择。以下从技术特性、应用场景及行业价值三方面展开分析。一、方案对比技术特性方案类型核
    的头像 发表于 04-21 08:54 539次阅读
    芯资讯|基于广州唯创电子<b class='flag-5'>语音</b>芯片的烟雾报警器<b class='flag-5'>语音</b>方案<b class='flag-5'>技术</b>解析

    信息入选2024语音识别技术公司TOP30榜单

    凭借在语音识别领域多年的技术积淀与持续的创新突破,成功入选“2024语音识别技术公司TOP30”榜单。作为行业标杆,普
    的头像 发表于 04-18 17:25 1005次阅读

    离线语音模组VC系列出厂固件使用教程——SDK开源?

    安信可VC系列离线语音模组,采用云知声方案,在语音识别技术上不断优化和创新算法,离线识别算法与芯片架构深度融合,为客户提供超低成本的离线语音识别方案,可广泛且快速应用于智能家居,各类智
    的头像 发表于 02-26 14:14 833次阅读
    离线<b class='flag-5'>语音</b>模组VC系列出厂固件使用教程——SDK开源?

    谷歌“减法”新动作:砍掉耳机按键唤醒朗读功能

    电子发烧友网报道(文/莫婷婷)近期,谷歌宣布将对耳机上的 Google Assistant语音助手功能进行调整,取消通过触控唤醒助理“自动朗读未读通知”的功能。谷歌表示,要想完成该功能可以通过语音
    的头像 发表于 02-22 22:56 2885次阅读
    谷歌“减法”新动作:砍掉耳机按键<b class='flag-5'>唤醒</b>朗读功能

    详解语音识别技术在通信领域中的应用

    语音识别技术也被称为自动语音识别(Automatic Speech Recognition,ASR),是通过计算机对语音信号进行分析和识别,将人类的
    的头像 发表于 02-21 17:05 1032次阅读
    详解<b class='flag-5'>语音</b>识别<b class='flag-5'>技术</b>在通信领域中的应用

    领先技术语音识别芯片,探索NRK3502芯片的技术特点

    九芯电子NRK3502芯片以卓越创新力和技术积累引领语音识别领域,低成本纯离线,高精度识别保障隐私,支持多唤醒词,低功耗高性能,推动智能家居、智慧办公等领域发展。
    的头像 发表于 12-25 13:06 934次阅读