0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

华为研发语音唤醒方法及电子设备的语音交互技术

454398 来源:搜狐 作者:搜狐 2021-01-09 09:07 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

通常语音交互过程通常分为唤醒、响应、输入、理解、反馈几个环节,语音交互技术也一直是IBM、微软、百度等遥遥领先。

几个月前,华为消费者业务CEO余承东表示华为正在研发国际版的语音助手,同时建立自己的AI服务,并将在未来扩展到国际市场。

人工智能的潮流推动下,智能化语音技术不断发展,许多电子设备中都添加了语音助手,如Siri、小爱同学、天猫精灵等,用来协助用户进行人机交互过程。为了使得语音助手能够及时检测并响应用户发出的语音交互指令,电子设备一般会预设一些唤醒词,如“Hi Siri”等,当检测到用户输入唤醒词时,可触发电子设备与用户进行交流。通常设备设置唤醒词的声强门限60dB,当用户输入声强大于60dB时,电子设备检测成功,然而当用户距离设备较远时,由于输入声强的降低,电子设备往往难以检测到输入语音信号从唤醒失败。在这种情况下,如何在远距离下提高语音助手唤醒成功率成为诸多企业竞相研究的热点。

华为公司于2019年7月25日提出了一项名为“一种语音唤醒方法及电子设备”的发明专利(申请号:201910677390 .9),申请人为华为技术有限公司。

此发明专利介绍了一种语音唤醒方法及相对应的电子设备,可以在较广的位置范围内保证电子设备被成功唤醒的几率,从而提高用户的使用体验,而该种方法可以被应用于诸如智能家居设备、PC、手机、音箱等具有语音交互功能的电子设备之中。

o4YBAF9uXB6ASSloAACJI4NT3Lc054.png

图1 语音交互过程示意图

通常语音交互过程可分为唤醒、响应、输入、理解、反馈几个环节。当设备处于待机状态时,需要识别用户输入的语音唤醒信号,如果识别成功则切换到工作状态,此后则可以通过语音识别算法用户对输入的语义内容进行识别并响应,整个过程如图1所示。

从上述过程可以看出,成功唤醒电子设备是实现人机语音交互的基础,而唤醒设备的过程就是通过预设的唤醒参数检测用户的语音输入。唤醒参数如唤醒门限、拾音方向、噪声抑制参数、放大增益等的取值决定了电子设备在检测唤醒输入语音时唤醒率的高低。在实际使用过程中,用户相对设备的位置差异导致了唤醒率的不同,因此根据用户所在的位置动态设置唤醒参数可以使得电子设备在不同位置场景下保持较高的唤醒率。

pIYBAF9uXCCACWbGAAEKoHGuKwk742.png

图2 语音唤醒方法应用场景示意图

图2为上述提到的基于用户位置信息来划分区域,从而进行语音唤醒的示意图。电子设备在待机状态时可周期性地通过摄像头采集用户图像信息,并根据图像确定用户所在的位置信息。对于不同区域,设备可预先设置对应的唤醒参数,以声强为例,在近处的区域设置较大的门限,而在远处区域设置较小的门限,从而使各个区域都达到较高的唤醒率。如图2所示的三个区域各自具有一套唤醒参数,从而提高了语音交互场景下用户的使用体验。

o4YBAF9uXCGAUjaBAAITFAM0hTk601.png

图3 语音唤醒方法流程图

图3是此专利提供的一种语音唤醒方法流程示意图。以智能电视为例,首先设备通过摄像头采集图像,并通过采集的图像确定其中是否包含用户,如果包含则确定图像中第一用户所在的第一目标位置,并获取该位置下的唤醒参数。当用户输入语音后,设备根据上述唤醒参数处理输入语音信号。如果用户从区域1切换到区域2,则设备获取区域2中的唤醒参数并进行信号处理,包括模数转换、降噪、放大等,因此该设备可根据用户所在位置实时动态的对切换唤醒参数,达到更好的人机交互效果。

在智能语音服务上,Google和亚马逊的是目前公认的业界巨头,然而从此项专利可以推断出华为在语音业务上也在不断努力发展!

编辑:hfy
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 华为
    +关注

    关注

    217

    文章

    35783

    浏览量

    260706
  • 人工智能
    +关注

    关注

    1813

    文章

    49734

    浏览量

    261498
  • 语音交互
    +关注

    关注

    3

    文章

    339

    浏览量

    29063
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    什么是语音芯片串口AT指令?实现智能语音交互的核心技术详解

    一、语音芯片串口AT指令的基本概念在现代智能电子产品中,语音芯片已成为实现人机交互的关键组件。作为语音IC厂家与
    的头像 发表于 11-10 12:53 190次阅读
    什么是<b class='flag-5'>语音</b>芯片串口AT指令?实现智能<b class='flag-5'>语音</b><b class='flag-5'>交互</b>的核心<b class='flag-5'>技术</b>详解

    语音芯片白噪音支持功能详解:打造舒适音频体验的关键技术 | 广州唯创电子语音IC厂家

    前言:探索语音芯片的白噪音技术世界在现代电子设备日益普及的今天,语音芯片的功能创新正在不断丰富着我们的日常生活体验。作为专业的语音IC厂家,
    的头像 发表于 11-06 08:56 176次阅读
    <b class='flag-5'>语音</b>芯片白噪音支持功能详解:打造舒适音频体验的关键<b class='flag-5'>技术</b> | 广州唯创<b class='flag-5'>电子</b><b class='flag-5'>语音</b>IC厂家

    揭秘AI玩具“听得清”的秘密!这几款语音前端芯片撑起交互体验天花板

    电子发烧友网报道(文/黄山明)在AI大模型的加持下,AI玩具的最重要的功能便是语音交互,而要做到较好的语音交互,少不了
    的头像 发表于 10-17 08:42 9635次阅读

    广州唯创电子WTN6系列语音芯片:四维控制模式重塑智能设备交互体验

    在智能化设备普及的今天,灵活高效的控制方式成为产品差异化竞争的关键。广州唯创电子WTN6系列语音芯片以其独特的四种控制模式,为智能设备提供了前所未有的设计灵活性。随着物联网
    的头像 发表于 10-09 08:45 256次阅读
    广州唯创<b class='flag-5'>电子</b>WTN6系列<b class='flag-5'>语音</b>芯片:四维控制模式重塑智能<b class='flag-5'>设备</b><b class='flag-5'>交互</b>体验

    “芯”声代,智未来—VS680本地语音交互系统 #语音交互 #芯片

    语音交互
    深蕾半导体
    发布于 :2025年09月17日 10:59:30

    赋能智能语音交互:广州唯创电子WTV系列语音芯片IC引领播放与报警设备新变革

    在万物互联与智能化浪潮的推动下,语音交互已成为人机沟通最自然、最直接的桥梁。语音播放器与报警器作为这一技术的关键载体,正广泛应用于公共安全、智能家居、工业控制及交通管理等领域。然而,传
    的头像 发表于 09-01 09:30 399次阅读
    赋能智能<b class='flag-5'>语音</b><b class='flag-5'>交互</b>:广州唯创<b class='flag-5'>电子</b>WTV系列<b class='flag-5'>语音</b>芯片IC引领播放与报警<b class='flag-5'>设备</b>新变革

    广州唯创电子常用语音芯片全解析:赋能智能语音交互的多场景应用

    语音芯片作为智能设备实现语音交互的核心部件,已广泛应用于家居、车载、医疗、工业等领域。广州唯创电子凭借多年的
    的头像 发表于 08-28 08:41 504次阅读
    广州唯创<b class='flag-5'>电子</b>常用<b class='flag-5'>语音</b>芯片全解析:赋能智能<b class='flag-5'>语音</b><b class='flag-5'>交互</b>的多场景应用

    普强智能语音技术重新定义车载交互边界

    普强凭借自主研发的智能语音技术,为某国内头部车企提供的语音前处理、唤醒词、ASR、TTS等技术
    的头像 发表于 07-11 14:00 960次阅读

    告别 “起床气”!NV340D 语音芯片解锁电子闹钟唤醒新体验!

    在快节奏的现代生活中,电子闹钟作为我们每天清晨的“唤醒伙伴”,其重要性不言而喻。如今,随着科技的飞速发展,电子闹钟也在不断进化,功能日益丰富。而这背后,离不开关键技术——
    的头像 发表于 07-05 11:09 1071次阅读
    告别 “起床气”!NV340D <b class='flag-5'>语音</b>芯片解锁<b class='flag-5'>电子</b>闹钟<b class='flag-5'>唤醒</b>新体验!

    语音助手只能聊天?启明云端AI语音交互方案偷偷修炼了音乐才艺!

    语音助手只能聊天?太out了!”语音交互的新乐章已经奏响!启明云端基于乐鑫科技芯片的AI语音方案正式解锁音乐技能树,只需一句指令,智能设备
    的头像 发表于 06-27 18:03 710次阅读
    <b class='flag-5'>语音</b>助手只能聊天?启明云端AI<b class='flag-5'>语音</b><b class='flag-5'>交互</b>方案偷偷修炼了音乐才艺!

    芯资讯|广州唯创电子WTK6900P语音识别芯片:离线语音交互的革新者

    在智能设备全面普及的浪潮中,语音交互技术正逐步从“云端依赖”向“本地化高效处理”演进。广州唯创电子推出的WTK6900P
    的头像 发表于 05-22 09:22 582次阅读
    芯资讯|广州唯创<b class='flag-5'>电子</b>WTK6900P<b class='flag-5'>语音</b>识别芯片:离线<b class='flag-5'>语音</b><b class='flag-5'>交互</b>的革新者

    芯资讯|广州唯创电子WTV系列语音芯片:以技术创新赋能智能语音交互

    在万物互联的智能化时代,语音交互技术已成为人机交互的重要桥梁。广州唯创电子深耕语音芯片领域多年,
    的头像 发表于 05-21 08:45 549次阅读
    芯资讯|广州唯创<b class='flag-5'>电子</b>WTV系列<b class='flag-5'>语音</b>芯片:以<b class='flag-5'>技术</b>创新赋能智能<b class='flag-5'>语音</b><b class='flag-5'>交互</b>

    智能收银语音交互新标杆—WT3000T8语音合成芯片TTS技术应用解析

    一、行业应用背景在零售业态智能化转型的浪潮中,收银设备正经历从功能型向服务型转变的关键阶段。WT3000T8语音合成芯片应运而生,专为满足新零售场景下智能收银终端的语音交互需求而设计。
    的头像 发表于 04-24 08:45 618次阅读
    智能收银<b class='flag-5'>语音</b><b class='flag-5'>交互</b>新标杆—WT3000T8<b class='flag-5'>语音</b>合成芯片TTS<b class='flag-5'>技术</b>应用解析

    智能语音交互方案在客服领域的应用

    着客服行业的面貌,为企业和用户带来了全新的体验。 语音识别模型优化私部署 方案:精准高效,定制专属服务 语音识别技术作为智能语音交互的基础,
    的头像 发表于 04-11 14:35 623次阅读

    零知开源——ESP32语音交互系统(AI小智)开发教程

    小智AI聊天机器人是一个基于嵌入式硬件与人工智能技术深度融合的智能交互系统。该项目以ESP32开发板为核心,结合语音唤醒、自然语言处理、音频解码播放及图形化
    的头像 发表于 03-29 15:33 1w次阅读
    零知开源——ESP32<b class='flag-5'>语音</b><b class='flag-5'>交互</b>系统(AI小智)开发教程