0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

三星无声语音助手专利解密:可以完成精准语音识别任务

ss 来源:爱集微APP 作者:爱集微APP 2021-02-12 15:03 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

【嘉德点评】三星发明的可以完成精准语音识别任务的语音识别助手,在交互时无需发出语音,仅通过用户少量选择操作就可以完成复杂的交互任务,因此,可以简便且准确地采用语音识别方式来实现交互任务。

集微网消息,在2019年,三星就曾预告过新的“人造人”NEON助手,并表示NEON可以像真正的人类一样进行对话,并有一定的感知能力。NEON的网站上宣传其外观和行为都像真实的人类,能够表现出情感和智慧,而据相关消息,三星最终将随三星Galaxy S21 Ultra独家发售这款数字助手。

数字助手首先也是一款手机助手软件,目前,智能手机能够提供各种类型的应用服务,其中就包括手机助手软件,用户可以通过语音、文字等方式与智能手机之间进行交互,智能手机通过该语音识别助手软件识别语音后,提供对应的应用服务。

智能手机识别语音的功能可以有三种方式:交互任务型、知识问答型及闲聊型。其中,交互任务型语音识别方式使得用户可以通过直接的语音输入,由智能手机识别该语音,完成与智能手机的应用服务之间的交互意图,而无需进行多次语音识别界面的操作。

但是,智能手机提供的交互任务型语音识别方式对用户来说,使用率并不高,这是因为用户在通过语音操控智能手机时,存在以下缺点:1)公众场合不适合使用语音,有隐私问题;2) 智能手机处于嘈杂的远程环境下,语音识别的效果不佳;3)因为用户发音不准确,形同意思的表述方式多样等因素,语音识别和语音理解的准确率还需要提高;4)有些用户不习惯使用智能手机提供的语音识别界面。

那么,智能手机该如何在这些条件下简便且准确地采用语音识别方式实现交互任务呢?为此,三星在2019年9月27日申请了一项名为“一种采用语音识别方式实现交互任务的方法及系统”的发明专利(申请号:201910921533.6),申请人为三星电子(中国)研发中心和三星电子株式会社。

根据该专利目前公开的资料,让我们一起来看看这项应用于智能设备的语音识别方法及系统吧。

如上图,为该专利中发明的采用语音识别方式实现交互任务的方法流程示意图,首先,系统会基于当前环境进行语音识别来得到文本以及语义信息,基于得到的文本以及语义信息,来确定对应的上下文信息,且划分不同的场景,基于不同的场景来在系统中匹配不同的语音技能推荐表。

这种利用语音技能推荐表的方式,可以更加准确的应对不同的场景,通过事先准备好丰富的语料库,就可以非常人性化的与用户进行对话以及完成相应的操作。而当要实现交互任务时,则会根据语音技能推荐表执行智能手机的交互任务。同时,由于是智能助手主动分析用户所处场景,并主动提供相关的操作服务,因此无需用户主动发起语音唤醒,而是由语音助手主动为用户提供相关服务,只需用户进行选择即可。

如上图,为这种采用语音识别方式实现交互任务的方法子流程图,当用户唤醒语音助手插件模块时,语音助手插件模块被触发,该模块通知语言输入信息采集模块启动信息采集,信息采集模块通过上下文感知模块获取到当前的环境信息,再向语音助手插件模块发送请求,来获取从用户语音识别得到的文本,以及做自然语言理解后的语义信息。

之后,语言输入信息采集模块将采集到的文本、语义信息及当前的环境信息传输给语言技能生成模块,由此来生成语言技能库,并通知语言技能推荐模块。

语言技能推荐模块在特定情况下可以启动,将大量不同的上下文划分到若干类场景中,对每个场景生成相应的语言技能推荐表。

如上图,为在手机上使用语言技能推荐表的展示图,该款语音助手插件模块为Bixby,当每次都调用Bixby时,都会显示出语言技能推荐表,并且场景不同,该语言技能推荐表中的推荐技能偶读不同。

例如,经过学习后,如果用户打开手机并且唤醒了Bixby,则就可以触发语言技能推荐表的展示,当用户选择某条推荐的语言技能时,将该语言技能推荐表中的文本用作用户语言输入识别的结果,以完成后续用户的指令。

以上就是三星发明的可以完成精准语音识别任务的静默式语音识别助手,其在实现交互任务时,基于当前环境下对语音识别得到文本以及语音信息,在交互时无需发出语音,仅通过用户少量选择操作就可以完成复杂的交互任务,因此可以简便且准确地采用语音识别方式来实现交互任务。

责任编辑:xj

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 三星电子
    +关注

    关注

    34

    文章

    15891

    浏览量

    182873
  • 语音助手
    +关注

    关注

    7

    文章

    241

    浏览量

    27530
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    语音识别芯片有哪些(语音识别芯片AT680系列)

    在人工智能技术飞速发展的今天,语音识别芯片作为人机交互的重要桥梁,正逐渐成为各类智能设备不可或缺的核心部件。与传统的语音芯片不同,语音识别
    的头像 发表于 11-14 17:11 1023次阅读

    什么是离线语音识别芯片(离线语音识别芯片有哪些优点)

    离线语音识别芯片,是一种集成了语音信号采集、前端处理和本地识别功能的专用集成电路,无须联网也可以进行语音
    的头像 发表于 10-31 15:27 267次阅读

    如何选择合适的语音识别芯片型号

    语音识别芯片(又称语音识别IC)是现代智能设备的核心组件,与传统语音芯片相比,其最大特点是能够主动识别
    的头像 发表于 10-30 16:32 461次阅读

    基于开源鸿蒙的语音识别语音合成应用开发样例

    本期内容由AI Model SIG提供,介绍了在开源鸿蒙中,利用sherpa_onnx开源方库进行ASR语音识别与TTS语音合成应用开发的流程。
    的头像 发表于 08-25 14:26 3579次阅读
    基于开源鸿蒙的<b class='flag-5'>语音</b><b class='flag-5'>识别</b>及<b class='flag-5'>语音</b>合成应用开发样例

    瑞芯微RK3576语音识别算法

    1.语音识别简介语音识别技术,也被称为自动语音识别(AutomaticSpeechRecogni
    的头像 发表于 08-15 15:13 1856次阅读
    瑞芯微RK3576<b class='flag-5'>语音</b><b class='flag-5'>识别</b>算法

    语音识别---大家怎么看呢?

    语音识别是一门交叉学科。近二十年来,语音识别技术取得显著进步,开始从实验室走向市场。人们预计,未来10年内,语音
    发表于 08-09 10:54

    EASY EAl Orin Nano(RK3576) whisper语音识别训练部署教程

    英语语音识别上达到接近人类水平的鲁棒性和准确性。Whisper还可以进行多语言语音识别语音翻译
    的头像 发表于 07-25 15:21 547次阅读
    EASY EAl Orin Nano(RK3576) whisper<b class='flag-5'>语音</b><b class='flag-5'>识别</b>训练部署教程

    EASY EAl Orin Nano(RK3576) whisper语音识别训练部署教程

    Whisper是OpenAI开源的,识别语音识别能力已达到人类水准自动语音识别系统。Whisper作为一个通用的
    的头像 发表于 07-17 14:55 1433次阅读
    EASY EAl Orin Nano(RK3576) whisper<b class='flag-5'>语音</b><b class='flag-5'>识别</b>训练部署教程

    芯知识|语音芯片发码无声解析:上电无声、连发指令才响的大根源及解决之道

    在嵌入式语音方案开发中,广州唯创电子语音芯片(如WT系列)以其高性价比和易用性广受青睐。但当开发者遭遇“上电发码无声”或“必须连发两次指令才有声音”的问题时,往往陷入调试困境。本文将深入剖析这些现象
    的头像 发表于 06-19 09:14 550次阅读
    芯知识|<b class='flag-5'>语音</b>芯片发码<b class='flag-5'>无声</b>解析:上电<b class='flag-5'>无声</b>、连发指令才响的<b class='flag-5'>三</b>大根源及解决之道

    芯知识|语音芯片“无声之谜”:当DACL波形正常,功放开启却无声音时……

    信号“通道冲突”这一关键陷阱。一、无声故障的典型表现与诊断盲点“正常”的表象:工程师用示波器检测语音芯片(如广州唯创电子某型号)的关键引脚:供电电压稳定,逻辑通信正常
    的头像 发表于 06-13 08:53 642次阅读
    芯知识|<b class='flag-5'>语音</b>芯片“<b class='flag-5'>无声</b>之谜”:当DACL波形正常,功放开启却<b class='flag-5'>无声</b>音时……

    明远智睿SSD2351开发板:语音机器人领域的变革力量

    的四核1.4GHz处理器具备强劲的运算性能,能够高效处理语音机器人运行过程中的复杂任务语音识别和合成需要大量的计算资源,该处理器可以快速对
    发表于 05-28 11:36

    厂家芯资讯|WTK6900系列语音识别芯片:精准交互,智创未来

    “芯片性能+算法优化+场景适配”位一体的解决方案,将标准方案识别率提升至97%,为行业树立技术标杆。一、WTK6900系列:破解语音识别难题的核心利器1.高性能
    的头像 发表于 03-19 09:12 991次阅读
    厂家芯资讯|WTK6900系列<b class='flag-5'>语音</b><b class='flag-5'>识别</b>芯片:<b class='flag-5'>精准</b>交互,智创未来

    分钟带你接入OpenAI构建个人语音助手

    上周,我们在用户群发布了基于AtomS3R与AtomicEchoBase接入OpenAI的个人语音助手Demo视频,得到了很多用户的喜欢。为此,我们特别制作了详细的教程和视频,按照步骤操作,你也可以
    的头像 发表于 01-10 18:36 1685次阅读
    <b class='flag-5'>三</b>分钟带你接入OpenAI构建个人<b class='flag-5'>语音</b><b class='flag-5'>助手</b>

    空调语音控制方案NRK3501语音识别芯片-让智能生活触手可及!

    NRK3501语音识别芯片支持离线语音控制空调,精准识别,远场降噪,最多支持200条离线指令,5米内识别
    的头像 发表于 01-07 11:40 1252次阅读
    空调<b class='flag-5'>语音</b>控制方案NRK3501<b class='flag-5'>语音</b><b class='flag-5'>识别</b>芯片-让智能生活触手可及!

    基于语音识别的智能会议系统具备哪些交互功能

    标贝科技专注智能语音交互领域多年,在语音识别语音合成领域有着多项大型企业合作案例,标贝与多个智能会议系统厂商合作,成功将语音
    的头像 发表于 12-20 10:35 895次阅读