0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

剑桥语音博士俞凯解读智能语音技术

思必驰 来源:djl 作者:思必驰 2019-08-05 16:02 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

1 智能语音技术发展与siri

智能语音技术发展过程可以理解为两个阶段,第一是输入和输出阶段,即识别与合成,第二是理解和思考阶段,即语义理解、对话系统、人工智能反馈。并且每一个细分领域均为单独研究,例如语音识别、自然语言处理、声纹处理,语义解析等等。

siri 目前最大的优势在于语义单项理解的算法,在一个限定的领域下,siri表现确实很好,但在整个语音领域内,尤其不限定领域和语音识别不稳定的情况下,显得有些后劲不足,这也与目前技术有关。而思必驰与siri不同的地方在与交互的理论,目前思必驰以任务型对话为目标,并专注于此。

2 一体化综合解决技术增强用户体验

目前的智能语音基本是单独模块定义单独的功能,例如语义理解、语音识别模块,彼此之间没有控制与调度,这也是造成目前语音延迟现象的部分原因,而造成延迟另外的原因是语音的处理、理解、交互系统设计方式。

用户最希望的是智能语音界面能像人与人的交流一样,语音能够迅速反馈。但目前,虽然单独语音识别很多单位都能做的很快,但组装成交互系统之后就大都无法做到这一点了。目前思必驰推出的一体化解决方案,针对利于用户体验方面进行优化,达到端到端的用户体验,优化整个控制流程,在识别的基础上同时进行输出,达到一个快速智能反馈的效果。我们是面向终端用户体验去做语音交互优化,而不仅仅提供一个模块而已。

3 人性化交互的智能语音方向

未来的智能语音交互发展方向一定是混合发展模式,将以用户为中心,综合应用全面的语音技术,而不仅仅是单纯的语音识别。第一,智能语音技术会与环境、语境自适应的结合;第二,语音的发展在自然场景下应用会越来越多,例如在高噪声环境中的处理是未来的一个方向;第三,结合上下文的语义理解以及端到端的语音交互解决。目前单独的识别以不能解决所有问题与满足用户需求,将识别、理解、对话的交互控制等融合,提供整套的解决方案才是最终的方向。

人工智能层面的语音技术中,单纯的识别率是以科研指标为中心,而人工智能角度与工程科研指标在某些方面截然不同。而我们一直以用户为中心,面向指标是令人工智能语音真正人性化,在多类环境下准确识别并反馈,以个性化色彩进行交流。语音交互的未来应当是面向用户,人性化的智能交互,而非过去模块化的交互。

俞凯博士背景:拥有剑桥大学语音识别专业的学术背景,也是国内学术界“青年***”里唯一一位来自智能语音技术行业领域的语音专家,曾多次获得美国国家标准局和美国国防部语音识别评测冠军,是国际最早的认知型人机口语对话系统原型的主要实现者,在上海交通大学创建了智能语音实验室。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 人工智能
    +关注

    关注

    1813

    文章

    49752

    浏览量

    261639
  • 智能语音
    +关注

    关注

    11

    文章

    822

    浏览量

    50056
  • 思必驰
    +关注

    关注

    4

    文章

    373

    浏览量

    15886
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    思必驰荣获国际语音通讯协会会士

    2025年8月18日,由ISCA(国际语音通讯联盟)主办的国际语音领域顶级会议InterSpeech 2025大会在荷兰鹿特丹举行。ISCA是国际上最大的智能语音
    的头像 发表于 08-26 09:47 720次阅读

    普强智能语音技术重新定义车载交互边界

    普强凭借自主研发的智能语音技术,为某国内头部车企提供的语音前处理、唤醒词、ASR、TTS等技术模块,构建覆盖泰语、俄语、韩语、日语等多语种的
    的头像 发表于 07-11 14:00 985次阅读

    蓝牙语音遥控器:智能家居的智慧控制核心

    和低功耗特性,成为理想选择。 蓝牙语音遥控器不仅是智能家居控制的枢纽,更是技术进步的缩影。其便捷的操作、智能语音交互和低功耗设计,为用户
    发表于 06-01 20:24

    明远智睿SSD2351开发板:语音机器人领域的变革力量

    在人工智能快速发展的今天,语音机器人逐渐成为人们生活和工作中的得力助手。明远智睿SSD2351开发板凭借强大性能与丰富功能,为语音机器人的发展注入新动力,成为该领域的变革力量。 SSD2351开发板
    发表于 05-28 11:36

    芯资讯|广州唯创电子WTV系列语音芯片:以技术创新赋能智能语音交互

    在万物互联的智能化时代,语音交互技术已成为人机交互的重要桥梁。广州唯创电子深耕语音芯片领域多年,凭借自主研发的WTV系列语音芯片,持续为
    的头像 发表于 05-21 08:45 552次阅读
    芯资讯|广州唯创电子WTV系列<b class='flag-5'>语音</b>芯片:以<b class='flag-5'>技术</b>创新赋能<b class='flag-5'>智能</b><b class='flag-5'>语音</b>交互

    智能收银语音交互新标杆—WT3000T8语音合成芯片TTS技术应用解析

    一、行业应用背景在零售业态智能化转型的浪潮中,收银设备正经历从功能型向服务型转变的关键阶段。WT3000T8语音合成芯片应运而生,专为满足新零售场景下智能收银终端的语音交互需求而设计。
    的头像 发表于 04-24 08:45 633次阅读
    <b class='flag-5'>智能</b>收银<b class='flag-5'>语音</b>交互新标杆—WT3000T8<b class='flag-5'>语音</b>合成芯片TTS<b class='flag-5'>技术</b>应用解析

    智能语音交互方案在客服领域的应用

    着客服行业的面貌,为企业和用户带来了全新的体验。 语音识别模型优化私部署 方案:精准高效,定制专属服务 语音识别技术作为智能语音交互的基础,
    的头像 发表于 04-11 14:35 631次阅读

    语音识别技术在通信领域中的应用实例

    语音识别技术也被称为自动语音识别(Automatic Speech Recognition,ASR),是通过计算机对语音信号进行分析和识别,将人类的
    的头像 发表于 02-21 17:12 1075次阅读

    详解语音识别技术在通信领域中的应用

    语音识别技术也被称为自动语音识别(Automatic Speech Recognition,ASR),是通过计算机对语音信号进行分析和识别,将人类的
    的头像 发表于 02-21 17:05 1034次阅读
    详解<b class='flag-5'>语音</b>识别<b class='flag-5'>技术</b>在通信领域中的应用

    HarmonyOS NEXT 应用开发练习:AI智能语音播报

    一、DEMO思路 在这个HarmonyOS NEXT原生应用DEMO中,我们将使用ArkTS开发语言创建一个简单的AI智能语音播报应用。 该应用能够接收用户输入的文本,并使用TTS
    发表于 01-06 15:33

    【「嵌入式系统设计与实现」阅读体验】+ 基于语音识别的智能杯垫

    语音命令Q 识别,适用于智能家居控制、玩具、人机交互等多个领域。该模块以其高识别率、低功耗和易于集成的特点受到广大开发者的青睐。 主要技术及功能有: 磁力搅拌、重量采集、语音识别、
    发表于 01-02 18:15

    解锁个性化语音交互新时代:九芯智能语音云平台,让创意声音触手可及!

    九芯智能语音云平台提供全面高效安全的智能语音服务,支持自定义语音内容,简化烧录流程,依托AI技术
    的头像 发表于 01-02 16:51 1448次阅读
    解锁个性化<b class='flag-5'>语音</b>交互新时代:九芯<b class='flag-5'>智能</b><b class='flag-5'>语音</b>云平台,让创意声音触手可及!

    离线语音识别技术引领智能语音灯具市场——NRK3502

    智能语音灯具集高科技与人性化设计,内置NRK3502离线语音识别芯片,支持远场识别与自定义指令,提供便捷智能体验,推动智能家居行业发展。
    的头像 发表于 12-30 15:04 1222次阅读
    离线<b class='flag-5'>语音</b>识别<b class='flag-5'>技术</b>引领<b class='flag-5'>智能</b><b class='flag-5'>语音</b>灯具市场——NRK3502

    基于语音识别的智能会议系统具备哪些交互功能

    标贝科技专注智能语音交互领域多年,在语音识别和语音合成领域有着多项大型企业合作案例,标贝与多个智能会议系统厂商合作,成功将
    的头像 发表于 12-20 10:35 901次阅读

    标贝智能语音识别在智能会议场景中的落地案例

    标贝科技专注智能语音交互领域多年,在语音识别和语音合成领域有着多项大型企业合作案例,标贝与多个智能会议系统厂商合作,成功将
    的头像 发表于 12-20 10:31 1032次阅读
    标贝<b class='flag-5'>智能</b><b class='flag-5'>语音</b>识别在<b class='flag-5'>智能</b>会议场景中的落地案例