0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

剑桥语音博士俞凯解读智能语音技术

思必驰 来源:djl 作者:思必驰 2019-08-05 16:02 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

1 智能语音技术发展与siri

智能语音技术发展过程可以理解为两个阶段,第一是输入和输出阶段,即识别与合成,第二是理解和思考阶段,即语义理解、对话系统、人工智能反馈。并且每一个细分领域均为单独研究,例如语音识别、自然语言处理、声纹处理,语义解析等等。

siri 目前最大的优势在于语义单项理解的算法,在一个限定的领域下,siri表现确实很好,但在整个语音领域内,尤其不限定领域和语音识别不稳定的情况下,显得有些后劲不足,这也与目前技术有关。而思必驰与siri不同的地方在与交互的理论,目前思必驰以任务型对话为目标,并专注于此。

2 一体化综合解决技术增强用户体验

目前的智能语音基本是单独模块定义单独的功能,例如语义理解、语音识别模块,彼此之间没有控制与调度,这也是造成目前语音延迟现象的部分原因,而造成延迟另外的原因是语音的处理、理解、交互系统设计方式。

用户最希望的是智能语音界面能像人与人的交流一样,语音能够迅速反馈。但目前,虽然单独语音识别很多单位都能做的很快,但组装成交互系统之后就大都无法做到这一点了。目前思必驰推出的一体化解决方案,针对利于用户体验方面进行优化,达到端到端的用户体验,优化整个控制流程,在识别的基础上同时进行输出,达到一个快速智能反馈的效果。我们是面向终端用户体验去做语音交互优化,而不仅仅提供一个模块而已。

3 人性化交互的智能语音方向

未来的智能语音交互发展方向一定是混合发展模式,将以用户为中心,综合应用全面的语音技术,而不仅仅是单纯的语音识别。第一,智能语音技术会与环境、语境自适应的结合;第二,语音的发展在自然场景下应用会越来越多,例如在高噪声环境中的处理是未来的一个方向;第三,结合上下文的语义理解以及端到端的语音交互解决。目前单独的识别以不能解决所有问题与满足用户需求,将识别、理解、对话的交互控制等融合,提供整套的解决方案才是最终的方向。

人工智能层面的语音技术中,单纯的识别率是以科研指标为中心,而人工智能角度与工程科研指标在某些方面截然不同。而我们一直以用户为中心,面向指标是令人工智能语音真正人性化,在多类环境下准确识别并反馈,以个性化色彩进行交流。语音交互的未来应当是面向用户,人性化的智能交互,而非过去模块化的交互。

俞凯博士背景:拥有剑桥大学语音识别专业的学术背景,也是国内学术界“青年***”里唯一一位来自智能语音技术行业领域的语音专家,曾多次获得美国国家标准局和美国国防部语音识别评测冠军,是国际最早的认知型人机口语对话系统原型的主要实现者,在上海交通大学创建了智能语音实验室。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 人工智能
    +关注

    关注

    1820

    文章

    50314

    浏览量

    266885
  • 智能语音
    +关注

    关注

    11

    文章

    829

    浏览量

    50343
  • 思必驰
    +关注

    关注

    4

    文章

    416

    浏览量

    16047
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    什么是语音芯片?思泽远科技语音芯片的工作原理、主流类型与核心应用

    随着智能家居、物联网和消费电子产业的迅猛发展,“会说话的设备”已融入我们的日常生活——从智能音箱到可语音控制的空调,从会播报体温的测温枪到会语音提示的汽车导航。这些设备之所以能够发出声
    的头像 发表于 04-21 10:11 69次阅读

    国际语音与人工智能领域权威专家博士加入传音控股

    日前,国际语音与人工智能领域权威专家博士加入传音控股,担任首席科学顾问,全面引领传音在语音及相关AI领域的
    的头像 发表于 03-23 10:47 499次阅读

    语音识别IC分类,语音识别芯片的工作原理

    语音识别芯片,也叫语音识别集成电路,是一种集声音存储、播放、录音及语音识别功能于一体的专用芯片。语音识别IC的核心功能在于实现语音识别,即让
    的头像 发表于 01-14 15:22 388次阅读
    <b class='flag-5'>语音</b>识别IC分类,<b class='flag-5'>语音</b>识别芯片的工作原理

    ATH8809 智能语音处理芯片

    智能语音
    深圳市声讯电子有限公司
    发布于 :2025年12月24日 16:58:05

    语音识别芯片有哪些(语音识别芯片AT680系列)

    在人工智能技术飞速发展的今天,语音识别芯片作为人机交互的重要桥梁,正逐渐成为各类智能设备不可或缺的核心部件。与传统的语音芯片不同,语音识别芯
    的头像 发表于 11-14 17:11 1536次阅读

    广州唯创电子常用语音芯片全解析:赋能智能语音交互的多场景应用

    语音芯片作为智能设备实现语音交互的核心部件,已广泛应用于家居、车载、医疗、工业等领域。广州唯创电子凭借多年的技术积累,推出多系列功能各异的语音
    的头像 发表于 08-28 08:41 1026次阅读
    广州唯创电子常用<b class='flag-5'>语音</b>芯片全解析:赋能<b class='flag-5'>智能</b><b class='flag-5'>语音</b>交互的多场景应用

    思必驰荣获国际语音通讯协会会士

    2025年8月18日,由ISCA(国际语音通讯联盟)主办的国际语音领域顶级会议InterSpeech 2025大会在荷兰鹿特丹举行。ISCA是国际上最大的智能语音
    的头像 发表于 08-26 09:47 1125次阅读

    智能语音交互升级,九芯语音识别芯片来助力

    在科技飞速发展的当下,智能语音交互已经深度融入我们的生活,从智能家居的便捷操控,到车载电子的安全驾驶辅助,再到智能玩具的趣味互动,语音识别
    的头像 发表于 08-11 14:08 1161次阅读
    <b class='flag-5'>智能</b><b class='flag-5'>语音</b>交互升级,九芯<b class='flag-5'>语音</b>识别芯片来助力

    普强智能语音技术重新定义车载交互边界

    普强凭借自主研发的智能语音技术,为某国内头部车企提供的语音前处理、唤醒词、ASR、TTS等技术模块,构建覆盖泰语、俄语、韩语、日语等多语种的
    的头像 发表于 07-11 14:00 1301次阅读

    智能语音交互别再瞎选语音芯片了!NRK3502 才是你的最优解!

    在科技飞速发展的当下,智能产品如潮水般涌入我们的生活,从智能家居到智能医疗,从智能玩具到工业控制,语音交互
    的头像 发表于 07-10 07:03 777次阅读
    <b class='flag-5'>智能</b><b class='flag-5'>语音</b>交互别再瞎选<b class='flag-5'>语音</b>芯片了!NRK3502 才是你的最优解!

    蓝牙语音遥控器:智能家居的智慧控制核心

    和低功耗特性,成为理想选择。 蓝牙语音遥控器不仅是智能家居控制的枢纽,更是技术进步的缩影。其便捷的操作、智能语音交互和低功耗设计,为用户
    发表于 06-01 20:24

    明远智睿SSD2351开发板:语音机器人领域的变革力量

    在人工智能快速发展的今天,语音机器人逐渐成为人们生活和工作中的得力助手。明远智睿SSD2351开发板凭借强大性能与丰富功能,为语音机器人的发展注入新动力,成为该领域的变革力量。 SSD2351开发板
    发表于 05-28 11:36

    芯资讯|广州唯创电子WTV系列语音芯片:以技术创新赋能智能语音交互

    在万物互联的智能化时代,语音交互技术已成为人机交互的重要桥梁。广州唯创电子深耕语音芯片领域多年,凭借自主研发的WTV系列语音芯片,持续为
    的头像 发表于 05-21 08:45 827次阅读
    芯资讯|广州唯创电子WTV系列<b class='flag-5'>语音</b>芯片:以<b class='flag-5'>技术</b>创新赋能<b class='flag-5'>智能</b><b class='flag-5'>语音</b>交互

    智能收银语音交互新标杆—WT3000T8语音合成芯片TTS技术应用解析

    一、行业应用背景在零售业态智能化转型的浪潮中,收银设备正经历从功能型向服务型转变的关键阶段。WT3000T8语音合成芯片应运而生,专为满足新零售场景下智能收银终端的语音交互需求而设计。
    的头像 发表于 04-24 08:45 1280次阅读
    <b class='flag-5'>智能</b>收银<b class='flag-5'>语音</b>交互新标杆—WT3000T8<b class='flag-5'>语音</b>合成芯片TTS<b class='flag-5'>技术</b>应用解析