0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

Alexa耳语模式——AI技术更显人性化

人工智能 2018-10-09 15:20 次阅读

上周,亚马逊在美国西雅图举行的发布会上一口气推出了十余款Alexa设备,大部分设备主要由Alexa语音平台驱动。其中部分设备将增添“耳语模式”功能,使Alexa设备用耳语来回应用户的低声说话。日前,亚马逊Alexa语音系统小组的一位专家Zeynab Raeesy在其博文中揭秘了这一功能的AI基础。

Raeesy在博文中介绍:“如果你在一个有小孩睡觉的房间,当有人走进来时,你会马上低声说话,提醒进来的人你希望房间内能保持安静,而进来的人意识到这一点之后,很可能也会压低声音讲话。”

Raeesy指出,Alexa的耳语模式令人难以理解的地方在于它是清音的,也就是说,它不涉及声带振动,往往比普通的语音在低频段具有更少的能量。她与小组的同事研究了两种能区分正常语音和耳语音的神经网络

两种神经网络主要在结构上有所区别,一个是MLP(多层感知器),另一个是能进行时间递归的LSTM(长短期记忆)网络,这两者用来做训练的数据是一样的,这些数据包括(1)对数滤波器组能量,或者是用来记录不同频率范围信号能量的语音信号表示;(2)能区别耳语音与正常语音之间信号差异的一组特征。

在测试中,他们发现LSTM的表现结果比MLP更好,具备许多优势。Raeesy解释道,Alexa语音识别引擎的其他组件完全依赖对数滤波器组能量,并给不同的组件提供相同的输入数据,进而使整个系统更加紧凑。

Alexa耳语模式的开发并非一帆风顺,至少在最初阶段是这样的。由于Alexa是通过短时间的沉默(一种被称为“结束指向”的技术)来识别指令的结束或者进行回复,LSTM往往在话语即将结束时降低置信度。为解决这个问题,研究人员将LSTM的输出校准成整个话语的平均值,最终,降低最后1.25秒的语音数据成为维持“耳语模式”性能的关键。

美式英语的耳语模式功能将在今年11月份推出,对耳语模式具体工作原理的介绍将以论文的形式在12月份的IEEE语音技术研讨会上发表。


声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • AI
    AI
    +关注

    关注

    87

    文章

    26363

    浏览量

    263955
收藏 人收藏

    评论

    相关推荐

    为昕原理图设计EDA软件(Jupiter)试用

    为昕原理图设计EDA软件(Jupiter)是一款符合中国国情的原理图设计软件,聚焦核心功能,覆盖原理图设计全流程,功能设计更智能,界面操作更人性化,让硬件工程师使用得更愉悦、顺畅。为昕科技旨在通过
    发表于 04-12 14:30

    NanoEdge AI技术原理、应用场景及优势

    NanoEdge AI 是一种基于边缘计算的人工智能技术,旨在将人工智能算法应用于物联网(IoT)设备和传感器。这种技术的核心思想是将数据处理和分析从云端转移到设备本身,从而减少数据传输延迟、降低
    发表于 03-12 08:09

    美格智能在MWC 2024展示5G-A和端侧AI解决方案

    2024年世界移动通信大会(MWC)在西班牙巴塞罗那圆满落幕。本届大会以“未来先行”为主题,聚焦“超越5G”、“智联万物”和“AI人性化”等核心议题,吸引了全球2400多家业界领先企业参展。
    的头像 发表于 03-03 15:37 448次阅读

    高通亮相MWC 2024:AI+连接助力创新与协作,让智能计算无处不在

    2月26日,全球最具影响力的移动通信盛会2024世界移动通信大会(MWC)在巴塞罗那拉开帷幕,以“未来先行”为主题,围绕“超越5G”、“智联万物”、“AI人性化”等话题展开。
    的头像 发表于 02-28 15:57 267次阅读

    The Green Light | 取智于人,用智予人:以人性化的解决方案贯穿集装箱物流

    原文标题:The Green Light | 取智于人,用智予人:以人性化的解决方案贯穿集装箱物流 文章出处:【微信公众号:westwell西井科技】欢迎添加关注!文章转载请注明出处。
    的头像 发表于 12-12 19:45 480次阅读
    The Green Light | 取智于人,用智予人:以<b class='flag-5'>人性化</b>的解决方案贯穿集装箱物流

    亚马逊Alexa部门再次裁员,传统智能语音助手已来到终章

    等生成式AI所带来的强大竞争压力。   引领一个时代的Alexa ,正在走向艰难转型   20世纪50年代的早期,当时美国科学家们开始研究语音识别技术。这种技术经历了多个阶段的发展,从
    的头像 发表于 11-28 01:22 1208次阅读

    亚马逊发布智能家居新功能,高通推出下一代Wi-Fi和光纤技术

    亚马逊在其年度设备和服务活动上公布了一系列令人兴奋的新功能和产品。其中最引人注目的是 Alexa 生成式 AI 功能,这将使用户与 Alexa 的对话更自然及人性化。这些新功能不仅提
    的头像 发表于 09-21 21:50 484次阅读
    亚马逊发布智能家居新功能,高通推出下一代Wi-Fi和光纤<b class='flag-5'>技术</b>

    AI智能呼叫中心

    随着科技的飞速发展,人工智能(AI)已经成为了各行各业的关键技术,其中,AI智能呼叫中心的出现,给传统的呼叫中心带来了巨大的改变与创新,本文将探讨AI智能呼叫中心的优势,包括自动化处理
    发表于 09-20 17:53

    FAQ_MA35D1_Adjust如何调整耳语音量?

    如何调整耳语音量?
    发表于 09-07 08:09

    如何使用Alexa语音服务集成在受约束的物联网设备上设置语音命令

    本指南供硬件和软件架构师学习如何使用Alexa语音服务集成在受约束的物联网设备上设置语音命令。AWS物联网核心的Alexa语音服务集成(AIA)将与Alexa Voice Services集成所需
    发表于 08-02 12:53

    Alexa上与数学狗一起练习

    电子发烧友网站提供《在Alexa上与数学狗一起练习.zip》资料免费下载
    发表于 07-10 11:10 0次下载
    在<b class='flag-5'>Alexa</b>上与数学狗一起练习

    ESP8266 Alexa能发现几台设备?

    大家好,这是我的第一篇文章,所以我将简要介绍一下我是如何来到这里的。 在过去一个月左右的时间里,我对家庭自动和语音控制有了一些了解。虽然我不是完全的计算机文盲,但我对任何类型的编码都没有什么经验
    发表于 06-06 07:42

    WT2003H语音芯片IC方案让洗地机更加智能和人性化支持OTA远程更新

    随着科技的不断发展,洗地机越来越受人们的青睐。而语音芯片的应用也让洗地机更加智能和人性化,洗地机语音芯片IC方案的应用不但可以提供语音提示和操作指导,还可以提供清洁工作中的语音提醒和警报功能,从而
    的头像 发表于 06-02 11:12 238次阅读
    WT2003H语音芯片IC方案让洗地机更加智能和<b class='flag-5'>人性化</b>支持OTA远程更新

    WT2003H语音芯片IC方案让洗地机更加智能和人性化支持OTA远程更新

    随着科技的不断发展,洗地机越来越受人们的青睐。而语音芯片的应用也让洗地机更加智能和人性化,洗地机语音芯片IC方案的应用不但可以提供语音提示和操作指导,还可以提供清洁工作中的语音提醒和警报功能,从而
    发表于 06-02 09:53 91次阅读

    工业5.0时代:重新引入人性化元素

    了重新引入了人性化元素的工业5.0这一全新的概念。工业5.0预示着一个诱人的新世界的到来,到那时机器人和人类将以一度被认为不可能的方式进行合作,从而实现大规模定制等新概念。那么,工业5.0这个概念是如何产生的?它又能否改变未来智能产品的设计和制造方式?
    的头像 发表于 05-08 10:36 935次阅读