0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

Alexa耳语模式——AI技术更显人性化

人工智能 2018-10-09 15:20 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

上周,亚马逊在美国西雅图举行的发布会上一口气推出了十余款Alexa设备,大部分设备主要由Alexa语音平台驱动。其中部分设备将增添“耳语模式”功能,使Alexa设备用耳语来回应用户的低声说话。日前,亚马逊Alexa语音系统小组的一位专家Zeynab Raeesy在其博文中揭秘了这一功能的AI基础。

Raeesy在博文中介绍:“如果你在一个有小孩睡觉的房间,当有人走进来时,你会马上低声说话,提醒进来的人你希望房间内能保持安静,而进来的人意识到这一点之后,很可能也会压低声音讲话。”

Raeesy指出,Alexa的耳语模式令人难以理解的地方在于它是清音的,也就是说,它不涉及声带振动,往往比普通的语音在低频段具有更少的能量。她与小组的同事研究了两种能区分正常语音和耳语音的神经网络

两种神经网络主要在结构上有所区别,一个是MLP(多层感知器),另一个是能进行时间递归的LSTM(长短期记忆)网络,这两者用来做训练的数据是一样的,这些数据包括(1)对数滤波器组能量,或者是用来记录不同频率范围信号能量的语音信号表示;(2)能区别耳语音与正常语音之间信号差异的一组特征。

在测试中,他们发现LSTM的表现结果比MLP更好,具备许多优势。Raeesy解释道,Alexa语音识别引擎的其他组件完全依赖对数滤波器组能量,并给不同的组件提供相同的输入数据,进而使整个系统更加紧凑。

Alexa耳语模式的开发并非一帆风顺,至少在最初阶段是这样的。由于Alexa是通过短时间的沉默(一种被称为“结束指向”的技术)来识别指令的结束或者进行回复,LSTM往往在话语即将结束时降低置信度。为解决这个问题,研究人员将LSTM的输出校准成整个话语的平均值,最终,降低最后1.25秒的语音数据成为维持“耳语模式”性能的关键。

美式英语的耳语模式功能将在今年11月份推出,对耳语模式具体工作原理的介绍将以论文的形式在12月份的IEEE语音技术研讨会上发表。


声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • AI
    AI
    +关注

    关注

    91

    文章

    41073

    浏览量

    302573
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    Vibe Coding AI全栈开发实战

    ”或“直觉编程”,它并非某种具体的编程语言或框架,而是一种融合了AI辅助开发、直觉编程和高效迭代的实战思维方式。在这种模式下,开发者不再需要逐行编写代码,而是通过自然语言描述需求,AI
    发表于 04-15 16:02

    论马斯克的预言:AI使人类边缘

    呈指数级爆炸增长,在这种级别的AI面前,人类的智能总和将显得微不足道,从而导致人类被边缘。 合理性 技术发展趋势角度:从当前技术发展来看,AI
    发表于 03-14 05:27

    还在手动拼接 AI 代码?你的 IDE 早就该升级了

    ,提供了对AI工作流的全面支持,彻底摒弃“AI工具+脚本框架”的繁琐拼接模式,使开发者能够轻松地将AI技术应用于工业控制系统,让嵌入式
    发表于 03-11 10:25

    AI技术时代三种全新工作模式如何实现

    AI技术正在重塑我们的工作。前沿企业以“人类主导、智能体运营”为核心,形成三种AI技术的融合模式:人类+
    的头像 发表于 01-29 15:08 740次阅读

    Robotec.ai与AMD Silo AI的合作实践

    。秉承 Robotec.ai 的使命,AMD Silo AI 正通过 Robotec.ai 的开源 AI 驱动数字孪生仿真工具,助力构建安全、人性化
    的头像 发表于 01-28 16:23 880次阅读

    电子电器气密性检测仪:人性化操作界面,一用就会-岳信仪器

    在电子电器生产制造过程中,气密性检测至关重要,它关乎产品的质量、性能以及使用寿命。而一款操作便捷的电子电器气密性检测仪,能大大提高检测效率和质量。其中,人性化操作界面的电子电器气密性检测仪更是备受
    的头像 发表于 10-13 16:12 644次阅读
    电子电器气密性检测仪:<b class='flag-5'>人性化</b>操作界面,一用就会-岳信仪器

    AI赋能6G与卫星通信:开启智能天网新时代

    技术,更关乎人类如何连接、如何生活、如何创造更美好的未来。 在这个万物互联的时代,AI正在让我们的\"天网\"更加智能、更加可靠、更加人性化。当我们在高速公路上畅享高清视频,或在偏远
    发表于 10-11 16:01

    【「AI芯片:科技探索与AGI愿景」阅读体验】+AI的科学应用

    主要步骤: ①溯因②假说③实验 1、科学推理的类型 ①演绎②归纳 2、自动科学发现框架 AI-笛卡儿-----自动科学发现框架,利用数据和知识来生成和评估候选的科学假说。 4项规则:三、直觉
    发表于 09-17 11:45

    广州唯创电子 WT588F02B-8S 语音芯片:为智能吸尘器注入人性化声音

    在智能家居浪潮席卷全球的当下,吸尘器作为家庭清洁的核心工具,正经历着前所未有的智能升级。广州唯创电子推出的WT588F02B-8S语音芯片,凭借其强大的交互能力,正成为高端吸尘器实现人性化、智能
    的头像 发表于 08-19 08:29 1108次阅读
    广州唯创电子 WT588F02B-8S 语音芯片:为智能吸尘器注入<b class='flag-5'>人性化</b>声音

    达辰威AI酒精测试仪有什么优势

    在交通事故的“隐形杀手”酒驾面前,达辰威(DCW)AI酒精测试仪正以AI技术为核心,重新定义酒精检测的精准性与效率。这不仅是一台设备仪器,更是一场科技与安全的深度融合革命。从3秒极速响应到智能防作弊系统,从多场景覆盖到
    的头像 发表于 08-08 10:22 1453次阅读

    信而泰×DeepSeek:AI推理引擎驱动网络智能诊断迈向 “自愈”时代

    模态的技术特性,DeepSeek正加速推动AI在金融、政务、科研及网络智能等关键领域的深度应用。 信而泰:AI推理引擎赋能网络智能诊断新范式信而泰深度整合DeepSeek-R1大模型
    发表于 07-16 15:29

    芯资讯|广州唯创电子WT588F02B-8S语音芯片:驱动充电桩智能升级,打造人性化充电体验

    随着电动汽车的普及浪潮席卷全球,充电桩作为核心基础设施,其智能人性化水平直接影响用户体验。在这一背景下,广州唯创电子WT588F02B-8S语音芯片凭借其创新的技术特性,正成为提升充电桩交互
    的头像 发表于 07-03 08:41 937次阅读
    芯资讯|广州唯创电子WT588F02B-8S语音芯片:驱动充电桩智能升级,打造<b class='flag-5'>人性化</b>充电体验

    华为无线充电台灯怎么使用的?

    华为无线充电台灯以“一灯双用”的创新设计,融合无线充电技术、智能触控操作与人性化设计,成为科技与美学结合的典范。具备多种照明模式和延时关灯功能,且可以根据需求自动调整明暗与色调。
    的头像 发表于 06-20 08:43 4324次阅读
    华为无线充电台灯怎么使用的?

    成本狂降90%!国产芯片+开源模型如何改写AI玩具规则

    成本实现更人性化的体验。这种技术迭代不仅重塑了玩具的定义,更悄然重构着人与机器的关系图谱。   轻量级模型的出现,本质上是将云端大模型的智慧浓缩至终端设备的过程。以DeepSeek-R1为代表的技术路径,通过知识蒸馏将千亿参数模
    的头像 发表于 05-29 00:52 4086次阅读

    【「零基础开发AI Agent」阅读体验】+ 入门篇学习

    10.AI Agent开发模式走向了零代码可视模式(需要我们程序员对此有着观念上的转变),但是掌握编程技术,有助于
    发表于 05-02 09:26