0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

Alexa耳语模式——AI技术更显人性化

人工智能 2018-10-09 15:20 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

上周,亚马逊在美国西雅图举行的发布会上一口气推出了十余款Alexa设备,大部分设备主要由Alexa语音平台驱动。其中部分设备将增添“耳语模式”功能,使Alexa设备用耳语来回应用户的低声说话。日前,亚马逊Alexa语音系统小组的一位专家Zeynab Raeesy在其博文中揭秘了这一功能的AI基础。

Raeesy在博文中介绍:“如果你在一个有小孩睡觉的房间,当有人走进来时,你会马上低声说话,提醒进来的人你希望房间内能保持安静,而进来的人意识到这一点之后,很可能也会压低声音讲话。”

Raeesy指出,Alexa的耳语模式令人难以理解的地方在于它是清音的,也就是说,它不涉及声带振动,往往比普通的语音在低频段具有更少的能量。她与小组的同事研究了两种能区分正常语音和耳语音的神经网络

两种神经网络主要在结构上有所区别,一个是MLP(多层感知器),另一个是能进行时间递归的LSTM(长短期记忆)网络,这两者用来做训练的数据是一样的,这些数据包括(1)对数滤波器组能量,或者是用来记录不同频率范围信号能量的语音信号表示;(2)能区别耳语音与正常语音之间信号差异的一组特征。

在测试中,他们发现LSTM的表现结果比MLP更好,具备许多优势。Raeesy解释道,Alexa语音识别引擎的其他组件完全依赖对数滤波器组能量,并给不同的组件提供相同的输入数据,进而使整个系统更加紧凑。

Alexa耳语模式的开发并非一帆风顺,至少在最初阶段是这样的。由于Alexa是通过短时间的沉默(一种被称为“结束指向”的技术)来识别指令的结束或者进行回复,LSTM往往在话语即将结束时降低置信度。为解决这个问题,研究人员将LSTM的输出校准成整个话语的平均值,最终,降低最后1.25秒的语音数据成为维持“耳语模式”性能的关键。

美式英语的耳语模式功能将在今年11月份推出,对耳语模式具体工作原理的介绍将以论文的形式在12月份的IEEE语音技术研讨会上发表。


声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • AI
    AI
    +关注

    关注

    89

    文章

    38111

    浏览量

    296656
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    电子电器气密性检测仪:人性化操作界面,一用就会-岳信仪器

    在电子电器生产制造过程中,气密性检测至关重要,它关乎产品的质量、性能以及使用寿命。而一款操作便捷的电子电器气密性检测仪,能大大提高检测效率和质量。其中,人性化操作界面的电子电器气密性检测仪更是备受
    的头像 发表于 10-13 16:12 397次阅读
    电子电器气密性检测仪:<b class='flag-5'>人性化</b>操作界面,一用就会-岳信仪器

    AI赋能6G与卫星通信:开启智能天网新时代

    技术,更关乎人类如何连接、如何生活、如何创造更美好的未来。 在这个万物互联的时代,AI正在让我们的\"天网\"更加智能、更加可靠、更加人性化。当我们在高速公路上畅享高清视频,或在偏远
    发表于 10-11 16:01

    【「AI芯片:科技探索与AGI愿景」阅读体验】+AI的科学应用

    主要步骤: ①溯因②假说③实验 1、科学推理的类型 ①演绎②归纳 2、自动科学发现框架 AI-笛卡儿-----自动科学发现框架,利用数据和知识来生成和评估候选的科学假说。 4项规则:三、直觉
    发表于 09-17 11:45

    广州唯创电子 WT588F02B-8S 语音芯片:为智能吸尘器注入人性化声音

    在智能家居浪潮席卷全球的当下,吸尘器作为家庭清洁的核心工具,正经历着前所未有的智能升级。广州唯创电子推出的WT588F02B-8S语音芯片,凭借其强大的交互能力,正成为高端吸尘器实现人性化、智能
    的头像 发表于 08-19 08:29 566次阅读
    广州唯创电子 WT588F02B-8S 语音芯片:为智能吸尘器注入<b class='flag-5'>人性化</b>声音

    达辰威AI酒精测试仪有什么优势

    在交通事故的“隐形杀手”酒驾面前,达辰威(DCW)AI酒精测试仪正以AI技术为核心,重新定义酒精检测的精准性与效率。这不仅是一台设备仪器,更是一场科技与安全的深度融合革命。从3秒极速响应到智能防作弊系统,从多场景覆盖到
    的头像 发表于 08-08 10:22 1003次阅读

    信而泰×DeepSeek:AI推理引擎驱动网络智能诊断迈向 “自愈”时代

    模态的技术特性,DeepSeek正加速推动AI在金融、政务、科研及网络智能等关键领域的深度应用。 信而泰:AI推理引擎赋能网络智能诊断新范式信而泰深度整合DeepSeek-R1大模型
    发表于 07-16 15:29

    芯资讯|广州唯创电子WT588F02B-8S语音芯片:驱动充电桩智能升级,打造人性化充电体验

    随着电动汽车的普及浪潮席卷全球,充电桩作为核心基础设施,其智能人性化水平直接影响用户体验。在这一背景下,广州唯创电子WT588F02B-8S语音芯片凭借其创新的技术特性,正成为提升充电桩交互
    的头像 发表于 07-03 08:41 684次阅读
    芯资讯|广州唯创电子WT588F02B-8S语音芯片:驱动充电桩智能升级,打造<b class='flag-5'>人性化</b>充电体验

    华为无线充电台灯怎么使用的?

    华为无线充电台灯以“一灯双用”的创新设计,融合无线充电技术、智能触控操作与人性化设计,成为科技与美学结合的典范。具备多种照明模式和延时关灯功能,且可以根据需求自动调整明暗与色调。
    的头像 发表于 06-20 08:43 2567次阅读
    华为无线充电台灯怎么使用的?

    成本狂降90%!国产芯片+开源模型如何改写AI玩具规则

    成本实现更人性化的体验。这种技术迭代不仅重塑了玩具的定义,更悄然重构着人与机器的关系图谱。   轻量级模型的出现,本质上是将云端大模型的智慧浓缩至终端设备的过程。以DeepSeek-R1为代表的技术路径,通过知识蒸馏将千亿参数模
    的头像 发表于 05-29 00:52 3631次阅读

    【「零基础开发AI Agent」阅读体验】+ 入门篇学习

    10.AI Agent开发模式走向了零代码可视模式(需要我们程序员对此有着观念上的转变),但是掌握编程技术,有助于
    发表于 05-02 09:26

    移远通信智能模组全面接入多模态AI大模型,重塑智能交互新体验

    全系智能模组产品已全面接入火山引擎豆包VLM(视觉语言)多模态AI大模型。这一突破性进展表明,搭载移远任意智能模组的终端设备,均可无缝融合多模态AI大模型的强大功能,为用户带来更智能、便捷、人性化的产品体验。       一键接
    发表于 03-21 14:12 426次阅读
    移远通信智能模组全面接入多模态<b class='flag-5'>AI</b>大模型,重塑智能交互新体验

    三星Galaxy S25系列:AI天团赋能,重塑旗舰新标杆

    为“智能伙伴”。与此同时,三星特别成立“三星AI天团”,邀请演员金晨担任团长兼AI颜值官,李川担任AI智慧管,孙越担任AI掌事管,哈瑞担任翻译官,进一步强化
    的头像 发表于 03-06 11:40 1354次阅读

    亚马逊升级版Alexa推迟发布

    据悉,亚马逊计划在2月26日举办的一场活动中,首次展示其基于人工智能技术的全新升级版Alexa。然而,令人意外的是,这款备受期待的升级版Alexa预计至少要到3月31日或更晚才会正式与消费者见面
    的头像 发表于 02-17 14:02 952次阅读

    AI技术与PLC编程融合

    如何将AI技术融入PLC编程软件
    发表于 02-14 15:55

    企业AI算力租赁模式的好处

    构建和维护一个高效、可扩展的AI算力基础设施,不仅需要巨额的初期投资,还涉及复杂的运维管理和持续的技术升级。而AI算力租赁模式为企业提供了一种灵活、高效且成本可控的解决方案。下面,
    的头像 发表于 12-24 10:49 1658次阅读