借助 NVIDIA GPU,亚马逊Alexa语义识别模型的识别准确度提高了15%-电子发烧友网

近期，来自于约翰霍普金斯大学（John Hopkins University）和亚马逊（Amazon）的研究人员们发布了一篇论文，介绍他们是如何通过训练一个深度学习系统来帮助亚马逊Alexa语音助手识别并忽略那些并非是对她说的话，从而将其语义识别模型的识别准确度提高了15%。

研究人员在他们的论文中指出，“诸如Amazon Echo和Google Home的这类家用声控设备都面临着一个问题，那就是当周围存在干扰声源的时候，设备如何能够照常地识别指令。”

为了让Alexa更好地识别指令，研究人员训练了一个神经网络，来匹配和识别“唤醒词”（通常是“Alexa”）以及紧随其后的指令，并忽略那些来自于其他人或媒体设备的干扰。

研究人员介绍说：“这项任务的挑战在于需要从含有特定词汇的话语片段中学习使用者的语言习惯。借助于两种不同的神经网络架构，我们最终实现了这一目标。两个神经网络架构都是具有注意机制的序列到序列编码器 - 解码器网络的变体。”

借助于NVIDIA V100 GPU和OpenSeq2Seq工具，用于序列到序列模型的分布式和混合精度训练，使用TensorFlow建立，团队用1,200小时来自于Amazon Echo的实时英文数据训练他们的算法。

通过改进所开发的基线网络，该团队还添加了一个额外的输入端，能够通过优先处理类似于锚字的语音来增强注意机制。研究人员总结说： “在训练期间，注意机制会自动学习唤醒词的哪些声学特征，以便在随后的演讲中寻找。”

该团队还开发了一个mask-based模型，该模型能够更加明确地将输入语音与锚字的声学轮廓相匹配。

最后的测试结果显示：第一种方法的性能更好，达到了15%的改进；第二种模型也达到了13%的改进。

根据研究人员介绍，该算法在训练和推理过程中都采用了NVIDIA GPU。

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

NVIDIA

NVIDIA

+关注

关注
14

文章
4592

浏览量
101706
亚马逊

亚马逊

+关注

关注
8

文章
2480

浏览量
82372

原文标题：借助AI研究，将亚马逊Alexa语义识别准确度提高15%

文章出处：【微信号：NVIDIA-Enterprise，微信公众号：NVIDIA英伟达企业解决方案】欢迎添加关注！文章转载请注明出处。

利用NVIDIA产品技术组合提升用户体验

本案例通过利用NVIDIA TensorRT-LLM加速指令识别深度学习模型，并借助NVIDIA Triton推理服务器在

发表于 01-17 09:30 •366次阅读

ADAS3022怎样能提高ADC的测量准确度呢？

在调试ADAS3022这颗ADC时每次测量会有30+mV的波动，信号源电压波动不到0.1mV，怎样能提高ADC的测量准确度呢？下图为不同次测量的值（信号源1.1V），感觉误差挺大：

发表于 12-04 07:39

新的宽带隙半导体技术提高了功率转换效率

新的宽带隙半导体技术提高了功率转换效率

发表于 11-30 18:00 •247次阅读

新的宽带隙半导体技术<b class='flag-5'>提高了</b>功率转换效率

NVIDIA 为部分大型亚马逊 Titan 基础模型提供训练支持

本文将介绍亚马逊如何使用 NVIDIA NeMo 框架、GPU 以及亚马逊云科技的 EFA 来训练其最大的新一代大语言模型（LLM）。大

发表于 11-29 21:15 •318次阅读

<b class='flag-5'>NVIDIA</b> 为部分大型<b class='flag-5'>亚马逊</b> Titan 基础<b class='flag-5'>模型</b>提供训练支持

亚马逊Alexa部门再次裁员，传统智能语音助手已来到终章

电子发烧友网报道（文/黄山明）近日，美国科技巨头亚马逊宣布，将裁撤Alexa语音助手业务部门数百个岗位，并表示将投入更多资源打造生成式AI功能。从侧面表明亚马逊的智能语音助手正在面临ChatGPT

发表于 11-28 01:22 •1218次阅读

离线语音识别及控制是怎样的技术？

信号转化为文本或语义结果。　与传统的云端语音识别相比，离线语音识别的工作原理是将语音识别技术算法和模型部署在用户的设备上，通过设备内部的处

发表于 11-24 17:41

情感语音识别：技术发展与未来趋势

的技术发展特征提取技术：特征提取是情感语音识别的关键步骤之一。目前，基于深度学习模型的特征提取技术已经取得了显著的进展。这些模型能够自动学习语音中的特征，从而提高了情感

发表于 11-23 14:28 •248次阅读

语音识别芯片在产品应用上的难点列举

语音识别技术已广泛应用于多个领域，但实现依赖于语音识别芯片，其研发和应用面临语音信号复杂性和差异性的挑战，导致识别准确度下降。芯片能耗问题也限制了应用领域的扩张。另外，隐私泄露风险需要

发表于 11-13 11:09 •184次阅读

智慧矿山：AI算法为何能提高未戴安全带识别准确率！

未穿戴安全带识别AI算法是智慧矿山的重要应用之一，可以提高矿山工作人员的安全意识和降低事故发生的概率。为了提高识别准确率，研究人员可以优化数

发表于 10-22 22:01 •239次阅读

基于LPRNet模型的TrainingToolbox车牌识别

这一概念证明利用OpenVINOTM工具包和LPRNet TensorFlow*培训工具箱Intel分发OpenVINOTM工具包预培训示范比例来探索牌照识别方法,以便检测车辆和相应的车辆属性,如颜色、牌照识别和检测,并有足够的准确

发表于 08-04 06:49

MCU人脸识别模型的设计注意事项和最佳实践

·安全地解锁你的智能手机·自动在照片中标记你的朋友这些系统的准确性和可靠性已经取得了很大的进步。这些进步主要归功于神经网络模型的采用和使用。然而，这些精度的提高是以不断增加的计算和电力需求为代价

发表于 08-02 08:58

离线语音识别技术的应用

离线语音识别技术可以在本地进行处理，不需要联网，大大提高了识别速度和安全性。

发表于 05-23 10:02 •706次阅读

在NGC容器中体验中英文混合语音识别方案

PaddleSpeech 模型训练方案定制与业务场景相关的语音识别模型。欢迎广大开发者使用 NVIDIA 与飞桨联合深度适配的 NGC 飞桨容器，在

发表于 05-05 11:00 •553次阅读

形状感知零样本语义分割

由于大规模视觉语言预训练取得了令人瞩目的进展，最近的识别模型可以以惊人的高准确度对任意对象进行零样本和开放式分类。

发表于 04-28 11:26 •529次阅读

搜索历史

借助 NVIDIA GPU,亚马逊Alexa语义识别模型的识别准确度提高了15%

评论

利用NVIDIA产品技术组合提升用户体验

ADAS3022怎样能提高ADC的测量准确度呢？

新的宽带隙半导体技术提高了功率转换效率

NVIDIA 为部分大型亚马逊 Titan 基础模型提供训练支持

亚马逊Alexa部门再次裁员，传统智能语音助手已来到终章

离线语音识别及控制是怎样的技术？

情感语音识别：技术发展与未来趋势

语音识别芯片在产品应用上的难点列举

智慧矿山：AI算法为何能提高未戴安全带识别准确率！

在ADC输入内阻不配情况下提高ADC准确度方法

基于LPRNet模型的TrainingToolbox车牌识别

MCU人脸识别模型的设计注意事项和最佳实践

离线语音识别技术的应用

在NGC容器中体验中英文混合语音识别方案

形状感知零样本语义分割