0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

恩智浦发布新一代智能语音技术组合的语音识别引擎

NXP客栈 来源:NXP客栈 2024-01-26 09:15 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

恩智浦发布新一代智能语音技术组合的语音识别引擎。本文将探讨开发人员在嵌入式语音控制设计中面临的挑战、恩智浦新的Speech to Intent引擎,以及您如何在应用中使用它。

嵌入式系统中语音命令的挑战

随着亚马逊、谷歌和苹果等公司推出了具有革命性意义的智能扬声器,嵌入式语音控制的设备已经成为了当下的热门趋势,而这种技术其实已经存在了很多年。通过这些智能扬声器,终端用户第一次体验到了语音优先设备的便捷性、实用性和直观性。语音是这些设备的用户界面(UI),也是它们最重要或唯一的交互方式。借助云端的自然语言理解技术,智能扬声器可以让语音优先设备的终端用户用自然语言与智能设备进行沟通,无论是请求、查询还是命令,都可以得到理解和响应。

为了实现自然语言处理,设计人员和终端用户需要面对一些挑战,比如要求有稳定、可靠的网络连接,以及要承受始终在线、始终聆听的设备的高耗电,更别提这种联网设备可能带来的隐私风险了。

针对嵌入式设计中的语音引擎难题,恩智浦推出了其智能语音技术(VIT)产品组合的最新产品VIT Speech to Intent (VIT S2I) 引擎,了解该技术详情,点击这里>>

本地语音控制vs.云语音控制

为了让设备具备语音控制功能,工程师通常有三种选择:本地处理、在云端处理或两者的组合,我们称之为“混合处理”。

通过本地语音控制,终端设备在边缘本地处理所有语音,而无需连接到云端或远程服务器进行二次处理。基于云的处理就是利用云端的计算能力来处理语音音频,然后把云端生成的响应通过网络传回设备。在混合处理的情况下,通常会使用本地唤醒词引擎来唤醒设备(如“Hey NXP”),然后将该唤醒词之后的所有语音命令流式传输到云端或远程服务器进行处理。

本地处理具有低延迟、低功耗和独立于网络等优点,但它通常只支持需要精确措辞的基本关键词和命令。例如,开灯可能需要准确的短语“Hey, NXP(唤醒词),开灯(语音命令)”,并且不能有任何变化。

对于云端处理和混合系统,云服务的使用增加了延迟,但提供了能够运行极其复杂的算法的优势,包括自然语言理解模型。重温刚才说的开灯示例,使用任何词语组合,系统都可以理解所要求操作的环境,例如“这里很黑,请开灯”。

如前所述,基于云的自然语言处理的一个主要缺点是安全和隐私问题。简单地说,这种方式的原理是把语音音频流通过网络传送到远程服务器进行处理,但是这也可能导致系统误启动并把无关的音频流传输到云端。这些音频流可能包括个人对话、凭证或其他敏感信息。

恩智浦VIT S2I引擎介绍

针对嵌入式设计中的语音引擎难题,恩智浦推出了其智能语音技术(VIT)产品组合的最新产品VIT Speech to Intent引擎。S2I引擎是VIT产品组合的高端产品,其中还包括免费的唤醒词引擎 (WWE) 和语音命令引擎 (VCE)。

与依赖远程云服务的系统不同,VIT S2I能够在本地确定自然语言的意图。这一功能要归功于恩智浦针对嵌入式系统设计的神经网络算法和机器学习模型的最新开发成果。因此,要实现“开灯”的目的,可以用很多不同的方式来表达,比如“开灯”、“太暗了”和“你能让光线更亮吗”等。

观看视频,进一步了解基于RW61x上的本地语音控制功能——

这种Speech to Intent功能使用户能够更自然地与嵌入式系统进行交互,同时降低了系统延迟和云连接系统的功耗。此外,消除云服务也有助于提高安全性和隐私,因为所有语音都在设备上本地处理。此外,如果搭配恩智浦唤醒词引擎,可以开发超低功耗设计,只有在听到特定的唤醒词后,才会启动VIT S2I引擎来处理语音命令。

支持VIT S2I的恩智浦器件包括:Arm Cortex-M (i.MX RT跨界MCU和RW61x MCU),以及Cortex A (i.MX 8M Mini、i.MX 8MPlus和i.MX 9x应用处理器)。VIT S2I目前支持英语、普通话和韩语,于2023年底推出。用于创建自定义命令和训练模型的在线开发工具计划将于2024年发布。

052f8c90-bbdf-11ee-8b88-92fbcf53809c.jpg

VIT Speech to Intent框图

VIT S2I为您的下一个设计增加语音功能

物联网领域日新月异,VIT S2I能够适应各种应用场景,无论是家居自动化、可穿戴电子产品,还是汽车远程信息处理和楼宇门禁等,都能发挥其优势。消费者喜欢用自然语言来免手动控制设备的基本功能,消除边缘语音处理的云服务不仅减少了系统延迟,还减少了隐私和安全问题。

对于那些需要使用语音优先用户界面的设备,VIT S2I系统是一个不可或缺的部分,它可以应用在智能恒温器、智能电器、家居自动化、灯光控制、遮阳控制等领域。VIT S2I也适用于可穿戴设备和健身设备,一些用例包括设置提醒、控制蓝牙设备和监测健康状况。

使用恩智浦的VIT产品组合增强您的应用

如果您想要使用恩智浦智能语音技术组合进行开发,欢迎使用我们免费的VIT唤醒词和语音命令引擎,通过MCUXpresso SDK和在线模型工具即可获得。这些引擎可以让您方便地定制唤醒词和基本的语音控制,适用于那些不涉及自然语言理解的快速原型制作和开发周期。

如果您的应用需要更多自然语言理解功能,请联系当地的恩智浦代表,开始使用VIT Speech to Intent。




审核编辑:刘清

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 处理器
    +关注

    关注

    68

    文章

    20329

    浏览量

    254808
  • mcu
    mcu
    +关注

    关注

    147

    文章

    19116

    浏览量

    403521
  • 神经网络
    +关注

    关注

    42

    文章

    4841

    浏览量

    108150
  • 恩智浦
    +关注

    关注

    14

    文章

    6122

    浏览量

    153729
  • 语音识别
    +关注

    关注

    39

    文章

    1820

    浏览量

    116233

原文标题:将意图转化为行动:恩智浦新一代语音识别引擎,开启嵌入式语音控制新时代!

文章出处:【微信号:NXP客栈,微信公众号:NXP客栈】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    语音识别芯片介绍,语音识别芯片工作原理解析

    智能交互不断深入的今天,语音识别芯片正成为众多设备实现语音控制与AI对话的关键部件。语音芯片广义上涵盖
    的头像 发表于 04-01 16:26 201次阅读

    创新模拟前端赋能新一代热量式流量计

    从确保医疗设备的精准给药,到监测环境系统、优化工业流程,精确的流体测量在各行各业都至关重要。NAFE13144 AFE赋能新一代热量式流量计,具备更高的可靠性与性能,适用于多种严苛的应用场景。
    的头像 发表于 03-16 09:47 774次阅读
    <b class='flag-5'>恩</b>智<b class='flag-5'>浦</b>创新模拟前端赋能<b class='flag-5'>新一代</b>热量式流量计

    语音识别IC分类,语音识别芯片的工作原理

    语音识别芯片,也叫语音识别集成电路,是种集声音存储、播放、录音及语音
    的头像 发表于 01-14 15:22 386次阅读
    <b class='flag-5'>语音</b><b class='flag-5'>识别</b>IC分类,<b class='flag-5'>语音</b><b class='flag-5'>识别</b>芯片的工作原理

    语音识别芯片有哪些(语音识别芯片AT680系列)

    在人工智能技术飞速发展的今天,语音识别芯片作为人机交互的重要桥梁,正逐渐成为各类智能设备不可或缺的核心部件。与传统的语音芯片不同,
    的头像 发表于 11-14 17:11 1530次阅读

    广州唯创电子WTK6900H-32N语音识别芯片:智能语音控制赋能LED灯带创新应用 | 语音IC厂家

    芯片,凭借其卓越的性能和精准的识别能力,在LED灯带控制领域展现出强大的应用价值,为智能照明系统带来了革命性的创新突破。、核心技术优势1.1高性能
    的头像 发表于 11-04 08:53 803次阅读
    广州唯创电子WTK6900H-32N<b class='flag-5'>语音</b><b class='flag-5'>识别</b>芯片:<b class='flag-5'>智能</b><b class='flag-5'>语音</b>控制赋能LED灯带创新应用 | <b class='flag-5'>语音</b>IC厂家

    什么是离线语音识别芯片(离线语音识别芯片有哪些优点)

    离线语音识别芯片,是种集成了语音信号采集、前端处理和本地识别功能的专用集成电路,无须联网也可以进行语音
    的头像 发表于 10-31 15:27 665次阅读

    如何选择合适的语音识别芯片型号

    语音识别芯片(又称语音识别IC)是现代智能设备的核心组件,与传统语音芯片相比,其最大特点是能够主
    的头像 发表于 10-30 16:32 732次阅读

    助力亿境虚拟打造新一代AI眼镜解决方案

    半导体宣布,深圳市亿境虚拟现实技术有限公司(简称“亿境虚拟”)在其新一代 AI 眼镜解决方案SW3021中采用
    的头像 发表于 10-16 09:03 4567次阅读

    【内测活动同步开启】这么小?这么强?新一代大模型MCP开发板来啦!

    【内测活动同步开启】这么小?这么强?新一代大模型MCP开发板来啦! 聆思全新一代六合芯片「LS26系列」,搭载WIFI / BLE & BT / NPU,与「小聆AI」强强联合
    发表于 09-25 11:47

    语音识别系统的技术核心:从声音到文字的智能转换

          语音识别技术,也称为自动语音识别(ASR),其核心目标是将人类语音信号转换为对应的文
    的头像 发表于 09-05 14:04 995次阅读

    智能语音交互升级,九芯语音识别芯片来助力

    在科技飞速发展的当下,智能语音交互已经深度融入我们的生活,从智能家居的便捷操控,到车载电子的安全驾驶辅助,再到智能玩具的趣味互动,语音
    的头像 发表于 08-11 14:08 1154次阅读
    <b class='flag-5'>智能</b><b class='flag-5'>语音</b>交互升级,九芯<b class='flag-5'>语音</b><b class='flag-5'>识别</b>芯片来助力

    语音识别---大家怎么看呢?

    语音识别门交叉学科。近二十年来,语音识别技术取得显著进步,开始从实验室走向市场。人们预计,未
    发表于 08-09 10:54

    广和通发布自研端侧语音识别大模型FiboASR

    7月,全球领先的无线通信模组及AI解决方案提供商广和通,发布其自主研发的语音识别大模型FiboASR。该模型专为端侧设备上面临的面对面实时对话及多人会议场景深度优化,在低延迟语音交互、
    的头像 发表于 08-04 11:43 1749次阅读

    广和通发布新一代AI语音智能体FiboVista

    近日,2025火山引擎Force原动力大会正式开幕。广和通发布新一代AI语音智能体FiboVista,并已率先应用于车联网,成为
    的头像 发表于 06-17 09:22 1410次阅读

    明远智睿SSD2351开发板:语音机器人领域的变革力量

    源的开发资料为开发者提供了深入研究和定制语音机器人功能的基础,开发者可以根据不同的应用需求,对语音识别算法、语音合成引擎等进行优化和改进。
    发表于 05-28 11:36