0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

在本地与云端部署语音识别

星星科技指导员 来源:嵌入式计算设计 作者:Todd Mozer 2022-07-09 07:31 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

、熟悉 Siri、Google Now、Cortana、S-Voice 和/或 Echo 的每个人都熟悉过去十年语音识别的进步和改进。这种改进大部分来自基于云的识别器在大数据上部署“深度学习”。

尽管它经常不在聚光灯下,但嵌入式系统的语音识别已经取得了很大进展。事实上,大多数主要的语音引擎都部署了嵌入式和基于云的识别的组合。这在“Hey Siri”、“OK Google”、“Hey Cortana”、“Hi Galaxy”和“Alexa”等命令中最为明显。所有这些基于云的识别系统都使用嵌入的“触发”短语来打开云连接,为语音识别做好准备。

嵌入式触发短语允许一些基于云的方法的改进和实用性。一方面,拥有一个“永远在线”的嵌入式识别器比让你的对话上传到云端让谷歌和其他人以他们想要的任何方式分析要少得多。由于它在设备上,因此在说出触发短语之前不会进行语音录制或传输,并且触发侦听是实时完成的,而不会发送您的语音。

嵌入式唤醒触发器也有实际原因,其中一个主要原因是功耗。仅在云中运行需要大量数据传输和分析,使得电池供电或“绿色”产品不切实际。许多主要的 DSP 公司都为“始终开启”的 DSP 提供解决方案,这些 DSP 以 2 mA 或更低的电流运行 Sensory 的 TrulyHandsfree 唤醒触发选项。使用健全的活动检测方案,平均电池消耗可以低于 1 mA,将其置于电池泄漏领域。

嵌入式语音识别的其他流行用途是在需要对有限命令进行快速准确响应的设备中。我最喜欢的例子之一是三星 Galaxy 智能手机,在相机模式下,用户可以启用语音命令来拍照。这适用于我在 20 英尺远的安静环境或 5 英尺远的嘈杂位置。这是随身携带自拍杆的绝佳替代品,每当我向人们展示此功能时,他们都会很快获得并喜欢它。

嵌入式扬声器验证也被更频繁地部署,并且通常被合并到唤醒触发器中,以降低其他人唤醒您的设备的可能性。对于语音识别和说话人验证,总是需要在错误接受(接受错误的用户)和错误拒绝(拒绝正确的用户)之间进行权衡。首选的唤醒触发设置通常是以偶尔让正确的人进入为代价来保持极低的错误拒绝。在需要更复杂的扬声器验证以确保安全的系统中,可以部署不需要最低要求的更复杂的算法功耗,以增加电流消耗为代价获得更好的精度。

随着消费产品和手机使用更复杂的处理器,我预计更高比例的语音识别使用将转移到嵌入式设备,并且会出现“分层”语音识别方法,从而在设备上进行快速初始分析并做出响应如果设备对成功有很高的信心(自我认知),但如果它不太确定自己的响应或需要基于云的搜索,则将其传递给云端。

审核编辑:郭婷

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 处理器
    +关注

    关注

    68

    文章

    20332

    浏览量

    254916
  • 嵌入式
    +关注

    关注

    5209

    文章

    20655

    浏览量

    336977
  • 深度学习
    +关注

    关注

    73

    文章

    5607

    浏览量

    124625
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    语音识别ic芯片分类工作原理,语音识别芯片分类

    设备执行相应动作。例如,智能娃娃产品中,当用户说出“眨眨眼”,芯片识别指令后便会控制电机让娃娃完成眨眼动作。除了语音识别功能,现代语音
    的头像 发表于 04-24 15:14 70次阅读
    <b class='flag-5'>语音</b><b class='flag-5'>识别</b>ic芯片分类工作原理,<b class='flag-5'>语音</b><b class='flag-5'>识别</b>芯片分类

    简单认识安信可VC系列离线语音识别模组

    VC系列是安信可基于云知声US516P6芯片推出的离线语音识别模组,支持中英文双语、150条指令词、98%识别率、100ms响应。不需联网、不需云端调用、一个模组搞定
    的头像 发表于 04-14 17:02 896次阅读

    语音识别芯片介绍,语音识别芯片工作原理解析

    智能交互不断深入的今天,语音识别芯片正成为众多设备实现语音控制与AI对话的关键部件。语音芯片广义上涵盖
    的头像 发表于 04-01 16:26 209次阅读

    本地部署OpenClaw,只要500元的开发板?

    也成为了新方向,类似树莓派这样的开发板则被爱好者们视为Openclaw本地部署的新载体。   OpenClaw 的性能消耗主要集中模型推理和云端交互、任务调度、外设联动三大环节,不同
    的头像 发表于 03-20 14:56 2180次阅读
    <b class='flag-5'>本地</b><b class='flag-5'>部署</b>OpenClaw,只要500元的开发板?

    爆火的OpenClaw! 告别云端,米尔RK3576本地部署

    PART01概述基于最近爆火的OpenClaw项目,本文将在MYD-LR3576开发板上部署OpenClaw,并接入飞书机器人,实现本地自托管AI助手。1.1.硬件资源部署端:MYD-LR3576
    的头像 发表于 03-06 08:04 1123次阅读
    爆火的OpenClaw! 告别<b class='flag-5'>云端</b>,米尔RK3576<b class='flag-5'>本地</b><b class='flag-5'>部署</b>

    语音识别IC分类,语音识别芯片的工作原理

    语音识别芯片,也叫语音识别集成电路,是一种集声音存储、播放、录音及语音识别功能于一体的专用芯片。
    的头像 发表于 01-14 15:22 390次阅读
    <b class='flag-5'>语音</b><b class='flag-5'>识别</b>IC分类,<b class='flag-5'>语音</b><b class='flag-5'>识别</b>芯片的工作原理

    语音识别芯片有哪些(语音识别芯片AT680系列)

    人工智能技术飞速发展的今天,语音识别芯片作为人机交互的重要桥梁,正逐渐成为各类智能设备不可或缺的核心部件。与传统的语音芯片不同,语音
    的头像 发表于 11-14 17:11 1538次阅读

    工业物联网平台适合私有本地部署还是云端部署

    工业物联网平台的部署方式需根据企业核心需求选择, 私有本地部署适合数据安全要求极高、需深度定制且具备技术实力的企业;云端部署则更适合追求成本
    的头像 发表于 11-12 11:42 525次阅读
    工业物联网平台适合私有<b class='flag-5'>本地</b><b class='flag-5'>部署</b>还是<b class='flag-5'>云端</b><b class='flag-5'>部署</b>?

    什么是离线语音识别芯片(离线语音识别芯片有哪些优点)

    离线语音识别芯片,是一种集成了语音信号采集、前端处理和本地识别功能的专用集成电路,无须联网也可以进行语音
    的头像 发表于 10-31 15:27 673次阅读

    语音识别---大家怎么看呢?

    语音识别是一门交叉学科。近二十年来,语音识别技术取得显著进步,开始从实验室走向市场。人们预计,未来10年内,语音
    发表于 08-09 10:54

    EASY EAl Orin Nano(RK3576) whisper语音识别训练部署教程

    1Whisper简介Whisper是OpenAI开源的,识别语音识别能力已达到人类水准自动语音识别系统。Whisper作为一个通用的
    的头像 发表于 07-25 15:21 992次阅读
    EASY EAl Orin Nano(RK3576) whisper<b class='flag-5'>语音</b><b class='flag-5'>识别</b>训练<b class='flag-5'>部署</b>教程

    能源监测管理平台是本地部署好还是云端部署好?

    能源监测管理平台本地部署云端部署各有优劣,企业需根据自身需求和实际情况来选择。如果企业对数据安全要求极高、网络环境特殊且预算充足,本地
    的头像 发表于 07-22 15:16 656次阅读
    能源监测管理平台是<b class='flag-5'>本地</b>化<b class='flag-5'>部署</b>好还是<b class='flag-5'>云端</b><b class='flag-5'>部署</b>好?

    EASY EAl Orin Nano(RK3576) whisper语音识别训练部署教程

    Whisper是OpenAI开源的,识别语音识别能力已达到人类水准自动语音识别系统。Whisper作为一个通用的
    的头像 发表于 07-17 14:55 1986次阅读
    EASY EAl Orin Nano(RK3576) whisper<b class='flag-5'>语音</b><b class='flag-5'>识别</b>训练<b class='flag-5'>部署</b>教程

    明远智睿SSD2351开发板:语音机器人领域的变革力量

    接口则让语音机器人可以连接到互联网,实时获取最新的信息,增强其智能性和交互能力。 实际应用场景中,以智能客服语音机器人为例。SSD2351开发板可以驱动语音
    发表于 05-28 11:36

    芯资讯|广州唯创电子WTK6900P语音识别芯片:离线语音交互的革新者

    智能设备全面普及的浪潮中,语音交互技术正逐步从“云端依赖”向“本地化高效处理”演进。广州唯创电子推出的WTK6900P语音
    的头像 发表于 05-22 09:22 961次阅读
    芯资讯|广州唯创电子WTK6900P<b class='flag-5'>语音</b><b class='flag-5'>识别</b>芯片:离线<b class='flag-5'>语音</b>交互的革新者