0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

语音控制的算法和硬件功率上升

龙献益 来源:uwjfuwer 作者:uwjfuwer 2022-07-15 15:45 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

语音控制和语音界面已经开始无情地渗透到几乎所有的消费边缘设备类别。语音识别算法AI 加速器硬件的进步意味着该技术甚至可以用于智能家居设备(甚至是一些愚蠢的设备)等功率和成本受限的应用程序。

从用户端来看,智能家居设备语音控制背后的驱动力是显而易见的。

PicoVoice 首席执行官 Alireza Kenarsari-Anhari 告诉 EE Times:“易用性和便利性是目前的主要驱动力。” 很容易想象当你想要一杯咖啡时,你可以从办公桌上对着家庭办公室的咖啡机大喊大叫,或者拿着一篮湿衣服向滚筒式烘干机口述订单。

我们假设像这些非便携式的智能设备可以永久访问家庭的 WiFi 连接——那么为什么不在云中进行这种语音处理呢?

在这种情况下,边缘人工智能的趋势主要是由隐私驱动的,Kenarsari-Anhari 说这是消费者的担忧,但对一些企业来说是必须的。可靠性是另一个驱动因素:“如果您的 WiFi 不工作,您的洗衣机停止工作是否有意义?” 他说。

在某些情况下,延迟也很重要;某些应用程序确实需要语音工作负载处理的实时保证,例如游戏。

成本是语音边缘处理的另一个重要驱动因素,因为在云中处理这些语音数据需要花钱。每次使用云 API 时都付费的商业模式不适用于家电和消费电子等成本低且每天可能多次使用的用例。

PicoVoice 的 AI 语音到文本推理引擎被设计为在低于 1 美元的微控制器上独立于云运行,旨在在原本不可行的应用程序中实现语音控制。这可能包括消费类可穿戴设备和可听设备,它们正处于需要基于微控制器的语音解决方案可以实现的功率效率和成本效率的交叉点。Kenarsari-Anhari 说,功率和成本优化的解决方案还可以释放工业、安全和医疗应用的机会。

该公司最近推出了 Shepherd,这是一个用于在微控制器上构建语音应用程序的无代码平台,可与该公司的模型创建软件 PicoVoice Console 配合使用。Shepherd 支持 ST 和 NXP 的流行 Arm Cortex-M 微控制器,并支持正在开发的其他设备。

“我认为语音是一个界面——如果你可以在不编码的情况下构建你的 GUI 或网站,也许使用 WordPress,以类似的方式构建语音界面是下一个合乎逻辑的步骤,”Kenarsari-Anhari 说。“Shepherd 正在授权产品经理和 UX 设计师构建原型并快速迭代,但我们的目标是扩大其目标用户群。如果每个人都可以建立自己的助手会怎样?将其命名为他们想要的名称 - 而不是 Alexa!——并赋予它他们想要的个性。”

虽然开发自然语言处理模型并在没有专业软件的情况下实现它们是完全可能的,但这条路线并不适合所有人。

“当然可以——苹果、亚马逊、谷歌和微软做到了,”他说。“这真的是关于一个企业是否有资源,是否致力于围绕它建立一个组织,是否有能力等待几年。”

未来的趋势

语音正在成为下一代技术用户的首选界面,Syntiant 的首席执行官 Kurt Busch 在去年夏天接受 EE Times 采访时表示。

Busch 描述了他最小的孩子是如何使用智能手机上的语音界面与他的朋友发短信的,他可以阅读,但对于写作和拼写还太小。

“他的哥哥姐姐们发短信,但他这一代人比他们早几年有了手机,”布施说。“随着时间的流逝,对于他这一代和年轻一代来说,他们的默认界面是与它交谈。”

Busch 的观点是,语音将成为“未来的触摸屏”,设备内处理首先在具有键盘或鼠标的设备中提供快速响应的界面,然后在白色家电中提供。

Syntiant 的芯片是专门的 AI 加速器,旨在处理功耗预算低至极低的消费电子设备中的语音 AI 工作负载。迄今为止,这家初创公司已在全球出货超过 1000 万颗芯片,其中大部分已进入手机以实现始终在线的关键字检测。最新的 Syntiant 芯片NDP120可以识别“OK Google”等热词,以低于 280 µW 的功率激活 Google 助手。

在未来,Busch 还看到语音控制能够为每个人实现连接和访问技术。

“我们将声音视为技术的伟大民主化者,”布希说。“世界上有 30 亿人每天靠 2 美元过活。我的假设是那些人没有互联网接入,可能没有通过教育系统。这里的自然界面是[speech]。这就是您如何将技术带入当今未与技术交互的第三个世界。我们看到发展中国家对语音优先应用程序产生了浓厚的兴趣,以获取以前可能无法访问的社会群体,不仅从费用的角度来看,而且从舒适的角度来看。”

市场分割

Knowles 的物联网高级总监 Vikram Shirastava 告诉 EE Times,一个与语音一样快速增长的市场的危险在于,它可能会迅速变得极其分散,而不仅仅是硬件产品线。

“市场变得支离破碎,比如说,使用的是什么语音识别引擎?” 希拉斯塔瓦说。“市场会变得支离破碎,这取决于您是与电视 SoC 集成还是内部是简单的 MCU,例如微波炉。您会根据操作系统或声学环境获得碎片——它只是家吗?是外面的门铃吗?不可能有一种万能的解决方案。你必须找到这些垂直领域的共同点,并尝试相应地解决语音整合问题。”

Knowles 有一个基于 DSP 的语音控制解决方案,它打算为不同的垂直行业推出版本。它的方法是将市场碎片归为具有共同点的市场——例如,家庭控制、电视条形音箱和遥控器可能属于同一组——然后开发针对该组应用进行优化的解决方案。Shirastava 将这种方法称为“比统包低一级”,它提供统包的可扩展性,但增加了一些灵活性。

“我们必须有一些不同的版本来解决这种碎片化的某个方面,以便我们能够覆盖我们想要追求的垂直领域,”他说。

Knowles 最近发布的 AISonic 蓝牙标准解决方案是一款用于蓝牙连接设备(如智能扬声器、智能家居设备、可穿戴设备和车载语音助手)的语音识别开发套件。该套件基于 Knowles 的 IA8201 双核 DSP 芯片,该芯片专为神经网络处理而设计,功耗远低于应用处理器。例如,该芯片可以在 50 mW 以下同时处理用于关键字定位、源分类、波束形成、声学回声消除 (AEC) 和源方向估计的单独 AI 模型。这是通过在 Tensilica DSP 内核上用于音频和 AI 处理的近 400 条自定义指令的指令集扩展实现的,这反过来又允许降低时钟频率以节省功耗。

语音最终会成为大多数消费类电子产品的默认用户界面吗?看起来确实是这样。先进、高效的 AI 语音控制算法、使开发人员能够轻松集成语音的开发环境以及不断增长的能源和成本效益硬件解决方案生态系统的组合已经出现,使这一切成为可能。



审核编辑 黄昊宇

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 算法
    +关注

    关注

    23

    文章

    4761

    浏览量

    97168
  • 功率
    +关注

    关注

    14

    文章

    2115

    浏览量

    74929
  • 语音控制
    +关注

    关注

    5

    文章

    510

    浏览量

    29563
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    安信可小智AI语音模组实测:实现语音控制关灯

    以下作品由安信可社区用户 zzbinfo 制作   这次评测的是安信可科技出品的Ai-WV01-32S的小智AI语音模组。 将从 开箱、配网、语音测试 ,到最终通过 串口指令控制 一个真实的LED灯
    的头像 发表于 11-19 16:09 480次阅读
    安信可小智AI<b class='flag-5'>语音</b>模组实测:实现<b class='flag-5'>语音</b><b class='flag-5'>控制</b>关灯

    什么是离线语音识别芯片(离线语音识别芯片有哪些优点)

    离线语音识别芯片,是一种集成了语音信号采集、前端处理和本地识别功能的专用集成电路,无须联网也可以进行语音控制。它内设先进的数字信号处理模块及人工智能
    的头像 发表于 10-31 15:27 285次阅读

    广州唯创电子WTK6900H-32N语音识别芯片:AI降噪算法助力抽油烟机精准语音控制 | 语音IC厂家

    语音识别领域深厚的技术积累,推出的WTK6900H-32N语音识别芯片结合创新的AI语音降噪算法,成功攻克了这一技术难题,为智能厨房的发展打开了新的局面。一、突
    的头像 发表于 10-30 09:17 182次阅读
    广州唯创电子WTK6900H-32N<b class='flag-5'>语音</b>识别芯片:AI降噪<b class='flag-5'>算法</b>助力抽油烟机精准<b class='flag-5'>语音</b><b class='flag-5'>控制</b> | <b class='flag-5'>语音</b>IC厂家

    复杂的软件算法硬件IP核的实现

    Compiler)将算法编译转化为可综合的 Verilog 文本,进而通过 FPGA 在硬件上实现算法。 1.C to Hardware 技术简介 AltiumDesigner
    发表于 10-30 07:02

    BLDC与PMSM电机控制算法的联系与区别

    降低了硬件成本和传感器故障风险,但存在技术门槛高、位置估算有延迟和误差、动态响应性能不及带传感器FOC等缺点。其控制精度和鲁棒性通常介于六步换相法和有传感器FOC之间。 三、 算法与电机的典型搭配
    发表于 10-27 09:23

    增加语音控制功能关注这几颗芯片轻松搞定

    增加语音控制功能关注这几颗芯片轻松搞定 目前感觉几乎所有的头部或者非头部的产品都在争先恐后的上语音控制功能,产品单价高的上离在线AI对话功能,产品单价低的上离线
    的头像 发表于 08-19 16:46 639次阅读

    瑞芯微RK3576语音识别算法

    字符序列。与说话人识别及说话人确认不同,后者尝试识别或确认发出语音的说话人而非其中所包含的词汇内容。我们的语音算法是基于Whisper是OpenAI设计的。Whis
    的头像 发表于 08-15 15:13 1874次阅读
    瑞芯微RK3576<b class='flag-5'>语音</b>识别<b class='flag-5'>算法</b>

    语音输出模块是什么?自控语音播报

    :接收来自云平台(如单片机/PLC/电脑)的指令,输入可能是:文本数据(例如:"温度过高")、预存语音编码(如MP3/WAV文件的数字信号)、控制指令(触发预置语音片段) 2.语音合成
    的头像 发表于 08-13 15:20 624次阅读

    语音控制模块工作原理

    语音控制芯片或者说模块的应用前景越来越广泛,无论是设计方案还是厂家生产的产品在越来越多越来越频繁的使用语音控制芯片。当然行业内更多的是称呼为语音
    的头像 发表于 06-17 11:49 1008次阅读
    <b class='flag-5'>语音</b><b class='flag-5'>控制</b>模块工作原理

    电机技术资料—BLDC 电机控制算法

    电机时,冰箱和空调压缩机也需要无传感器控制。 死区的插入和补充 许多不同的控制算法都被用以提供对于BLDC电机的控制。典型地, 将功率晶体管
    发表于 04-01 16:43

    SVPWM的原理及法则推导和控制算法详解

    SVPWM 是近年发展的一种比较新颖的控制方法,是由三相功率逆变器的六个功率开关元件组成的特定开关模式产生的脉宽调制波,能够使输出电流波形尽 可能接近于理想的正弦波形。空间电压矢量 PWM 与传统
    发表于 03-14 14:51

    【智能语音交互新标杆】WTK6900HC语音识别芯片:重新定义离线语音控制体验

    在万物智联时代,离线语音控制技术正以革命性姿态重塑智能设备交互方式。WTK6900HC语音识别芯片凭借其突破性的技术创新,为智能清洁设备领域带来三大核心价值升级,助力产品实现"听得清、反应
    的头像 发表于 03-05 09:26 747次阅读
    【智能<b class='flag-5'>语音</b>交互新标杆】WTK6900HC<b class='flag-5'>语音</b>识别芯片:重新定义离线<b class='flag-5'>语音</b><b class='flag-5'>控制</b>体验

    PID控制算法的C语言实现:PID算法原理

    的是,在我所接触的控制算法当中,PID 控制算法又是最简单,最能体现反馈思想的控制算法,可谓经典
    发表于 02-26 15:24

    网络语音控制器的原理与应用

    随着科技的飞速发展,网络语音控制器作为一种新兴的技术产品,已经在各个领域展现出了其巨大的应用潜力和价值。网络语音控制器是一种人机系统中以语言驱动的
    的头像 发表于 02-20 18:16 825次阅读

    网络语音控制器是什么设备

    网络语音控制器,作为一种能够通过语音识别技术接收并执行用户语音指令的智能设备,结合计算机、人工智能、物联网、网络通信、语音处理等技术,使用户
    的头像 发表于 02-19 17:42 821次阅读