0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

离线自然说,无需记固定唤醒词也能语音控制设备!

Carol Li 来源:电子发烧友 作者:李弯弯 2024-04-29 09:12 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

电子发烧友网报道(文/李弯弯)离线语音识别是指不需要依赖网络,在本地设备实现语音识别的过程,通常以端侧AI语音芯片作为载体来进行数据的采集、计算和决策。

离线语音识别技术在诸多领域都具有广泛的应用前景,如用户可以通过语音控制智能家居设备,实现灯光、空调、电视等的自动化操作;在医疗设备领域,离线语音识别技术可以用于控制轮椅、病床等设备,为行动不便的患者提供便利;在车载系统中,离线语音识别技术可以实时识别驾驶者的语音指令,确保驾驶安全。

但是语音芯片的存储空间有限,通过传统的语音算法技术,最多也只能存储数百条词条,导致用户只能使用固定的词条来控制设备,大大降低了用户与设备之间的语音交互体验。

离线自然说,解决当前语音识别痛点

近日,在启英泰伦最新语音方案发布及技术交流会上,该公司技术支持总监孙振奎介绍了启英泰伦推出的一种轻量级NLP技术——离线自然说。

它的实现原理是,通过语义协议和语音识别构图结合,在进行语音识别同时对指令包含的意图和槽位进行解析(NLU),实现设备功能语音指令的理解和泛化。并且支持同时生成控制指令和反馈播报,完成识别、理解、播报的闭环。通过矩阵分解、权重共享等技术,保持低资源提高建模能力,支持说法突破万种。

据孙振奎介绍,离线自然说,可以很好地解决当前语音识别的诸多痛点,如需要联网、不会说、记不住词、反应慢、词条太少、普通话不标准、经常掉线等。离线自然说的价值在于,用户无需记忆固定词条,只需知道功能和唤醒词,即可语音控制设备,真正做到了自然、方便的人机交互。

59733f9a1f0549c1af9b402e7c29b478~tplv-tt-shrink:640:0.image?lk3s=06827d14&traceid=20240429091209D914799B7E0B2D69E2BE&x-expires=2147483647&x-signature=7XZFUiUWMrX4sOJACwtFzmrDWlM%3D

具体来看,用户如果通过传统离线语音交互来打开空调,他只能说:“打开空调”。而如果通过离线自然说来打开空调,他可以说:“打开空调”、“帮我开空调”、“空调打开吧”、“开一下空调”、“我要开空调”、“空调开启”、“启动空调”、“吹空调”……

启英泰伦认为,相对于手机APP/小程序、红外遥控器、触摸按键等传统控制方式而言,自然化的语音交互更便捷、更高效、更人性化。

目前,启英泰伦离线自然说方案,已经在在风扇、吸顶灯、空调、茶吧机、油烟机、空调伴侣、窗帘电机、晾晒机、风扇灯等上完成应用,在风扇、取暖器上的应用已经非常成熟。另外,离线自然说方案在洗衣机、马桶、按摩椅、浴霸、微波炉等上的应用也在开发中。

不断迭代的语音芯片及全链条语音算法技术

启英泰伦是一家集语音芯片、语音算法、应用方案、开发平台于一体的语音解决方案供应商。其芯片产品已历经三次大迭代,四次小迭代,共计推出15款型号的智能语音芯片,涵盖AI语音芯片,AI语音Wi-Fi芯片,AI语音BLE芯片,形成系列化的芯片产品布局。

公司芯片产品现已广泛应用于智慧家居家电、智慧养老、智慧穿戴、智慧医疗、智慧酒店、智慧安防、智慧教育、智慧汽车和机器人等领域,服务客户超过5000家。

从发展历程来看,2016年,启英泰伦首度提出脑神经网络处理器(BNPU),发布全球首款AI语音芯片CI1006;2017年AI语音芯片进入家电巨头美的供应体系,支持英文语音识别;2018年发布1.5代AI语音芯片,性能不变,成本降低30%;2019年发布高性价比2代AI语音芯片(搭载BNPU V2),上线语音AI开发平台;2020年发布2.5代AI语音芯片,成本更低,支持日文等小语种语音识别;

2021年离线NLP算法取得突破,深度人声分离算法取得突破;2022年量产3代AI语音芯片、AI语音Wi-Fi Combo芯片(搭载BNPU V3),算法算力登上新台阶;2023年AIOT方案成熟,推出AI语音BLE芯片Cl231,预推出语音MCU芯片Cl132。

启英泰伦第三代CI13系列是一款极具性价比的离线AI语音芯片,包含CI1301、CI1302、CI1303、CI1306、CI1311、CI1312六款型号,据称其年装机达数千万台。

CI13系列基于启英泰伦自研BNPU 3.0,系统主频最高可达240MHz,内置高达640KByte SRAM,集成PMU电源管理单元和RC振荡器,集成双通道高性能低功耗Audio Codec和多路UART、IIC、IIS、PWM、GPIO、PDM等外围控制接口。芯片仅需少量电阻电容等外围器件就可以实现各类智能语音产品硬件方案,性价比极高。

e98fe0f9a3254f6e9e7fce530e7e9bad~tplv-tt-shrink:640:0.image?lk3s=06827d14&traceid=20240429091209D914799B7E0B2D69E2BE&x-expires=2147483647&x-signature=ApbzjtogJXReJM4ZkHv4zWbIkBY%3D

CI13系列具有强大的自然语言交互能力,70dB噪声下,可以做到85%识别率及90%唤醒率(降噪模式),命令词数支持10001+词条,支持离线自然说。

在语音算法上,启英泰伦拥有完全自主知识产权的语音交互技术链条,包括语音识别、语音增强、深度降噪、回声消除、低功耗唤醒、本地语义理解、声纹识别、本地命令词自学习等语音算法。

此次交流会上,孙振奎还介绍了启英泰伦的多个语音算法。如,声纹识别,基于特定词条的声纹识别,可以通过注册声纹来区分讲话人,从而提供定制化的服务,如场景1:注册成人声纹,防止小孩不当操作导致危险;场景2:不同的人说“打开空调”,自动设置为不同人喜欢的模式,温度,档位等。

男女性别识别,基于声音特征,区分男女性别,进行不同的定制化功能开发,如识别到性别后,进行不同声音的播放;部分产品对性别有要求的,可以进行性别识别并进行个性化展示:例如智能马桶的洗洁方式。

特定声音检测,如鼾声识别:可用于智能床垫,智能枕头;婴儿哭声识别:婴儿监护产品,婴儿摇摇床等。

写在最后

用过语音控制产品的朋友们可能都知道,目前市面上大多数产品都需要精准通过唤醒词控制,然而如果一个设备一段时间没使用,或者其中一些唤醒词长时间没用过,当突然需要使用的时候,会忘记这个词,而无法顺利控制设备。而且对于一些功能较复杂的设备,需要记大量的唤醒词,稍有偏差都可能难以控制。而离线自然说算法技术,则打破了传统离线语音识别的这种局限性,只需要说出大意,设备就能听懂,互动更为高效。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • AI
    AI
    +关注

    关注

    91

    文章

    41326

    浏览量

    302711
  • 智能家居
    +关注

    关注

    1945

    文章

    10045

    浏览量

    197926
  • 语音控制
    +关注

    关注

    5

    文章

    518

    浏览量

    29749
  • nlp
    nlp
    +关注

    关注

    1

    文章

    491

    浏览量

    23346
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    双芯片架构如何实现离线语音+Wi-Fi 6云端AI? Ai-WV02-32S硬件方案解析

    在同一SMD-40封装内分工协作,省掉额外的语音芯片BOM成本。 做AI硬件的工程师,大多遇到过一个设计矛盾: 你要做离线语音唤醒,保证断网
    的头像 发表于 04-27 09:46 87次阅读

    ASR语音识别485模块:语音唤醒设备,赋工业自动化控制

    几个核心领域: 一、工业机器人控制与自动化 语音识别模块正让机器人的操作门槛从“懂代码”变为“听指令”,显著提升效率与灵活性。 无代码操控:操作人员可通过自然语言直接控制机器人,例如下
    的头像 发表于 04-24 15:50 136次阅读

    485AI语音识别模块:多路语音控制,实现安防设备语音联动

    防消防、能源设施、老旧设备改造等。 一、工业自动化(核心场景) - 智慧工厂/产线:语音控制流水线启停、机械臂、传送带调速、机床操作、设备参数查询 - 智慧仓储:
    的头像 发表于 04-22 15:17 150次阅读

    简单认识安信可VC系列离线语音识别模组

    VC系列是安信可基于云知声US516P6芯片推出的离线语音识别模组,支持中英文双语、150条指令、98%识别率、100ms响应。不需联网、不需云端调用、一个模组搞定本地语音
    的头像 发表于 04-14 17:02 1033次阅读

    离线语音芯片哪些品牌好用?如何选择?

    随着智能家居市场的快速发展,语音交互已成为主流控制方式之一。离线语音芯片因其本地处理、即时响应、高隐私性等特点,正成为越来越多智能设备的首选
    的头像 发表于 01-27 15:10 321次阅读

    新品 | Module ASR,AI智能离线语音模块

    新的指令。内置AEC(回声消除),有效去除回声和噪声干扰,提升语音识别准确性。产品出厂时预设了53条英文唤醒和反馈命令,支持通过UART指令或
    的头像 发表于 12-05 18:15 966次阅读
    新品 | Module ASR,AI智能<b class='flag-5'>离线</b><b class='flag-5'>语音</b>模块

    智能语音识别控制器是什么?图形中文编程,多路设备控制

    智能语音识别控制器是一种融合语音识别技术、物联网通信技术与设备控制模块的智能终端设备,核心功能是
    的头像 发表于 12-03 16:35 861次阅读

    AI人工智能语音识别控制模块:自定义命令,全维度落地应用场景

    AI人工智能语音识别控制模块是一种集成了语音识别、自然语言处理和智能控制功能的电子设备或系统。用
    的头像 发表于 12-03 16:34 1183次阅读

    什么是离线语音识别芯片(离线语音识别芯片有哪些优点)

    离线语音识别芯片,是一种集成了语音信号采集、前端处理和本地识别功能的专用集成电路,无须联网可以进行语音
    的头像 发表于 10-31 15:27 704次阅读

    零代码实现茶吧机自定义语音控制定制

    零代码实现茶吧机自定义语音控制定制 前言 茶吧机集成离线语音控制,核心是通过自然
    的头像 发表于 10-17 16:43 1474次阅读
    零代码实现茶吧机自定义<b class='flag-5'>语音</b><b class='flag-5'>控制</b>定制

    零基础在智能硬件上克隆原神可莉实现桌面陪伴(提供人设提示、知识库、固件下载)

    /ab2748af51845e57c9640ca921a1d230e51a78a3)来了解实现步骤。 五、修改唤醒为【可莉可莉】1、使用CSK6大模型开发板接入还可以更改唤醒,通
    发表于 08-22 19:51

    AT6811-超低功耗离线智能语音识别 SoC

    AT6811芯片以0.8mA超低功耗实现离线语音交互,在嘈杂环境中仍保持92%识别率,已赋空调、电动工具、助听器等设备,让万物拥有自然对话
    的头像 发表于 08-07 17:44 1892次阅读

    哪些离线语音芯片适用于家电设备

    ​哪些离线语音芯片适用于家电设备?选择适用于家电设备离线语音芯片时,需综合考量家电的使用环境、
    的头像 发表于 08-06 17:27 1035次阅读
    哪些<b class='flag-5'>离线</b><b class='flag-5'>语音</b>芯片适用于家电<b class='flag-5'>设备</b>

    智芯科超低功耗离线语音唤醒芯片的应用场景

    想让设备无需联网秒速响应语音指令?我们的超低功耗离线语音
    的头像 发表于 07-08 10:24 1568次阅读

    鸿雁电器携手智芯科推出离线双核语音控制单火线开关

    近日,杭州鸿雁电器携手智芯科,基于其领先的双核离线语音识别芯片技术,联合开发出离线双核语音控制单火线开关,为智能家居行业带来了全新变革。该产
    的头像 发表于 06-11 10:23 1126次阅读