0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

重庆大学:研究用于语音识别和交互的机器学习辅助可穿戴传感系统

传感器专家网 2025-03-14 14:59 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

背景介绍

人体会产生丰富的生物信号,这些信号可以被人体检测、数字化、分析并与外界设备交互。其中,人类的语音尤其具有丰富的时域、频域和幅度信息传输能力。这种丰富的信息承载能力使声音成为生物通信、人机交互(HMI)和物联网IoT)应用(包括智能家居、远程控制、身份识别和语音系统)的重要组成部分。然而,基于空气振动的语音通信容易受到背景噪声(如路边、商场、车站等嘈杂环境)和声学介质(如火灾、医院、水下等特殊场景)的干扰和阻碍。此外,发声过程依赖于器官的协调系统,任何因肌萎缩侧索硬化症(ALS)、中风、帕金森病或喉癌等疾病引起的损伤都会严重影响语音清晰度和识别效率。为了应对这些挑战,研究人员开发了先进的降噪算法和多麦克风系统来增强语音处理能力。然而,这些解决方案的有效性受到声音信号质量和多特征参数复杂性的限制。例如,单麦克风系统无法捕捉空间特征,难以提供高信噪比的音频信号。虽然多麦克风系统和相关算法可以改善语音信号处理,但它们需要复杂的工程设计并占用更多空间。

最近,基于面部和嘴唇运动的视觉语音识别已成为一种在嘈杂环境中增强语音感知的方法。虽然这种方法可以在具有挑战性的声学条件下提高语音感知质量,但它需要额外的摄像头,这增加了系统的复杂性并降低了实用性。近年来,直接监测面部运动状态的可连接传感器作为无声语音识别的解决方案引起了人们的关注。虽然面部特征可以在一定程度上补充音频信号,但它们在捕捉音高、音色和声音强度等声学参数方面存在很大的局限性。相反,将传感器直接放置在发声器官区域是一种实现全面声音信息收集的有效方法。用于监测声音信号的传统可穿戴设备通常使用绑带或粘性贴片附着在身体上。然而,它们的刚性和扁平形状限制了实际应用。柔性材料和传感技术的发展为隐形皮肤可穿戴设备铺平了道路。目前,安装在发声器官中的柔性传感技术主要包括石墨烯、柔性表面肌电图电极、压阻和摩擦电。与传统的刚性麦克风相比,这些技术佩戴更舒适,可以无缝融入日常活动中。尽管这些传感器有诸多优势,但它们通常依赖于有线硬件,限制了它们在日常使用中的适应性。

为了克服这些挑战,集成信号处理和传输单元的柔性可穿戴设备对于充分利用各种机电特性的潜力至关重要。微机电系统 (MEMS) 制造技术的进步为改善可穿戴设备的集成带来了希望。一项值得注意的创新是将商用 MEMS 加速度计芯片整合到可穿戴设备中,从而能够连续监测机械声音信号,例如语音、吞咽、呼吸和心脏运动。然而,目前的传感器无法满足宽频带范围和平坦度的要求,限制了信号频谱的能量分布。此外,检测皮肤加速度只能提供肌肉运动模式数据,而忽略了发声器官的关键振动信息。由于缺乏生物特征信息,在监测小幅度肌肉运动时,机械声音信号相对较弱。这种限制对于皮肤组织较厚(例如甲状腺肿大)或喉部受伤的用户尤其不友好。因此,有必要开发一种新的便携式语音交互系统来解决这些问题并提高用户体验和HMI。

本文亮点

1. 本工作提出了一种可穿戴无线柔性贴肤声学传感器(SAAS),能够捕捉发声器官的振动和皮肤运动,从而实现恶劣声学环境下的语音识别和人机交互(HMI)。

2. 该系统采用压电微机械超声换能器(PMUT),具有高灵敏度(-198 dB)、宽带宽(10 Hz-20 kHz)和优异的平坦度(±0.5 dB)等特点。柔性封装提高了佩戴时的舒适性和适应性,同时与残差网络(ResNet)架构的集成显著提高了喉部语音特征的分类,准确率超过 96%。

3. 在多个 HMI 场景中展示了 SAAS 的数据收集和智能分类能力。语音识别系统能够通过深度学习模型以 99.8% 的准确率识别参与者所说的日常句子。

图文解析

wKgZPGfSu-SAWa47ABLWJVRB1_s612.png

图1. 用于恶劣声学环境下语音识别的无线、柔性、可附着式声学传感器。

a 实现HMI的语音识别系统示意图。b 可附着式声学传感系统爆炸图。c PMUT结构示意图。d 处理发声器官振动和肌肉运动信号的步骤流程图,包括信号处理、控制、无线通信和显示终端。e SAAS在语音识别与交互中的应用示意图。

wKgZPGfSu-WARauxAAuLGS6ykyc681.png

图2. 装置设计原理及特性描述。

a 基于SOI晶片的声学传感器三维结构剖面图。b PZT、AlN、ScAlN及对应三种形状的声学传感器相关参数的有限元仿真对比。c PMUT正面(I)和背面(II)的照片。d 制备的声学芯片的光学显微镜图像和微元件的特写细节。e 制备的声学芯片的Mo/ScAlN/Mo薄膜结构的SEM剖面图。f 空气中MEMS芯片的电阻抗幅值与相位的谐振频率响应。g 水中封装后的MEMS传感器在低频宽带范围内的灵敏度测试曲线。h 柔性器件在未变形(I)、扭曲(II)、弯曲(III)和拉伸(IV)下的图像显示。

wKgZPGfSu-WACEl5ABBU5EYCH4Y496.png

图3. 恶劣声学环境下的语音检测对比实验。

a 安静环境(I)、嘈杂环境(II)和戴口罩(III)下同一项对比测试的照片。b 当受试者在安静环境(I)、嘈杂环境(II)和戴口罩(III)下说“CQU”时,SAAS显示声音信号的时域波形和频谱信息。c 当受试者在安静环境(I)、嘈杂环境(II)和戴口罩(III)下说“CQU”时,商用参考麦克风显示声音信号的时域波形和频谱信息。d 受试者在9种喉部附着位置和动作下的照片。e 通过 SAAS 在 9 个喉咙附着位置和动作中说“完美”时获得的时域波形。

wKgZPGfSu-WAJ8vgAAlAGkSij_k494.png

图4. 基于SAAS的身份识别演示。

a–c音素、声调、同音词分类任务的混淆矩阵。d通过数据采集、深度学习和实时显示实现的身份识别系统示意图。e不同参与者说“hello world”时的声音信息。f身份识别的混淆矩阵。

wKgZPGfSu-aAIWdTAA7IXHVlAYs643.png

图5. 使用SAAS控制虚拟游戏和机器狗。

a实时无线HMI控制系统示意图。b吃豆人游戏中语音指令上下左右命令演示。c远程无线控制机器狗通过语音命令执行动作:“站起来”、“跳舞”、“侧翻”、“爬楼梯”。

wKgZPGfSu-aAbuxFAAnSMkFICqY403.png

图6. 基于SAAS的语音识别系统在人机交互中的应用。

a通过数据处理、分类和实时显示实现的交互系统示意图。b 使用卷积神经网络从参与者的日常对话中收集到的 10 个句子样本的波形和相应的频谱图。c 句子识别任务的混淆矩阵。d 60 个 epoch 迭代过程中训练和测试数据的归一化准确率。e 经过 60 次 T-SNE 算法迭代处理后的特征向量矩阵。f 经过 60 次 T-SNE 算法迭代处理后的特征向量矩阵。

来源:柔性传感及器件

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 人机交互
    +关注

    关注

    12

    文章

    1275

    浏览量

    57641
  • 语音识别
    +关注

    关注

    39

    文章

    1803

    浏览量

    115569
  • 机器学习
    +关注

    关注

    66

    文章

    8541

    浏览量

    136236
  • 可穿戴传感器

    关注

    2

    文章

    101

    浏览量

    13057
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    香港理工大学、南方科技大学:新型压阻式石墨烯/CNC声学传感器,用于语音识别

      可穿戴声学传感器通过校准喉部振动并将其转化为合成语音,为语言障碍者提供了有效的沟通解决方案。本文,香港理工大学Zhongqing SU、南方科技
    的头像 发表于 11-27 18:28 54次阅读
    香港理工<b class='flag-5'>大学</b>、南方科技<b class='flag-5'>大学</b>:新型压阻式石墨烯/CNC声学<b class='flag-5'>传感</b>器,<b class='flag-5'>用于</b><b class='flag-5'>语音</b><b class='flag-5'>识别</b>

    全北国立大学:研究可穿戴汗液传感贴片,用于无创连续健康监测

    全北国立大学Suraj Shinde 团队系统地探讨了用于个性化医疗保健监测的可穿戴汗液感应贴片 (WSP) 的最新进展,为将 WSP 集成到灵活的人机界面、个性化医疗保健解决方案和闭
    的头像 发表于 11-24 16:18 911次阅读
    全北国立<b class='flag-5'>大学</b>:<b class='flag-5'>研究</b><b class='flag-5'>可穿戴</b>汗液<b class='flag-5'>传感</b>贴片,<b class='flag-5'>用于</b>无创连续健康监测

    中科院/重庆大学:仿生“电子皮肤”获突破!梯度模量设计让传感器实现“宽压域、高灵敏、抗漂移”

    应用。尽管已有研究通过微结构或梯度设计提升性能,但多数仍面临制备复杂、界面不稳定或反应不均等挑战。 文章简介     近日, 中国科学院重庆绿色智能技术研究院 、 重庆大学 等机构的
    的头像 发表于 11-24 14:45 852次阅读
    中科院/<b class='flag-5'>重庆大学</b>:仿生“电子皮肤”获突破!梯度模量设计让<b class='flag-5'>传感</b>器实现“宽压域、高灵敏、抗漂移”

    华中科技大学研究面向水陆两栖人体运动识别的柔性多维肌肉形变磁传感阵列

    准确的人体运动识别对于控制可穿戴机器人及虚拟/增强现实等人机交互系统至关重要,而捕获人体运动特征的可穿戴
    的头像 发表于 11-24 11:39 451次阅读
    华中科技<b class='flag-5'>大学</b>:<b class='flag-5'>研究</b>面向水陆两栖人体运动<b class='flag-5'>识别</b>的柔性多维肌肉形变磁<b class='flag-5'>传感</b>阵列

    北京航空航天大学:基于二维材料的可穿戴生物设备—从柔性传感器到智能集成系统

    ,可高效集成于柔性传感系统中。随着具有独特性能的二维材料的迅速发展,可穿戴传感器在智能交互和集成功能方面展现出了新的应用前景。本综述整合了最
    的头像 发表于 11-04 17:07 3554次阅读
    北京航空航天<b class='flag-5'>大学</b>:基于二维材料的<b class='flag-5'>可穿戴</b>生物设备—从柔性<b class='flag-5'>传感</b>器到智能集成<b class='flag-5'>系统</b>

    语音机器交互系统:核心技术与应用挑战

          语音机器交互系统是融合多学科技术的复杂工程,其核心目标是实现人与机器间的自然、流畅语音
    的头像 发表于 09-02 11:08 559次阅读

    深圳大学:构建“喉部地图”法,柔性超灵敏碳阵列传感器,用于语音识别

    with deep learning”的论文,研究提出一种“喉部地图”,利用柔性碳阵列传感器和基于深度学习的信号处理方法,以确定高精度语音识别
    的头像 发表于 08-23 17:16 571次阅读
    深圳<b class='flag-5'>大学</b>:构建“喉部地图”法,柔性超灵敏碳阵列<b class='flag-5'>传感</b>器,<b class='flag-5'>用于</b><b class='flag-5'>语音</b><b class='flag-5'>识别</b>

    西南大学,西华大学,河北工业大学重庆大学:基于双介质层的离子压力传感器耦合超高灵敏度和宽范围检

    人工智能的加速发展推动了对柔性可穿戴传感器的需求,特别是在柔性机器人、医疗健康监测和人机交互等应用中。柔性可穿戴压力
    的头像 发表于 07-24 18:20 2858次阅读
    西南<b class='flag-5'>大学</b>,西华<b class='flag-5'>大学</b>,河北工业<b class='flag-5'>大学</b>,<b class='flag-5'>重庆大学</b>:基于双介质层的离子压力<b class='flag-5'>传感</b>器耦合超高灵敏度和宽范围检

    明远智睿SSD2351开发板:语音机器人领域的变革力量

    的四核1.4GHz处理器具备强劲的运算性能,能够高效处理语音机器人运行过程中的复杂任务。语音识别和合成需要大量的计算资源,该处理器可以快速对语音
    发表于 05-28 11:36

    北京理工大学研究眼机界面智能传感硬件——从可穿戴到仿生

      眼机交互界面(Eye-machine interface, EMI)作为沉浸式人机交互的重要一环,已被应用于VR/AR、自动驾驶、脑机接口、生物医学等领域。但现有EMI传感硬件正在
    的头像 发表于 04-25 18:42 680次阅读
    北京理工<b class='flag-5'>大学</b>:<b class='flag-5'>研究</b>眼机界面智能<b class='flag-5'>传感</b>硬件——从<b class='flag-5'>可穿戴</b>到仿生

    max30100用于可穿戴健康的脉搏血氧仪和心率传感器IC手册

    电子发烧友网站提供《max30100用于可穿戴健康的脉搏血氧仪和心率传感器IC手册.pdf》资料免费下载
    发表于 03-24 09:49 3次下载

    基于WTVxxx语音芯片的智能清洁机器人语音交互系统设计方案介绍

    集成度、低功耗、多控制模式及传感器扩展能力,为智能清洁机器人提供了高效的语音交互解决方案。核心需求分析:1、实时状态反馈:工作模式切换、电量提醒、故障报警等
    的头像 发表于 03-06 08:27 665次阅读
    基于WTVxxx<b class='flag-5'>语音</b>芯片的智能清洁<b class='flag-5'>机器人语音</b><b class='flag-5'>交互</b><b class='flag-5'>系统</b>设计方案介绍

    基于语音识别的智能会议系统具备哪些交互功能

    标贝科技专注智能语音交互领域多年,在语音识别语音合成领域有着多项大型企业合作案例,标贝与多个智能会议
    的头像 发表于 12-20 10:35 899次阅读

    语音芯片赋能可穿戴设备:开启个性化音频新体验

    语音芯片与可穿戴设备合作,带来定制化音效、智能降噪、个性化推荐、语音交互及跨设备共享等,引领个性化音频时代,提升用户听觉体验。
    的头像 发表于 12-14 15:44 1287次阅读

    蓝牙可穿戴方案,蓝牙手环,蓝牙戒指,方案

    可穿戴
    必尔易半导体
    发布于 :2024年12月13日 20:20:09