
说话过程中的喉部运动为信息传输提供了一条有前途的途径,但声带和周围肌肉的复杂动态会在喉咙中产生复杂的信号,这给传感器的最佳放置以获取信号带来了挑战。本文,深圳大学刁东风院士团队在《Carbon》期刊发表名为“Throat map of speech recognition achieved by flexible ultrasensitive carbon array sensors with deep learning”的论文,研究提出一种“喉部地图”,利用柔性碳阵列传感器和基于深度学习的信号处理方法,以确定高精度语音识别所需的传感器最佳放置坐标。在传感器制备过程中,通过电子回旋共振法沉积石墨烯纳米晶碳膜作为传感单元,随后将其转移至聚二甲基硅氧烷(PDMS)基底并集成可拉伸电路。该传感器在2×2 cm²的区域内包含16个传感单元,实现超高的灵敏度系数(>1000)和10000 Hz的频率响应极限。 在信号处理方面,我们首次提出了一种基于卷积神经网络算法的信号-位置分类方法。该方法可可视化以喉结为中心的坐标信息并构建喉部地图,从而识别产生最独特且一致信号的位置。借助喉部地图,选定的传感单元通过深度学习模型对14个音素的分类准确率超过96%。该喉部地图可作为语音及喉部语言识别应用中传感器布局的指导依据。
2图文导读

图1.“喉咙图”研究的总体图。

图2.超灵敏阵列传感器的表征。

图3.语音识别的喉咙图。

图4.用于语音识别的喉咙图验证。
3小结
我们提出了一种构建“喉部地图”的方法,通过检测喉部运动信号来提升音素信息的识别能力。该方法基于两项关键技术突破:一种可行的制备柔性超敏感碳阵列传感器技术,用于在狭窄的喉部区域捕捉多点细微喉部运动信号;以及一种基于深度学习的SPC方法,通过位置权重累积来创建喉部地图。碳阵列传感器在2×2 cm²的面积内拥有16个传感单元,具有高灵敏度系数(>1000)和高达10000 Hz的高频响应极限。喉部地图的构建提供了在喉部区域布置传感单元的坐标信息,以实现音素识别。通过使用5个传感单元,该方法在14个音素识别中实现了超过96%的高准确率。本文提出喉部地图构建方法为多传感器单元在运动识别中的位置布局提供了高效解决方案。
文献:
https://doi.org/10.1016/j.carbon.2025.120720
审核编辑 黄宇
-
传感器
+关注
关注
2574文章
54460浏览量
786594
发布评论请先 登录
安徽农业大学: 开发石墨烯/聚氨酯海绵复合材料,用于柔性压力传感器和智能缓冲材料
香港理工大学、南方科技大学:新型压阻式石墨烯/CNC声学传感器,用于语音识别
深圳大学:研发新型传感器,实现阿摩尔级生物分子精准检测
四川大学:协同离子-电子传输应变传感器实现宽工作范围内超高且可调灵敏度
深圳技术大学:超薄石墨烯应变传感器阵列,用于毫米级分辨率的高灵敏度多功能传感
关于CAPSENSE™接近按钮传感器阵列的设计问题求解
清华大学:研发高柔性压电驻极体声学传感器,抗环境噪声能力远超商用麦克风
芯森电子FR6V系列磁通门电流传感器在光伏阵列中的应用
新思科技携手深圳大学助力数字集成电路人才培养
研究用于人体足底压力和步态分析的高灵敏度压力传感器
南洋理工大学:研究通过 4D 打印开发增强对应变、温度和磁场的灵敏度的超柔性传感器
北京化工大学,中国石化北京化工研究院:一种用于柔性应变传感器的高拉伸、自愈、自粘聚丙烯酸/壳聚糖多

深圳大学:构建“喉部地图”法,柔性超灵敏碳阵列传感器,用于语音识别
评论