深圳大学：构建“喉部地图”法，柔性超灵敏碳阵列传感器，用于语音识别-电子发烧友网

说话过程中的喉部运动为信息传输提供了一条有前途的途径，但声带和周围肌肉的复杂动态会在喉咙中产生复杂的信号，这给传感器的最佳放置以获取信号带来了挑战。本文，深圳大学刁东风院士团队在《Carbon》期刊发表名为“Throat map of speech recognition achieved by flexible ultrasensitive carbon array sensors with deep learning”的论文，研究提出一种“喉部地图”，利用柔性碳阵列传感器和基于深度学习的信号处理方法，以确定高精度语音识别所需的传感器最佳放置坐标。在传感器制备过程中，通过电子回旋共振法沉积石墨烯纳米晶碳膜作为传感单元，随后将其转移至聚二甲基硅氧烷（PDMS）基底并集成可拉伸电路。该传感器在2×2 cm²的区域内包含16个传感单元，实现超高的灵敏度系数（>1000）和10000 Hz的频率响应极限。在信号处理方面，我们首次提出了一种基于卷积神经网络算法的信号-位置分类方法。该方法可可视化以喉结为中心的坐标信息并构建喉部地图，从而识别产生最独特且一致信号的位置。借助喉部地图，选定的传感单元通过深度学习模型对14个音素的分类准确率超过96%。该喉部地图可作为语音及喉部语言识别应用中传感器布局的指导依据。

2图文导读

图1.“喉咙图”研究的总体图。

图2.超灵敏阵列传感器的表征。

图3.语音识别的喉咙图。

图4.用于语音识别的喉咙图验证。

3小结

我们提出了一种构建“喉部地图”的方法，通过检测喉部运动信号来提升音素信息的识别能力。该方法基于两项关键技术突破：一种可行的制备柔性超敏感碳阵列传感器技术，用于在狭窄的喉部区域捕捉多点细微喉部运动信号；以及一种基于深度学习的SPC方法，通过位置权重累积来创建喉部地图。碳阵列传感器在2×2 cm²的面积内拥有16个传感单元，具有高灵敏度系数（>1000）和高达10000 Hz的高频响应极限。喉部地图的构建提供了在喉部区域布置传感单元的坐标信息，以实现音素识别。通过使用5个传感单元，该方法在14个音素识别中实现了超过96%的高准确率。本文提出喉部地图构建方法为多传感器单元在运动识别中的位置布局提供了高效解决方案。

文献：

https://doi.org/10.1016/j.carbon.2025.120720

审核编辑黄宇

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉