0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

基于树莓派的电话录音系统研究

机电信息杂志 来源:机电信息杂志 2023-06-26 14:10 次阅读

陈健 刘清心

广东电网有限责任公司珠海供电

摘 要:

电话录音系统广泛应用于电力通信中,它在调度语音下达的过程中起着重要的作用。然而传统的录音系统存在占地面积过大、查询录音信息不方便等问题,鉴于此,运用深度神经网络-隐马尔可夫模型(DNN-HMM模型),基于树莓派设计了一种电话录音系统,通过特征提取等方式识别语音并进行录音,录音完成后可以通过电脑手机等终端方便快捷地查看录音以及语音对应的文字版文件。

0 引言

根据南方电网调度规范的要求,500 kV变电站应配置录音系统,调度机构应实现录音系统的双重化配置。准确可靠的原始录音能为事件处理提供可靠的证据,防止出现纠纷。

目前局内变电站通信室空间狭小,机柜位置紧张,然而站内的电话录音系统设备体积庞大,占据了大量的空间。同时,目前电话录音系统普遍存在录音音质较差,查询和检索烦琐复杂的问题,不利于长期存储和管理,难以对分布于不同区域的电话进行远程录音监听。按规范要求,调度录音应保存至少6个月,电话录音内容可用于安全监管,是判定责任纠纷的重要依据,对提高公司服务质量、增强竞争实力等具有重要意义。但现有的录音方式相对落后,无法满足以上要求。树莓派相对于其他的载体价格更低,但计算能力强大,具有很高的性价比。搭建基于树莓派的电话录音系统,可以解决传统录音系统体积庞大的缺陷,节约机房内部可利用空间,实现语音文字高识别转化,保存传输方便;同时,该系统支持多端口输入,具备强大的兼容性与可拓展性。

1 基于树莓派的电话录音系统简介及优势

使用基于树莓派的电话录音系统,可解决传统录音系统体积庞大的缺陷,充分利用机房空间,满足多通道录音的要求,具备强大的兼容性与可拓展性,同时能改善录音质量,提高自动化程度,降低操作的复杂度,方便用户运维系统。

1.1 设备小型化

最初,树莓派是由基于Atmel的ATmega644单片机制成的,它采用ARM处理器,与传统芯片相比具有更高的性能。它的外形只有信用卡大小,以SD/MicroSD卡为内存硬盘,具有HDMI等多种接口,具备个人计算机的基本功能,可以实现录音设备的小型化[1]。树莓派采用Linux操作系统,代码采用Linux系统下的Python语言,功能强大,操作方便。基于树莓派的新型录音系统可以节省机房空间,提高机房空间的利用效率。

1.2 系统安全性高

系统权限管理制度严格,根据用户权限不同划分不同的操作权限,系统通过加密的并网权限,满足录音电话的保密要求,保障了网络安全。

1.3 用户界面更友好

基于树莓派的电话录音系统用户界面友好,采用图形化操作界面,可以查看录音记录及语音对应的文字记录,可以实时显示不同录音通道所处的工作状态,可以方便快捷地查找信息,界面具有提示和在线帮助机制,可以帮助用户快速了解系统的使用方法,降低操作难度。本系统是基于Web开发的操作系统,不需要PC也可以登录,操作更加便捷。

2 基于树莓派的电话录音系统设计与实现

2.1 体系结构

本系统是基于Web开发的操作系统,其中采用B/S架构开发的Web操作层为用户交互层,用户通过浏览器直接访问系统进行相关操作;设备交互层通过串口连接UWB定位设备,根据电子围栏的位置关系进行数据处理入库。

系统总体架构如表1所示。

8b2a7af8-13e7-11ee-962d-dac502259ad0.png

语音识别模块可以将完成特征提取的原始语音信号转化为相应的特征向量,配合声学模型、语音字典和语音模型得到识别结果[2]。语音特征提取模块可以识别语音上有用的特征,排除说话人性别、年龄、说话习惯和录音条件等不同引起的变化的影响,避免噪声干扰。语音识别系统如图1所示。

8b463bbc-13e7-11ee-962d-dac502259ad0.png

语音识别系统由特征提取、声学模型、发音字典、语言模型和解码器5个部分组成[1],语言识别通常使用隐马尔可夫模型,根据语音信号推断对应的文字,语音的特征序列为OT1={o1,o2,…,oT};语言模型P(W)代表特定词序出现的先验概率;声学模型P(OT1|W)代表当给定词序为W时,输出声学特征OT1的概率,根据最大后验概率,词序列W~如下:

8b622d5e-13e7-11ee-962d-dac502259ad0.png

声学特征OT1的概率P(OT1)与词序W无关,可以忽略不计,所以式(1)可表示为:

8b6e24f6-13e7-11ee-962d-dac502259ad0.png

马尔可夫性表示现在决定未来状态。马尔可夫链描述了时刻(t-1)决定当前时刻t的状态概率分布。隐马尔可夫模型在此基础上引入了隐状态的概念,它只与当前的状态有关。

确定马尔可夫状态,需要确定以下5个参数:状态空间Ω={si},i=1,2,k,N;初始状态的概率分布π=πi;状态转移概率矩阵A=[aij],i=1,2,k,N;观测序列O={oi};状态输出概率B={bi(ok)}。其中,bi(ok)表示状态i发生观测到输出语音特征ok的概率;aij表示从状态si到sj的转移概率;πi表示状态si的初始概率分布。

特征提取模块将输入语音转换为可用于模型训练的特征矢量,梅尔频率倒谱系数MFCC是语音识别中常用的特征。首先对语音信号进行分帧、加窗,把语音信号切分为语音片段,一帧语音片段的长度为10~30 ms。由于直接截断语音信号会造成频谱泄漏,因此需对每帧数据做加窗处理,选择汉宁窗、汉明窗等合适的窗函数减轻影响。之后通过傅里叶变换将帧信号从时域转换到频域分析,傅里叶变换公式如下:

8b7ca030-13e7-11ee-962d-dac502259ad0.png

式中:Sa为加窗后第a帧语音信号;Sa(k)为对应的傅里叶变换后的语音信号;n为时间变量;k为常数;N为整数,表示帧长。 然后计算Mel子带对数能量Em,通过离散余弦变换DCT转换到DCT域,得到MFCC特征向量,DCT变换公式如下:

8b8ca30e-13e7-11ee-962d-dac502259ad0.png

式中:C(n)为特征值;M为Mel滤波器中滤波器的数量;m为时间变量;L为整数,表示MFCC系数阶数。 MFCC提取过程如图2所示。

8b9b2744-13e7-11ee-962d-dac502259ad0.png

采用隐马尔可夫模型进行声学建模,使用高斯混合模型-隐马尔可夫模型(GMM-HMM)做模型训练,进行数据对齐,状态输出概率bi(k)表示状态si的条件下输出语音特征ok的概率。之后以此作为训练深层神经网络DNN模型的标准,用DNN模型替换GMM模型,计算观察概率,保留转移概率和初始概率等其他部分,估算HMM状态的后验概率[3]。

基于DNN-HMM的声学模型语音识别准确率更高,可以自动学习声学状态和特征向量之间的分布关系,提升语音识别系统的性能。

2.2 系统的设计与实现

本文设计的基于树莓派的电话录音系统按功能可分为录音、储存和语音识别转换几个部分。录音系统采用触发式录音,电话摘机应答时自动开始录音,形成语音数据队列,通话结束后语音通话通过录音文件写入模块存储在电话录音系统中,形成语音文件队列,之后通过中文语音转写模块将录音文件转成文字。日志记录层中记录了系统操作信息与操作错误信息,便于查询出错情况。录音系统架构图如图3所示。

8bb4eaee-13e7-11ee-962d-dac502259ad0.png

电话录音系统的界面如图4所示。用户可以通过展示界面查看录音状态,播放音频文件,实现实时监听。用户根据录音时间查询音频文件,系统采用多线程技术,实现对同时录音的多部电话的并行控制,统一管理位于不同空间的电话。该系统还可通过语音识别将语音数据转换为文字,用户可以将音频文件和文字文件备份到U盘上,实现脱机查询[4]。

8bd821bc-13e7-11ee-962d-dac502259ad0.png

3 测试结果

经过测试,本系统的语音识别率相比其他系统提升了5%~10%,反应时间也缩短了。与原有的录音系统相比,本系统可以在手机上进行操作,便携程度提高,同时语音识别率较高,可以将语音转化为对应的文字,快速识别语音内容是否合规,并结合南方电网的调度规范等规章制度进行判断。

录音设备在输入语音信号后进行语音录制与语音识别,之后将录制的语音与语音识别转换的文字上传至系统,用户可以通过人机交互终端查询录音结果。录音流程如图5所示。

8c0d103e-13e7-11ee-962d-dac502259ad0.png

基于树莓派的电话录音系统可以通过电脑、手机等终端访问,将语音转为对应的文字,应用在调度台、变电站里可以保存录音数据,更方便工作人员保留录音证据,对用电话进行的工作许可可以更好地进行监督,提升了工作效率。

该电话录音系统占地面积小,终端设备的屏幕大小是7英寸,设备具有USBRJ11等接口,可以连接电话、U盘等设备,以此记录保存语音通话。

4 结语

本文设计的基于树莓派的电话录音系统使用了隐马尔可夫模型和深度学习等技术,录音效果好,语音识别准确率高。另外,本系统解决了传统录音系统占地面积过大的问题,操作方式简单,适用于变电站、调度台等场合。除了电力行业以外,系统还适用于铁路、石油、公安等行业的调度指挥中心和客户服务中心。

审核编辑:汤梓红

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 单片机
    +关注

    关注

    6001

    文章

    43973

    浏览量

    620825
  • Linux
    +关注

    关注

    87

    文章

    10990

    浏览量

    206733
  • 电话录音
    +关注

    关注

    0

    文章

    11

    浏览量

    12988
  • 录音系统
    +关注

    关注

    0

    文章

    5

    浏览量

    6914
  • 树莓派
    +关注

    关注

    113

    文章

    1639

    浏览量

    104737

原文标题:基于树莓派的电话录音系统研究

文章出处:【微信号:机电信息杂志,微信公众号:机电信息杂志】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    供应PCI电话录音卡,电话录音监控系统,深圳电话录音设备

    电话录音系统—2路、4路、8路、16路电话录音系统[电话录音盒+商务版软件]0755-82971230-8003阮小姐
    发表于 04-23 14:00 1231次阅读
    供应PCI<b class='flag-5'>电话录音</b>卡,<b class='flag-5'>电话录音</b>监控<b class='flag-5'>系统</b>,深圳<b class='flag-5'>电话录音</b>设备

    电话录音深圳,电话录音系统,电话录音卡,来电显示设备

    电话录音系统—1~128线电话录音系统[电话录音卡+商务版软件]0755-82971230-8003阮小姐主要功能
    发表于 04-23 14:02 456次阅读

    批发2路电话录音盒,电话录音系统,电话录音卡,电话录音设备

    电话录音,电话录音设备,电话录音系统,2路电话录音盒产品简介 价格
    发表于 04-25 15:01 487次阅读

    4路电话录音盒,电话录音系统,电话录音深圳

    电话录音系统,电话录音设备,电话录音,4路电话录音盒产品简介
    发表于 04-25 15:07 515次阅读
    4路<b class='flag-5'>电话录音</b>盒,<b class='flag-5'>电话录音系统</b>,<b class='flag-5'>电话录音</b>深圳

    深圳16路录音卡,电话录音系统,电话录音设备

    电话录音-电话录音系统-电话录音卡-电话录音盒深圳诺斯卡科技◆◆批发、零售高性价比电话录音,电话录音
    发表于 04-25 15:25 332次阅读

    16路电话录音系统,电话录音卡,电话录音设备,深圳诺斯卡电话

    电话录音-电话录音系统-电话录音卡-电话录音盒深圳诺斯卡科技◆◆批发、零售高性价比电话录音,电话录音
    发表于 06-23 11:09 465次阅读

    电话录音 深圳,电话录音软件,电话录音系统,电话录音盒,电话

    电话录音,电话录音设备,电话录音系统,2路电话录音盒产品简介 价格便宜,使用方便,功能强大,性能稳定,全数
    发表于 06-24 10:26 666次阅读

    电话录音电话录音系统电话录音卡,电话录音

    电话录音-电话录音系统-电话录音卡-电话录音盒深圳诺斯卡科技◆◆批发、零售高性价比电话录音,电话录音
    发表于 07-22 16:08 473次阅读

    16路电话录音系统,电话录音卡,电话录音设备,深圳诺斯卡电话

    诚征代理:电话录音电话录音系统,电话录音产品,电话录音设备,USB电话录音电话录音系统
    发表于 07-26 10:10 467次阅读

    PCI电话录音卡,电话录音监控系统,深圳电话录音设备

    电话录音。USB电话录音,电话录音系统,电话录音设备,电话录音
    发表于 07-30 09:56 423次阅读

    电话录音系统—1~128线电话录音系统[电话录音卡+商务版软

    电话录音系统—1~128线电话录音系统[电话录音卡+商务版软件]0755-83127845-8004李小姐主要功能 多路
    发表于 08-06 14:10 655次阅读

    电话录音系统—2路、4路、8路、16路电话录音系统[电话录音

    电话录音系统—2路、4路、8路、16路电话录音系统[电话录音盒+商务版软件]0755-83127845-8004李小姐产
    发表于 08-06 14:13 787次阅读

    深圳电话录音电话录音电话录音软件电话录音系统

    电话录音系统—1~128路电话监#听系统电话语音系统传真系统呼叫
    发表于 08-06 15:19 327次阅读

    电话录音系统—1路、2路、4路、8路、16路电话录音系统8路

    电话录音系统—1路、2路、4路、8路、16路电话录音系统8路/16路PCI电话录音套件[电话录音盒+商务版软件]0755-83127845-8004李小姐
    发表于 08-07 15:40 966次阅读

    USB电话录音系统,USB电话录音系统的功能有哪些?

    USB电话录音系统,USB电话录音系统的功能有哪些? USB电话录音系统,是使用最新数字电子技术,辅以计算机及 Windows 软件所设计完成的
    发表于 03-06 17:34 971次阅读