基于0MAP5912芯片实现SVM语音识别程序的应用开发-电子发烧友网

随着语音识别和语音合成技术的不断更新与发展，将语音识别技术应用于嵌入式产品中已得到广泛应用。SVM（支持向量机）作为统汁概率模型已经被证明是一种很好的识别模型。OMAP5912处理器是由TI 公司的TMS320C55X型DSP内核与低功耗、增强型ARM926EJ-S微处理器组成的双核应用处理器。ARM核可满足控制和接口方面的需要，DSP核以其低功耗高性能来实现多媒体应用。目前存 0MAP平台上实现的多媒体应用有语音、音频、图像、视频等。在实验室开发的基于0MAP5912嵌入式语音识别系统上进行基于SVM的语音识别程序开发。

1 SVM多类分类方法

SVM最初是为处理两类分类问题而设计的，如何有效地处理多类分类问题目前仍是一个持续研究的课题。采用SVM中的“一对一”方法实现多类分类，下面对这种方法进行简单介绍。

S.Knerr等在1990年首次介绍了“一对一”方法。J.Friedman在1996年和U KreBel在1999年分别首次在支持向量机中使用这种方法。它需要构造k（k-1）/2个分类器，每个分类器由特定的某两类训练样本训练得到，判定测试样本的类别时，结合所有两类分类器对测试样本类别的判定意见，采用“投票法”的策略，并认为得票数最多（Max Wins）的类别就是测试样本所属的类别。具体如下：考虑K类的分类问题，设训练集

首先对所有的（i，j）∈{（i，j）|i≤j，i，j=1，…，K}进行运算：从训练集

基于0MAP5912芯片实现SVM语音识别程序的应用开发

中抽取所有y=i和y=j的样本点。基于这些样本点组成一个训练集Ti-j，每个两类分类SVM解决问题

约束条件为：

通过求解式（3）的最优化问题得到k（k-1）/2个决策函数，如果函数

判断x属于i类，则i类的得票数增加1;否则j类的得票数增加1。最终判定得票数最多的类别就是测试样本x所属的类别。

“一对一”方法的特点是训练时需要构造k（k-1）/2个分类器，预测时则采用投票选择策略。这样做的优点是：每一个分类问题的规模较小，需要求的问题较简单，样本数量不很大时训练速度较快，而且由于类别有较少的重合，改善了样本拒分、错分的范同;缺点是：投票法可能存在得票相同的类，即可能存在一个样本同时属于多个类的情况。这可以使用其他方法解决，这里重点研究SVM算法在0MAP上的实现。

2 嵌入式系统开发环境的搭建

0MAP5912处理器是由TI公司的TMS320C55x型DSP内核（192 MHz）与低功耗、增强型ARM926EJ-S微处理器（192 MHz）组成的双核应用处理器，采用0.13μm CMOS工艺制造。TMS320C55x型DSP可提供对低功耗应用的实时多媒体处理的支持;ARM926EJ-S MPU可满足控制和接口方面的处理需要。基于双核结构的0MAP5912具有极强的运算能力和极低的功耗，采用开放式、易于开发的软件设施，支持广泛的操作系统。嵌入式系统开发在解决了硬件平台的设计和操作系统的搭建后就需要考虑应用程序如何编译、主机如何与开发板通信、程序如何调试、程序如何下载到开发板这几个方面的问题。

2.1 通信环境

采用minicom通信终端程序，通过minicom可以设置、监视串口工作状态，接收、显示串口收到的信息、并且在宿主机和开发板之间传递数据和控制指令，从而实现通过宿主机上调试开发板的目的。

设置minicom参数值如下：“Serial Device”为/dev/ttyrSO（使用串口1）;主机串口波特率为：115 200;数据位为：8位;停止位为：1位;奇偶校验位为：无;数据流控制为：无。完成后保存设置重启Minicom。

2.2 程序下载环境

在程序开发期间，经常需要把程序下载到开发板上进行测试，采用通用开发模式：将宿主机和开发板通过以太网连接，在宿主机上运行minicom作为开发板的显示终端，通过NFS（Network File System，网络文件系统）来挂载宿主机硬盘，让应用程序直接运行在开发板上。

2.3 交叉编译环境的建立

宿主机系统为Ubuntu version 2.6.27，将交叉编译工具arm-linux-gcc-3.4.1解压缩到/usr/local/arm目录下，然后在终端执行命令：#gedit/root/.bashrc，修改/root/.bashrc文件，在文件中加入export PATH=“$PATH：/sbin：/usr/local/arm/3.4.1/bin：/usr/local/bin：/usr/local”，最后在终端执行命令#source.bashrc.至此，交叉编译环境搭建完成。资源文件和库文件都

安装在/usr/local/arm/3.4.1/arm-linux目录下。交叉编译过程如图l所示。

2.4 安装NFS《Network File System）

在开发阶段采用NFS比较方便，这样开发板的根文件系统可以放在宿主机上，然后通过NFS来挂载和运行。内核同样也可放在宿主机上，然后由引导器使用 TFTP（Trivial FileTransferProtocol）协议通过以太网来获取。开发板同时具有以太网口和串口，且以太网连接的传输速度远比串口连接要快，因此，用以太网接口下载内核和根文件系统，而串口作为调试和控制台来使用。

2.4.1安装NFS

Ubuntu上默认是没有NFS服务的，首先要安装NFS服务程序，#sudo apt-get install nfs-kernel-server，使宿主机相当于NFS服务器。同样地，开发板作为NFS的客户端，需要安装NFS客户端程序：#sudo apt-get install nfs-commmon。

2.4.2 配置portmap服务

nfs-common和nfs-kernel-setver都依赖于portmap，所以需要配置portmap。#sudo dpkg-reconfigure portmap，对Shouldportmap be bound to the loopback address？选N。

在/etc/hosts.deny和/etc/hosts.allow两文件中设置对portmap的访问：首先在/etc/hosts.deny中，禁止所有用户对portmap的访问，然后在/etc/hosts.allow中，允许特定用户对portmap进行访问。文件修改完后执行#sudo/etc/init.d/pottmap restart，重启portmap daemon使改动后的内容生效。

2.4.3 配置/etc/exports

NFS挂载目录及权限由/etc/expotts文件定义。在该文件最后添加语句：

/data/rootfs2.6 192.168.0.*（rw，sync，no_root_squash）

使192.168.O.*网段内的NFS客户端能够共享NFS服务器/data/rootfs2.6目录内容，不仅有渎写权限，而且进入/data/rootfs-2.6目录后的身份为root。更新配置，重启NFS服务。

#sudo exportfs-r

#sudo/etc/init.d/nfs-kernel-server restait

2.4.4 拷贝根文件系统

拷贝根文件系统到/data/rootfs2.6目录下，这时就可以启动minicom，作为虚拟终端，可以通过它来操作开发板。

2.5 修改开发板启动项

bootargs参数设置Linux系统启动时挂载在NOR Flash上的JFFS2根文件系统。挂载宿主机上的网络文件系统，则bootargs参数应设置

setenv bootargs=console=ttyS0，115200n8 noinitrd rw ip=192.168.0.158 root=/dev/nfs nfsroot=192.168.0.204：/data/rootfs2.6.nolock mem=62M

#sayenv保存设置后重启u-boot，之后将顺利进入到开发板，调试应用程序。

3 实验及结果分析

基于VC++6.0编程实现一种多类分类SVMs算法，PC机环境为Ubuntu version 2.6.27，开发板为Omap5912的ARM926ej-s，其环境为Lin-ux version 2.6.18;Boot Loader采用u-boot version 1.1.6;交叉编译工具链arm-linux-gcc version3.4.1。

采用16个人分别对50个词的孤立词发音，在不同信噪比下（15、20、25、30 dB和无噪音）得到的语音数据作为样本，采用由MFCC特征提取算法得到的特征参数作为识别网络的输入。语音信号采样率为11.025 kHz，帧长N=256点，帧移M=128点。词汇量分别为10、20、30、40和50个词。训练样本由9人每人对每词在15、20、25、30 dB、无噪音下发音3次得到。测试样本由另外7人在相应SNR下对每词发音3次得到。识别算法采用RBF核函数的SVM算法，采用交叉验证和网格搜索法进行核参数选择并建立模型，对测试样本进行分类识别。核函数参数取最优为（c，y）=（32.0，O.000 122 070 312 5）。实验结果见表l所示，识别率均在95%以上。表1中同时列出同样条件下使用HMM识别网络的识别结果。

HMM模型是典型的语音识别模型，它是目前语音识别效果最好的少数几种方法之一。在相同特征参数下将SVM与HMM模型进行对比，从实验结果看出：1）SVM比HMM模型具有更高的识别率;2）比较相同信噪比和词汇量下的测试精度，可发现HMM模型的测试精度有明显下降，而SVM的测试结果下降较少，说明SVM比HMM模型具有更强推广性。

4 结束语

提出一种基于SVM的0MAP5912非特定人嵌入式语音识别系统的实现方法。在搭建的开发环境下运用SVM算法巾的“一对一”方法进行语音识别，获得良好结果。通过实验可以得出，对中小词汇量采用MFCC特征参数，“一对一”SVM作为后端识别方法可以得到较好的识别结果，比传统的HMM模型有明显优势。同时SVM算法作为应用程序集成到0MAP5912嵌入式系统里，存储量需求小，能够满足实用要求。

责任编辑：gt

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

处理器

处理器

+关注

关注
68

文章
18266

浏览量
222118
ARM

ARM

+关注

关注
134

文章
8648

浏览量
361764
嵌入式

嵌入式

+关注

关注
4981

文章
18275

浏览量
288367

labview实现语音识别

发出语音命令后通过语音识别软件识别，然后调用labview程序，在labview程序中调用API

发表于 02-21 17:31

无线语音遥控智能车设计与实现

设计方案154.2 主控板设计方案154.3 控制板设计方案184.4 中断方案196.声音控制智能小车软件设计206.1 语音控制实现流程216.2 语音识别主

发表于 07-31 22:12

求大佬分享一种基于SVM的0MAP5912非特定人嵌入式语音识别系统的实现方法

SVM多类分类方法是什么？嵌入式系统开发环境怎么搭建？基于SVM的0MAP5912非特定人嵌入式语音识别

发表于 06-01 06:47

TWEN-ASR ONE 语音识别系列教程（1）——运行第一个语音程序

语音识别控制，可以快速编写程序，这个芯片就是TWEN-ASR。本篇文章将使用TWEN ASR ONE V1.0开发板，进行

发表于 06-16 18:10

求一种基于LD332X的单芯片语音识别解决方案

进行快速验证和开发，将语音识别模块M-LD3320和自己的单片机连接起来（模块可以插入面包板或者标准DIP40插座），就可以在单片机中编写程序实现

发表于 07-30 06:01

[CB5654智能语音开发板测评] 语音识别开发板的比较

。对于CB5654开发板，它的产品似乎并不是提供语音识别的功能，需要自行更新工具及应用程序。此外在软件的实验方面，也不是很方便，好像对软件的版本匹配要求比较高，不匹配就无法

发表于 03-09 08:11

智能肩颈按摩仪离线语音识别芯片方案

、语音识别主控、识别芯片外挂flash，而现在单片机市场竞争日益激烈和货源短缺的市场行情中，这三个主要元器件的市场价格高，供货不稳定，导致我们的生产变得困难，面临成本高等问题。九芯电子

发表于 06-16 11:45

基于SVM的0MAP5912非特定人嵌入式语音识别系统的实现

　　随着语音识别和语音合成技术的不断更新与发展，将语音识别技术应用于嵌入式产品中已得到广泛应用。SVM

发表于 08-19 09:50 •1110次阅读

OMAP5912双核通信及数字音频系统实现

0MAP5912采用独特的双核结构，内含1个实现控制功能的带有TI增强型ARM926EJ-S内核的处理器和1个实现数据处理功能的高性能、低功耗TMS320C55x DSP内核

发表于 09-17 01:28 •1714次阅读

语音识别芯片原理

语音识别芯片也叫语音识别IC，与传统的语音芯片相比，

发表于 03-27 15:09 •9457次阅读

语音识别芯片种类

语音识别芯片也叫语音识别IC，与传统的语音芯片相比，

发表于 03-27 15:09 •5020次阅读

语音识别芯片的原理_语音识别芯片有哪些

语音识别芯片也叫语音识别IC，与传统的语音芯片相比，

发表于 10-01 08:46 •4971次阅读

语音识别芯片的分类及应用

语音识别芯片也叫语音识别IC，与传统的语音芯片相比，

发表于 10-21 15:38 •2382次阅读

介绍语音识别芯片分类

语音识别芯片也被称为语音识别IC.与传统的语音芯片相

发表于 02-27 16:04 •1049次阅读

基于OMAP5912的嵌入式非特定人连续语音识别系统

电子发烧友网站提供《基于OMAP5912的嵌入式非特定人连续语音识别系统.pdf》资料免费下载

发表于 10-09 15:21 •0次下载

搜索历史

基于0MAP5912芯片实现SVM语音识别程序的应用开发

评论

labview实现语音识别

无线语音遥控智能车设计与实现

求大佬分享一种基于SVM的0MAP5912非特定人嵌入式语音识别系统的实现方法

TWEN-ASR ONE 语音识别系列教程（1）——运行第一个语音程序

求一种基于LD332X的单芯片语音识别解决方案

[CB5654智能语音开发板测评] 语音识别开发板的比较

智能肩颈按摩仪离线语音识别芯片方案

基于SVM的0MAP5912非特定人嵌入式语音识别系统的实现

OMAP5912双核通信及数字音频系统实现

语音识别芯片原理

语音识别芯片种类

语音识别芯片的原理_语音识别芯片有哪些

语音识别芯片的分类及应用

介绍语音识别芯片分类

基于OMAP5912的嵌入式非特定人连续语音识别系统