0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

基于视觉的手势识别系统的设计与研究

电子设计 来源:电子产品世界 作者:杨全,彭进业 2021-03-26 16:42 次阅读

手语识别的目的就是通过计算机提供一种有效的、准确的机制将聋哑人常用的手语手势识别出来,使得他们与健全人之间的交互变得更方便、快捷。同时,手语识别的应用还可以提供更自然的人机交互方式,方便聋哑人对计算机等常用信息设备的使用。目前手语识别可以分为基于视觉(图像)的识别系统和基于数据手套(佩戴式设备)的识别系统。基于视觉的手势识别系统采用常见的视频采集设备作为手势感知输入设备,价格便宜、便于安装。鉴于基于视觉的手势识别方法交互自然便利,适于普及应用,且更能反映机器模拟人类视觉的功能,所以目前是手势识别的研究重点。

手语识别的研究开始于1982年,Shantz和Poizner实现了一个合成美国手语的计算机程序。之后,中国、美国、日本、德国等许多国家都进行了自己国家的手语识别与合成研究,并取得了许多重要的研究成果。Triesch和Malsburg开发了一种弹性图模板匹配技术对复杂背景下的手形进行分类,在相对复杂的背景下的识别率达到86.2%。Davis和Shah将戴上指间具有高亮标记的视觉手套的手势作为系统的输入,可识别7种手势。Starner等在对美国手语中带有词性的40个词汇随机组成的短句子识别率达到99.2%。Yang等人采用7Hu不变矩特征量进行手语字母识别,最好识别率为90%。

本文采用SVMs (Support Vector Machines,支持向量机)作为手语识别的分类器,提出了一种基于视觉的手语字母识别方法。SVMs在解决小样本、非线性及高维模式识别问题中表现出许多特有的优势,并能够推广应用到函数拟合等其他机器学习问题中。采用SVMs作为图像分类器首先要解决的问题是:如何用典型视觉特征来表征图像的不同视觉特性。

在图像特征提取方面,为了能够同时表征图像的全局特性和局部特性,需要同时提取图像的全局特征和局部特征,并且这些特征中用以描述图像整体形状的特征应当具备平移、旋转和尺度不变性。SIFT(Scale Invariant Feature Transform)是一种对尺度空间、图像缩放、旋转甚至仿射不变的图像局部特征描述算子;而7Hu不变矩特征量具有平移、旋转和尺度不变性的特点,具有很好的稳定性,适合描述目标整体形状。

手语简介

手语是一种聋人使用的语言,是一种靠动作/视觉交际的特殊语言。中国手语包括30个手指字母,大约5500个基本手势词。手指语是从字母语言发展起来的,是汉语手语的一种,用一个指式代表一个汉语拼音字母,按照汉语拼音方案拼成普通话。而手势语则是由象形语言发展起来的。它充分利用人的手势、表情和身体动作形象地表达物体和行动的最基本特征。

中国文字改革委员会、教育部等单位于1963年联合公布实施汉语手指字母方案。方案中包括汉语拼音中26个单字母(A~ Z)和4个双字母(ZH、CH、SH、NG)如图1所示。

基于视觉的手势识别系统的设计与研究

图1 中国手语字母表

SVMs

SVMs的主要思想是建立一个超平面作为决策曲面,使得正例和反例之间的隔离边缘被最大化。对于二维线性可分情况,令 H为把两类训练样本没有错误地分开的分类线,H1,H2分别为过各类中离分类线最近的样本且平行于分类线的直线,它们之间的距离叫做分类间隔。所谓最优分类线就是要求分类线不但能将两类正确分开,而且使分类间隔最大。在高维空间,最优分类线就成为最优分类面[8,9]。

设线性可分样本集为(xi,yi)),i=1,2,…,n,x∈Rd,即x是d维特征向量,y∈{+1,-1}是类别标号,d维空间线性判断函数的一般形式为g(x)=w×x+b,分类面方程为:w×x+b=0 (1)

式中w为权向量,b为分类阈值。要求分类面对所有样本正确分类,就是要求它满足:

Yi[w×xi+b]-1≥0,i=1,2,…,n (2)

满足上述条件且使||w||2最小的分类面就叫做最优分类面, H1,H2上的训练样本点,也就是使式(2)中等号成立的样本点,称作支持向量。解这个最优化问题后得到的最优分类函数是:

在学习样本是线性不可分,但却是非线性可分的情况下,可以通过非线性变换把学习样本变换到高维空间,使其在高维空间里是线性可分的。用核函数 K(x,y)代替原来的点积(x·y),Mercer定理指出,核函数 K(x,y)通过与其相联系的非线性变换Φ隐含地把特征向量映射到高维特征空间,使得学习样本成为线性可分的。常用的核函数有:

图像特征选取

手语图像特征的选取,会直接影响到识别的效果,因此在表示图像的不同视觉特征时本文同时提取全局视觉特征和局部视觉特征。为了避免图像分割工具可能带来的问题,在特征提取时不进行图像分割。在研究中,将提取图像的以下特征:(1)7维不变矩特征量,作为图像整体形状描述的特征向量(2)用Gabor小波提取48维的纹理特征,以表示图像的整体结构属性[10];(3)提取一定数量的兴趣点及它们的SIFT特征[11],以表示图像的局部结构特征与所包含目标的大致形状。实验表明,全局和局部视觉特征可以有效的表示出图像的主要视觉特征。

Hu不变矩特征量

利用矩不变量进行形体识别是模式识别中的一种重要的方法, Hu在1961年首先提出了矩不变量的概念。Hu首先提出代数不变矩的概念,并给出了一组基于通用矩组合的代数矩不变量。这些矩具有平移、尺度和旋转不变性,被称为Hu’s矩。

对于连续灰度函数 f(x, y),它的(p + q)阶二维原点矩Mpq 的定义为:

假设 f(x, y)为分段连续的有界函数,并且在x,y平面上有限区域内有非零值。根据唯一性定理,它的各阶矩存在且唯一地被 f(x, y)确定,反过来,f(x, y)也唯一地被它的各阶矩确定。

此外,还可以定义 f(x, y)的(p + q)阶中心矩μpq 为:

Hu首先提出了不变矩,他给出了连续函数矩的定义和关于矩的基本性质,证明了有关矩的平移不变性、旋转不变性以及比例不变性等性质,具体给出了具有平移不变性、旋转不变性和比例不变性的七个不变矩的表达式。

七个不变矩由二阶和三阶中心矩的线性组合构成,具体表达式如下:

实验中,使用了全部的7Hu不变矩特征量作为手语图像整体形状描述的特征向量。形成特征空间(M1, M2, M3, M4, M5, M6, M7),如表1所示。

表1手语字母X,Y,Z的7Hu矩分量

SIFT特征

David G.Lowe在2004年总结了现有的基于不变量技术的特征检测方法,并正式提出了一种基于尺度空间的、对图像缩放、旋转甚至仿射变换保持不变性的图像局部特征描述算子-SIFT算子[6,11],即尺度不变特征变换。

SIFT算法首先在尺度空间进行特征检测,并确定关键点(Keypoints)的位置和关键点所处的尺度,然后使用关键点邻域梯度的主方向作为该点的方向特征,以实现算子对尺度和方向的无关性。

Lowe在图像二维平面空间和DoG(Difference of Gaussian)尺度空间中同时检测局部极值以作为特征点,以使特征具备良好的独特性和稳定性。DoG算子定义为两个不同尺度的高斯核的差分,其具有计算简单的特点,是归一化LoG (Laplacian of Gaussian)算子的近似。DoG算子如下式所示:

对于图像上的点,计算其在每一尺度下DoG算子的响应值,这些值连起来得到特征尺度轨迹曲线。特征尺度曲线的局部极值点即为该特征的尺度。尺度轨迹曲线上完全可能存在多个局部极值点,这时可认为该点有多个特征尺度。

一幅图像SIFT特征向量的生成算法总共包括4步:

(1)尺度空间极值检测,初步确定关键点位置和所在尺度。

(2)通过拟和三维二次函数以精确确定关键点的位置和尺度,同时去除低对比度的关键点和不稳定的边缘响应点(因为DoG算子会产生较强的边缘响应),以增强匹配稳定性、提高抗噪声能力[6,11]。

(3)利用关键点邻域像素的梯度方向分布特性为每个关键点指定方向参数,使算子具备旋转不变性。

式(14)为(x,y)处梯度的模值和方向公式。其中L所用的尺度为每个关键点各自所在的尺度。

(4)生成SIFT特征向量。 首先将坐标轴旋转为关键点的方向,以确保旋转不变性。接下来以关键点为中心取8×8的窗口。然后在每4×4的小块上计算8个方向的梯度方向直方图,绘制每个梯度方向的累加值,即可形成一个种子点。手语字母图像的SIFT特征提取如图2所示。

图2 (a)手语字母J原图 (b)对(a)提取SIFT特征向量

实验

本文从视频中采集了中国手语字母表中的30个手语字母的图像,30组,每组图像195幅,共5850幅图像作为实验图像。每组的前50幅作为正例训练样本,从其他29组中各选取5幅共145幅作为反例训练样本。每类图像除选作正例的50图像外,剩余的145幅作为测试图像。实验中首先提取图像的7维不变矩特征量,48维Gabor纹理特征,128维SIFT特征作为图像全局和局部特征描述。然后分别采用两种不同核函数(Linear kernel, Radical Basis Function)的SVMs分类器进行训练,对中国手语字母表中的30个手语字母图像的识别结果如表2所示。

表2 30个中国手语字母的识别结果

基于线性核函数的SVM平均识别率为95.556%,基于径向基核函数的SVM平均识别率为83.1282%。实验表明,采用径向基核函数的SVM识别率普遍低于采用线性核函数的SVM。

结语

本文提出了一种采用7Hu不变矩特征量等多种图像特征相融合的SVMs手语识别方法。实验表明,在手语识别中,采用图像全局和局部特征相结合的方法,可获得较高的识别率,为手语识别方法的早日推广应用提供了理论依据。

责任编辑:gt

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 计算机
    +关注

    关注

    19

    文章

    6649

    浏览量

    84524
  • 机器
    +关注

    关注

    0

    文章

    756

    浏览量

    40491
收藏 人收藏

    评论

    相关推荐

    创意耳纹识别系统研究与实现方案

    基于FPGA与传感技术的耳纹识别系统研究与实现。
    发表于 07-24 09:13 778次阅读
    创意耳纹<b class='flag-5'>识别系统</b>的<b class='flag-5'>研究</b>与实现方案

    车辆牌照识别系统的原理及算法研究

    车辆牌照识别系统的原理及算法研究本文对车辆牌照自动识别系统中图象预处理、特征提取和字符识别等环节涉及的新算法、新技术以及系统整体设计做了一个
    发表于 12-02 12:59

    FPGA和Nios_软核的语音识别系统研究

    FPGA和Nios_软核的语音识别系统研究引言语音识别的过程是一个模式匹配的过程 在这个过程中,首先根据说话人的语音特点建立语音模型,对输入的语音信号进行分析,并提取所需的语音特征,在此基础上建立
    发表于 08-11 11:47

    【UT4418申请】手势识别系统

    申请理由:我是一名嵌入式软件工程师 。 大学花了很长一段时间开发一套手势识别系统。该系统是基于Xilinx 的 Zedboard开发板。Zedboard中包含有Cotex-A9处理器 。现在回忆起
    发表于 09-23 14:54

    基于BP神经网络的手势识别系统

    的高效性有机地结合起来。研究新型的人机交互工具能够打破这一障碍。当虚拟现实越来越被人熟知时,可以使用手势作为载体进行人机交互。  目前,手势输入的种类有基于图像的和基于加速度传感器的。由于图像的
    发表于 11-13 16:04

    射频识别系统的天线有哪些分类?

    射频识别(RFID)技术是一种非接触的自动识别技术,其应用范围不断扩大。而作为射频识别系统中不可或缺的重要一环,电子标签天线的设计、生产、测试等均是未来研究的主要内容之一。
    发表于 08-14 07:11

    嵌入式系统实时交互的手势识别方法是什么?

    过程中的变化以及周围环境的干扰都会影响到手势识别和理解,因此手势识别是计算机视觉和人机交互领域中的重要问题,如何将这种交互方式更好地在嵌入
    发表于 03-31 08:21

    【创龙TLZ7x-EasyEVM评估板试用连载】基于ZYNQ的动态手势识别系统

    项目名称:基于ZYNQ的动态手势识别系统试用计划:申请理由:申请人为研究生,本科期间参加过多个国家级省市级竞赛并获得多项荣誉,拥有丰富的Xilinx嵌入式系统的开发经验。已对zynq平
    发表于 04-23 10:33

    介绍一个基于单片机的手势识别系统

    文章目录1 简介2 实现效果3 使用场景4 参数说明5 注意事项6 最后1 简介Hi,大家好,这里是丹成学长,今天向大家介绍一个学长做的单片机项目基于单片机得手势识别系统大家可用于 课程设计 或
    发表于 11-19 09:19

    如何实现基于MEMS加速度传感器的手势识别系统的设计?

    如何实现基于MEMS加速度传感器的手势识别系统的设计?
    发表于 12-20 07:55

    划片机视觉识别系统设计原理分析

    划片机视觉识别系统设计原理分析 1 视觉识别系统构成 划片机的视觉识别系统是以计算机为主的实
    发表于 04-21 09:20 2872次阅读
    划片机<b class='flag-5'>视觉</b><b class='flag-5'>识别系统</b>设计原理分析

    基于肌点信号的识别手势系统

    设备及智能家居方面,但其识别准确度不高,不易识别三维空间的动作,且很少能应用于医疗或残疾人辅助设施上。针对这一现象,笔者将手势识别与人体白身产生的肌电信号相结合,来实现基于肌电信的
    发表于 11-01 17:49 7次下载
    基于肌点信号的<b class='flag-5'>识别</b><b class='flag-5'>手势</b><b class='flag-5'>系统</b>

    史上最牛高速手势识别系统解决方案

    以Xilinx公司Spartan 6系列FPGA为核心器件的手势识别系统设计的方案,采用FPGA芯片的内置DSP硬核作为手势识别模块的核心,负责图像
    发表于 09-28 16:14 523次阅读

    手势识别系统的程序和资料说明

    本项目在python 2.7上使用opencv实现了一个手势识别手势识别系统。一种基于直方图的方法被用来从背景图像中分离出一只手。背景消除技术被用来获得最佳的结果。然后对检测到的手进
    发表于 04-28 08:00 12次下载
    <b class='flag-5'>手势</b><b class='flag-5'>识别系统</b>的程序和资料说明

    计算机视觉中手语识别研究

    机交互方式,方便聋哑人对计算机等常用信息设备的使用。目前手语识别可以分为基于视觉(图像)的识别系统和基于数据手套(佩戴式设备)的识别系统。基于视觉
    的头像 发表于 04-14 16:11 821次阅读