一种基于图像空间金字塔特征包的手势识别方法技术

技术编号:10663706 阅读:367 留言:0更新日期:2014-11-20 10:09
本发明专利技术涉及一种基于图像空间金字塔特征包的手势识别方法,包括以下步骤:对带有手势的图像进行手势分割;对分割出来的手势图像进行特征提取和描述;利用提取的特征训练直方图相交核支持向量机,并根据支持向量机得到该手势图像的特征向量所属的手势类别,实现手势识别。本发明专利技术利用空间金字塔算法与特征包算法相结合,描述了手势图像特征点的全局数量特性与分布特性;利用直方图相交核支持向量机实现了手势特征的分类,进而实现了手势识别;提高了识别多类相似手势的识别率。

【技术实现步骤摘要】
一种基于图像空间金字塔特征包的手势识别方法
本专利技术属于图像处理与模式识别领域,具体涉及一种基于图像特征提取与支持向量机的手势识别方法。
技术介绍
现代人机交互方式正朝着一种更和谐、自然地方向发展。人机交互研究的一个热点问题是使得用户可以方便、自然地使用人类所熟知的方式使用计算机。手势语言具有简洁、直观的特点,是人机交互方式的一种有效扩展,在智能家电控制,机器人控制,手语识别,计算机游戏控制等方面有着广泛的应用。手势识别的关键技术在于手势图像的特征提取与手势识别两个步骤。当前最常用的图像特征提取的方法有利用边缘特征像素点特征提取,利用傅里叶算子描述手势特征,利用手掌手指的空间分布特性表示手势,利用基于图像特征包算法的手势图像特征提取。在手势特征提取阶段,现有技术的主要问题为:(1)利用边缘特征像素点特征提取。不能对尺度、旋转、光照变化保持不变性,必须收集各种情况下的手势训练样本。详见:张国良,吴江琴,高文等.基于Hausdorff距离的手势识别[J].吉林图象图形学报,2002,7(7):1144-1150(2)利用傅里叶算子描述手势特征和利用手掌手指的空间分布特性表示手势,这两种方法解决了特征对尺度、旋转、光照的适应性,但运算量大,运算时间消耗长。详见:葛元,郭兴伟,王林泉.傅立叶描述子在手势识别中的应用[J].计算机应用与软件,2005,6(22):91-93张汗灵,李红英,周敏.融合多特征和压缩感知的手势识别[J].湖南大学学报(自然科学版),2013,3(40):87-92(3)利用基于图像特征包(BagofFeatures,BoF)算法的提取手势图像特征。该算法较为有效。缺点是该算法只描述了手势图像的特征点的数量信息,而忽略了特征点的空间分布特性。不能很好的识别相似的手势。详见:陈小波,谢秋生.基于BagofFeatures的手势识别[J].计算机工程与设计,2013,3(34):983-988当前最常用的手势识别的方法有:(1)基于模板匹配的方法。(2)基于Adaboost的方法。通过一系列弱分类器构成一个强分类器,实现手势识别。(3)基于支持向量机的方法。手势识别通常为线性不可分的样本,支持向量机解决线性不可分样本的方法是通过核函数,将线性不可分样本通过核函数映射到线性可分的空间上,实现样本分类。存在的主要技术问题为:(1)模板匹配需要大量训练图像,计算速度慢。(2)Adaboost分类器设计复杂,计算量大,计算速度慢。详见:丁友东,庞海波,吴学纯等.一种用于手势识别的局部均值模式纹理描述子[J].应用科学学报,2013,(5):526-532。(3)支持向量机能够很好的解决线性不可分,小样本的分类问题。但选用的核函数及核函数的参数对识别结果影响较大。
技术实现思路
为了克服上述现有技术存在的不足,本专利技术设计了一种基于图像特征提取与支持向量机的手势识别方法。本专利技术解决其技术问题所采用的技术方案是:一种基于图像空间金字塔特征包的手势识别方法,包括以下步骤:对带有手势的图像进行手势分割;对分割出来的手势图像进行特征提取和描述;利用提取的特征训练直方图相交核支持向量机,并根据支持向量机得到该手势图像的特征向量所属的手势类别,实现手势识别。所述对分割出来的手势图像进行特征提取和描述包括以下步骤:(2.1)将手势图像构造成三层手势图像,第一层将整张手势图像划分为16个子块,第二层将整张手势图像划分为4个子块,第三层为整张手势图像;(2.2)将第三层的整张手势图像均匀分成若干个像素为16×16的小块,对每个小块生成尺度不变特征变换描述子;(2.3)将特征变换描述子用聚类的方法生成多个聚类中心,以聚类中心为视觉词汇,所有的聚类中心构成特征包;(2.4)对每一层手势图像的每一块进行特征包量化,得到每层图像的特征向量;(2.5)将三层的特征向量融合成一个新的向量,用于训练直方图相交核支持向量机。所述将特征变换描述子用聚类的方法生成多个聚类中心包括以下步骤:①从手势样本库的特征向量空间中,任取一个向量为第一个初始聚类中心其中,为每个特征点的SIFT特征描述向量,m为从手势样本库的所有手势图像中提取的特征点个数;②任取一个其它向量,如果该向量所得概率为目前选取向量的所得概率中的最大概率时这个向量就为下一个初始聚类中心其中为选取向量到目前已选出的所有聚类中心的最近距离;③重复步骤②,直到选出K个初始聚类中心,④计算特征向量空间中剩余的每个特征向量与各聚类中心之间的距离如果满足则该特征向量属于第j个类别即⑤求出新的聚类中心其中F为迭代次数,为属于第j个聚类中心的第i个样本点,nj是属于第j个聚类中心的样本点的个数,计算误差的平方和准则函数⑥判断|Jc(F)-Jc(F-1)|<ξ是否成立;其中,ξ为误差阈值,F为迭代次数;如果不成立,则F=F+1,以cj(F)为初始聚类中心,返回步骤④;如果成立,则此时所得的K个聚类中心为最终聚类中心。所述利用提取的特征训练直方图相交核支持向量机具体为通过核函数将线性不可分样本映射到线性可分的高维空间,并得到分类超平面:其中,核函数为其中,H1、H2为图像的直方图;h1i、h2i(i=1,2,...m)是直方图H1、H2每个类的值;拥有最大间隔分类线的权向量xi为任一支持向量,yi为类别标签;a*为Lagrange乘子的最优解,通过将二次规划问题采用SMO算法求解得到;x为待输入样本,n为样本特征向量维数。所述根据支持向量机得到该手势图像的特征向量所属的手势类别包括以下步骤:将分类超平面作为判别函数对输入的新的向量进行判别;如果则判别输入样本为+1类,否则为-1类;其中,xi为任一支持向量,xT为输入待判别特征向量,yi为类别标签;ai*为Lagrange乘子的最优解,通过将二次规划问题采用SMO算法求解得到。本专利技术具有以下有益效果及优点:1.本专利技术利用空间金字塔算法与特征包算法相结合,描述了手势图像特征点的全局数量特性与分布特性,更准确的描述手势图像特征,总体方法能够提高多类相似手势的识别率。2.本专利技术通过空间金字塔特征包算法提取图像特征的算法,实现了对图像全局特征和局部细节特征的描述,生成的特征描述子同时具备对尺度、旋转、光照变化保持不变性。3.本专利技术的空间金字塔特征包算法具备了特征包算法能同时描述图像局部特征和全局数量特征优点,改善了特征包算法不能对特征点分部信息的缺点。4.本专利技术设计了手势特征提取方法,利用一种新的核函数实现支持向量机手势识别。直方图相交核作为支持向量机的核函数优点在于能正确分类线性不可分、小样本的样本,且直方图相交核不用像其它核函数那样选择参数,方便了分类器的设计。5.本专利技术利用直方图相交核支持向量机实现了手势特征的分类,进而实现了手势识别。附图说明图1为本专利技术的算法流程图。图2为图像空间金字塔特征包算法示意图。图3为图像空间金字塔特征包算法流程图。图4为SIFT特征描述子生成过程示意图。图5为支持向量机的原理图。图6为十种手势的识别率混淆矩阵示意图。具体实施方式下面结合实例对本专利技术做进一步的详细说明。本专利技术的工作流程包括:首先对所有图像实施光照补偿并利用预先统计的肤色信息设定YCrCb颜色空间各分量的阈值,实现手势分割。然后,通过将原图像分割成不本文档来自技高网
...
一种基于图像空间金字塔特征包的手势识别方法

【技术保护点】
一种基于图像空间金字塔特征包的手势识别方法,其特征在于包括以下步骤:对带有手势的图像进行手势分割;对分割出来的手势图像进行特征提取和描述;利用提取的特征训练直方图相交核支持向量机,并根据支持向量机得到该手势图像的特征向量所属的手势类别,实现手势识别。

【技术特征摘要】
1.一种基于图像空间金字塔特征包的手势识别方法,其特征在于包括以下步骤:对带有手势的图像进行手势分割;对分割出来的手势图像进行特征提取和描述;利用提取的特征训练直方图相交核支持向量机,并根据支持向量机得到该手势图像的特征向量所属的手势类别,实现手势识别;所述对分割出来的手势图像进行特征提取和描述包括以下步骤:(2.1)将手势图像构造成三层手势图像,第一层将整张手势图像划分为16个子块,第二层将整张手势图像划分为4个子块,第三层为整张手势图像;(2.2)将第三层的整张手势图像均匀分成若干个像素为16×16的小块,对每个小块生成尺度不变特征变换描述子;(2.3)将特征变换描述子用聚类的方法生成多个聚类中心,以聚类中心为视觉词汇,所有的聚类中心构成特征包;(2.4)对每一层手势图像的每一块进行特征包量化,得到每层图像的特征向量;(2.5)将三层的特征向量融合成一个新的向量,用于训练直方图相交核支持向量机;所述将三层的特征向量融合成一个新的向量具体为将加权后的三层特征向量首尾相连组成一个新的向量。2.根据权利要求1所述的一种基于图像空间金字塔特征包的手势识别方法,其特征在于所述将特征变换描述子用聚类的方法生成多个聚类中心包括以下步骤:①从手势样本库的特征向量空间中,任取一个向量为第一个初始聚类中心其中,为每个特征点的SIFT特征描述向量,m为从手势样本库的所有手势图像中提取的特征点个数;②任取一个其它向量,如果该向量所得概率为目前选取向量的所得概率中的最大概率时这个向量就为下一个初始聚类中心其中为选取向量到目前已选出的所有聚类中心的最近距离;③重复步骤②,直到选出K个初始聚类中心,④计算特征向量...

【专利技术属性】
技术研发人员:曹江涛余思泉李平
申请(专利权)人:辽宁石油化工大学
类型:发明
国别省市:辽宁;21

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1