一种手势识别方法技术

技术编号：21892776 阅读：33 留言：0更新日期：2019-08-17 14:51

本发明专利技术公开了一种手势识别方法，首先，对手势图像做预处理，得到固定尺寸的手势图像。其次，分别使用针对全局和针对局部地特征提取网络获取手势图像的不同特征。其中用于提取局部特征的网络完全由卷积层组成，残差网络结构被用于融合低层与高层信息，输出大尺寸特征图；用于提取全局特征的网络由卷积和池化组成，其池化层输出与局部特征提取网络相应输出相融合作为下层卷积输入，最终输出小尺寸、大感受野的特征图。最终，检测网络1和2分别在大尺寸和小尺寸特征图上检测手势目标，二者检测结果经非极大值抑制处理后输出分类结果。本发明专利技术有效减轻了梯度消失和神经元死亡的程度。

A Gesture Recognition Method

全部详细技术资料下载

【技术实现步骤摘要】
一种手势识别方法
本专利技术涉及人机交互研究领域，具体是指一种手势识别方法。
技术介绍
近年来随着科技水平的日益提高，人与机器人的交互场景更加丰富多样，传统基于鼠标和键盘的交互方式已经难以满足人与机器人交互的需求。基于手势的交互具有任务间切换时间短，交互方式自然友好的优点，可满足人们对人机交互的需求，而手势识别技术是其核心内容。目前手势识方法主要分基于传感器和基于视觉两种，其中基于传感器的手势识别需要昂贵的辅助设备，交互方式不够友好自然，难以满足实际人机交互中的需求，而基于视觉的手势识别方法在复杂背景、不同光照下识别能力不稳定。中国专利201810542738.9公开了一种手势识别方法及装置，用以提高手势识别的准确率，减少误操作。所述方法包括：当检测到触摸操作时，检测触点的运动轨迹；触点的运动轨迹用于表示控制终端设备的手势；检测触点的当前移动速率；根据当前移动速率与运动轨迹识别手势。中国专利201510552869.1公开了一种3D手势识别方法，包括以下步骤：S1、物理硬件对用户手势的3D坐标数据进行实时采集；S2、物理硬件对采集到的3D坐标数据进行预处理，形成反馈数据；S3、数据处理软件对反馈数据进行识别处理；S4、系统输出数据识别处理结果。本专利技术可以有效解决视频手势识别需处理大量的数据，过程复杂，软件处理效率低的问题，直接根据三维空间坐标进行有效的动作判断过程，使处理更为高效。在手势动作产生时，首先在物理硬件中对其进行预判断，然后再把动作可能的结果交给软件进行处理，最后将软件处理的结果与硬件预判断的手势结果进行印证，进一步提高了手势动作的识别率。中...

【技术保护点】
1.一种手势识别方法，其特征在于：该方法包括：设计并制作针对人机交互场景的手势数据集；构建深度卷积网络并训练数据集以获取参数权重，摄像头将手势图像输入网络与参数权重做相应运算获得手势识别结果；根据实际人机交互场景选择手势数据集的背景、手势与摄像头距离；在选定背景下使用摄像机捕捉手势图像，剔除手势图像中过度模糊、存在歧义的手势；使用LabelImage标注手势位置和手势类别，完成手势数据集的制作；一个深度卷积网络，其核心为：针对局部特征提取的卷积网络；针对全局特征提取的卷积网络；激活函数Lrelu。

【技术特征摘要】
1.一种手势识别方法，其特征在于：该方法包括：设计并制作针对人机交互场景的手势数据集；构建深度卷积网络并训练数据集以获取参数权重，摄像头将手势图像输入网络与参数权重做相应运算获得手势识别结果；根据实际人机交互场景选择手势数据集的背景、手势与摄像头距离；在选定背景下使用摄像机捕捉手势图像，剔除手势图像中过度模糊、存在歧义的手势；使用LabelImage标注手势位置和手势类别，完成手势数据集的制作；一个深度卷积网络，其核心为：针对局部特征提取的卷积网络；针对全局特征提取的卷积网络；激活函数Lrelu。2.根据权利要求1所述的一种手势识别方法，其特征在于：“特征提取网络1”全部由卷积层组成以最大程度保留局部相关信息，直接融合低层特征图与高层特征图以使低层特征图具备参数更新能力，“特征提取网络1”实现了对较远距离手势特征的提取；“特征提取网络2”使用卷积层提取手势特征，使用池化操作降低特征图维度加速训练，借助参数复用的方法将“特征提取网络1”获取的部分细节特征信息作为输入，以较小的计算代价有效实现了远距离手势的特征提取。3.根据权利要求1所述的一种手势识别方法，其特征在于：对于每层卷积的输入做正则化处理，把上层非线性函数映射后趋向于极限饱和区的输入转换为正态分布，输出落入非线性激活函数的敏感区间。4.根据权利要求1所述的一种手势识别方法，其特征在于：每层卷积中加入所设计的新型激活函数。5.根据权利要求1所述的一种手势识别方法，其特征在于：设计了激活函数Lrelu，如公式(1)：其中x是非线性激活函数的输入；e是自然常数；f(x)是输入经过非线性函数映射后的结果；Lrelu具有可微性、非线性、单调性，有效缓解了伴随深度加深出现的问题，提高了手势识别精度。6.根据权利...

【专利技术属性】
技术研发人员：曹政才，李清林，许潇文，谢红玉，
申请(专利权)人：北京化工大学，
类型：发明
国别省市：北京,11

全部详细技术资料下载我是这个专利的主人