【技术实现步骤摘要】
基于自适应空间监督的动态手势识别方法
本专利技术涉及视频分析与模式识别领域,具体涉及一种动态手势识别方法。
技术介绍
伴随着人机交互方式的快速革新,手势识别以其广泛的应用性使得其有着重要的研究意义,近年来基于计算机视觉的手势识别逐渐成为了研究热点。手势识别作为一种新型的人机交互方式,可以取代原有的传统触摸交互方式,在家庭娱乐、智能驾驶、教学应用、智能穿戴等多个领域都有着重要的应用前景。手势识别是通过数学算法来识别人类手势动作的一个议题,手势可以分为静态手势和动态手势。静态手势识别往往考虑某一时刻手的姿态信息,多利用单帧图片中的手的形状或关键点的静态坐标,无法考虑时序问题,在实际应用场景中有很大的局限性。而动态手势识别考虑手势的时序关系,结合帧与帧之间的相关性,多采用模型参数空间的轨迹信息,应用面广,可识别的手势类别丰富,实际应用性高。
技术实现思路
针对传统的动态手势识别中手势跟踪算法在目标短暂丢失情况下跟踪效果差的缺点以及长序列模型依赖问题,本专利技术提出一种基于空间监督的动态手势识别算法,利用 ...
【技术保护点】
1.基于自适应空间监督的动态手势识别方法,其特征在于,该方法首先通过卷积网络模型对视频序列进行高层视觉特征提取,并通过YOLO模型得到手势区域的位置信息,将位置信息转化为特征向量后,将手势位置特征和高层视觉特征分别输入到双流长短期记忆网络模型(LSTM)对手势轨迹进行时序模型跟踪,以手势位置特征作为主要跟踪环节,高层视觉特征对识别结果进行空间监督,并利用YOLO输出结果中的平均置信度作为自适应融合控制器参数,实现自适应融合权重调节,促进跟踪网络的回归,实现手势快速跟踪识别。/n
【技术特征摘要】
1.基于自适应空间监督的动态手势识别方法,其特征在于,该方法首先通过卷积网络模型对视频序列进行高层视觉特征提取,并通过YOLO模型得到手势区域的位置信息,将位置信息转化为特征向量后,将手势位置特征和高层视觉特征分别输入到双流长短期记忆网络模型(LSTM)对手势轨迹进行时序模型跟踪,以手势位置特征作为主要跟踪环节,高层视觉特征对识别结果进行空间监督,并利用YOLO输出结果中的平均置信度作为自适应融合控制器参数,实现自适应融合权重调节,促进跟踪网络的回归,实现手势快速跟踪识别。
2.根据权利要求1所述的基于自适应空间监督的动态手势识别方法,其特征在于:具体包括以下步骤:
步骤1:读取动态手势视频序列;
步骤2:基于卷积层神经网络模型,分别提取视频序列中每帧图像的高层视觉特征,通过第一个全连接层输出一组视觉特征特征向量U用来训练LSTM模型;
步骤3:利用手势检测器对视频序列中的标志手势区域进行检测定位;
步骤4:将步骤3中得到的手势区域特征转化为一组新的特征特征向量V用来训练新的LSTM模型;
步骤5:设计一个自适应融合控制器M用来控制决策级融合权重,并提取步骤4中得到的特征向量V中的置信度信息p作为自适应控制器控制参数;
步骤6:将步骤3、步骤4得到的两组特征向量输入到双流LSTM模型,结合前后帧特征信息,建立时序模型,对手势区域进行跟踪识别;
步骤7:利用步骤5得到的自适应控制器控制双流LSTM模型做决策级融合;
步骤:8:根据LSTM网络的融合结果得到动态手势的识别结果。
3.根据...
【专利技术属性】
技术研发人员:姬晓飞,张旭,李晨宇,王艳辉,田晓鸥,
申请(专利权)人:沈阳航空航天大学,
类型:发明
国别省市:辽宁;21
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。