【技术实现步骤摘要】
一种远距离手势识别方法及装置
[0001]本专利技术涉及计算机视觉和手势识别领域,具体涉及一种远距离手势识别方法及装置。
技术介绍
[0002]手势识别在人与人之间的交流和人与机器之间的交互中发挥着重要的作用,在手语识别和自然人机交互领域中有着广阔的应用前景。由于手势变化复杂多样,持续时间也具有很大的不确定性,再加上拍摄角度和距离以及光照条件的影响,手势的检测和识别是一项挑战性很大的任务。
[0003]手势的识别需要考虑手部形状、位置的变化,人工设计的特征描述子很难覆盖到手势的细节特征,而深度神经网络具有很好的特征表征能力,在图像和视频视觉任务上显示出其强大的优势。因此,目前主流的手势识别方法是基于深度神经网络学习表达手势复杂的空间形态特征和时序运动特征。卷积神经网络(Convolutional Neural Networks,CNNs)被广泛用于提取图像的空间特征。对于时序运动特征的表示,主要有三种方法:第一种是基于光流(opticalflow)、运动向量,这种方式计算量非常大,而且易受光照和遮挡情况影响,鲁棒性差;第二种是使用循环神经网络(Recurrent Neural Networks,RNNs)提取时序特征,这种方式将卷积神经网络提取到的图像特征输入到循环神经网络中提取运动特征,模型庞大复杂,优化困难,而且往往需要对原始视频进行大幅度的下采样,这样容易丢失关键信息;第三种是基于3D卷积,使用三维卷积核在两个空间维度和一个时间维度上进行卷积,同时提取空间特征和时序特征,这种方式在能够很好的建模和融合时
【技术保护点】
【技术特征摘要】
1.一种远距离手势识别方法,其步骤包括:获取目标视频中帧p1的手部位置h1,并基于所述手部位置h1,计算帧p1的手势估计区域q1;获取目标视频中帧p
i
的手部位置h
i
,并当所述手部位置h
i
落在帧p
i
‑1的手势估计区域q
j
之内时,将所述手势估计区域q
j
作为所述帧p
i
的手势估计区域,否则基于所述手部位置h
i
,计算帧p
i
的手势估计区域q
j+1
;基于手势估计区域q
j
切分所述目标视频,得到若干视频流s
t
;对各所述视频流s
t
进行手势识别,得到所述目标视频的手势识别结果。2.如权利要求1所述的方法,其特征在于,所述获取目标视频中帧p1的手部位置h1,包括:在手部位置训练集上对YOLO V4 Tiny检测模型进行监督训练,得到手部检测器;将所述帧p1的图像输入所述手部检测器,得到所述手部位置h1。3.如权利要求1所述的方法,其特征在于,所述基于所述手部位置h1,计算帧p1的手势估计区域q1,包括:以所述手部位置h1为中心,分别向外扩展r
w
倍手部宽度及r
h
倍手部高度的矩形区域。4.如权利要求1所述的方法,其特征在于,所述基于手势估计区域q
j
切分所述目标视频,得到视频流s
t
,包括:在各帧p
i
中获取若干关键帧;使用同一手势估计区域q
j
中的关键帧,构建视频流s
t
。5.如权利要求4所述的方法,其特征在于,所述在各帧p
i
中获取关键帧,包括:针对具有同一手势估计区域q
j
的帧p
i
与帧p
i
‑1,分别将所述手势估计区...
【专利技术属性】
技术研发人员:刘丹,张立波,武延军,
申请(专利权)人:中国科学院软件研究所,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。