当前位置: 首页 > 专利查询>四川大学专利>正文

一种基于骨骼和轮廓特征融合的步态识别方法技术

技术编号:34932396 阅读:20 留言:0更新日期:2022-09-15 07:28
本发明专利技术提供了一种基于骨骼和轮廓特征融合的步态识别方法,融合了行人轮廓图识别方法和骨骼关键点识别方法的优点,先提取行人骨骼关键点特征和行人轮廓图特征,再将其送入神经网络,在网络中间进行融合,实现基于步态的行人识别;本方法可解决步态识别中易受服装、视角和携带物等因素影响识别效果的问题,使得处于携带物、服装、视角等因素影响下的步态识别精度有了显著提升,具有识别精度高、鲁棒性强等优点。等优点。等优点。

【技术实现步骤摘要】
一种基于骨骼和轮廓特征融合的步态识别方法


[0001]本专利技术属于计算机视觉领域,尤其涉及一种基于骨骼和轮廓特征融合的步态识别方法。

技术介绍

[0002]步态识别通常是指根据行人行走时的步态来识别来行人的过程,是计算机视觉领域一个重要的研究和应用方向,广泛应用于场景监控、行人识别等领域的视频分析,具有广阔的应用前景和使用价值。
[0003]步态识别技术可分为基于模型的方法、基于行人轮廓图的方法、基于步态能量图的方法、基于步态熵图的方法、基于骨骼关键点的方法等类别。
[0004]基于行人轮廓图的方法是一种常用方法,它通过背景分离或实例分割技术对视频中的行人进行实例提取,生成行人轮廓图,然后通过卷积神经网络对步态特征进行提取和识别;该方法具有较好的识别效果,但在拍摄角度、行人衣着或携带物等发生变化时,识别率会明显下降。
[0005]基于骨骼关键点的方法是另一种常用方法,它通过姿态估计方法来进行骨骼关键点信息提取,通过对关键点运动变化的识别来实现对行人步态的识别;该方法对行人衣着打扮具有较高的鲁棒性;但是在受遮挡时识别率也会受到严重影响。
[0006]为了解决步态识别中易受服装、视角和携带物等因素影响识别效果的问题,考虑到多模态特征融合具有鲁棒性强和稳定性好等优点,本专利技术提出一种多模态特征融合的步态识别方法,先提取行人骨骼关键点特征,以及行人轮廓图特征,再将其送入神经网络,在网络中间进行融合,可实现的基于步态的行人识别;该方法具有识别精度高、鲁棒性强等优点。

技术实现思路
r/>[0007]一种基于骨骼和轮廓特征融合的步态识别方法,其特征在于,包括以下步骤。
[0008]步骤1,采用基于神经网络的姿态估计算法对视频进行处理,得到每帧图像中的行人骨骼关键点位置,包括:基于神经网络的姿态估计算法,采用具有并行的多子网络结构的特征提取模型,使用骨骼关键点的高斯热力图作为标签进行模型训练;最后通过寻找高斯热力图中的峰值点来确定行人骨骼关键点位置。
[0009]步骤2,使用骨骼关键点位置数据进行计算,生成关键点移动速度、骨骼长度与角度数据;骨骼关键点的位置、速度、骨骼长度与角度统称为骨骼关键点数据。
[0010]步骤3,通过图卷积神经网络对行人骨骼关键点数据进行特征提取,包括:将骨骼关键点位置、速度、骨骼长度与角度这三组骨骼关键点数据,作为三个输入分别顺序经过批正则化模块、初始化模块、两个带注意力机制的图卷积神经网络模块,进行特征提取;然后在网络的中部进行融合,最后通过一条共享的主干网络,即两个带注意力机
制的图卷积神经网络模块,生成最终的行人骨骼关键点特征图。
[0011]步骤4,采用基于神经网络的实例分割方法对原始视频数据进行处理,生成行人的轮廓图,包括:采用轻量化的实例分割模型对原始视频中的每一帧进行特征提取,得到相应的行人轮廓图。
[0012]步骤5,对行人轮廓图进行归一化处理,包括:剪除垂直方向上的多余像素并放缩到合适的尺寸,剪除水平方向上多余的像素得到最终的图片尺寸。
[0013]步骤6,采用局部轮廓特征提取器对归一化后的行人轮廓图进行特征提取,并使用时间特征聚合注意力模块对其进行特征压缩,包括:时间特征聚合注意力模块通过最大值函数、均值函数和中值函数三种基础函数对输入进行全局特征收集,然后在时间维度上进行复制并将三者拼接到一起;最后通过1*1的卷积进行通道压缩并生成注意力图,得到最终的行人轮廓特征图。
[0014]步骤7,将行人骨骼关键点特征图和行人轮廓特征图进行拼接,使用分离全连接层和局部注意力机制引导两者融合,生成最终的步态特征。
[0015]步骤8,使用欧式距离,比对计算生成的步态特征与数据库中的步态特征,选取出距离最小的步态特征对应的行人,作为最终的识别结果。
[0016]本方法融合了行人轮廓图识别方法和骨骼关键点识别方法的优点,将行人轮廓图特征和骨骼关键点特征送入神经网络,在网络中间进行融合,使得处于携带物、服装、视角等因素影响下的步态识别精度有了显著提升,具有良好的鲁棒性。
附图说明
[0017]图1为本专利技术方法的流程示意图。
[0018]图2为骨骼关键点及其高斯热力图示意图。
[0019]图3为COCO数据集行人关键点分布图。
[0020]图4为骨骼关键点数据包含的三组特征。
[0021]图5为使用图卷积神经网络提取行人骨骼关键点特征流程示意图。
[0022]图6为对行人轮廓图进行归一化处理流程示意图。
[0023]图7为时间特征聚合注意力模块示意图。
具体实施方式
[0024]为了更加清楚地展示本专利技术的目的和技术方案,下面将结合具体的实施过程和附图,对本专利技术的具体实施方式和参数进行更加详细的描述。
[0025]一种基于骨骼和轮廓特征融合的步态识别方法,如图1所示,包含以下步骤。
[0026]步骤1,采用基于HRNet的姿态估计算法对视频进行处理,得到每帧图像中的行人骨骼关键点位置。
[0027]HRNet姿态估计算法,采用具有并行的多子网络结构的特征提取模型,处于最上层分支中的特征图一直保持着高分辨率;使用骨骼关键点的高斯热力图作为标签进行模型训练,网络最终便可生成关键点高斯热力图;最后通过寻找高斯热力图中的峰值点可确定行
人骨骼关键点位置。
[0028]所述使用骨骼关键点的高斯热力图作为标签是指,根据通过高斯函数在骨骼关键点生成热力图;其灰度可以公式表示为:I(x,y)=exp(

((x

xc)^2+(y

yc)^2)/(2*var^2)),其中,(x,y)表示热力图上一个像素点的位置,(xc,yc)表示关键点的位置,^2表示平方,var表示标准差,在本实施例中设定为3。
[0029]用灰度表示的骨骼关键点及其高斯热力图的示意图如图2所示。
[0030]不同的行人关键点数据集标注的行人关键点个数不同,如COCO数据集行人关键点有17个,其分布如图3所示。
[0031]步骤2,使用骨骼关键点位置数据进行计算,生成关键点移动速度、骨骼长度与角度数据,位置、速度、长度与角度这三组特征的示意图如图4所示;其中,将骨骼视为关键点的连线。
[0032]步骤3,通过图卷积神经网络GCN对行人骨骼关键点数据进行特征提取,其流程如图5上方所示,包括:将骨骼关键点位置、速度、骨骼长度与角度这三组骨骼关键点数据,作为三个输入,分别顺序经过批正则化模块(Batch Normal)、初始化模块(Initial Block)、两个带注意力机制的图卷积神经网络(64*48的GCN、48*16的GCN),进行特征提取;然后在网络的中部进行融合,最后经过一条共享的主干网络,即两个带注意力机制的图卷积神经网络(48*64的GCN、64*128的GCN),生成最终的行人骨骼关键点特征图。
[0033]带注意力机制的图卷积神经网络(GC本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于骨骼和轮廓特征融合的步态识别方法,其特征在于,包括以下步骤:步骤1,使用基于神经网络的姿态估计算法对视频进行处理,得到每帧图象中的行人骨骼关键点位置;步骤2,使用骨骼关键点位置数据进行计算,生成关键点移动速度、骨骼长度与角度数据;步骤3,通过图卷积神经网络对行人骨骼关键点数据进行特征提取,生成行人骨骼关键点特征图;步骤4,使用基于神经网络的实例分割方法对原始视频数据进行处理,生成行人的轮廓图;步骤5,对行人轮廓图进行归一化处理;步骤6,采用局部轮廓特征提取器对归一化后的行人轮廓图进行特征提取,并使用时间特征聚合注意力模块对其进行特征压缩;生成行人轮廓特征图;步骤7,将行人骨骼关键点特征图和行人轮廓特征图进行拼接,使用分离全连接层和局部注意力机制引导两者融合,生成最终的步态特征;步骤8,使用欧式距离,比对计算生成的步态特征与数据库中的步态特征,选取出距离最小的步态特征对应的行人,作为最终的识别结果。2.基于权利要求1所述的方法,其特征在于,步骤1所述基于神经网络的姿态估计算法,包括:采用具有并行的多子网络结构的特征提取模型,使用骨骼关键点的高斯热力图作为标签进行模型训练;最后通过寻找高...

【专利技术属性】
技术研发人员:冯子亮单强达许重阳蓝田野潘悦唐玄霜黎光耀董佳乐
申请(专利权)人:四川大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1