一种基于有限监督信息的联合学习步态表征方法技术

技术编号：38220351 阅读：12 留言：0更新日期：2023-07-25 17:51

本发明专利技术公开了一种基于有限监督信息的联合学习步态表征方法，属于深度学习和模式识别技术领域；提出一种同时利用半监督和自监督学习，联合学习步态时空特征表示的新方法，包含两个主要的分支：1)半监督分支中，通过在输入的步态序列中引入序列级形态学扰动，增加数据的多样性，并利用Mean Teacher架构学习鲁棒的特征表示；2)自监督分支中，定义了两个与步态识别任务相关的辅助任务，包括管道掩码重建和片段顺序预测，以加强网络学习相关性特征的能力。本发明专利技术方法将半监督和自监督学习应用于步态识别任务的工作，能够从有限的被标注的步态序列中学习特定的任务特征，并从未被标注的数据中挖掘出强大的通用特征，识别性能得到显著提升。提升。提升。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于有限监督信息的联合学习步态表征方法

[0001]本专利技术属于深度学习和模式识别
，具体涉及一种基于有限监督信息的联合学习步态表征方法。

技术介绍

[0002]步态是一种独特的生物识别特征，步态识别的基本任务是从人体行走时的时间变化中学习互异的不变性特征，其不需要高分辨率的图像，可以远距离，在被识别者毫无感知的情况下进行步态分析。因此，步态识别在安防监控，预防犯罪，维护社会公共安全方面起着关键的作用。然而，在现实世界的场景中，常会受到例如障碍物的遮挡，行人穿大衣和背包，识别时视角的变化等协变量因素的影响，使它们存在较大的对象内差异，这往往会对步态识别的性能带来巨大影响。
[0003]大量基于深度学习的步态识别方法为缓和上述问题提供了有效的解决方案，一类是基于模型的方法，基于模型的方法通过提取人类行走时的姿势信息和身体骨架结构来完成识别任务，但是其难以从远距离采集到的低像素步态图像中检测身体的关键点；另一类是基于外观的方法，也称为基于整体或无模型的方法，如将所有步态轮廓序列压缩成单个步态模版，但是压缩过程中会丢失大量的时间信息和细粒度的空间信息。几乎所有的方法都依赖于标注好的步态序列数据，对大量步态序列进行标注是一个繁琐的任务，它不仅需要消耗大量专家的时间和精力，而且在标注过程中，标注者之间的差异又会在步态数据中引入不确定性。为了减轻对有标签步态数据的依赖，当务之急是开发出只使用少量或不使用标签数据的步态识别算法。
[0004]半监督学习是一类试图从大量无标签和少量有标签的样本中学习表征的...

【技术保护点】

【技术特征摘要】
1.一种基于有限监督信息的联合学习步态表征方法，其特征在于：包括以下步骤：S1、构建输入数据与输出数据之间在网络中的关系：给定一个长度为k的步态轮廓序列式中，其中h和w分别表示帧的高度和宽度，表示特征矩阵，并将作为输入数据；假设N个候选主体定义为y
i
,i∈1,2,...,N，其中y
i
是第i个主体，则输出数据表示为一个n维的向量：式中，即属于y
i
的可能性；进一步假设y是输入数据的身份ID，y表述为：S2、优化半监督分支模型：基于半监督的损失优化模型student模型f(x,θ,η)和teacher模型f(x,θ
′
,η
′
)，在模型中增加序列级形态学扰动，从上述步骤S1中得到的步态轮廓序列中随机选择出μ帧步态轮廓图，其中μ是一个超参数，对于被选出的μ帧步态图，采用形态学的扰动方案，首先对轮廓图进行边缘检测，检测出轮廓边缘上的像素点，随后按一定概率随机的丢弃掉其轮廓边缘上的像素点，或在像素点的邻域上增加新的像素值，新像素值的取值应为其邻域像素的平均值，获得优化后的半监督分支模型；S3、在自监督分支模型中构建和步态识别任务高度相关的辅助任务：1)管道掩码重建：模拟现实场景中被识别主体被障碍物遮挡而缺失关键信息的情况，沿时间维度遮盖掉步态帧相同区域的像素后进行重建，使模型学习到高层次的语义信息；管道掩码重建的具体步骤包括：1)步态片段：采用步长为τ的时间采样策略从步态轮廓序列中抽取一个由n帧组成的片段记为c，采样步态片段数据；2)管道掩码：使用管道掩码策略，分别在CASIA
‑
B和OUMVLP两个数据集上设定步长τ的数值，根据步长τ的设定数值将片段c切分为多个非重叠的立方体；3)token嵌入：每个立方体用token嵌入方法进行编码，并将每个token映射到通道维度；4)重建步态片段：使用高遮蔽率的策略丢弃掉部分立方体，将未遮蔽的立方体作为基础模块的输入进行训练，最后通过网络训练得到的遮蔽特征图和可学习的掩码tokens一起重建被丢弃的立方体；2)片段顺序预测：将原始步态序列打乱顺序，采用步态帧组成的片段对步态序列的顺序预测，顺序预测的具体步骤包括：1)先从完整的步态序列中均匀采样N个有序的片段组成一个元组C＝<c1,c2,...,c
n
>，其中n是帧的数量，随机打乱元组C中片段的顺序后，元组C作为输入被送入神经网络中学习高级语义特征，输出不同顺序的概率分布，真实的顺序将被作为目标进行训练优化；S4、将半监督分支模型和自监督分支模型联合建立在步态识别网络GaitGL上，进行优化训练得到联合损失函数：步态识别网络GaitGL中用于特征提取的基础组件采用R(2+1)D结构，包括M
i
个尺寸为N
i
‑1×1×
d
×
d的二维卷积核和N
i
个尺寸为M
i
×
t
×
d
×
d的一维卷积核；联合损失函数的公式为：L
total
＝L
tri
+λ
con...

【专利技术属性】
技术研发人员：胡传平，奚昊，任楷，李永强，陈朋朋，朱思腾，许英奇，
申请(专利权)人：郑州大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人