一种基于主动学习的步态识别方法技术

技术编号:28497010 阅读:12 留言:0更新日期:2021-05-19 22:32
本发明专利技术公开了一种基于主动学习的步态识别方法,对待检测输入图像,使用主模型提取出特征矩阵,使用副模型对样本进行评估和筛选。在训练过程中,首先使用数量相对较少的已标注样本对主模型和副模型进行训练,然后对未标注的样本进行评估。在得到未标注样本的评估结果后,按照既定策略进行样本筛选,将筛选出的样本加入到已标注样本集中,输入模型中继续进行训练。本方法利用主动学习的思想,从未标注的数据样本中选取更有价值的样本进行标注训练,可以大大减少人工标注的代价。在数据样本有限时,本方法也可用来选取信息量相对更丰富的样本,使模型能够有针对性进行训练,从而在样本有限的情况下,尽可能利用样本多样性来提升模型的效果。型的效果。型的效果。

【技术实现步骤摘要】
一种基于主动学习的步态识别方法


[0001]本专利技术属于计算机视觉
,更具体地,涉及一种基于主动学习的步态识别方法。

技术介绍

[0002]步态识别是一种独特的生物识别技术,研究的是如何从人类走路的姿态中识别出目标的身份。与其他的生物识别技术,如面部识别、虹膜识别等方法相比,步态识别可以在较远距离进行识别,并且无需受配者的主动参与。因此,在预防犯罪、法医鉴定以及社会保障方面具有广泛的应用。
[0003]目前的步态识别方法主要是基于深度学习的方法,将图像输入到设计好的深度学习模型当中进行处理和匹配,从而达到识别的目的。这样的方法往往需要大量的数据。然而,大量的数据往往意味着需要大量的人力与时间,很多时候,这样巨大的标注代价是不可承受的。此外,在一些情况下,数据的获取比较困难,数据样本的数量比较有限。
[0004]因此,需要设计基于主动学习的步态识别方法,能够从大量数据中筛选出有训练价值的数据进行标注,从而减少标注代价;同时在数据样本数量有限时,能够尽可能有效利用数据样本的多样性来提升步态识别方法的识别性能。

技术实现思路

[0005]本专利技术的目的在于提供一种基于主动学习的步态识别方法,该方法可以有效地从数据集中找到信息量较大的数据进行标注,从而大大减少数据标注的代价。同时,在数据集数据量有限的时候,可以充分利用数据的多样性,达到提升性能的目的。
[0006]为了实现上述目的,本专利技术提供了一种基于主动学习的步态识别方法,包括下述步骤:
[0007](1)生成轮廓数据集:
[0008](1.1)对一段步态序列中的每一帧轮廓图,依据每一行的像素和不为0的原则,找上边和下边;
[0009](1.2)根据上边和下边对轮廓图进行切割;
[0010](1.3)对切割后的图进行resize操作,高度为64,宽度保持比例;
[0011](1.4)依据每一列的和最大的为中心线原则,找到中心线;
[0012](1.5)中心线左右各32像素进行切割,不够的补0;
[0013](1.6)得到对齐后的轮廓图;
[0014](2)初始化已标注集与未标注集:
[0015]将生成的轮廓数据集作为训练特征提取主模型和样本选择副模型的数据集。按照不同的应用场景选择相应的策略,对数据集进行初始化。当数据集样本数量庞大、需要高昂的代价进行人工标注时,初始化数据集的策略是:将轮廓数据集中已经进行了标注的数据设置为已标注集,轮廓数据集中未进行标注的数据设置为未标注集。当数据集样本数量有
限、难以获取更多样本时,初始化数据集的策略是:随机从生成的轮廓数据集中选择一定数量的样本作为已标注集,其余的样本视为未标注样本,加入未标注集;
[0016](3)训练特征提取主模型:
[0017](3.1)将初始化好的已标注集样本输入到特征提取主模型当中。使用卷积神经网络和池化层,将已标注集样本从图像序列编码成具有代表性的特征;
[0018](3.2)使用注意力机制,将每一个序列中最大的特征值、中间特征值和平均特征值进行叠加,作为每个序列在模型中的特征表示;
[0019](3.3)得到每个序列的特征表示后,按照不同的尺度将特征进行分层叠加,得到序列多尺度的特征表示;
[0020](3.4)使用损失函数对得到的特征进行评估,反向传播训练特征提取主模型;
[0021](4)训练主动学习样本选择副模型:
[0022](4.1)使用特征提取主模型提取好已标注集中样本的特征后,将提取好的特征输入到主动学习样本选择副模型当中。根据不同的应用场景,选择主动学习样本选择副模型的训练方式。
[0023](4.2)当数据样本数量庞大,需要大量的标注,标注代价高昂,主动学习样本选择副模型的主要目的是降低标注代价时,根据特征提取主模型提取出的特征,主动学习样本选择副模型对已标注集中的每个样本预测不确定分数,以特征提取主模型的损失函数值作为真实值,计算主动学习样本选择副模型的损失函数值,反向传播进行训练。
[0024](4.3)当数据集的数量比较有限,主动学习样本选择副模型的主要目的是充分利用数据样本的多样性时,根据特征提取主模型提取出的特征,主动学习样本选择副模型对已标注集中的样本预测目标标签,以每个样本的真实标签作为真实值,计算主动学习样本选择副模型的损失函数值,反向传播进行训练。
[0025](5)更新已标注集与未标注集:
[0026]将训练好的特征提取主模型和主动学习样本选择副模型设置为测试模式,使用特征提取主模型提取未标注集中样本的特征,输入到主动学习样本选择副模型中,主动学习样本选择副模型对未标注集中每一个样本进行评估,按照设定好的选择策略,根据每个样本的不确定性分数或离相应目标标签特征中心距离的大小,将未标注数据集中的样本进行排序,选取K个样本进行标注后加入到已标注集中。
[0027](6)重复步骤(3)到(5),直到已标注数据集中的样本数量达到预先设定好的容量。
[0028]本专利技术的一个实施例中,所述步骤(3.3)中的损失函数的计算过程为:根据(3.1)中提取出的每个序列的特征,计算不同样本之间的距离,使标签相同的样本距离尽可能近,标签不同的样本距离尽可能远。
[0029]本专利技术的一个实施例中,所述步骤(4.1)中主动学习样本选择副模型的使用过程具体为:根据需求场景的不同,选择相应的主动学习样本选择副模型筛选策略,使用特征提取主模型生成的特征矩阵进行联合训练;当数据样本数量庞大,需要大量的标注,标注代价高昂,主动学习样本选择副模型的主要目的是降低标注代价时,主动学习样本选择副模型对未标注集中的样本进行困难度的评估,筛选出困难样本进行标记,加入到已标注集中,送入到特征提取主模型进行进一步的训练;当数据集的数量比较有限,主动学习样本选择副模型的主要目的是充分利用数据样本的多样性时,主动学习样本选择副模型对样本进行混
淆度的评估;主动学习样本选择副模型预测未标注集中样本的目标标签,分别计算出每个目标标签下所有序列的中心特征,选择未标注集中离相应目标标签中心特征距离最远的样本作为混淆度最大的样本加入到已标注集中,送入到特征提取主模型中进行训练。
[0030]本专利技术的一个实施例中,所述步骤(4.2)中的主动学习样本选择副模型的具体训练方式为:利用特征提取主模型输出的特征矩阵作为输入,使用池化层和全连接层处理输入的特征,输出对样本预测的不确定值。
[0031]本专利技术的一个实施例中,所述步骤(4.2)中的主动学习样本选择副模型的损失函数计算方式为:利用特征提取主模型的损失函数值作为副模型的监督信息;由于特征提取主模型的损失函数值会随着训练动态变化,因此,在计算主动学习样本选择副模型的损失函数值时,进行成对样本损失函数相对值的比较;即比较成对的样本损失函数值相对大小,若主动学习样本选择副模型预测的损失函数值相对大小与特征提取主模型损失函数值相对大小相符合,则认定主动学习样本选择副模型本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于主动学习的步态识别方法,其特征在于,所述方法包括下述步骤:(1)生成轮廓数据集:(1.1)对一段步态序列中的每一帧轮廓图,依据每一行的像素和不为0的原则,找上边和下边;(1.2)根据上边和下边对轮廓图进行切割;(1.3)对切割后的图进行resize操作,高度为64,宽度保持比例;(1.4)依据每一列的和最大的为中心线原则,找到中心线;(1.5)中心线左右各32像素进行切割,不够的补0;(1.6)得到对齐后的轮廓图;(2)初始化已标注集与未标注集:将生成的轮廓数据集作为训练特征提取主模型和样本选择副模型的数据集,按照不同的应用场景选择相应的策略,对数据集进行初始化,当数据集样本数量庞大、需要高昂的代价进行人工标注时,初始化数据集的策略是:将轮廓数据集中已经进行了标注的数据设置为已标注集,轮廓数据集中未进行标注的数据设置为未标注集,当数据集样本数量有限、难以获取更多样本时,初始化数据集的策略是:随机从生成的轮廓数据集中选择一定数量的样本作为已标注集,其余的样本视为未标注样本,加入未标注集;(3)训练特征提取主模型:(3.1)将初始化好的已标注集样本输入到特征提取主模型当中,使用卷积神经网络和池化层,将已标注集样本从图像序列编码成具有代表性的特征;(3.2)使用注意力机制,将每一个序列中最大的特征值、中间特征值和平均特征值进行叠加,作为每个序列在模型中的特征表示;(3.3)得到每个序列的特征表示后,按照不同的尺度将特征进行分层叠加,得到序列多尺度的特征表示;(3.4)使用损失函数对得到的特征进行评估,反向传播训练特征提取主模型;(4)训练主动学习样本选择副模型:(4.1)使用特征提取主模型提取好已标注集中样本的特征后,将提取好的特征输入到主动学习样本选择副模型当中,根据不同的应用场景,选择主动学习样本选择副模型的训练方式;(4.2)当数据样本数量庞大,需要大量的标注,标注代价高昂,主动学习样本选择副模型的主要目的是降低标注代价时,根据特征提取主模型提取出的特征,主动学习样本选择副模型对已标注集中的每个样本预测不确定分数,以特征提取主模型的损失函数值作为真实值,计算主动学习样本选择副模型的损失函数值,反向传播进行训练;(4.3)当数据集的数量比较有限、新样本获取困难,主动学习样本选择副模型的主要目的是充分利用数据样本的多样性时,根据特征提取主模型提取出的特征,主动学习样本选择副模型对已标注集中的样本预测目标标签,以每个样本的真实标签作为真实值,计算主动学习样本选择副模型的损失函数值,反向传播进行训练;(5)更新已标注集与未标注集:将训练好的特征提取主模型和主动学习样本选择副模型设置为测试模式,使用特征提取主模型提取未标注集中样本的特征,输入到主动学习样本选择副模型中,主动学习样本
选择副模型对未标注集中每一个样本进行评估,按照设定好的选择策略,根据每个样本的不确定性分数或离相应目标标签特征中心距离的大小,将未标注数据集中的样本进行排序,选取K个样本进行标注后加入到已标注集中;(6)重复步骤(3)到(5),直到已标注数据集中的样本数量达到预先设定好的容量。2.根据权利要求1或2所述的基于主动学习的步态识别方法,其特征在于,所述步骤(3.3)中的损失函数的计算过程为:根据(3.1)中提取出的每个序列的特征,计算不同样本之间的距离,使标签相同的样本距离尽可能近,标签不同的样本距离尽可能远。3.根据权利要求1或2所述的基于主动学习的步态识别方法,其特征在于,所述步骤(4.1)中主动学习样本选择副模型的使用过程具体为:根据需求场景的不同,选择相应的主动学...

【专利技术属性】
技术研发人员:冯镔胡滨肖劲轩刘文予
申请(专利权)人:华中科技大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1