行人重识别的噪声样本识别方法、装置、设备和存储介质制造方法及图纸

技术编号:24889853 阅读:28 留言:0更新日期:2020-07-14 18:16
一种行人重识别的噪声样本识别方法、装置、设备和存储介质,所述方法包括:对行人重识别的各初始样本进行特征提取,获得各初始样本的样本特征;根据各样本特征,确定目标样本组的组内样本特征中心,以及目标样本组内的各初始样本的样本距离,目标样本组包括至少两个初始样本,样本距离为初始样本的样本特征与初始样本所在目标样本组的组内样本特征中心之间的距离;根据目标样本组的各初始样本的样本距离,确定目标样本组中的各初始样本是否为噪声样本;将确定为噪声样本的初始样本移除,获得更新后的样本数据;根据更新后的样本数据对预设神经网络进行网络训练,获得训练确定的行人重识别模型。通过上述方法获得的行人重识别模型的准确度更高。

【技术实现步骤摘要】
行人重识别的噪声样本识别方法、装置、设备和存储介质
本申请涉及计算机
,特别是涉及一种行人重识别的噪声样本识别方法、装置、计算机设备和存储介质。
技术介绍
在机器学习的领域中,需要携带标注信息的样本来训练模型,而样本的标注信息通常是由所属领域的经验丰富的人员对样本进行标注得到的,其中也有可能存在标注失误的情况,这一标注失误的样本称为噪声样本;为了使用于训练模型的样本更好,可以采用一些方法识别出样本中的噪声样本。通常认为噪声标签对应样本的loss(损失)倾向于比非噪声样本的loss要大,在例如图像分类问题中主要根据网络输出层(FC层)的损失(loss)来鉴别噪声样本数据;然而,在一些具体应用场景中,例如行人重识别(ReID),ID的数量很多,而每个ID内的样本数据量较少,通过上述方法网络输出层容易过拟合,利用样本的loss无法区分出噪声样本和非噪声样本,进而用包含噪声样本的样本数据进行行人重识别模型的训练,获得的模型识别准确度较低。
技术实现思路
基于此,有必要针对上述技术问题,提供一种能够获得识别准确度更高的行人重识别模型的行人重识别的噪声样本识别方法、装置、设备和存储介质。一种行人重识别的噪声样本识别方法,所述方法包括:对行人重识别的各初始样本进行特征提取,获得各所述初始样本的样本特征;根据各所述样本特征,确定目标样本组的组内样本特征中心,以及所述目标样本组内的各初始样本的样本距离,所述目标样本组包括至少两个所述初始样本,所述样本距离为所述初始样本的样本特征与所述初始样本所在目标样本组的组内样本特征中心之间的距离;根据所述目标样本组的各初始样本的样本距离,确定所述目标样本组中的各所述初始样本是否为噪声样本;将确定为所述噪声样本的初始样本移除,获得更新后的样本数据;根据所述更新后的样本数据对第一预设神经网络进行网络训练,获得训练确定的行人重识别模型。一种行人重识别的噪声样本识别装置,所述装置包括:特征提取模块,用于对行人重识别的各初始样本进行特征提取,获得各所述初始样本的样本特征;样本距离确定模块,用于根据各所述样本特征,确定目标样本组的组内样本特征中心,以及所述目标样本组内的各初始样本的样本距离,所述目标样本组包括至少两个所述初始样本,所述样本距离为所述初始样本的样本特征与所述初始样本所在目标样本组的组内样本特征中心之间的距离;噪声样本识别模块,用于根据所述目标样本组的各初始样本的样本距离,确定所述目标样本组中的各所述初始样本是否为噪声样本;样本更新模块,用于将确定为噪声样本的初始样本移除,获得更新后的样本数据;模型训练模块,用于根据所述更新后的样本数据对第一预设神经网络进行网络训练,获得训练确定的行人重识别模型。一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现以下步骤:对行人重识别的各初始样本进行特征提取,获得各所述初始样本的样本特征;根据各所述样本特征,确定目标样本组的组内样本特征中心,以及所述目标样本组内的各初始样本的样本距离,所述目标样本组包括至少两个所述初始样本,所述样本距离为所述初始样本的样本特征与所述初始样本所在目标样本组的组内样本特征中心之间的距离;根据所述目标样本组的各初始样本的样本距离,确定所述目标样本组中的各所述初始样本是否为噪声样本;将确定为所述噪声样本的初始样本移除,获得更新后的样本数据;根据所述更新后的样本数据对第一预设神经网络进行网络训练,获得训练确定的行人重识别模型。一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现以下步骤:对行人重识别的各初始样本进行特征提取,获得各所述初始样本的样本特征;根据各所述样本特征,确定目标样本组的组内样本特征中心,以及所述目标样本组内的各初始样本的样本距离,所述目标样本组包括至少两个所述初始样本,所述样本距离为所述初始样本的样本特征与所述初始样本所在目标样本组的组内样本特征中心之间的距离;根据所述目标样本组的各初始样本的样本距离,确定所述目标样本组中的各所述初始样本是否为噪声样本;将确定为所述噪声样本的初始样本移除,获得更新后的样本数据;根据所述更新后的样本数据对第一预设神经网络进行网络训练,获得训练确定的行人重识别模型。上述行人重识别的噪声样本识别方法、装置、设备和存储介质,通过对行人重识别的各初始样本进行特征提取,提取获得的各样本特征,确定目标样本组的组内样本特征中心,以及目标样本组中各初始样本的样本特征所在目标样本组的组内样本特征中心之间的样本距离;其中,目标样本组中包括至少两个初始样本;进一步地,根据各样本对应的目标样本距离确定各样本的是否为噪声样本;识别出噪声样本后,将初始样本中的噪声样本剔除,用更新后的样本对预设时间网络模型进行训练,获得行人重识别模型。上述行人重识别的噪声样本识别方法,通过对各初始样本进行特征提取,并基于提取的特征计算各初始样本的样本特征与所在组的组内样本特征中心的样本距离,并根据各初始样本的样本距离确定初始样本是否为噪声样本,确定为噪声样本后将其从初始样本中剔除获得更新后的样本数据,进而利用更新后的样本数据进行网络模型训练获得行人重识别模型,获得的行人重识别模型的识别准确度更高。附图说明图1为一个实施例中行人重识别的噪声样本识别方法的流程示意图;图2为一个实施例中对各行人重识别的初始样本进行特征提取,获得各初始样本的样本特征的流程示意图;图3为一个实施例中根据各样本特征,确定目标样本组的组内样本特征中心,以及目标样本组内的各初始样本的样本距离的流程示意图;图4为一个具体实施例中混合高斯模型的输出结果;图5为一个实施例中根据目标样本组的各初始样本的样本距离,确定目标样本组中的各初始样本是否为噪声样本的流程示意图;图6为一个具体实施例中ReID中ID内的各初始样本的示意图;图7为一个具体实施例中行人重识别的噪声样本识别方法的流程示意图;图8为一个具体实施例中提取各初始样本的特征的流程示意图;图9为一个实施例中行人重识别的噪声样本识别装置的结构框图;图10为一个实施例中计算机设备的内部结构图。具体实施方式为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。在一个实施例中,如图1所示,本申请提供了一种行人重识别的噪声样本识别方法,包括步骤S110至步骤S150。步骤S110,对行人重识别的各初始样本进行特征提取,获得各初始样本的样本特征。行人重识别(PersonReID,Personre-identification),也称行人再识别,是利用计算机视觉技术判断图像或者视频序列中是否存在特定行人的技术本文档来自技高网...

【技术保护点】
1.一种行人重识别的噪声样本识别方法,所述方法包括:/n对行人重识别的各初始样本进行特征提取,获得各所述初始样本的样本特征;/n根据各所述样本特征,确定目标样本组的组内样本特征中心,以及所述目标样本组内的各初始样本的样本距离,所述目标样本组包括至少两个所述初始样本,所述样本距离为所述初始样本的样本特征与所述初始样本所在目标样本组的组内样本特征中心之间的距离;/n根据所述目标样本组的各初始样本的样本距离,确定所述目标样本组中的各所述初始样本是否为噪声样本;/n将各所述初始样本中确定为噪声样本的初始样本移除,获得更新后的样本数据;/n根据所述更新后的样本数据对第一预设神经网络进行网络训练,获得训练确定的行人重识别模型。/n

【技术特征摘要】
1.一种行人重识别的噪声样本识别方法,所述方法包括:
对行人重识别的各初始样本进行特征提取,获得各所述初始样本的样本特征;
根据各所述样本特征,确定目标样本组的组内样本特征中心,以及所述目标样本组内的各初始样本的样本距离,所述目标样本组包括至少两个所述初始样本,所述样本距离为所述初始样本的样本特征与所述初始样本所在目标样本组的组内样本特征中心之间的距离;
根据所述目标样本组的各初始样本的样本距离,确定所述目标样本组中的各所述初始样本是否为噪声样本;
将各所述初始样本中确定为噪声样本的初始样本移除,获得更新后的样本数据;
根据所述更新后的样本数据对第一预设神经网络进行网络训练,获得训练确定的行人重识别模型。


2.根据权利要求1所述的行人重识别的噪声样本识别方法,其特征在于,所述对行人重识别的各初始样本进行特征提取,获得各所述初始样本的样本特征,包括:
根据所述初始样本训练第二预设神经网络,并在达到训练终止条件时停止训练,获得中间神经网络;
将所述初始样本输入所述中间神经网络,获取所述中间神经网络的卷积层对各所述初始样本进行特征提取得到的样本特征。


3.根据权利要求1所述的行人重识别的噪声样本识别方法,其特征在于,所述目标样本组包括各样本组;
所述根据各所述样本特征,确定目标样本组的组内样本特征中心,以及所述目标样本组内的各初始样本的样本距离,包括:
读取各所述初始样本的组别标识;
选取未被选取的任一组别标识对应的样本组为待处理样本组,获取所述待处理样本组中的各初始样本的样本特征;
根据所述待处理样本组中各初始样本的样本特征,确定所述待处理样本组对应的所述组内样本特征中心;
分别计算所述待处理样本组中各初始样本的样本特征与所述待处理样本组对应的所述组内样本特征中心之间的样本距离;
在存在未被选取的组别标识时,返回所述选取未被选取的任一组别标识对应的样本组为待处理样本组的步骤。


4.根据权利要求1所述的行人重识别的噪声样本识别方法,其特征在于,所述目标样本组为各样本组中未被选取的样本组;
所述根据所述目标样本组的各初始样本的样本距离,确定所述目标样本组中的各所述初始样本是否为噪声样本之后,还包括:
在存在未被选取的样本组时,选取未被选取的任一样本组为目标样本组,返回所述根据各所述样本特征,确定目标样本组的组内样本特征中心,以及所述目标样本组内的各初始样本的样本距离的步骤。


5.根据权利要求1所述的行人重识别的噪声样本识别方法,其特征在于,所述根据所述目标样本组的各初始样本的...

【专利技术属性】
技术研发人员:程昊蒋忻洋李珂孙星余宗桥彭湃郭晓威黄小明黄飞跃吴永坚
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1