行人重识别的噪声样本识别方法、装置、设备和存储介质制造方法及图纸

技术编号：24889853 阅读：28 留言：0更新日期：2020-07-14 18:16

一种行人重识别的噪声样本识别方法、装置、设备和存储介质，所述方法包括：对行人重识别的各初始样本进行特征提取，获得各初始样本的样本特征；根据各样本特征，确定目标样本组的组内样本特征中心，以及目标样本组内的各初始样本的样本距离，目标样本组包括至少两个初始样本，样本距离为初始样本的样本特征与初始样本所在目标样本组的组内样本特征中心之间的距离；根据目标样本组的各初始样本的样本距离，确定目标样本组中的各初始样本是否为噪声样本；将确定为噪声样本的初始样本移除，获得更新后的样本数据；根据更新后的样本数据对预设神经网络进行网络训练，获得训练确定的行人重识别模型。通过上述方法获得的行人重识别模型的准确度更高。

全部详细技术资料下载

【技术实现步骤摘要】
行人重识别的噪声样本识别方法、装置、设备和存储介质
本申请涉及计算机
，特别是涉及一种行人重识别的噪声样本识别方法、装置、计算机设备和存储介质。
技术介绍
在机器学习的领域中，需要携带标注信息的样本来训练模型，而样本的标注信息通常是由所属领域的经验丰富的人员对样本进行标注得到的，其中也有可能存在标注失误的情况，这一标注失误的样本称为噪声样本；为了使用于训练模型的样本更好，可以采用一些方法识别出样本中的噪声样本。通常认为噪声标签对应样本的loss(损失)倾向于比非噪声样本的loss要大，在例如图像分类问题中主要根据网络输出层(FC层)的损失(loss)来鉴别噪声样本数据；然而，在一些具体应用场景中，例如行人重识别(ReID)，ID的数量很多，而每个ID内的样本数据量较少，通过上述方法网络输出层容易过拟合，利用样本的loss无法区分出噪声样本和非噪声样本，进而用包含噪声样本的样本数据进行行人重识别模型的训练，获得的模型识别准确度较低。
技术实现思路
基于此，有必要针对上述技术问题，提供一种能够获得识别准确度更高的行人重识别模型的行人重识别的噪声样本识别方法、装置、设备和存储介质。一种行人重识别的噪声样本识别方法，所述方法包括：对行人重识别的各初始样本进行特征提取，获得各所述初始样本的样本特征；根据各所述样本特征，确定目标样本组的组内样本特征中心，以及所述目标样本组内的各初始样本的样本距离，所述目标样本组包括至少两个所述初始样本，所述样本距离为所述初始样本的样本特征...

【技术保护点】
1.一种行人重识别的噪声样本识别方法，所述方法包括：/n对行人重识别的各初始样本进行特征提取，获得各所述初始样本的样本特征；/n根据各所述样本特征，确定目标样本组的组内样本特征中心，以及所述目标样本组内的各初始样本的样本距离，所述目标样本组包括至少两个所述初始样本，所述样本距离为所述初始样本的样本特征与所述初始样本所在目标样本组的组内样本特征中心之间的距离；/n根据所述目标样本组的各初始样本的样本距离，确定所述目标样本组中的各所述初始样本是否为噪声样本；/n将各所述初始样本中确定为噪声样本的初始样本移除，获得更新后的样本数据；/n根据所述更新后的样本数据对第一预设神经网络进行网络训练，获得训练确定的行人重识别模型。/n

【技术特征摘要】
1.一种行人重识别的噪声样本识别方法，所述方法包括：
对行人重识别的各初始样本进行特征提取，获得各所述初始样本的样本特征；
根据各所述样本特征，确定目标样本组的组内样本特征中心，以及所述目标样本组内的各初始样本的样本距离，所述目标样本组包括至少两个所述初始样本，所述样本距离为所述初始样本的样本特征与所述初始样本所在目标样本组的组内样本特征中心之间的距离；
根据所述目标样本组的各初始样本的样本距离，确定所述目标样本组中的各所述初始样本是否为噪声样本；
将各所述初始样本中确定为噪声样本的初始样本移除，获得更新后的样本数据；
根据所述更新后的样本数据对第一预设神经网络进行网络训练，获得训练确定的行人重识别模型。

2.根据权利要求1所述的行人重识别的噪声样本识别方法，其特征在于，所述对行人重识别的各初始样本进行特征提取，获得各所述初始样本的样本特征，包括：
根据所述初始样本训练第二预设神经网络，并在达到训练终止条件时停止训练，获得中间神经网络；
将所述初始样本输入所述中间神经网络，获取所述中间神经网络的卷积层对各所述初始样本进行特征提取得到的样本特征。

3.根据权利要求1所述的行人重识别的噪声样本识别方法，其特征在于，所述目标样本组包括各样本组；
所述根据各所述样本特征，确定目标样本组的组内样本特征中心，以及所述目标样本组内的各初始样本的样本距离，包括：
读取各所述初始样本的组别标识；
选取未被选取的任一组别标识对应的样本组为待处理样本组，获取所述待处理样本组中的各初始样本的样本特征；
根据所述待处理样本组中各初始样本的样本特征，确定所述待处理样本组对应的所述组内样本特征中心；
分别计算所述待处理样本组中各初始样本的样本特征与所述待处理样本组对应的所述组内样本特征中心之间的样本距离；
在存在未被选取的组别标识时，返回所述选取未被选取的任一组别标识对应的样本组为待处理样本组的步骤。

4.根据权利要求1所述的行人重识别的噪声样本识别方法，其特征在于，所述目标样本组为各样本组中未被选取的样本组；
所述根据所述目标样本组的各初始样本的样本距离，确定所述目标样本组中的各所述初始样本是否为噪声样本之后，还包括：
在存在未被选取的样本组时，选取未被选取的任一样本组为目标样本组，返回所述根据各所述样本特征，确定目标样本组的组内样本特征中心，以及所述目标样本组内的各初始样本的样本距离的步骤。

5.根据权利要求1所述的行人重识别的噪声样本识别方法，其特征在于，所述根据所述目标样本组的各初始样本的...

【专利技术属性】
技术研发人员：程昊，蒋忻洋，李珂，孙星，余宗桥，彭湃，郭晓威，黄小明，黄飞跃，吴永坚，
申请(专利权)人：腾讯科技深圳有限公司，
类型：发明
国别省市：广东;44

全部详细技术资料下载我是这个专利的主人