【技术实现步骤摘要】
对象识别网络的训练方法及系统
本公开涉及机器学习
,尤其涉及一种对象识别网络的训练方法及系统。
技术介绍
行人重识别(英文PersonRe-identification,简称ReID)可以实现用一张或多张行人图像在检索库中搜索该图像对应的人在其他视角相机中的图像。早期的ReID技术采用人工设计的图像特征,精度很差,后来开始使用深度学习技术后精度有了大幅提高。当前主流的ReID技术为基于深度学习的ReID技术,通过深度学习实现ReID技术可以提高ReID技术的识别精度,然而,基于深度学习的ReID技术常常因为模型的训练结果不佳导致识别效率低下。因此,急需提出一种新的训练方法,以提高基于深度学习的ReID技术的识别精度及工作效率。
技术实现思路
根据本公开的一方面,提供了一种对象识别网络的训练方法,所述方法包括:将训练集中的多个样本图像分别输入第一识别网络中进行处理,获取每个样本图像的多个第一视图的教师特征;将每个样本图像分别输入第二识别网络中进行处理,获取所述第二识别网 ...
【技术保护点】
1.一种对象识别网络的训练方法,其特征在于,所述方法包括:/n将训练集中的多个样本图像分别输入第一识别网络中进行处理,获取每个样本图像的多个第一视图的教师特征;/n将每个样本图像分别输入第二识别网络中进行处理,获取所述第二识别网络的第一网络损失,并根据所述教师特征获取所述第二识别网络的第二网络损失及第三网络损失;/n根据所述第一网络损失、第二网络损失及第三网络损失对所述第二识别网络进行训练,得到训练后的第二识别网络,/n其中,所述第二识别网络用于识别待处理图像中的目标对象的身份,所述第一识别网络为用于训练所述第二识别网络的教师网络。/n
【技术特征摘要】
1.一种对象识别网络的训练方法,其特征在于,所述方法包括:
将训练集中的多个样本图像分别输入第一识别网络中进行处理,获取每个样本图像的多个第一视图的教师特征;
将每个样本图像分别输入第二识别网络中进行处理,获取所述第二识别网络的第一网络损失,并根据所述教师特征获取所述第二识别网络的第二网络损失及第三网络损失;
根据所述第一网络损失、第二网络损失及第三网络损失对所述第二识别网络进行训练,得到训练后的第二识别网络,
其中,所述第二识别网络用于识别待处理图像中的目标对象的身份,所述第一识别网络为用于训练所述第二识别网络的教师网络。
2.根据权利要求1所述的方法,其特征在于,所述第一识别网络包括第一视图分解子网络、第一图像增广子网络、第一卷积子网络、第一池化子网络以及第一嵌入子网络,
其中,将训练集中的多个样本图像分别输入第一识别网络中进行处理,获取每个样本图像的多个第一视图的教师特征,包括:
将目标样本图像输入第一视图分解子网络进行视图分解处理,获得所述目标样本图像的多个第一视图,其中,所述目标样本图像是所述多个样本图像中的任意一个;
将所述多个第一视图输入第一图像增广子网络进行增广处理,获得增广后的多个第二视图;
所述多个第一视图以及所述多个第二视图依次经由第一卷积子网络、第一池化子网络及第一嵌入子网络进行卷积、池化及嵌入处理,获得所述目标样本图像的多个第一视图的第一特征向量和多个第二视图的第二特征向量;
根据所述第一特征向量和所述第二特征向量,确定所述目标样本图像的教师特征。
3.根据权利要求1所述的方法,其特征在于,所述第二识别网络包括特征提取网络、特征图映射网络及特征向量映射网络,所述特征提取网络包括第二图像增广子网络、第二卷积子网络、第二池化子网络、第二嵌入子网络以及分类子网络,
其中,将每个样本图像分别输入第二识别网络中进行处理,获取所述第二识别网络的第一网络损失,并根据所述教师特征获取所述第二识别网络的第二网络损失及第三网络损失,包括:
将目标样本图像输入第二图像增广子网络进行增广处理,获得增广后的第三视图,其中,所述目标样本图像是所述多个样本图像中的任意一个;
将所述第三视图输入第二卷积子网络进行卷积处理,获得所述目标样本图像的特征图;
将所述目标样本图像的特征图输入特征图映射网络进行处理,获得所述目标样本图像的多个第三视图的第一预测值;
根据多个样本图像的教师特征以及第一预测值,确定所述第二识别网络的第二网络损失。
4.根据权利要求3所述的方法,其特征在于,将每个样本图像分别输入第二识别网络中进行处理,获取所述第二识别网络的第一网络损失,并根据所述教师特征获取所述第二识别网络的第二网络损失及第三网络损失,还包括:
所述目标样本图像的特征图依次经由第二池化子网络及第二嵌入子网络进行池化及嵌入处理,获得所述目标样本图像的第三特征向量;
将所述第三特征向量输入所述特征向量映射网络中处理,获得所述目标样本图像的多个第一视图的第二预测值;
根据多个样本图像的教师特征以及第二预测值,确定所述第二识别网络的第三网络损失。
5.根据权利要求4所述的方法,其特征在于,
所述特征图映射网络包括第一视图提取子网络、第三池化子网络及第三嵌入子网络,所述第一视图提取子网络用于将所述目标样本图像的特征图映射为所述目标样本图像的多个第一视图的特征图;
所述特征向量映射网络包括第二视图提取子网络及映射子网络,所述第二视图提取子网络用于将所述目标样本图像的第三特征向量映射为所述目标样本图像的多个第一视图的特征向量。
6.根据权利要求4所述的方法,其特征在于,将每个样本图像分别输入第二识别网络中进行处理,获取所述第二识别网络的第一网络损失,还包括:
将所述目标样本图像的第三特征向量输入所述分类子网络中进行处理,获得所述目标样本图像的分类信息;
根据所述多个样本图像的分类信息以及标注信息,确定所述第二识别网络的第一网络损失,
其中,所述第一网络损失包括交叉熵损失函数。
7.根据权利要求1所述的方法,其特征在于,根据所述第一网络损失、第二网络损失及第三网络损失对所述第二识别网络进行训练,得到训练后的第二识别网络,包括:
将所述第一网络损失、第二网络损失及第三网络损失的加权和确定为所述第二识别网络的总体网络损失;
根据所述总体网络损失,对所述第二识别网络进行反向训练,得到训练后的第二识别网络。
8.根据权利要求2所述的方法,其特征在于,将所述多个第一视图输入图像增广子网络进行增广处理,获得增广后的多个第二视图,包括:
对多个第一视图分别进行随机翻转处理、随机遮挡处理、随机抠图处理、随机颜色处理、随机旋转处理中的至少一种,获得多个第二视图。
9.根据权利要求2所述的方法,其特征在于...
【专利技术属性】
技术研发人员:袁培江,史震云,李建民,任鹏远,
申请(专利权)人:北京深醒科技有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。