分类网络的训练方法、装置、介质、设备及产品制造方法及图纸

技术编号:39294895 阅读:18 留言:0更新日期:2023-11-07 11:02
本申请提供一种分类网络的训练方法、装置、介质、设备及产品。其中,该方法包括获取第一分类网络针对初始样本图像的第一验证结果,以及第二分类网络针对初始样本图像的第二验证结果;根据第一验证结果和第二验证结果,从初始样本图像中确定出对应不同验证结果的第一子样本图像和第二子样本图像;以最小化第一分类网络和第二分类网络对第一子样本图像和第二子样本图像中任意一个子样本图像的特征提取结果的差异为约束,根据第一子样本图像对第一分类网络进行训练,以及根据第二子样本图像对第二分类网络进行训练,直至满足预设停止条件;从满足预设停止条件的第一分类网络和第二分类网络中确定出目标分类网络。本申请能够提升分类网络的预测性能。提升分类网络的预测性能。提升分类网络的预测性能。

【技术实现步骤摘要】
分类网络的训练方法、装置、介质、设备及产品


[0001]本申请涉及人工智能领域,具体涉及一种分类网络的训练方法、装置、介质、设备及产品。

技术介绍

[0002]随着人工智能技术在人们生活中的普遍应用,为人们生活带来了诸多便利。比如在物品识别方面,通过基于人工智能的物品识别模型,可以快速地对物品进行识别。
[0003]然而,因不同的物品识别模型对同一物品的预测性能存在差异,会影响预测结果在业务开展中的应用。比如在使用预测结果进行物品推荐时,受预测结果差异的影响,会致使所推荐的物品存在差异,从而影响推荐效果。

技术实现思路

[0004]本申请提供了一种分类网络的训练方法、装置、介质、设备及产品,能够提升分类网络的预测性能。
[0005]本申请提供的分类网络的训练方法,包括:
[0006]获取第一分类网络针对初始样本图像的第一验证结果,以及第二分类网络针对初始样本图像的第二验证结果,第一分类网络和第二分类网络的网络结构相同但网络参数不同;
[0007]根据第一验证结果和第二验证结果,从初始样本图像中确定本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种分类网络的训练方法,其特征在于,包括:获取第一分类网络针对初始样本图像的第一验证结果,以及第二分类网络针对所述初始样本图像的第二验证结果,所述第一分类网络和所述第二分类网络的网络结构相同但网络参数不同;根据所述第一验证结果和所述第二验证结果,从所述初始样本图像中确定出对应不同验证结果的第一子样本图像和第二子样本图像,所述第一子样本图像表示所述第一分类网络识别失败且所述第二分类网络识别成功的样本图像,所述第二子样本图像表示所述第一分类网络识别成功且所述第二分类网络识别失败的样本图像;以最小化所述第一分类网络和所述第二分类网络对所述第一子样本图像和所述第二子样本图像中任意一个子样本图像的特征提取结果的差异为约束,根据所述第一子样本图像对所述第一分类网络进行训练,以及根据所述第二子样本图像对所述第二分类网络进行训练,直至满足预设停止条件;从满足所述预设停止条件的第一分类网络和第二分类网络中确定出目标分类网络。2.根据权利要求1所述的方法,其特征在于,所述以最小化所述第一分类网络和所述第二分类网络对所述第一子样本图像和所述第二子样本图像中任意一个子样本图像的特征提取结果的差异为约束,根据所述第一子样本图像对所述第一分类网络进行训练,以及根据所述第二子样本图像对所述第二分类网络进行训练,直至满足预设停止条件之前,还包括:根据所述第一验证结果和所述第二验证结果,从所述初始样本图像中确定出对应相同验证结果的第三子样本图像和第四子样本图像,所述第一分类网络和所述第二分类网络对所述第三子样本图像识别成功,对所述第四子样本图像识别失败;所述以最小化所述第一分类网络和所述第二分类网络对所述第一子样本图像和所述第二子样本图像中任意一个子样本图像的特征提取结果的差异为约束,根据所述第一子样本图像对所述第一分类网络进行训练,以及根据所述第二子样本图像对所述第二分类网络进行训练,直至满足预设停止条件,包括:以最小化所述第一分类网络和所述第二分类网络对所述第一子样本图像和所述第二子样本图像中任意一个子样本图像的特征提取结果的差异,以及最大化所述第一分类网络和所述第二分类网络对所述第三子样本图像和所述第四子样本图像中任意一个子样本图像的特征提取结果的差异为约束,根据所述第一子样本图像、所述第三子样本图像以及所述第四子样本图像对所述第一分类网络进行训练,以及根据所述第二子样本图像、所述第三子样本图像以及所述第四子样本图像对所述第二分类网络进行训练,直至满足预设停止条件。3.根据权利要求2所述的方法,其特征在于,所述第一分类网络包括第一特征提取网络,所述第二分类网络包括第二特征提取网络;所述以最小化所述第一分类网络和所述第二分类网络对所述第一子样本图像和所述第二子样本图像中任意一个子样本图像的特征提取结果的差异,以及最大化所述第一分类网络和所述第二分类网络对所述第三子样本图像和所述第四子样本图像中任意一个子样本图像的特征提取结果的差异为约束,根据所述第一子样本图像、所述第三子样本图像以及所述第四子样本图像对所述第一分类网络进行训练,以及根据所述第二子样本图像、所
述第三子样本图像以及所述第四子样本图像对所述第二分类网络进行训练,直至满足预设停止条件,包括:将所述第一子样本图像、所述第三子样本图像以及所述第四子样本图像输入所述第一特征提取网络进行特征提取,得到所述第一子样本图像对应的第一特征提取结果,以及所述第三子样本图像和所述第四子样本图像对应的第三特征提取结果;将所述第二子样本图像、所述第三子样本图像以及所述第四子样本图像输入所述第二特征提取网络进行特征提取,得到所述第二子样本图像对应的第二特征提取结果,以及所述第三子样本图像和所述第四子样本图像对应的第四特征提取结果;根据所述第一特征提取结果和所述第二特征提取结果,确定第一损失值;根据所述第三特征提取结果和所述第四特征提取结果,确定第二损失值;以最小化所述第一损失值和所述第二损失值为约束,更新所述第一分类网络和所述第二分类网络的网络参数,直至满足预设停止条件。4.根据权利要求3所述的方法...

【专利技术属性】
技术研发人员:朱城
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1