目标检测模型的训练方法、装置、计算机设备及存储介质制造方法及图纸

技术编号：39057781 阅读：14 留言：0更新日期：2023-10-12 19:50

本申请实施例公开了一种目标检测模型的训练方法、装置、计算机设备及存储介质，本申请实施例通过将第一图像样本输入预训练的检测模型，输出对应的第一目标检测结果；根据第一目标检测结果与第一图像样本携带的标签数据确定第一目标损失函数；将第二图像样本分别输入教师检测模型以及学生检测模型，输出对应的第二目标检测结果以及第三目标检测结果确定第二目标损失函数；基于第一目标损失函数和第二目标损失函数对学生检测模型的第一网络参数进行更新；根据更新后的第一网络参数更新教师检测模型的第二网络参数，不断对第二网络参数更新，直至满足迭代条件停止，将训练得到的教师检测模型确定为目标检测模型。极大的提升了数据处理的效率。了数据处理的效率。了数据处理的效率。

全部详细技术资料下载

【技术实现步骤摘要】
目标检测模型的训练方法、装置、计算机设备及存储介质

[0001]本申请涉及计算机视觉
，具体涉及一种目标检测模型的训练方法、装置、计算机设备及存储介质。

技术介绍

[0002]近年来，深度学习网络模型在计算机视觉等应用领域上成为最实用的模型，而深度学习的成功，主要归因于可扩展性，即需要大量标签数据的存在，深度学习网络模型才可以展现出强健的(robust)性能。
[0003]在对现有技术的研究和实践过程中，本申请的专利技术人发现，现有技术中，大量高质量的标签数据意味着需要大量的人工参与标注，而人工成本是及其昂贵的，尤其是请专家进行的数据标注的成本更高，而且人工标注的速度往往比较慢，数据处理的效率较差。

技术实现思路

[0004]本申请实施例提供一种目标检测模型的训练方法、装置、计算机设备及存储介质，可以提升目标检测模型的训练效率。
[0005]为解决上述技术问题，本申请实施例提供以下技术方案：
[0006]一种目标检测模型的训练方法，包括：
[0007]获取第一图像样本以及第二图像样本，所述第一图像样本携带标签数据，所述第二图像样本不携带标签数据；
[0008]将所述第一图像样本输入预训练的检测模型，输出对应的第一目标检测结果；
[0009]根据所述第一目标检测结果与所述第一图像样本携带的标签数据确定第一目标损失函数；
[0010]将所述第二图像样本分别输入教师检测模型以及学生检测模型，输出对应的第二目标检测结果以及第三目标检测结果；
>[0011]基于所述第二目标检测结果和第三目标检测结果之间的差异确定第二目标损失函数；
[0012]基于所述第一目标损失函数和第二目标损失函数对所述学生检测模型的第一网络参数进行更新；
[0013]根据更新后的第一网络参数更新所述教师检测模型的第二网络参数，并迭代返回执行将所述第一图像样本输入预训练的检测模型，输出对应的第一目标检测结果，以不断对所述第二网络参数更新，直至满足迭代条件停止，将训练得到的教师检测模型确定为目标检测模型。
[0014]一种数据处理方法，包括：
[0015]将待标注图像输入如上述目标检测模型的训练方法训练得到的目标检测模型中，输出对应的第四目标检测结果；
[0016]根据所述第四目标检测结果生成所述待标注图像对应的目标标签信息。
[0017]一种目标检测模型的训练装置，包括：
[0018]获取单元，用于获取第一图像样本以及第二图像样本，所述第一图像样本携带标签数据，所述第二图像样本不携带标签数据；
[0019]第一输出单元，用于将所述第一图像样本输入预训练的检测模型，输出对应的第一目标检测结果；
[0020]第一确定单元，用于根据所述第一目标检测结果与所述第一图像样本携带的标签数据确定第一目标损失函数；
[0021]第二输出单元，用于将所述第二图像样本分别输入教师检测模型以及学生检测模型，输出对应的第二目标检测结果以及第三目标检测结果；
[0022]第二确定单元，用于基于所述第二目标检测结果和第三目标检测结果之间的差异确定第二目标损失函数；
[0023]第一更新单元，用于基于所述第一目标损失函数和第二目标损失函数对所述学生检测模型的第一网络参数进行更新；
[0024]迭代更新单元，用于根据更新后的第一网络参数更新所述教师检测模型的第二网络参数，并迭代返回执行将所述第一图像样本输入预训练的检测模型，输出对应的第一目标检测结果，以不断对所述第二网络参数更新，直至满足迭代条件停止，将训练得到的教师检测模型确定为目标检测模型。
[0025]在一些实施方式中，所述装置，还包括：
[0026]第三输出单元，用于将所述第一图像样本输入检测模型，输出对应的第一检测结果；
[0027]第三确定单元，用于根据所述第一检测结果和所述标签数据之间的差异确定第三目标损失函数；
[0028]第二更新单元，用于基于所述第三目标损失函数对所述检测模型的第三网络参数进行更新，并迭代返回执行将所述第一图像样本输入检测模型，输出对应的第一检测结果，以不断对所述第三网络参数进行更新，直至所述第三目标损失函数收敛，得到预训练的检测模型；
[0029]传递单元，用于将所述预训练的检测模型的第一目标网络参数传递给教师检测模型以及学生检测模型。
[0030]在一些实施例中，所述第三确定单元，用于：
[0031]根据所述第一检测结果中的第一区域的分类信息与标签数据中的标签区域的分类信息之间的差异确定第一损失函数；
[0032]根据所述第一检测结果中的第一区域的位置信息与标签数据中的标签区域的位置信息之间的差异确定第二损失函数；
[0033]根据所述第一检测结果中的第一感兴趣区域的分类信息与标签数据中的标签感兴趣区域的分类信息之间的差异确定第三损失函数；
[0034]根据所述第一检测结果中的第一感兴趣区域的位置信息与标签数据中的标签感兴趣区域的位置信息之间的差异确定第四损失函数；
[0035]基于所述第一损失函数、第二损失函数、第三损失函数和第四损失函数构建第三目标损失函数。
[0036]在一些实施例中，所述第一确定单元，用于：
[0037]根据所述第一目标检测结果中的第二区域的分类信息与标签数据中的标签区域的分类信息之间的差异确定第五损失函数；
[0038]根据所述第一目标检测结果中的第二区域的位置信息与标签数据中的标签区域的位置信息之间的差异确定第六损失函数；
[0039]根据所述第一目标检测结果中的第二感兴趣区域的分类信息与标签数据中的标签感兴趣区域的分类信息之间的差异确定第七损失函数；
[0040]根据所述第一目标检测结果中的第二感兴趣区域的位置信息与标签数据中的标签感兴趣区域的位置信息之间的差异确定第八损失函数；
[0041]基于所述第五损失函数、第六损失函数、第七损失函数和第八损失函数构建第一目标损失函数。
[0042]在一些实施例中，所述第二输出单元，包括：
[0043]第一增强子单元，用于将所述第二图像样本进行弱增强；
[0044]第一输出子单元，用于将弱增强之后的第二图像样本输入至教师检测模型，输出对应的第二目标检测结果；
[0045]第二增强子单元，用于将所述第二图像样本进行强增强；
[0046]第二输出子单元，用于将强增强之后的第二图像样本输入至学生检测模型，输出对应的第三目标检测结果。
[0047]在一些实施例中，所述第一输出子单元，用于：
[0048]将弱增强之后的第二图像样本输入至教师检测模型，输出对应的第三区域的分类信息、第三区域的位置信息、第三感兴趣区域的分类信息和第三感兴趣区域的位置信息；
[0049]将置信度大于第一预设阈值的第三区域的位置信息确定为第三目标区域的位置信息；
[0050]确定所述第三目标区域的位置信息对应的本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种目标检测模型的训练方法，其特征在于，包括：获取第一图像样本以及第二图像样本，所述第一图像样本携带标签数据，所述第二图像样本不携带标签数据；将所述第一图像样本输入预训练的检测模型，输出对应的第一目标检测结果；根据所述第一目标检测结果与所述第一图像样本携带的标签数据确定第一目标损失函数；将所述第二图像样本分别输入教师检测模型以及学生检测模型，输出对应的第二目标检测结果以及第三目标检测结果；基于所述第二目标检测结果和第三目标检测结果之间的差异确定第二目标损失函数；基于所述第一目标损失函数和第二目标损失函数对所述学生检测模型的第一网络参数进行更新；根据更新后的第一网络参数更新所述教师检测模型的第二网络参数，并迭代返回执行将所述第一图像样本输入预训练的检测模型，输出对应的第一目标检测结果，以不断对所述第二网络参数更新，直至满足迭代条件停止，将训练得到的教师检测模型确定为目标检测模型。2.根据权利要求1所述训练方法，其特征在于，所述将所述第一图像样本输入预训练的检测模型，输出对应的第一目标检测结果之前，还包括：将所述第一图像样本输入检测模型，输出对应的第一检测结果；根据所述第一检测结果和所述标签数据之间的差异确定第三目标损失函数；基于所述第三目标损失函数对所述检测模型的第三网络参数进行更新，并迭代返回执行将所述第一图像样本输入检测模型，输出对应的第一检测结果，以不断对所述第三网络参数进行更新，直至所述第三目标损失函数收敛，得到预训练的检测模型；将所述预训练的检测模型的第一目标网络参数传递给教师检测模型以及学生检测模型。3.根据权利要求2所述的训练方法，其特征在于，所述根据所述第一检测结果和所述标签数据之间的差异确定第三目标损失函数，包括：根据所述第一检测结果中的第一区域的分类信息与所述标签数据中的标签区域的分类信息之间的差异确定第一损失函数；根据所述第一检测结果中的第一区域的位置信息与所述标签数据中的标签区域的位置信息之间的差异确定第二损失函数；根据所述第一检测结果中的第一感兴趣区域的分类信息与所述标签数据中的标签感兴趣区域的分类信息之间的差异确定第三损失函数；根据所述第一检测结果中的第一感兴趣区域的位置信息与所述标签数据中的标签感兴趣区域的位置信息之间的差异确定第四损失函数；基于所述第一损失函数、第二损失函数、第三损失函数和第四损失函数构建第三目标损失函数。4.根据权利要求1所述的训练方法，其特征在于，所述根据所述第一目标检测结果与所述第一图像样本携带的标签数据确定第一目标损失函数，包括：根据所述第一目标检测结果中的第二区域的分类信息与所述标签数据中的标签区域
的分类信息之间的差异确定第五损失函数；根据所述第一目标检测结果中的第二区域的位置信息与所述标签数据中的标签区域的位置信息之间的差异确定第六损失函数；根据所述第一目标检测结果中的第二感兴趣区域的分类信息与所述标签数据中的标签感兴趣区域的分类信息之间的差异确定第七损失函数；根据所述第一目标检测结果中的第二感兴趣区域的位置信息与所述标签数据中的标签感兴趣区域的位置信息之间的差异确定第八损失函数；基于所述第五损失函数、第六损失函数、第七损失函数和第八损失函数构建第一目标损失函数。5.根据权利要求1所述的训练方法，其特征在于，所述将所述第二图像样本分别输入教师检测模型以及学生检测模型，输出对应的第二目标检测结果以及第三目标检测结果，包括：将所述第二图像样本进行弱增强；将弱增强之后的第二图像样本输入至教师检测模型，输出对应的第二目标检测结果；将所述第二图像样本进行强增强；将强增强之后的第二图像样本输入至学生检测模型，输出对应的第三目标检测结果。6.根据权利要求5所述的训练方法，其特征在于，所述将弱增强之后的第二图像样本输入至教师检测模型，输出对应的第二目标检测结果，包括：将弱增强之后的第二图像样本输入至教师检测模型，输出对应的第三区域的分类信息、第三区域的位置信息、第三感兴趣区域的分类信息和第三感兴趣区域的位置信息；将置信度大于第一预设阈值的第三区域的位置信息确...

【专利技术属性】
技术研发人员：吕永春，朱徽，周迅溢，曾定衡，
申请(专利权)人：马上消费金融股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人