训练目标检测模型和构建样本集的方法、装置及存储介质制造方法及图纸

技术编号：33119261 阅读：17 留言：0更新日期：2022-04-17 00:15

本申请涉及人工智能技术领域，特别是公开了一种训练目标检测模型和构建样本集的方法、装置及存储介质。其中，该方法包括：利用第一训练样本集对第一目标检测模型进行训练，其中训练样本集包括第一图像集合和第一标注集合，第一图像集合包括多个第一图像，第一标注集合包括分别与多个第一图像对应的第一标注信息；利用第一目标检测模型确定与第二图像集合对应的第二标注集合，第二图像集合包括多个第二图像，第二标注集合包括分别与多个第二图像对应的第二标注信息；以及将第一图像与相应的第一标注信息进行配对，将第二图像与相应的第二标注信息进行配对，并且利用配对后的图像和标注信息对待训练的目标检测模型进行训练。信息对待训练的目标检测模型进行训练。信息对待训练的目标检测模型进行训练。

全部详细技术资料下载

【技术实现步骤摘要】
训练目标检测模型和构建样本集的方法、装置及存储介质

[0001]本申请涉及人工智能
，特别是涉及一种训练目标检测模型和构建样本集的方法、装置及存储介质。

技术介绍

[0002]深度学习技术的迅速发展与大规模类别的标注数据推动了计算机视觉任务的发展与进步，包括图像识别、目标检测与图像分割。其中，目标检测技术作为计算机视觉任务中一个有着广泛适用范围和需求的基础任务，受到了广泛的关注。
[0003]和分类模型一样，基于CNN的目标检测模型需要大量的标注信息用于监督训练。但不同的是，分类训练集数据只需要标注图像的类别信息（class），而检测训练集数据需要同时标注图像中的多个边界框（bbox）和类别（class）。例如，当样本图像中包含多个目标对象时，则需要分别标注与每个目标对象对应的类别以及相应的边界框的位置信息。研究表明，边界框标注的时间约为10sec/ins，是类别标注耗时的10倍（1sec/class），因此获得大规模的高质量检测数据集代价十分高，这使得完全依赖监督方法的目标检测模型的训练受到限制。
[0004]针对上述的现有技术中存在的目标检测模型的检测训练集数据的标注成本高昂，导致目标检测模型的训练受到限制的的技术问题，目前尚未提出有效的解决方案。

技术实现思路

[0005]本公开的实施例提供了一种训练目标检测模型和构建样本集的方法、装置及存储介质，以至少解决现有技术中存在的目标检测模型的检测训练集数据的标注成本高昂，导致目标检测模型的训练受到限制的的技术问题。
[0...

【技术保护点】

【技术特征摘要】
1.一种对目标检测模型进行训练的方法，其特征在于，包括：利用第一训练样本集对第一目标检测模型进行训练，其中所述训练样本集包括第一图像集合和第一标注集合，所述第一图像集合包括多个第一图像，所述第一标注集合包括分别与所述多个第一图像对应的第一标注信息，并且每个第一标注信息包括第一边界框位置信息以及与所述第一边界框位置信息对应的类别信息；利用所述第一目标检测模型确定与第二图像集合对应的第二标注集合，所述第二图像集合包括多个第二图像，所述第二标注集合包括分别与所述多个第二图像对应的第二标注信息，并且每个第二标注信息包括第二边界框位置信息以及与所述第二边界框位置信息对应的类别信息；以及将所述第一图像与相应的第一标注信息进行配对，将所述第二图像与相应的第二标注信息进行配对，并且利用配对后的图像和标注信息对待训练的目标检测模型进行训练。2.根据权利要求1所述的方法，其特征在于，将所述第一图像与相应的第一标注信息进行配对，将所述第二图像与相应的第二标注信息进行配对，并且利用配对后的图像和标注信息，对待训练的目标检测模型进行训练的操作，包括：对所述第一图像集合和所述第二图像集合中的图像进行组合，得到对待训练的目标检测模型进行训练的图像批次；以及将所述图像批次中的第一图像与相应的第一标注信息配对，将所述图像批次中的第二图像与相应的第二标注信息配对，并且利用配对后的图像和标注信息，对待训练的目标检测模型进行训练。3.根据权利要求2所述的方法，其特征在于，对所述第一图像集合和所述第二图像集合中的图像进行组合，得到对待训练的目标检测模型进行训练的图像批次的操作，包括：对所述第一图像集合和所述第二图像集合中的图像进行图像增强处理；以及将图像增强处理后的图像进行组合，得到所述图像批次。4.根据权利要求2所述的方法，其特征在于，利用所述第一目标检测模型确定与第二图像集合对应的第二标注集合的操作，包括：利用设置于所述第一目标检测模型的锚框，通过所述第一目标检测模型对所述多个第二图像进行目标检测，确定所述第二标注集合的第一标注子集，其中所述第一标注子集包括多个第三标注信息，所述第三标注信息分别与所述多个第二图像对应，并且每个第三标注信息包括根据所述锚框确定的第三边界框位置信息以及与所述第三边界框位置信息对应的类别信息；对所述多个第二图像进行随机图像块采样处理，确定与所述多个第二图像对应的图像块的图像块边界框信息；以及利用设置于所述第一目标检测模型的锚框以及所述图像块边界框信息，通过所述第一目标检测模型对所述多个第二图像进行目标检测，确定所述第二标注集合的第二标注子集，其中所述第二标注子集包括多个第四标注信息，所述第四标注信息分别与所述多个第二图像对应，并且每个第四标注信息包括根据所述锚框以及所述图像块边界框信息确定的第三边界框位置信息以及与所述第三边界框位置信息对应的类别信息。5.根据权利要求4所述的方法，其特征在于，将所述图像批次中的第一图像与相应的第一标注信息配对，将所述图像批次中的第二图像与相应的第二标注信息配对，并且利用配
对后的图像和标注信息，对待训练的目标检测模型进行训练的操作，包括：使用不同的初始化参数，分别对待训练的第二目标检测模型和第三目标检测模型进行初始化；将所述图像批次中的第一图像与相应的第一标注信息配对，将所述图像批次中的第二图像与相应的第三标注信息配对，并且利用配对后的第一图像和第一标注信息以及配对后的第二图像和第三标注信息，对所述第二目标检测模型进行训练；以及将所述图像批次中的第一图像与相应的第一标注信息配对，将所述图像批次中的第二...

【专利技术属性】
技术研发人员：陈文晶，王坚，李兵，余昊楠，胡卫明，
申请(专利权)人：人民中科济南智能技术有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人