一种训练样本的生成方法及生成装置制造方法及图纸

技术编号：30100439 阅读：50 留言：0更新日期：2021-09-18 09:05

本申请适用于图像处理的技术领域，提供一种训练样本的生成方法及生成装置，所述生成方法包括：获取多个车辆样本图像各自对应的原始标签集合；在原始标签集合中保留单个目标车辆信息对应的第一标签，并将其余车辆信息对应的第二标签替换为预设参数，得到原始标签集合对应的第一标签集合；循环执行所述按照不同所述目标车辆信息的预设顺序，在多个所述第一标签集合中获取每个所述预设顺序对应的一个目标第一标签集合，形成第一标签集合组的步骤，得到目标训练样本集合。由于在循环排列后，不同目标车辆信息的第一标签的数量均匀且分布具有循环性，故可保证不同目标车辆信息的第一标签的均匀分布。签的均匀分布。签的均匀分布。

全部详细技术资料下载

【技术实现步骤摘要】
一种训练样本的生成方法及生成装置

[0001]本申请属于图像处理的
，尤其涉及一种训练样本的生成方法及生成装置。

技术介绍

[0002]多分类模型是图像处理领域中常用的识别手段，可应用于不同的场景，例如：应用于车辆识别场景，以实现对车辆类型、车辆颜色、车辆品牌以及朝向等不同车辆信息对应的标签进行识别。其中，对于车辆识别场景而言，往往需要同时识别车辆样本图像中的多个车辆信息对应的标签。故多分类模型在训练阶段需要获取具有多个标签的训练样本(训练样本包括车辆样本图像以及车辆样本图像对应的多个标签)，并通过训练样本对多分类模型进行训练。
[0003]然而，训练样本在采集过程中往往由于车辆样本图像过于模糊、主体缺失或属性稀缺性等原因，无法获取车辆样本图像对应车辆信息的所有标签。导致训练样本集合中每种车辆信息的标签分布不均匀，进而导致根据训练样本集合训练得到的多分类模型的分类效果不佳。故，如何保证训练样本集合中各类标签的均匀分布，成了一个亟需解决的技术问题。

技术实现思路

[0004]有鉴于此，本申请实施例提供了一种训练样本的生成方法、生成装置、终端设备以及计算机可读存储介质，可以解决训练样本集合中每种标签的数据分布不均匀的技术问题。
[0005]本申请实施例的第一方面提供了一种训练样本的生成方法，所述生成方法包括：
[0006]获取多个车辆样本图像各自对应的原始标签集合；所述原始标签集合包括由不同的车辆信息各自对应标签构成的集合；
[0007]在所述原始标签集合中保留单个目...

【技术保护点】

【技术特征摘要】
1.一种训练样本的生成方法，其特征在于，所述生成方法，包括：获取多个车辆样本图像各自对应的原始标签集合；所述原始标签集合包括由不同的车辆信息各自对应标签构成的集合；在所述原始标签集合中保留单个目标车辆信息对应的第一标签，并将其余车辆信息对应的第二标签替换为预设参数，得到所述原始标签集合对应的第一标签集合；所述预设参数用于暂停所述其余车辆信息对多分类模型的训练操作或测试操作；所述第一标签用于训练或测试所述多分类模型；按照不同目标车辆信息的预设顺序，在多个所述第一标签集合中获取每个所述预设顺序对应的一个目标第一标签集合，形成第一标签集合组；所述目标第一标签集合是指包括所述预设顺序对应的所述目标车辆信息的第一标签集合；循环执行所述按照不同所述目标车辆信息的预设顺序，在多个所述第一标签集合中获取每个所述预设顺序对应的一个目标第一标签集合，形成第一标签集合组的步骤，并将各个所述第一标签集合组以及各个所述第一标签集合组对应的车辆样本图像作为目标训练样本集合；所述目标训练样本集合用于训练或测试所述多分类模型。2.如权利要求1所述生成方法，其特征在于，所述获取多个车辆样本图像各自对应的原始标签集合，包括：获取多个第一车辆样本图像以及预先训练的第一多分类模型；将所述第一车辆样本图像输入所述第一多分类模型处理，得到由所述第一多分类模型输出所述第一车辆样本图像对应的第一原始标签集合；获取基于所述第一原始标签集合扩充的多个第二车辆样本图像；将所述第二车辆样本图像集合输入所述第一多分类模型处理，得到由所述第一多分类模型输出所述第二车辆样本图像对应的第二原始标签集合；将所述第二原始标签集合，作为多个车辆样本图像各自对应的所述原始标签集合。3.如权利要求2所述生成方法，其特征在于，在所述循环执行所述按照不同所述目标车辆信息的预设顺序，在多个所述第一标签集合中获取每个所述预设顺序对应的一个目标第一标签集合，形成第一标签集合组的步骤，并将各个所述第一标签集合组以及各个所述第一标签集合组对应的车辆样本图像作为目标训练样本集合之后，还包括：通过所述目标训练样本集合训练所述第一多分类模型，得到第二多分类模型；将所述第二多分类模型作为预先训练的第一多分类模型，将目标训练样本集合中的图像作为所述第一车辆样本图像，并循环执行所述获取多个第一车辆样本图像以及预先训练的第一多分类模型的步骤以及后续步骤，直至所述目标训练样本集合符合预设条件。4.如权利要求2所述生成方法，其特征在于，所述将所述第一车辆样本图像输入所述第一多分类模型处理，得到由所述第一多分类模型输出所述第一车辆样本图像对应的第一原始标签集合，包括：通过车辆检测模型，截取每个所述过滤车辆样本图像中车辆所处图像区域对应的目标图像；通过车辆过滤模型，过滤多个所述第一车辆样本图像，得到过滤车辆样本图像；将所述目标图像输入所述第一多分类模型处理，得到由所述第一多分类模型输出所述第一车辆样本图像对应的第一原始标签集合。
5.如权利要求1所述生成方法，其特征在于，所述在所述原始标签集合中保留单个目标车辆信息对应的第一标签，并将其余车辆信息对应的第二标签替换为预设参数，得到所述原始标签集合对应的第一标签集合，包括：将多个所述原始标签集合中错误标签集合进行纠...

【专利技术属性】
技术研发人员：陈晓，张伟，谢思敏，
申请(专利权)人：杭州联吉技术有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人