一种训练样本的生成方法及生成装置制造方法及图纸

技术编号:30100439 阅读:50 留言:0更新日期:2021-09-18 09:05
本申请适用于图像处理的技术领域,提供一种训练样本的生成方法及生成装置,所述生成方法包括:获取多个车辆样本图像各自对应的原始标签集合;在原始标签集合中保留单个目标车辆信息对应的第一标签,并将其余车辆信息对应的第二标签替换为预设参数,得到原始标签集合对应的第一标签集合;循环执行所述按照不同所述目标车辆信息的预设顺序,在多个所述第一标签集合中获取每个所述预设顺序对应的一个目标第一标签集合,形成第一标签集合组的步骤,得到目标训练样本集合。由于在循环排列后,不同目标车辆信息的第一标签的数量均匀且分布具有循环性,故可保证不同目标车辆信息的第一标签的均匀分布。签的均匀分布。签的均匀分布。

【技术实现步骤摘要】
一种训练样本的生成方法及生成装置


[0001]本申请属于图像处理的
,尤其涉及一种训练样本的生成方法及生成装置。

技术介绍

[0002]多分类模型是图像处理领域中常用的识别手段,可应用于不同的场景,例如:应用于车辆识别场景,以实现对车辆类型、车辆颜色、车辆品牌以及朝向等不同车辆信息对应的标签进行识别。其中,对于车辆识别场景而言,往往需要同时识别车辆样本图像中的多个车辆信息对应的标签。故多分类模型在训练阶段需要获取具有多个标签的训练样本(训练样本包括车辆样本图像以及车辆样本图像对应的多个标签),并通过训练样本对多分类模型进行训练。
[0003]然而,训练样本在采集过程中往往由于车辆样本图像过于模糊、主体缺失或属性稀缺性等原因,无法获取车辆样本图像对应车辆信息的所有标签。导致训练样本集合中每种车辆信息的标签分布不均匀,进而导致根据训练样本集合训练得到的多分类模型的分类效果不佳。故,如何保证训练样本集合中各类标签的均匀分布,成了一个亟需解决的技术问题。

技术实现思路

[0004]有鉴于此,本申请实施例提供了一种训练样本的生成方法、生成装置、终端设备以及计算机可读存储介质,可以解决训练样本集合中每种标签的数据分布不均匀的技术问题。
[0005]本申请实施例的第一方面提供了一种训练样本的生成方法,所述生成方法包括:
[0006]获取多个车辆样本图像各自对应的原始标签集合;所述原始标签集合包括由不同的车辆信息各自对应标签构成的集合;
[0007]在所述原始标签集合中保留单个目标车辆信息对应的第一标签,并将其余车辆信息对应的第二标签替换为预设参数,得到所述原始标签集合对应的第一标签集合;所述预设参数用于暂停所述其余车辆信息对多分类模型的训练操作或测试操作;所述第一标签用于训练或测试所述多分类模型;
[0008]按照不同目标车辆信息的预设顺序,在多个所述第一标签集合中获取每个所述预设顺序对应的一个目标第一标签集合,形成第一标签集合组;所述目标第一标签集合是指包括所述预设顺序对应的所述目标车辆信息的第一标签集合;
[0009]循环执行所述按照不同所述目标车辆信息的预设顺序,在多个所述第一标签集合中获取每个所述预设顺序对应的一个目标第一标签集合,形成第一标签集合组的步骤,并将各个所述第一标签集合组以及各个所述第一标签集合组对应的车辆样本图像作为目标训练样本集合;所述目标训练样本集合用于训练所述多分类模型。
[0010]本申请实施例的第二方面提供了一种训练样本的生成装置,所述生成装置包括:
[0011]获取单元,用于获取多个车辆样本图像各自对应的原始标签集合;所述原始标签集合包括由不同的车辆信息各自对应标签构成的集合;
[0012]处理单元,用于在所述原始标签集合中保留单个目标车辆信息对应的第一标签,并将其余车辆信息对应的第二标签替换为预设参数,得到所述原始标签集合对应的第一标签集合;所述预设参数用于暂停所述其余车辆信息对多分类模型的训练操作或测试操作;所述第一标签用于训练或测试所述多分类模型;
[0013]排列单元,用于按照不同目标车辆信息的预设顺序,在多个所述第一标签集合中获取每个所述预设顺序对应的一个目标第一标签集合,形成第一标签集合组;所述目标第一标签集合是指包括所述预设顺序对应的所述目标车辆信息的第一标签集合;
[0014]循环单元,用于循环执行所述按照不同所述目标车辆信息的预设顺序,在多个所述第一标签集合中获取每个所述预设顺序对应的一个目标第一标签集合,形成第一标签集合组的步骤,并将各个所述第一标签集合组以及各个所述第一标签集合组对应的车辆样本图像作为目标训练样本集合;所述目标训练样本集合用于训练所述多分类模型。
[0015]本申请实施例的第三方面提供了一种终端设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述第一方面所述方法的步骤。
[0016]本申请实施例的第四方面提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述第一方面所述方法的步骤。
[0017]本申请实施例与现有技术相比存在的有益效果是:本申请通过,保留原始标签集合中单个目标车辆信息对应的第一标签,将其余车辆信息对应的第二标签替换为预设参数,得到第一标签集合。其中,预设参数用于暂停所述其余车辆信息对多分类模型的训练操作或测试操作;所述第一标签用于训练或测试所述多分类模型。也即,每个第一标签集合中有且仅有一个标签。进而按照不同目标车辆信息的预设顺序,在多个第一标签集合中获取每个预设顺序对应的一个目标第一标签集合,形成第一标签集合组,并以此循环执行上述步骤,得到目标训练样本集合。由于在循环排列后,不同目标车辆信息的第一标签的数量均匀且分布具有循环性,故可保证不同目标车辆信息的第一标签的均匀分布。解决了训练样本集合中每种标签的数据分布不均匀的技术问题。
附图说明
[0018]为了更清楚地说明本申请实施例中的技术方案,下面将对实施例或相关技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。
[0019]图1示出了本申请提供的一种训练样本的生成方法的示意性流程图;
[0020]图2示出了本申请提供的一种训练样本的生成方法中步骤101的示意性流程图;
[0021]图3示出了本申请提供的一种训练样本的生成方法中步骤1012的示意性流程图;
[0022]图4示出了本申请提供的一种训练样本的生成方法中步骤102的示意性流程图;
[0023]图5示出了本申请提供的另一种训练样本的生成方法中的示意性流程图;
[0024]图6示出了本申请提供的另一种训练样本的生成方法的示意性流程图;
[0025]图7示出了本申请提供的另一种训练样本的生成方法中的示意性流程图;
[0026]图8示出了本申请提供的目标多分类模型的网络结构的示意图;
[0027]图9示出了本申请提供的一种训练样本的生成装置的示意图;
[0028]图10是本专利技术一实施例提供的一种终端设备的示意图。
具体实施方式
[0029]以下描述中,为了说明而不是为了限定,提出了诸如特定系统结构、技术之类的具体细节,以便透彻理解本申请实施例。然而,本领域的技术人员应当清楚,在没有这些具体细节的其它实施例中也可以实现本申请。在其它情况中,省略对众所周知的系统、装置、电路以及方法的详细说明,以免不必要的细节妨碍本申请的描述。
[0030]为了更好地理解本申请解决的技术问题,故在此结合示例对上述
技术介绍
进行进一步说明:
[0031]车辆识别技术是一种利用深度学习模型进行车辆信息识别的技术。车辆识别技术所采用的深度学习网络包括单分类模型和多分类模型。单分类模型和多分类模型本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种训练样本的生成方法,其特征在于,所述生成方法,包括:获取多个车辆样本图像各自对应的原始标签集合;所述原始标签集合包括由不同的车辆信息各自对应标签构成的集合;在所述原始标签集合中保留单个目标车辆信息对应的第一标签,并将其余车辆信息对应的第二标签替换为预设参数,得到所述原始标签集合对应的第一标签集合;所述预设参数用于暂停所述其余车辆信息对多分类模型的训练操作或测试操作;所述第一标签用于训练或测试所述多分类模型;按照不同目标车辆信息的预设顺序,在多个所述第一标签集合中获取每个所述预设顺序对应的一个目标第一标签集合,形成第一标签集合组;所述目标第一标签集合是指包括所述预设顺序对应的所述目标车辆信息的第一标签集合;循环执行所述按照不同所述目标车辆信息的预设顺序,在多个所述第一标签集合中获取每个所述预设顺序对应的一个目标第一标签集合,形成第一标签集合组的步骤,并将各个所述第一标签集合组以及各个所述第一标签集合组对应的车辆样本图像作为目标训练样本集合;所述目标训练样本集合用于训练或测试所述多分类模型。2.如权利要求1所述生成方法,其特征在于,所述获取多个车辆样本图像各自对应的原始标签集合,包括:获取多个第一车辆样本图像以及预先训练的第一多分类模型;将所述第一车辆样本图像输入所述第一多分类模型处理,得到由所述第一多分类模型输出所述第一车辆样本图像对应的第一原始标签集合;获取基于所述第一原始标签集合扩充的多个第二车辆样本图像;将所述第二车辆样本图像集合输入所述第一多分类模型处理,得到由所述第一多分类模型输出所述第二车辆样本图像对应的第二原始标签集合;将所述第二原始标签集合,作为多个车辆样本图像各自对应的所述原始标签集合。3.如权利要求2所述生成方法,其特征在于,在所述循环执行所述按照不同所述目标车辆信息的预设顺序,在多个所述第一标签集合中获取每个所述预设顺序对应的一个目标第一标签集合,形成第一标签集合组的步骤,并将各个所述第一标签集合组以及各个所述第一标签集合组对应的车辆样本图像作为目标训练样本集合之后,还包括:通过所述目标训练样本集合训练所述第一多分类模型,得到第二多分类模型;将所述第二多分类模型作为预先训练的第一多分类模型,将目标训练样本集合中的图像作为所述第一车辆样本图像,并循环执行所述获取多个第一车辆样本图像以及预先训练的第一多分类模型的步骤以及后续步骤,直至所述目标训练样本集合符合预设条件。4.如权利要求2所述生成方法,其特征在于,所述将所述第一车辆样本图像输入所述第一多分类模型处理,得到由所述第一多分类模型输出所述第一车辆样本图像对应的第一原始标签集合,包括:通过车辆检测模型,截取每个所述过滤车辆样本图像中车辆所处图像区域对应的目标图像;通过车辆过滤模型,过滤多个所述第一车辆样本图像,得到过滤车辆样本图像;将所述目标图像输入所述第一多分类模型处理,得到由所述第一多分类模型输出所述第一车辆样本图像对应的第一原始标签集合。
5.如权利要求1所述生成方法,其特征在于,所述在所述原始标签集合中保留单个目标车辆信息对应的第一标签,并将其余车辆信息对应的第二标签替换为预设参数,得到所述原始标签集合对应的第一标签集合,包括:将多个所述原始标签集合中错误标签集合进行纠...

【专利技术属性】
技术研发人员:陈晓张伟谢思敏
申请(专利权)人:杭州联吉技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1