增加训练数据的方法、相关设备及可读存储介质技术

技术编号:34174742 阅读:58 留言:0更新日期:2022-07-17 11:38
本申请公开了一种增加训练数据的方法、相关设备及可读存储介质。本方案中,利用训练数据集对第一模型进行训练,得到第二模型;确定第二模型对训练数据集中各训练数据的预测结果;确定训练数据集中与预测结果为错误的训练数据相似的训练数据作为要增加的训练数据,将其添加至训练数据集中,生成新的训练数据集。由于模型对预测结果为正确的训练数据对应情形的特征学习的较好,对预测结果为错误的训练数据对应情形的特征学习不够,因此,在本申请中从候选数据集中确定与预测结果为错误的数据相似的候选数据作为要增加的训练数据,能够准确覆盖模型学习较差的情形,使得深度学习模型能够快速达到较好的效果。型能够快速达到较好的效果。型能够快速达到较好的效果。

【技术实现步骤摘要】
增加训练数据的方法、相关设备及可读存储介质


[0001]本申请涉及深度学习
,更具体的说,是涉及一种增加训练数据的方法、相关设备及可读存储介质。

技术介绍

[0002]在特定场景中,可以通过训练一个深度学习模型解决制定问题(如,图像分类、目标检测等)。深度学习模型往往需要大量有标注的训练数据作为训练样本才能完成训练,在现实应用中,通过一次收集训练数据可能无法覆盖场景中各种情形,因此,无法使深度学习模型达到较好的效果,需要增加训练数据对深度学习模型进行迭代训练,以提升深度学习模型的效果。
[0003]目前,多采用人工方式确定要增加什么情形下的训练数据,再利用要增加的训练数据,与原有的训练数据一起对上次训练得到的深度学习模型进行迭代训练,但是,采用人工方式确定的要增加的训练数据往往缺乏准确性,无法准确覆盖模型学习较差的情形,导致深度学习模型无法快速达到较好的效果。
[0004]因此,如何增加训练数据,使得增加的训练数据能够准确覆盖模型学习较差的情形,使得深度学习模型能够快速达到较好的效果,成为本领域技术人员亟待解决的技术问题。

技术实现思路

[0005]鉴于上述问题,本申请提出了一种增加训练数据的方法、相关设备及可读存储介质。具体方案如下:
[0006]一种增加训练数据的方法,所述方法包括:
[0007]获取训练数据集、第一模型和候选数据集;
[0008]利用所述训练数据集对所述第一模型进行训练,得到第二模型;
[0009]将所述训练数据集中的各训练数据输入所述第二模型,得到所述第二模型对所述训练数据集中各训练数据的预测结果;
[0010]基于所述第二模型对所述训练数据集中各训练数据的预测结果,从所述候选数据集中确定要增加的训练数据;所述要增加的训练数据与预测结果为错误的训练数据相似;
[0011]将所述要增加的训练数据添加至所述训练数据集中,生成新的训练数据集。
[0012]可选地,所述基于所述第二模型对所述训练数据集中各训练数据的预测结果,从所述候选数据集中确定要增加的训练数据,包括:
[0013]对所述训练数据集进行聚类,得到多个类以及每个类的聚类中心和聚类半径;每个类对应至少一个训练数据;
[0014]从各个类中确定正类,所述正类对应的训练数据中,预测结果为正确的训练数据所占比例满足预设条件;
[0015]针对所述候选数据集中的每个候选数据,计算所述候选数据与每个正类的聚类中
心的距离;基于所述候选数据与各个正类的聚类中心的距离,和,各个正类的聚类半径,确定所述候选数据是否与预测结果为错误的训练数据相似;如果所述候选数据与预测结果为错误的训练数据相似,则将所述候选数据确定为要增加的训练数据。
[0016]可选地,所述对所述训练数据集进行聚类,得到多个类以及每个类的聚类中心和聚类半径,包括:
[0017]确定所述训练数据集中各训练数据的特征表示;
[0018]基于所述训练数据集中各训练数据的特征表示,对所述训练数据集进行聚类,得到多个类以及每个类的聚类中心和聚类半径。
[0019]可选地,所述确定所述训练数据集中各训练数据的特征表示,包括:
[0020]将所述训练数据集中各训练数据输入所述第二模型,所述第二模型输出所述训练数据集中各训练数据的特征表示。
[0021]可选地,计算所述候选数据与每个正类的聚类中心的距离,包括:
[0022]确定所述候选数据集中各个候选数据的特征表示;
[0023]计算所述候选数据的特征表示与每个正类的聚类中心的距离,作为所述候选数据与每个正类的聚类中心的距离。
[0024]可选地,所述确定所述候选数据集中各个候选数据的特征表示,包括:
[0025]将所述候选数据集中各个候选数据输入所述第二模型,所述第二模型输出所述候选数据集中各个候选数据的特征表示。
[0026]可选地,所述基于所述候选数据与各个正类的聚类中心的距离,和,各个正类的聚类半径,确定所述候选数据是否与预测结果为错误的训练数据相似,包括:
[0027]针对每个正类,判断所述候选数据与所述正类的聚类中心的距离是否小于预设倍数的所述正类的聚类半径;
[0028]如果不存在候选数据与正类的聚类中心的距离小于预设倍数的聚类半径的正类,则确定所述候选数据与预测结果为错误的训练数据相似。
[0029]一种增加训练数据的装置,所述装置包括:
[0030]获取单元,用于获取训练数据集、第一模型和候选数据集;
[0031]训练单元,用于利用所述训练数据集对所述第一模型进行训练,得到第二模型;
[0032]预测结果确定单元,用于将所述训练数据集中的各训练数据输入所述第二模型,得到所述第二模型对所述训练数据集中各训练数据的预测结果;
[0033]要增加的训练数据确定单元,用于基于所述第二模型对所述训练数据集中各训练数据的预测结果,从所述候选数据集中确定要增加的训练数据;所述要增加的训练数据与预测结果为错误的训练数据相似;
[0034]训练数据增加单元,用于将所述要增加的训练数据添加至所述训练数据集中,生成新的训练数据集。
[0035]可选地,所述要增加的训练数据确定单元,包括:
[0036]聚类单元,用于对所述训练数据集进行聚类,得到多个类以及每个类的聚类中心和聚类半径;每个类对应至少一个训练数据;
[0037]正类确定单元,用于从各个类中确定正类,所述正类对应的训练数据中,预测结果为正确的训练数据所占比例满足预设条件;
[0038]候选数据判定单元,用于针对所述候选数据集中的每个候选数据,计算所述候选数据与每个正类的聚类中心的距离;基于所述候选数据与各个正类的聚类中心的距离,和,各个正类的聚类半径,确定所述候选数据是否与预测结果为错误的训练数据相似;如果所述候选数据与预测结果为错误的训练数据相似,则将所述候选数据确定为要增加的训练数据。
[0039]可选地,所述聚类单元,包括:
[0040]第一特征表示确定单元,用于确定所述训练数据集中各训练数据的特征表示;
[0041]聚类子单元,用于基于所述训练数据集中各训练数据的特征表示,对所述训练数据集进行聚类,得到多个类以及每个类的聚类中心和聚类半径。
[0042]可选地,所述第一特征表示确定单元,具体用于:
[0043]将所述训练数据集中各训练数据输入所述第二模型,所述第二模型输出所述训练数据集中各训练数据的特征表示。
[0044]可选地,所述候选数据判定单元,包括,距离计算单元;
[0045]所述距离计算单元,包括:
[0046]第二特征表示确定单元,用于确定所述候选数据集中各个候选数据的特征表示;
[0047]距离计算子单元,用于计算所述候选数据与每个正类的聚类中心的距离,作为所述候选数据与每个正类的聚类中心的距离。
[0048]可选地,所述第本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种增加训练数据的方法,其特征在于,所述方法包括:获取训练数据集、第一模型和候选数据集;利用所述训练数据集对所述第一模型进行训练,得到第二模型;将所述训练数据集中的各训练数据输入所述第二模型,得到所述第二模型对所述训练数据集中各训练数据的预测结果;基于所述第二模型对所述训练数据集中各训练数据的预测结果,从所述候选数据集中确定要增加的训练数据;所述要增加的训练数据与预测结果为错误的训练数据相似;将所述要增加的训练数据添加至所述训练数据集中,生成新的训练数据集。2.根据权利要求1所述的方法,所述基于所述第二模型对所述训练数据集中各训练数据的预测结果,从所述候选数据集中确定要增加的训练数据,包括:对所述训练数据集进行聚类,得到多个类以及每个类的聚类中心和聚类半径;每个类对应至少一个训练数据;从各个类中确定正类,所述正类对应的训练数据中,预测结果为正确的训练数据所占比例满足预设条件;针对所述候选数据集中的每个候选数据,计算所述候选数据与每个正类的聚类中心的距离;基于所述候选数据与各个正类的聚类中心的距离,和,各个正类的聚类半径,确定所述候选数据是否与预测结果为错误的训练数据相似;如果所述候选数据与预测结果为错误的训练数据相似,则将所述候选数据确定为要增加的训练数据。3.根据权利要求2所述的方法,其特征在于,所述对所述训练数据集进行聚类,得到多个类以及每个类的聚类中心和聚类半径,包括:确定所述训练数据集中各训练数据的特征表示;基于所述训练数据集中各训练数据的特征表示,对所述训练数据集进行聚类,得到多个类以及每个类的聚类中心和聚类半径。4.根据权利要求3所述的方法,其特征在于,所述确定所述训练数据集中各训练数据的特征表示,包括:将所述训练数据集中各训练数据输入所述第二模型,所述第二模型输出所述训练数据集中各训练数据的特征表示。5.根据权利要求2所述的方法,其特征在于,计算所述候选数据与每个正类的聚类中心的距离,包括:确定所述候...

【专利技术属性】
技术研发人员:张友国贾若然谭昶吕军胡少云冯翔刘江姜殿洪宋薇薇
申请(专利权)人:讯飞智元信息科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1