一种训练模型的训练样本构建方法和训练模型的获取方法技术

技术编号:42845950 阅读:34 留言:0更新日期:2024-09-27 17:15
本申请提供一种训练模型的训练样本构建方法和训练模型的获取方法,一种训练模型的训练样本构建方法包括:获取原始数据集,利用不同的数据增强策略分别对原始数据集进行数据增强操作,得到与各数据增强策略分别对应的候选数据集;将多个候选数据集分别输入至初始训练模型进行训练,得到与各候选数据集对应的候选训练模型;对各候选训练模型进行评测,确定出目标候选数据集以及对应的目标数据增强策略;将目标候选数据集确定为目标训练样本集,或者,将利用目标数据增强策略进行数据增强的原始数据集以及目标候选数据集确定为目标训练样本集。利用本方法构建出的目标训练样本集进行模型训练,能够提高训练出的目标训练模型的性能。

【技术实现步骤摘要】

本申请涉及深度学习,尤其涉及一种训练模型的训练样本构建方法和装置、一种模型训练方法、一种训练模型的获取方法、终端设备以及计算机可读存储介质。


技术介绍

1、近年来,训练模型在自动驾驶、识别分拣、自然语言处理以及信息推荐等领域都发挥了重要作用。利用大量的训练样本基于初始训练模型进行学习训练,学习训练样本的内在规律和表示层次以得到对应的目标训练模型。在进行模型训练的过程中,若高质量的训练样本较少,将导致初始训练模型得不到充分训练,从而影响最终得出的目标训练模型的性能。

2、为了解决这一技术问题,目前的技术方案是基于多种数据增强策略对原始数据集进行数据增强(data augmentation)操作,以增加训练样本的数据量。但是,由于数据增强策略多种多样,利用按照目前的技术方案得出的训练样本进行模型训练,得出的目标训练模型的性能较差。

3、因此,如何提高训练模型的性能,是本领域技术人员目前需要解决的技术问题。


技术实现思路

1、本申请的目的在于提供一种训练模型的训练样本构建方法和装置、一种模型本文档来自技高网...

【技术保护点】

1.一种训练模型的训练样本构建方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述获取原始数据集,利用不同的数据增强策略分别对所述原始数据集进行数据增强操作,得到与各所述数据增强策略分别对应的候选数据集,包括:

3.根据权利要求2所述的方法,其特征在于,所述分析结果包括所述原始数据集的数据集特征。

4.根据权利要求3所述的方法,其特征在于,所述方法还包括:

5.根据权利要求4所述的方法,其特征在于,与所述初始训练模型对应的目标训练模型为危险车辆识别模型;所述模型特征为识别模型,所述识别模型的识别因子包括车辆型号和...

【技术特征摘要】

1.一种训练模型的训练样本构建方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述获取原始数据集,利用不同的数据增强策略分别对所述原始数据集进行数据增强操作,得到与各所述数据增强策略分别对应的候选数据集,包括:

3.根据权利要求2所述的方法,其特征在于,所述分析结果包括所述原始数据集的数据集特征。

4.根据权利要求3所述的方法,其特征在于,所述方法还包括:

5.根据权利要求4所述的方法,其特征在于,与所述初始训练模型对应的目标训练模型为危险车辆识别模型;所述模型特征为识别模型,所述识别模型的识别因子包括车辆型号和标识。

6.根据权利要求1所述的方法,其特征在于,所述原始数据集包括原始图像数据集和/或原始点云数据集。

7.根据权利要求4所述的方法,其特征在于,所述数据增强策略包括翻转、平移、缩放和镜像中的任意一种或者两种以上组合。

8.根据权利要求4所述的方法,其特征在于,所述数据增强策略包括旋转、加噪声、降采样、遮挡、平移、修改反射率和拼接中的任意一种或者两种以上组合。

9.根据权利要求1至8任一项所述的方法,其特征在于,所述方法还包括:

10.一种模型训练方法,其特征在于,所述方法包括:

11.一种训练模型的获取方法,其特征在于,所述方法包括:

12.根据权利要求11所述的方法,其特征在于,所述多个初始训练模型为同类任务训练模型;

13.根据权利要求11所述的方法,其特征在于,所述获取原始数据集,利用不同的数据增...

【专利技术属性】
技术研发人员:黄翔宇安海洋胡立同
申请(专利权)人:北京万集科技股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1