一种基于动态采样的分类模型迭代加速方法及系统技术方案

技术编号：36893755 阅读：17 留言：0更新日期：2023-03-15 22:12

本申请提供一种基于动态采样的分类模型迭代加速方法及系统，所述方法通过加载待训练模型，得到待训练模型的初始化权重，并根据初始化权重调整训练轮数，按照特定的比例，将训练轮数分割为多个数组，并设置每个数组在训练时的梯度步长。最后按照多个数组的训练顺序以及对应的梯度步长，对待训练模型交替进行全部训练和部分训练，直至待训练模型收敛。本申请提供的方法通过分割训练轮数，并在对应的数组筛选出部分较难学习的训练样本进行训练，再通过交替进行全部训练和部分训练的方式防止待训练模型的学习遗忘，以达到节省待训练模型的训练时间，提升待训练模型的训练效率的目的。提升待训练模型的训练效率的目的。提升待训练模型的训练效率的目的。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于动态采样的分类模型迭代加速方法及系统

[0001]本申请涉及检测模型训练领域，尤其涉及一种基于动态采样的分类模型迭代加速方法及系统。

技术介绍

[0002]在工业视觉领域，由于采样数据比较困难，往往初始训练的可用数据比较少，在对用于工业检测的模型训练时，需要后期不停的收集样本，进行迭代训练。这就造成了大量时间和资源的消耗，所以在保证精度的情况下，提高迭代训练速度是一项很重要的问题。
[0003]现有迭代训练的常规方法是将一个由大型数据集训练出来的待训练模型的权重作为迭代训练的初始化权重，再随着样本数据的不断增多，向数据集中不断增加新采样得到的样本数据，再使用增量后的数据集作为训练集重新对待训练模型进行训练。
[0004]但是，上述预模型在不断迭代训练的过程中，每迭代训练一次都需要耗费大量的时间，且占用资源。多次的对待训练模型进行迭代训练更是极大增加了工业产品的生产周期以及维护成本，降低生产效率。

技术实现思路

[0005]为解决在工业视觉领域中，待训练模型在不断迭代训练的过程中，训练一次待训练模型需要消耗大量的时间，且占用资源，多次对待训练模型进行迭代训练极大增加工业产品的生产周期以及维护成本，降低生产效率的问题。
[0006]第一方面，本申请实施例提供一种基于动态采样的分类模型迭代加速方法及系统，所述方法包括：
[0007]加载待训练模型，得到所述待训练模型的初始化权重；
[0008]根据所述初始化权重调整训练轮数，并按照第一预设比例将所述训练轮数分割...

【技术保护点】

【技术特征摘要】
1.一种基于动态采样的分类模型迭代加速方法，其特征在于，所述方法包括：加载待训练模型，得到所述待训练模型的初始化权重；根据所述初始化权重调整训练轮数，并按照第一预设比例将所述训练轮数分割为多个数组；设置每个数组在训练时的梯度步长；按照多个数组的训练顺序以及对应的梯度步长，对待训练模型交替进行全部训练和部分训练；所述全部训练为使用所述训练集中的全部训练样本对待训练模型进行训练；所述部分训练为使用训练集中第二预设比例的训练样本对待训练模型进行训练。2.根据权利要求1所述的基于动态采样的分类模型迭代加速方法，其特征在于，所述方法还包括：按照所述数组的个数，将训练集分为多个子训练集；按照第二预设比例筛选所述子训练集中的训练样本，得到有效样本集；使用所述有效样本集对待训练模型进行所述部分训练。3.根据权利要求2所述的基于动态采样的分类模型迭代加速方法，其特征在于，按照第二预设比例筛选所述子训练集中的训练样本的步骤中，所述方法还包括：在执行任意一次训练之后，获取当前模型的训练权重；根据所述训练权重，计算下一次训练对应的子训练集中的训练样本的学习难度等级；根据第二预设比例，按照所述学习难度等级由高到低的排列顺序筛选有效样本。4.根据权利要求3所述的基于动态采样的分类模型迭代加速方法，其特征在于，计算下一次训练对应的子训练集中样本的难度值的步骤中，所述方法还包括：使用交叉熵损失函数计算子训练集中的训练样本的交叉熵损失；按照所述交叉熵损失确定样本的所述学习难度等级。5.根据权利要求2所述的基于动态采样的分类模型迭代加速方法，其特征在于，所述方法还包括：在对所述待训练模型进行全部训练之前，按照第三预设比例从训练集中筛选迭代样本；使用所述训练集中的全部样本以及所述迭代样本对所述待训练模型进行所述全部训练。6.根据权利要求2所述的基于动态采样的分类模型迭代加速方法，其特征在于，设置每个子轮数在训练时的梯度步长之后，所述方法还包括：计...

【专利技术属性】
技术研发人员：李楠，彭斌，杨艺，
申请(专利权)人：凌云光技术股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人