神经网络模型训练的方法和装置制造方法及图纸

技术编号:28943478 阅读:31 留言:0更新日期:2021-06-18 21:52
本申请公开了一种神经网络模型训练的方法和装置,属于机器学习技术领域。所述方法包括:获取新增样本集;将所述新增样本集输入目标神经网络模型,得到所述目标神经网络模型中至少一个候选分割层输出的特征数据集,其中,所述候选分割层为所述目标神经网络模型中的网络层;确定每个候选分割层输出的特征数据集的聚类程度,在所述候选分割层中确定出满足预设条件的聚类程度对应的目标分割层;基于所述新增样本集对所述目标分割层之后的网络层进行训练。采用本申请,可以提高神经网络模型的训练效率。

【技术实现步骤摘要】
神经网络模型训练的方法和装置
本申请涉及机器学习
,特别涉及一种神经网络模型训练的方法和装置。
技术介绍
神经网络模型可以高效的完成诸如目标检测、目标分类等任务,因此在安防、交通、工业生产等各个领域被广泛使用。如果想要得到一个可以较为准确的实现特定功能的神经网络模型,需要在建立神经网络模型之后,使用大量样本对其进行训练。对于神经网络模型的训练,较为常用的一种方式为增量训练,即训练神经网络模型所使用的样本不是一次提供的,而是分为多次提供。分批次对神经网络模型进行训练。目前,采用增量训练的方式训练神经网络模型时,每次获取到新增样本时,要使用新增样本对神经网络模型进行训练,调整神经网络中各网络层的参数。在实现本申请的过程中,申请人发现相关技术至少存在以下问题:神经网络模型中网络层较多时,每次获取到新增样本时,都要对整个神经网络模型中的各网络层的参数进行调整,训练效率较低。
技术实现思路
为了解决相关技术的问题,本申请实施例提供了一种神经网络模型训练的方法和装置。所述技术方案如下:<br>第一方面,提供本文档来自技高网...

【技术保护点】
1.一种神经网络模型训练的方法,其特征在于,所述方法包括:/n获取新增样本集;/n将所述新增样本集输入目标神经网络模型,得到所述目标神经网络模型中至少一个候选分割层输出的特征数据集,其中,所述候选分割层为所述目标神经网络模型中的网络层;/n确定每个候选分割层输出的特征数据集的聚类程度,在所述候选分割层中确定出满足预设条件的聚类程度对应的目标分割层;/n基于所述新增样本集对所述目标分割层之后的网络层进行训练。/n

【技术特征摘要】
1.一种神经网络模型训练的方法,其特征在于,所述方法包括:
获取新增样本集;
将所述新增样本集输入目标神经网络模型,得到所述目标神经网络模型中至少一个候选分割层输出的特征数据集,其中,所述候选分割层为所述目标神经网络模型中的网络层;
确定每个候选分割层输出的特征数据集的聚类程度,在所述候选分割层中确定出满足预设条件的聚类程度对应的目标分割层;
基于所述新增样本集对所述目标分割层之后的网络层进行训练。


2.根据权利要求1所述的方法,其特征在于,所述获取新增样本之前,还包括:
根据所述目标神经网络模型中各网络层的位置,在所述目标神经网络模型中确定出所述候选分割层。


3.根据权利要求2所述的方法,其特征在于,所述根据所述目标神经网络模型中各网络层的位置,在所述目标神经网络模型中确定出所述候选分割层,包括:
在所述目标神经网络模型中的网络层中,确定出网络连接层,作为所述候选分割层,其中,所述网络连接层连接所述目标神经网络模型,如果将所述网络连接层在所述目标神经网络模型中去除,则所述目标神经网络模型分为独立的两部分。


4.根据权利要求1所述的方法,其特征在于,所述确定每个候选分割层输出的特征数据集的聚类程度,在所述候选分割层中确定出满足预设条件的聚类程度对应的目标分割层,包括:
对于每个候选分割层,根据所述新增样本集中各新增样本所属的类别,确定所述候选分割层输出的特征数据集中每个特征数据所属的类别,每个类别的特征数据组成所述类别的特征数据子集;
对于每个类别的特征数据子集,确定对应的特征均值;
计算每个类别的特征数据子集中每个特征数据与所述特征数据子集对应的特征均值之间的聚类距离;
基于每个类别的特征数据子集中每个特征数据与所述特征数据子集对应的特征均值之间的聚类距离,和所述类别的特征数据的数目,确定所述类别的特征数据子集对应的第一聚类距离均值;
基于每个类别的特征数据子集对应的第一聚类距离均值和类别的数目,确定所述候选分割层输出的特征数据集对应的第二聚类距离均值;
在所有候选分割层输出的特征数据集对应的第二聚类距离均值中,确定出满足预设条件的目标聚类距离均值;
将所述目标聚类距离均值对应的候选分割层确定为目标分割层。


5.根据权利要求4所述的方法,其特征在于,所述确定出满足预设条件的目标聚类距离均值,包括:
确定出小于第一预设阈值的第三聚类距离均值;
将所述第三聚类距离中的最小值,确定为目标聚类距离均值。


6.根据权利要求4所述的方法,其特征在于,所述在所有候选分割层输出的特征数据集对应的第二聚类距离均值中,确定出满足预设条件的目标聚类距离均值;将所述目标聚类距离均值对应的候选分割层,确定为目标分割层,包括:
在所有候选分割层输出的特征数据集对应的第二聚类距离均值中,确定出小于第二预设阈值的第四聚类距离均值;
在所述第四聚类距离均值中,如果存在小于第三预设阈值的第五聚类距离均值,则在所述第五聚类均值对应的候选分割层中,将距离所述目标神经网络模型中的输入层最远的候选分割层,确定为目标分割层;
如果不存在小于所述第三预设阈值的第五聚类距离均值,则将所述第四聚类距离均值中的最小值确定为目标聚类距离均值;
将所述目标聚类距离均值对应的候选分割层确定为目标分割层。


7.根据权利要求1-6所述的方法,其特征在于,所述目标神经网络模型是以第一隐私场景的图像监控数据为训练数据训练得到的神经网络模型,所述新增样本集为第二隐私场景的图像监控数据。


8.根据权利要求1-6所述的方法,其特征在于,所述目标神经网络模型是以第一非隐私场景的图像监控数据为训练数据训练得到的神经网络模型,所述新增样本集为第二非隐私场景的图像监控数据;
所述基于所述新增样本集对所述目标分割层之后的网络层进...

【专利技术属性】
技术研发人员:孙海鸣
申请(专利权)人:杭州海康威视数字技术股份有限公司
类型:发明
国别省市:浙江;33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1