模型训练方法、装置及设备制造方法及图纸

技术编号:37404596 阅读:12 留言:0更新日期:2023-04-30 09:31
本申请实施例提供一种模型训练方法、装置及设备,该方法包括:获取多个第一训练样本,每个第一训练样本中包括M个特征,所述M为大于1的整数;确定每个特征对应的多个第一区间,得到N个第一区间,所述N为每个特征对应的第一区间的数量之和,所述N为大于1的整数;确定所述N个第一区间中每个第一区间中存在的第一训练样本的样本数量;根据所述N个第一区间中每个第一区间中存在的第一训练样本的样本数量,分别对每个第一区间对应的第一训练样本中的特征进行特征去除处理,得到多个第二训练样本;根据所述多个第二训练样本对预设模型进行训练。提高模型训练的效率。提高模型训练的效率。提高模型训练的效率。

【技术实现步骤摘要】
模型训练方法、装置及设备


[0001]本申请涉及计算机信息
,尤其涉及一种模型训练方法、装置及设备。

技术介绍

[0002]深度神经网络模型已应用于多个
,如,数据分类、图像识别等,深度神经网络模型需要对大量的样本数据进行训练,以得到符合需求的模型。
[0003]目前,在联邦学习的领域中,在模型的训练任务不同时,可以使用不同的训练样本训练得到不同的模型。但是,在训练任务相似或者场景相似的模型的训练过程中,每次建立新的训练任务时,都需要使用新的训练样本训练出一个新的模型,使得模型的训练时长较长,进而导致模型训练的效率较低。

技术实现思路

[0004]本申请实施例提供一种模型训练方法、装置及设备,用于解决现有技术中,模型训练的效率较低的技术问题。
[0005]第一方面,本申请实施例提供一种模型训练方法,该方法包括:
[0006]获取多个第一训练样本,每个第一训练样本中包括M个特征,所述M为大于1的整数;
[0007]确定每个特征对应的多个第一区间,得到N个第一区间,所述N为每个特征对应的第一区间的数量之和,所述N为大于1的整数;
[0008]确定所述N个第一区间中每个第一区间中存在的第一训练样本的样本数量;
[0009]根据所述N个第一区间中每个第一区间中存在的第一训练样本的样本数量,分别对每个第一区间对应的第一训练样本中的特征进行特征去除处理,得到多个第二训练样本;
[0010]根据所述多个第二训练样本对预设模型进行训练。
[0011]在一种可能的实施方式中,根据所述N个第一区间中每个第一区间中存在的第一训练样本的样本数量,分别对每个第一区间对应的第一训练样本中的特征进行特征去除处理,得到多个第二训练样本,包括:
[0012]确定所述多个第一区间对应的处理顺序;
[0013]按照所述处理顺序,根据所述N个第一区间中每个第一区间中存在的第一训练样本的样本数量,依次对每个第一区间对应的第一训练样本中的特征进行特征去除处理,得到多个第二训练样本。
[0014]在一种可能的实施方式中,针对任意一个第一区间;根据所述第一区间中存在的第一训练样本的样本数量,对所述第一区间对应的第一训练样本中的特征进行特征去除处理,包括:
[0015]若所述第一区间中存在的第一训练样本的数量小于或等于第一阈值,则获取中间训练样本集合,所述中间训练样本集合为上一次执行特征去除处理后的第一训练样本的集
合;
[0016]在所述中间训练样本集合中确定所述第一区间对应的第一训练样本,所述第一区间对应的第一训练样本位于所述第一区间内;
[0017]在所述M个特征中确定所述第一区间对应的目标特征;
[0018]在所述第一区间对应的第一训练样本中删除所述目标特征。
[0019]在一种可能的实施方式中,根据所述多个第二训练样本对预设模型进行训练,包括:
[0020]确定所述多个第二训练样本中各特征对应的权重值;
[0021]根据所述多个第二训练样本和所述多个第二训练样本中各特征对应的权重值,对所述预设模型进行训练。
[0022]在一种可能的实施方式中,针对所述多个第二训练样本中的任意一个第二训练样本;确定所述第二训练样本中各特征对应的权重值,包括:
[0023]确定所述第二训练样本中各特征所在的第一区间;
[0024]确定所述第二训练样本中各特征所在的第一区间的权重值;
[0025]针对所述第二训练样本中的任意一个特征,将所述特征所在第一区间的权重值确定为所述特征对应的权重值。
[0026]在一种可能的实施方式中,针对所述第二训练样本对应的至少一个特征中的任意一个特征;确定所述第二训练样本中所述特征所在的第一区间的权重值,包括:
[0027]判断所述预设模型中是否存在所述特征对应的第二区间,所述第二区间与所述第一区间相同;
[0028]若是,则将所述第二区间的权重值确定为所述第一区间的权重值;
[0029]若否,则将所述第一区间的权重值确定为预设值。
[0030]在一种可能的实施方式中,确定每个特征对应的多个第一区间,得到N个第一区间,包括:
[0031]根据树模型对所述多个第一训练样本按照特征进行分类处理,得到每个所述特征对应的多个所述第一区间。
[0032]第二方面,本申请实施例提供一种模型训练装置,该模型训练装置包括获取模块、第一确定模块、第二确定模块、处理模块、训练模块,其中:
[0033]所述获取模块用于,获取多个第一训练样本,每个第一训练样本中包括M个特征,所述M为大于1的整数;
[0034]所述第一确定模块用于,确定每个特征对应的多个第一区间,得到N个第一区间,所述N为每个特征对应的第一区间的数量之和,所述N为大于1的整数;
[0035]所述第二确定模块用于,确定所述N个第一区间中每个第一区间中存在的第一训练样本的样本数量;
[0036]所述处理模块用于,根据所述N个第一区间中每个第一区间中存在的第一训练样本的样本数量,分别对每个第一区间对应的第一训练样本中的特征进行特征去除处理,得到多个第二训练样本;
[0037]所述训练模块用于,根据所述多个第二训练样本对预设模型进行训练。
[0038]在一种可能的实施方式中,所述处理模块具体用于:
[0039]确定所述多个第一区间对应的处理顺序;
[0040]按照所述处理顺序,根据所述N个第一区间中每个第一区间中存在的第一训练样本的样本数量,依次对每个第一区间对应的第一训练样本中的特征进行特征去除处理,得到多个第二训练样本。
[0041]在一种可能的实施方式中,所述处理模块具体用于:
[0042]若所述第一区间中存在的第一训练样本的数量小于或等于第一阈值,则获取中间训练样本集合,所述中间训练样本集合为上一次执行特征去除处理后的第一训练样本的集合;
[0043]在所述中间训练样本集合中确定所述第一区间对应的第一训练样本,所述第一区间对应的第一训练样本位于所述第一区间内;
[0044]在所述M个特征中确定所述第一区间对应的目标特征;
[0045]在所述第一区间对应的第一训练样本中删除所述目标特征。
[0046]在一种可能的实施方式中,所述训练模块具体用于:
[0047]确定所述多个第二训练样本中各特征对应的权重值;
[0048]根据所述多个第二训练样本和所述多个第二训练样本中各特征对应的权重值,对所述预设模型进行训练。
[0049]在一种可能的实施方式中,所述训练模块具体用于:
[0050]确定所述第二训练样本中各特征所在的第一区间;
[0051]确定所述第二训练样本中各特征所在的第一区间的权重值;
[0052]针对所述第二训练样本中的任意一个特征,将所述特征所在第一区间的权重值确定为所述特征对应的权重值。
[0053本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种模型训练方法,其特征在于,包括:获取多个第一训练样本,每个第一训练样本中包括M个特征,所述M为大于1的整数;确定每个特征对应的多个第一区间,得到N个第一区间,所述N为每个特征对应的第一区间的数量之和,所述N为大于1的整数;确定所述N个第一区间中每个第一区间中存在的第一训练样本的样本数量;根据所述N个第一区间中每个第一区间中存在的第一训练样本的样本数量,分别对每个第一区间对应的第一训练样本中的特征进行特征去除处理,得到多个第二训练样本;根据所述多个第二训练样本对预设模型进行训练。2.根据权利要求1所述的方法,其特征在于,根据所述N个第一区间中每个第一区间中存在的第一训练样本的样本数量,分别对每个第一区间对应的第一训练样本中的特征进行特征去除处理,得到多个第二训练样本,包括:确定所述多个第一区间对应的处理顺序;按照所述处理顺序,根据所述N个第一区间中每个第一区间中存在的第一训练样本的样本数量,依次对每个第一区间对应的第一训练样本中的特征进行特征去除处理,得到多个第二训练样本。3.根据权利要求2所述的方法,其特征在于,针对任意一个第一区间;根据所述第一区间中存在的第一训练样本的样本数量,对所述第一区间对应的第一训练样本中的特征进行特征去除处理,包括:若所述第一区间中存在的第一训练样本的数量小于或等于第一阈值,则获取中间训练样本集合,所述中间训练样本集合为上一次执行特征去除处理后的第一训练样本的集合;在所述中间训练样本集合中确定所述第一区间对应的第一训练样本,所述第一区间对应的第一训练样本位于所述第一区间内;在所述M个特征中确定所述第一区间对应的目标特征;在所述第一区间对应的第一训练样本中删除所述目标特征。4.根据权利要求1

3任一项所述的方法,其特征在于,根据所述多个第二训练样本对预设模型进行训练,包括:确定所述多个第二训练样本中各特征对应的权重值;根据所述多个第二训练样本和所述多个第二训练样本中各特征对应的权重值,对所述预设模型进行训练。5.根据权利要求4所述的方法,其特征在于,针对所述多个第二训练样本中的任意一个第二训练样本;确定所述第二训练样本中各特征对应的权重值,包括:确定所述第二训练样本中各特征所在的第一区间;...

【专利技术属性】
技术研发人员:刘鸿儒孙中伟宋红花赵国梁曹雨晨刘永平姬艳鑫张钧皓张新
申请(专利权)人:京东科技信息技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1