数据衍生方法、模型训练方法、装置及电子设备制造方法及图纸

技术编号:31318871 阅读:16 留言:0更新日期:2021-12-13 00:01
本申请提供一种数据衍生方法、模型训练方法、装置及电子设备。方法包括:获取与项目任务对应的M个个体的第1代特征作为初始群体;通过遗传算法确定第t代群体中每个特征的适应度,以及对第t代群体中适应度大于预设阈值的特征进行交叉变异的迭代,得到第t+1代群体;当t+1的值为指定的T时,得到第T代群体,第T代群体中的特征用于对基于深度学习的神经网络模型进行训练,神经网络模型用于内容推荐或预估。如此,可以自动衍生出新的群体,以替代人工的方式衍生数据,能够提高数据衍生的效率,降低人力资源的开销。力资源的开销。力资源的开销。

【技术实现步骤摘要】
数据衍生方法、模型训练方法、装置及电子设备


[0001]本申请涉及人工智能领域,具体而言,涉及一种数据衍生方法、模型训练方法、装置及电子设备。

技术介绍

[0002]在人工智能领域,需要进行神经网络模型的训练。在一些场景下,用于模型训练的数据样本或数据类型不足,需要人工去采集或去分析伪造用于训练的新样本数据,而人工处理方式对操作人员的经验要求高,且处理的效率低。

技术实现思路

[0003]本申请实施例的目的在于提供一种数据衍生方法、模型训练方法、装置及电子设备,替换人工处理方式进行数据衍生,能改善数据衍生的效率低的问题。
[0004]为了实现上述目的,本申请的实施例通过如下方式实现:
[0005]第一方面,本申请实施例提供一种数据衍生方法,所述方法包括:获取与项目任务对应的M个个体的第1代特征作为初始群体,M为大于或等于1的整数,所述项目任务包括用于内容推荐或预估的任务;通过遗传算法确定第t代群体中每个特征的适应度,以及对所述第t代群体中适应度大于预设阈值的特征进行交叉变异的迭代,得到第t+1代群体,t依次取1至T

1,t、T均为整数;其中,当t取值为1时,所述第t代群体为所述初始群体,当t取值大于1时,所述第t代群体为第t

1次交叉变异得到的群体;当t+1的值为所述T时,所述第t+1代群体中的特征用于对基于深度学习的神经网络模型进行训练,所述神经网络模型用于内容推荐或预估。
[0006]在上述的实施方式中,利用遗传算法对项目任务的初始群体进行交叉变异的迭代,如此,可以自动衍生出新的群体,以替代人工的方式衍生数据,能够提高数据衍生的效率,降低人力资源的开销。
[0007]结合第一方面,在一些可选的实施方式中,所述遗传算法包括交叉算子及变异算子,对所述第t代群体中适应度大于预设阈值的特征进行交叉变异的迭代,得到第t+1代群体,包括:
[0008]通过所述交叉算子,对得到的所述第t代群体中适应度大于预设阈值的特征进行交叉组合,得到中间群体,所述中间群体包括交叉后得到的特征;
[0009]通过所述变异算子,对所述中间群体中的部分特征进行变异,得到第t+1代群体;
[0010]基于所述交叉算子及所述变异算子,对所述第t+1代群体进行迭代运算,并在t+1的值为指定的T时,停止对得到的群体进行迭代运算。
[0011]在上述的实施方式中,利用交叉算子与变异算子,对群体中的特征分别进行交叉组合与变异,如此,有利于得到新类型的特征,从而丰富群体中的特征类型。
[0012]结合第一方面,在一些可选的实施方式中,通过所述交叉算子,对得到的所述第t代群体中适应度大于预设阈值的特征进行交叉组合,得到中间群体,包括:
[0013]通过所述交叉算子,将所述第t代群体中适应度大于预设阈值的特征划分成多个大组,其中,所述多个大组中的每个大组包括两个小组,每个小组包括一个个体的特征集合;
[0014]针对所述每个大组中的两个小组,将所述两个小组中个体的特征集合中的部分特征进行交叉互换,得到所述中间群体。
[0015]在上述的实施方式中,通过对个体之间的特征进行交叉组合,有利于快速得到具有差异化的个体的特征集合。
[0016]结合第一方面,在一些可选的实施方式中,所述初始群体包括多个用户的用户信息,所述用户信息包括与每个用户对应的年龄、性别、历史购买记录,所述方法还包括:
[0017]利用得到的第T代群体对所述神经网络模型进行训练,以使训练后的神经网络模型基于目标用户的用户信息为所述目标用户推荐商品。
[0018]结合第一方面,在一些可选的实施方式中,所述初始群体包括多个用户的用户信息,所述用户信息包括与每个用户对应的年龄、性别、浏览记录,所述方法还包括:
[0019]利用得到的第T代群体对所述神经网络模型进行训练,以使训练后的神经网络模型基于目标用户的用户信息为所述目标用户推荐网页内容。
[0020]结合第一方面,在一些可选的实施方式中,所述初始群体包括多个设备的运行数据,所述运行数据包括与每个设备对应的负载及温度,所述方法还包括:
[0021]利用得到的第T代群体对所述神经网络模型进行训练,以使训练后的神经网络模型基于目标设备的运行数据为所述目标设备预估运行风险。
[0022]第二方面,本申请实施例还提供一种模型训练方法,所述方法包括:
[0023]获取第T代群体,其中,所述第T代群体通过上述的数据衍生方法得到;
[0024]利用所述第T代群体对所述神经网络模型进行训练,得到训练后的神经网络模型,其中,所述训练后的神经网络模型用于内容推荐或预估。
[0025]第三方面,本申请实施例还提供一种数据衍生装置,所述装置包括:
[0026]第一获取单元,用于获取与项目任务对应的M个个体的第1代特征作为初始群体,M为大于或等于1的整数,所述项目任务包括用于内容推荐或预估的任务;
[0027]迭代运算单元,用于通过遗传算法确定第t代群体中每个特征的适应度,以及对所述第t代群体中适应度大于预设阈值的特征进行交叉变异的迭代,得到第t+1代群体,t依次取1至T

1,t、T均为整数;其中,当t取值为1时,所述第t代群体为所述初始群体,当t取值大于1时,所述第t代群体为第t

1次交叉变异得到的群体;
[0028]结果输出单元,用于当t+1的值为所述T时,所述第t+1代群体中的特征用于对基于深度学习的神经网络模型进行训练,所述神经网络模型用于内容推荐或预估。
[0029]第四方面,本申请实施例还提供一种模型训练装置,所述装置包括:
[0030]第二获取单元,用于获取第T代群体,其中,所述第T代群体通过上述数据衍生方法得到;
[0031]训练单元,用于利用所述第T代群体对所述神经网络模型进行训练,得到训练后的神经网络模型,其中,所述训练后的神经网络模型用于内容推荐或预估。
[0032]第五方面,本申请实施例还提供一种电子设备,所述电子设备包括相互耦合的处理器及存储器,所述存储器内存储计算机程序,当所述计算机程序被所述处理器执行时,使
得所述电子设备执行上述的数据衍生方法,或上述的模型方法。
[0033]第六方面,本申请实施例还提供一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机程序,当所述计算机程序在计算机上运行时,使得所述计算机执行上述的数据衍生方法,或上述的模型方法。
附图说明
[0034]为了更清楚地说明本申请实施例的技术方案,下面将对本申请实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本申请的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
[0035]图1为本申请实施例提供的数据衍生方法的流程示意图。
[0036本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种数据衍生方法,其特征在于,所述方法包括:获取与项目任务对应的M个个体的第1代特征作为初始群体,M为大于或等于1的整数,所述项目任务包括用于内容推荐或预估的任务;通过遗传算法确定第t代群体中每个特征的适应度,以及对所述第t代群体中适应度大于预设阈值的特征进行交叉变异的迭代,得到第t+1代群体,t依次取1至T

1,t、T均为整数;其中,当t取值为1时,所述第t代群体为所述初始群体,当t取值大于1时,所述第t代群体为第t

1次交叉变异得到的群体;当t+1的值为所述T时,所述第t+1代群体中的特征用于对基于深度学习的神经网络模型进行训练,所述神经网络模型用于内容推荐或预估。2.根据权利要求1所述的方法,其特征在于,所述遗传算法包括交叉算子及变异算子,对所述第t代群体中适应度大于预设阈值的特征进行交叉变异的迭代,得到第t+1代群体,包括:通过所述交叉算子,对得到的所述第t代群体中适应度大于预设阈值的特征进行交叉组合,得到中间群体,所述中间群体包括交叉后得到的特征;通过所述变异算子,对所述中间群体中的部分特征进行变异,得到第t+1代群体;基于所述交叉算子及所述变异算子,对所述第t+1代群体进行迭代运算,并在t+1的值为指定的T时,停止对得到的群体进行迭代运算。3.根据权利要求2所述的方法,其特征在于,通过所述交叉算子,对得到的所述第t代群体中适应度大于预设阈值的特征进行交叉组合,得到中间群体,包括:通过所述交叉算子,将所述第t代群体中适应度大于预设阈值的特征划分成多个大组,其中,所述多个大组中的每个大组包括两个小组,每个小组包括一个个体的特征集合;针对所述每个大组中的两个小组,将所述两个小组中个体的特征集合中的部分特征进行交叉互换,得到所述中间群体。4.根据权利要求1

3中任一项所述的方法,其特征在于,所述初始群体包括多个用户的用户信息,所述用户信息包括与每个用户对应的年龄、性别、历史购买记录,所述方法还包括:利用得到的第T代群体对所述神经网络模型进行训练,以使训练后的神经网络模型基于目标用户的用户信息为所述目标用户推荐商品。5.根据权利要求1

3中任一项所述的方法,其特征在于,所述初始群体包括多个用户的用户信息,所述用户信息包括与每个用户对应的年龄、性别、浏览记录,所述方法还包括:利用得到的第T代群体对所述神经网络模型进行训练,以使训练后的神经网络模型基于目标用户的用...

【专利技术属性】
技术研发人员:张发恩陈斌斌潘昊
申请(专利权)人:创新奇智广州科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1