机器学习建模方法、装置、电子设备和可读存储介质制造方法及图纸

技术编号:27615586 阅读:21 留言:0更新日期:2021-03-10 10:45
本申请提供了一种机器学习建模方法、装置、电子设备和可读存储介质,其中,该方法包括:基于当前数据集构建目标元特征;计算目标元特征与历史数据库中各项元特征的相似度,历史数据库中包括多条特征记录,每一条特征记录包括一项元特征和一组模型实例;根据目标元特征与各项元特征的相似度,从历史数据库中确定出当前数据集的训练流程模型,训练流程模型中包括:预处理子模型、特征处理子模型、训练子模型、模型参数处理子模型中的一种或多种子模型的实例。能够提高确定用来训练推理模型的机器学习模型的效率。学习模型的效率。学习模型的效率。

【技术实现步骤摘要】
机器学习建模方法、装置、电子设备和可读存储介质


[0001]本申请涉及计算机
,具体而言,涉及一种机器学习建模方法、装置、电子设备和可读存储介质。

技术介绍

[0002]随着机器学习的发展,越来越多的产业都使用了基于机器学习技术的人工智能。在使用人工智能其中一项重要的工作是针对产业需求训练出具有对应功能的推理模型。在训练推理模型之前,相关技术人员基于目前经验已经可以从各种机器学习的模型筛选出合适的模型。但是,由于目前可用的机器学习中的各个节点可选的子模型较多,确定出能够使用的机器学习流程中所需使用的模型的工作量也相对较大。

技术实现思路

[0003]本申请的目的在于提供一种机器学习建模方法、装置、电子设备和可读存储介质,能够解决目前关于模型选择的工作量较大的问题。
[0004]第一方面,本专利技术提供一种机器学习建模方法,包括:
[0005]基于当前数据集构建目标元特征;
[0006]计算所述目标元特征与历史数据库中各项元特征的相似度,所述历史数据库中包括多条特征记录,每一条特征记录包括一项元特征和一组模型实例;
[0007]根据所述目标元特征与所述各项元特征的相似度,从所述历史数据库中确定出所述当前数据集的训练流程模型,所述训练流程模型中包括:预处理子模型、特征处理子模型、训练子模型、模型参数处理子模型中的一种或多种子模型的实例。
[0008]在可选的实施方式中,所述根据所述目标元特征与所述各项元特征的相似度,从所述历史数据库中确定出所述当前数据集的训练流程模型,包括:
[0009]在所述历史数据库中选出第一目标模型集,所述第一目标模型集中的第一指定子模型的实例与目标子模型实例相同;
[0010]根据所述第一目标模型集中的各项模型对应的元特征与所述目标元特征的相似度,确定出相似度最高的第一目标元特征;
[0011]将所述第一目标元特征对应的训练流程模型作为所述当前数据集的训练流程模型。
[0012]在上述实施方式中,在用于对当前数据集训练的整个流程中已经存在部分已知的子模型目标子模型实例时,则可以先从历史数据库中选出部分第一目标模型集,从而可以使选出的训练流程模型不仅满足当前数据集的训练需求,还能够适应已知的目标子模型实例的搭配需求。
[0013]在可选的实施方式中,所述根据所述目标元特征与所述各项元特征的相似度,从所述历史数据库中确定出所述当前数据集的训练流程模型,包括:
[0014]根据所述目标元特征与所述各项元特征的相似度,从所述历史数据库中确定相似
度大于第一指定值的第一指定数量的训练流程模型;
[0015]从所述第一指定数量的训练流程模型中筛选出所有的第二指定子模型的第一模型实例集;
[0016]从所述第一模型实例集确定出当前数据集的训练流程模型。
[0017]在上述实施方式中,在需要选出第二指定子模型对应的实例时,则可以基于选出的第一模型实例集,筛选出能够适应当前数据集的训练需求的第二指定子模型。
[0018]在可选的实施方式中,所述根据所述目标元特征与所述各项元特征的相似度,从所述历史数据库中确定出所述当前数据集的训练流程模型,包括:
[0019]在所述历史数据库中选出第三目标模型集,所述第三目标模型集中的训练子模型的实例与目标训练子模型实例相同;
[0020]根据所述目标元特征与所述各项元特征的相似度,从所述第三目标模型集中确定相似度大于第二指定值的第二指定数量的训练流程模型;
[0021]从所述第二指定数量的训练流程模型中筛选出所有的模型参数处理子模型的第二模型实例集;
[0022]从所述第二模型实例集确定出当前数据集的训练流程模型。
[0023]在上述实施方式中,在需要选出模型参数处理子模型的实例时,可以先选出目标训练子模型实例相同的第三目标模型集,从而可以使确定出的训练流程模型能是适合目标训练子模型实例的需求的模型参数处理子模型实例。
[0024]在可选的实施方式中,所述根据所述目标元特征与所述各项元特征的相似度,从所述历史数据库中确定出所述当前数据集的训练流程模型,包括:
[0025]从所述历史数据库中确定出,与所述目标元特征相似度最高的目标相似元特征;
[0026]将所述目标相似元特征关联的训练流程模型,作为所述当前数据集的训练流程模型。
[0027]在上述实施方式中,可以直接将与目标元特征相似度最高的目标相似元特征关联的训练流程模型作为所需的训练流程模型,可以更契合历史训练所使用的模型,也能够更好地满足训练需求。
[0028]在可选的实施方式中,所述计算所述目标元特征与历史数据库中各项元特征的相似度,包括:
[0029]计算所述目标元特征与所述历史数据库中各项元特征的空间距离,并根据所述空间距离确定所述目标元特征与所述历史数据库中各项元特征的相似度,所述空间距离包括余弦距离或欧式距离中的一种或多种。
[0030]在可选的实施方式中,所述基于当前数据集构建目标元特征,包括:
[0031]对所述当前数据集进行分析,以得到所述当前数据集中所包含的多项特征数值;
[0032]根据所述多项特征数值,确定出所述目标元特征。
[0033]在上述实施方式中,通过对当前数据集进行分析,可以将当前数据集所保证的信息解析出来,因此,基于确定出的目标元特征能够更好地表达当前数据集。进一步地,基于目标元特征确定出的训练流程模型能满足当前数据集的训练需求。
[0034]第二方面,本专利技术提供一种机器学习建模装置,包括:
[0035]构建模块,用于基于当前数据集构建目标元特征;
[0036]计算模块,用于计算所述目标元特征与历史数据库中各项元特征的相似度;
[0037]确定模块,用于根据所述目标元特征与所述各项元特征的相似度,从所述历史数据库中确定出所述当前数据集的训练流程模型,所述训练流程模型中包括:预处理子模型、特征处理子模型、训练子模型、模型参数处理子模型中的一种或多种子模型的实例。
[0038]第三方面,本专利技术提供一种电子设备,包括:处理器、存储器,所述存储器存储有所述处理器可执行的机器可读指令,当电子设备运行时,所述机器可读指令被所述处理器执行时执行如前述实施方式任一所述的方法的步骤。
[0039]第四方面,本专利技术提供一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器运行时执行如前述实施方式任一所述的方法的步骤。
[0040]本申请实施例的有益效果是:通过对需要训练的数据进行分析,以确定出该需要训练的数据所需的训练流程模型,相对于现有的用户从可用的模型数据库中进行逐一筛选,本申请实施例中的机器学习建模方法能够更快速地确定出所需训练流程模型;进一步地,由于本申请实施例中通过对当前数据集的结构的分析,从而可以使确定出的训练流程模型更符合当前数据集的训练需求。
附图说明
[0041本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种机器学习建模方法,其特征在于,包括:基于当前数据集构建目标元特征;计算所述目标元特征与历史数据库中各项元特征的相似度,所述历史数据库中包括多条特征记录,每一条特征记录包括一项元特征和一组模型实例;根据所述目标元特征与所述各项元特征的相似度,从所述历史数据库中确定出所述当前数据集的训练流程模型,所述训练流程模型中包括:预处理子模型、特征处理子模型、训练子模型、模型参数处理子模型中的一种或多种子模型的实例。2.根据权利要求1所述的方法,其特征在于,所述根据所述目标元特征与所述各项元特征的相似度,从所述历史数据库中确定出所述当前数据集的训练流程模型,包括:在所述历史数据库中选出第一目标模型集,所述第一目标模型集中的第一指定子模型的实例与目标子模型实例相同;根据所述第一目标模型集中的各项模型对应的元特征与所述目标元特征的相似度,确定出相似度最高的第一目标元特征;将所述第一目标元特征对应的训练流程模型作为所述当前数据集的训练流程模型。3.根据权利要求1所述的方法,其特征在于,所述根据所述目标元特征与所述各项元特征的相似度,从所述历史数据库中确定出所述当前数据集的训练流程模型,包括:根据所述目标元特征与所述各项元特征的相似度,从所述历史数据库中确定相似度大于第一指定值的第一指定数量的训练流程模型;从所述第一指定数量的训练流程模型中筛选出所有的第二指定子模型的第一模型实例集;从所述第一模型实例集确定出当前数据集的训练流程模型。4.根据权利要求1所述的方法,其特征在于,所述根据所述目标元特征与所述各项元特征的相似度,从所述历史数据库中确定出所述当前数据集的训练流程模型,包括:在所述历史数据库中选出第三目标模型集,所述第三目标模型集中的训练子模型的实例与目标训练子模型实例相同;根据所述目标元特征与所述各项元特征的相似度,从所述第三目标模型集中确定相似度大于第二指定值的第二指定数量的训练流程模型;从所述第二指定数量的训练...

【专利技术属性】
技术研发人员:张发恩田贵成
申请(专利权)人:创新奇智南京科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1