一种自动化训练数据预测模型、数据预测的方法及装置制造方法及图纸

技术编号:37783176 阅读:11 留言:0更新日期:2023-06-09 09:13
本申请的一些实施例提供了一种自动化训练数据预测模型、数据预测的方法及装置,该方法包括:从预设模型拟合参数范围内获取至少一组模型拟合参数,其中,所述至少一组模型拟合参数中各组模型拟合参数包括:下限值和上限值;从样本数据库中选择出符合条件的样本数据,得到至少一个样本数据集,所述至少一个样本数据集中各个样本数据集包括:训练集和测试集;根据所述至少一组模型拟合参数、所述至少一个样本数据集和初始数据模型,得到目标数据预测模型。本申请的一些实施例可以实现模型拟合参数和样本数据集的自动选取,之后进行自动化训练得到目标数据预测模型,效率较高。效率较高。效率较高。

【技术实现步骤摘要】
一种自动化训练数据预测模型、数据预测的方法及装置


[0001]本申请涉及数据预测
,具体而言,涉及一种自动化训练数据预测模型、数据预测的方法及装置。

技术介绍

[0002]随着大数据技术的不断发展,通过机器学习训练模型的方式来进行预测分析被广泛应用。
[0003]当前企业的规模不断扩大,企业架构也比较复杂。由于适应市场的变化需求,需要及时定制企业的业务发展方案。因此及时得知企业的业务数据情况至关重要。目前,企业一般由总公司以及多个子公司构成,传统的对企业业务发展情况的数据分析一般是所有子公司和总公司指定相同的模型训练参数去训练模型。但是每个子公司的发展趋势和业务数据存在差异,通过该方法并不能反映出每个子公司数据的实际情况,进而对数据的分析和预测的准确度较低,影响业务发展。如果单独对每个子公司构建个体模型,需要耗费大量的人力成本,且效率较低。
[0004]因此,如何提供一种高效的自动化训练数据预测模型的方法的技术方案成为亟需解决的技术问题。

技术实现思路

[0005]本申请的一些实施例的目的在于提供一种自动化训练数据预测模型、数据预测的方法及装置,通过本申请的实施例的技术方案可以实现对模型的自动化训练,可复用性较高且模型训练的效率较高,模型应用的效果较好。
[0006]第一方面,本申请的一些实施例提供了一种自动化训练数据预测模型的方法,包括:从预设模型拟合参数范围内获取至少一组模型拟合参数,其中,所述至少一组模型拟合参数中各组模型拟合参数包括:下限值和上限值;从样本数据库中选择出符合条件的样本数据,得到至少一个样本数据集,所述至少一个样本数据集中各个样本数据集包括:训练集和测试集;根据所述至少一组模型拟合参数、所述至少一个样本数据集和初始数据模型,得到目标数据预测模型。
[0007]本申请的一些实施例通过自动选取至少一组模型拟合参数和至少一个样本数据集对模型进行训练,得到目标数据预测模型。本申请实施例可以针对不同情况选择不同的模型拟合参数,得到符合不同场景下的模型,效率较高且易于实现,而且可复用性较高。
[0008]在一些实施例,所述从预设模型拟合参数范围内获取至少一组模型拟合参数,包括:响应于用户的操作指令,获取所述预设模型拟合参数范围,其中,所述预设模型拟合参数范围包括:拟合下限值范围和拟合上限值范围,所述拟合下限值范围中包括:所述下限值的最小取值、所述下限值的最大取值和第一间隔值,所述拟合上限值范围中包括:所述上限值的最小取值、所述上限值的最大取值和第二间隔值;在所述下限值不大于所述下限值的最大取值的情况下,将所述下限值的最小取值与m个所述第一间隔值进行相加,得到m个下
限值;在所述上限值不大于所述上限值的最大取值的情况下,将所述上限值的最小取值与n个所述第二间隔值进行相加,得到n个上限值;将所述m个下限值和所述n个上限值进行两两组合,得到所述至少一组模型拟合参数。
[0009]本申请的一些实施例通过预先设定预设模型拟合参数范围的拟合上/下限范围取值,然后进行随机组合得到至少一组模型拟合参数,可以实现对模型的多种情况下的拟合,使得训练得到的模型适应性较好。
[0010]在一些实施例,在所述从样本数据库中选择出符合条件的样本数据之前,所述方法还包括:获取与预测业务相关的历史时序数据,其中,所述历史时序数据包括:历史时间和业务指标值;获取与所述业务指标值相关的历史假日节点数据和未来假日节点数据,其中,所述历史假日节点数据和所述未来假日节点数据均包括:假日名称和时间;基于所述历史时序数据、所述历史假日节点数据和所述未来假日节点数据,构建所述样本数据库,其中,所述样本数据库中的所有数据按照时间节点的顺序存储并生成时间节点编号。
[0011]本申请的一些实施例通过将历史时序数据、历史假日节点数据和未来假日节点数据均添加到样本数据库中,为模型训练提供丰富的样本数据。
[0012]在一些实施例,所述从样本数据库中选择出符合条件的样本数据,得到至少一个样本数据集,包括:获取设定的起始时间节点编号;利用所述样本数据库中在所述起始时间节点编号之后的样本数据,构建数据集,其中,所述数据集为所述至少一个样本数据集中的一个。
[0013]本申请的一些实施例通过时间节点编号可以获得对应的数据集,效率较高且自动化性强。
[0014]在一些实施例,在所述构建数据集之前,所述方法还包括:获取预先设置的预留期数;按照所述预留期数将所述数据集分为所述训练集和所述测试集。
[0015]本申请的一些实施例通过预留期数划分训练集和测试集,不需要人工参与,效率较高,可复用性强。
[0016]在一些实施例,所述根据所述至少一组模型拟合参数、所述至少一个样本数据集和初始数据模型,得到目标数据预测模型,包括:利用所述至少一组模型拟合参数中的各组模型拟合参数和所述各个样本数据集中的训练集对所述初始数据模型进行训练,得到各个待测试数据模型;利用所述各个样本数据集中的测试集对所述各个待测试数据模型进行测试,得到所述各个待测试数据模型的各个测试指标值;将所述各个测试指标值中的最优测试指标值对应的待测试数据模型作为所述目标数据预测模型。
[0017]本申请的一些实施例通过至少一组模型拟合参数和所述至少一个样本数据集对初始数据模型进行训练,得到各个待测试数据模型,之后再选择出测试指标最优的目标数据预测模型。本申请实施例可以从训练得到的模型中自动选择最优的目标数据预测模型,效率较高。
[0018]在一些实施例,所述下限值为m个,所述上限值为n个,所述起始时间节点编号设定有k个,其中,所述至少一组模型拟合参数中包括m*n组模型拟合参数,所述至少一个样本数据集为k个,其中,所述根据所述至少一组模型拟合参数、所述至少一个样本数据集和初始数据模型,包括:利用所述m*n组模型拟合参数和k个样本数据集对初始数据模型进行训练,得到z个待测试数据模型,其中,所述z=m*n*k;从所述z个待测试数据模型中筛选出所述目
标数据预测模型。
[0019]本申请的一些实施例通过对初始数据模型进行z次训练后选择出目标数据预测模型,可以得到最优的模型,进而确保模型应用的准确度。
[0020]第二方面,本申请的一些实施例提供了一种数据预测的方法,包括:获取待预测时间序列数据集;将所述待预测时间序列输入至经过第一方面中任一实施例所述的方法得到的目标数据预测模型中,得到业务数据预测结果。
[0021]第三方面,本申请的一些实施例提供了一种自动化训练数据预测模型的装置,包括:第一选择模块,用于从预设模型拟合参数范围内获取至少一组模型拟合参数,其中,所述至少一组模型拟合参数中各组模型拟合参数包括:下限值和上限值;第二选择模块,用于从样本数据库中选择出符合条件的样本数据,得到至少一个样本数据集,所述至少一个样本数据集中各个样本数据集包括:训练集和测试集;训练模块,用于根据所述至少一组模型拟合参数、所述至少一个样本数据集和初始数据模型,得到目标数据预测模型。
[00本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种自动化训练数据预测模型的方法,其特征在于,包括:从预设模型拟合参数范围内获取至少一组模型拟合参数,其中,所述至少一组模型拟合参数中各组模型拟合参数包括:下限值和上限值;从样本数据库中选择出符合条件的样本数据,得到至少一个样本数据集,所述至少一个样本数据集中各个样本数据集包括:训练集和测试集;根据所述至少一组模型拟合参数、所述至少一个样本数据集和初始数据模型,得到目标数据预测模型。2.如权利要求1所述的方法,其特征在于,所述从预设模型拟合参数范围内获取至少一组模型拟合参数,包括:响应于用户的操作指令,获取所述预设模型拟合参数范围,其中,所述预设模型拟合参数范围包括:拟合下限值范围和拟合上限值范围,所述拟合下限值范围中包括:所述下限值的最小取值、所述下限值的最大取值和第一间隔值,所述拟合上限值范围中包括:所述上限值的最小取值、所述上限值的最大取值和第二间隔值;在所述下限值不大于所述下限值的最大取值的情况下,将所述下限值的最小取值与m个所述第一间隔值进行相加,得到m个下限值;在所述上限值不大于所述上限值的最大取值的情况下,将所述上限值的最小取值与n个所述第二间隔值进行相加,得到n个上限值;将所述m个下限值和所述n个上限值进行两两组合,得到所述至少一组模型拟合参数。3.如权利要求1或2所述的方法,其特征在于,在所述从样本数据库中选择出符合条件的样本数据之前,所述方法还包括:获取与预测业务相关的历史时序数据,其中,所述历史时序数据包括:历史时间和业务指标值;获取与所述业务指标值相关的历史假日节点数据和未来假日节点数据,其中,所述历史假日节点数据和所述未来假日节点数据均包括:假日名称和时间;基于所述历史时序数据、所述历史假日节点数据和所述未来假日节点数据,构建所述样本数据库,其中,所述样本数据库中的所有数据按照时间节点的顺序存储并生成时间节点编号。4.如权利要求1或2所述的方法,其特征在于,所述从样本数据库中选择出符合条件的样本数据,得到至少一个样本数据集,包括:获取设定的起始时间节点编号;利用所述样本数据库中在所述起始时间节点编号之后的样本数据,构建数据集,其中,所述数据集为所述至少一个样本数据集中的一个。5.如权利要求4所述的方法,其特征在于,在所述构建数据集之前,所述方法还包括...

【专利技术属性】
技术研发人员:韩敏慕学玲付焕利杨鹏升李丹丹杜新凯韩雅姝
申请(专利权)人:阳光保险集团股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1