一种指标数据的预估方法及装置、电子设备、存储介质制造方法及图纸

技术编号:35101278 阅读:15 留言:0更新日期:2022-10-01 17:08
本申请公开了一种指标数据的预估方法及装置、电子设备、存储介质,应用于大数据领域或金融领域,所述方法包括:获取包括多个特征数据的目标数据矩阵;确定目标数据矩阵中的各个特征数据间的关联性数据;基于目标数据矩阵中的各个特征数据间的关联性数据,将目标数据矩阵中具有关联性的各个特征数据组合为一个当前特征组合,以及将目标数据矩阵中独立的各个特征数据分别作为一个当前独立特征;分别利用因子分解机对每个当前特征组合进行计算,得到各个当前特征组合对应的隐向量内积;将各个当前特征组合对应的隐向量内积以及各个当前独立特征输入预先训练好的预估模型中,通过预估模型进行计算,得到目标指标的当前预估值。得到目标指标的当前预估值。得到目标指标的当前预估值。

【技术实现步骤摘要】
一种指标数据的预估方法及装置、电子设备、存储介质


[0001]本申请涉及数据预测方法,特别涉及一种指标数据的预估方法及装置、电子设备、存储介质。

技术介绍

[0002]FM预估模型是在个性化推荐、信息检索等场景中,常用来进行学习和预测用户反馈的模型,例如用于预估用户点击、收藏、购买等行为的概率信息。其具有高维、稀疏、多类别等特点。
[0003]当前对于FM预估模型的训练,主要是将所有的特征进行组合,并提取特征组合的隐向量内积用于训练,即直接提取整个样本特征矩阵的隐向量内用于训练。所以在使用FM预估模型进行指标预估时,也同样是将获取的各个特征进行组合,然后提取该特征组合的隐向量内积,并输入FM预估模型中,通过FM预估模型计算得到预估值。
[0004]但是当特征维度比较高时,由于所有特征是组合一起的,这就会使得模型训练难度增加,也会使得在预测时的效率较降低。

技术实现思路

[0005]基于上述现有技术的不足,本申请提供了一种指标数据的预估方法及装置、电子设备、存储介质,以解决现有技术训练难度高,且效率较低的问题。
[0006]为了实现上述目的,本申请提供了以下技术方案:
[0007]本申请第一方面提供了一种指标数据的预估方法,包括:
[0008]获取目标数据矩阵;其中,所述目标数据矩阵包括多个特征数据;
[0009]确定所述目标数据矩阵中的各个所述特征数据间的关联性数据;
[0010]基于所述目标数据矩阵中的各个所述特征数据间的关联性数据,将所述目标数据矩阵中具有关联性的各个所述特征数据组合为一个当前特征组合,以及将所述目标数据矩阵中独立的各个所述特征数据分别作为一个当前独立特征;其中,所述独立的所述特征数据指代与其他的所述特征数据均不存在关联性的所述特征数据;
[0011]分别利用因子分解机对每个所述当前特征组合进行计算,得到各个所述当前特征组合对应的隐向量内积;
[0012]将各个所述当前特征组合对应的隐向量内积以及各个所述当前独立特征输入预先训练好的预估模型中,通过所述预估模型进行计算,得到目标指标的当前预估值;其中,所述预估模型预先利用样本矩阵的各个样本特征组合对应的隐向量内积和各个样本独立特征进行训练得到。
[0013]可选地,在上述的指标数据的预估方法中,所述确定所述目标数据矩阵中的各个所述特征数据间的关联性数据,包括:
[0014]利用Glasso算法对所述目标数据矩阵进行计算,得到当前特征关联矩阵;其中,所述当前特征关联矩阵中的值表示每两个所述特征数据之间的关联程度;
[0015]利用De

Glasso算法对所述当前关联矩阵进行计算,得到当前置信区间矩阵;其中,所述当前关联矩阵中的每个值对应所述当期置信区间矩阵中的一个置信区间。
[0016]可选地,在上述的指标数据的预估方法中,所述基于所述目标数据矩阵中的各个所述特征数据间的关联性数据,将所述目标数据矩阵中具有关联性的各个所述特征数据组合为一个当前特征组合,以及将所述目标数据矩阵中独立的各个所述特征数据分别作为一个当前独立特征,包括:
[0017]分别将每个所述目标数据矩阵中的所述特征数据作为一个节点;
[0018]基于所述当期置信区间矩阵,将具有关联的每两个所述特征数据对应的节点进行连接,得到特征关联图;其中,不覆盖0的所述当期置信区间矩阵中的置信区间所对应的两个所述特征数据具有关联;
[0019]分别将所述特征关联图中连接的各个所述节点对应的所述特征数据组合为一个所述当前特征组合,以及将所述特征关联图中各个独立的所述节点对应的所述特征数据分别作为一个当前独立特征。
[0020]可选地,在上述的指标数据的预估方法中,所述将各个所述当前特征组合对应的隐向量内积以及各个所述当前独立特征输入预先训练好的预估模型中,通过所述预估模型进行计算,得到目标指标的当前预估值,包括:
[0021]将各个所述当前特征组合对应的隐向量内积以及各个所述当前独立特征输入预先训练好的预估模型中,通过所述预估模型进行计算当前目标值;其中,所述当前目标值为预先确定的常量、各个所述当前独立特征的加权值以及各个所述当前特征组合对应的隐向量内积的总和;
[0022]通过所述预估模型计算1除以1和所述当前目标值的指数函数值的和的结果,得到所述目标指标的当前预估值;其中,所述当前目标值的指数函数值为以当前目标值为指数,自然常数为底数的指数函数的值的负数。
[0023]可选地,在上述的指标数据的预估方法中,所述预估模型的训练方法,包括:
[0024]获取多个样本数据矩阵;其中,一个所述样本矩阵包括多个特征数据;
[0025]分别针对每个所述样本数据矩阵,确定所述样本数据矩阵中的各个所述特征数据间的关联性数据;
[0026]基于所述样本数据矩阵中的各个所述特征数据间的关联性数据,将所述样本数据矩阵中具有关联性的各个所述特征数据组合为一个所述样本特征组合,以及将所述样本数据矩阵中独立的各个所述特征数据分别作为一个所述样本独立特征;
[0027]分别利用因子分解机对每个所述样本特征组合进行计算,得到各个所述样本特征组合对应的隐向量内积;
[0028]分别将每个所述样本数据矩阵的各个所述样本特征组合对应的隐向量内积以及各个所述样本独立特征,输入所述预估模型中,通过所述预估模型进行计算,得到各个所述样本数据矩阵对应的所述目标指标的预估值;
[0029]判断各个所述样本数据矩阵对应的所述目标指标的预估值准确率是否满足预设阈值;
[0030]若判断出各个所述样本数据矩阵对应的所述目标指标的预估值准确率不满足预设阈值,则调整所述预估模型中的参数,并返回执行所述分别将每个所述样本数据矩阵的
各个所述样本特征组合对应的隐向量内积以及各个所述样本独立特征,输入所述预估模型中;
[0031]若判断出各个所述样本数据矩阵对应的所述目标指标的预估值准确率满足预设阈值,确定所述预估模型的训练结束。
[0032]本申请第二方面提供了一种指标数据的预估装置,包括:
[0033]第一获取单元,用于获取目标数据矩阵;其中,所述目标数据矩阵包括多个特征数据;
[0034]第一确定单元,用于确定所述目标数据矩阵中的各个所述特征数据间的关联性数据;
[0035]第一划分单元,用于基于所述目标数据矩阵中的各个所述特征数据间的关联性数据,将所述目标数据矩阵中具有关联性的各个所述特征数据组合为一个当前特征组合,以及将所述目标数据矩阵中独立的各个所述特征数据分别作为一个当前独立特征;其中,所述独立的所述特征数据指代与其他的所述特征数据均不存在关联性的所述特征数据;
[0036]第一计算单元,用于分别利用因子分解机对每个所述当前特征组合进行计算,得到各个所述当前特征组合对应的隐向量内积;
[0037]第一预估单元,用于将各个所述当前特征组合对应的隐向量内积以及各个所述当本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种指标数据的预估方法,其特征在于,包括:获取目标数据矩阵;其中,所述目标数据矩阵包括多个特征数据;确定所述目标数据矩阵中的各个所述特征数据间的关联性数据;基于所述目标数据矩阵中的各个所述特征数据间的关联性数据,将所述目标数据矩阵中具有关联性的各个所述特征数据组合为一个当前特征组合,以及将所述目标数据矩阵中独立的各个所述特征数据分别作为一个当前独立特征;其中,所述独立的所述特征数据指代与其他的所述特征数据均不存在关联性的所述特征数据;分别利用因子分解机对每个所述当前特征组合进行计算,得到各个所述当前特征组合对应的隐向量内积;将各个所述当前特征组合对应的隐向量内积以及各个所述当前独立特征输入预先训练好的预估模型中,通过所述预估模型进行计算,得到目标指标的当前预估值;其中,所述预估模型预先利用样本矩阵的各个样本特征组合对应的隐向量内积和各个样本独立特征进行训练得到。2.根据权利要求1所述的方法,其特征在于,所述确定所述目标数据矩阵中的各个所述特征数据间的关联性数据,包括:利用Glasso算法对所述目标数据矩阵进行计算,得到当前特征关联矩阵;其中,所述当前特征关联矩阵中的值表示每两个所述特征数据之间的关联程度;利用De

Glasso算法对所述当前关联矩阵进行计算,得到当前置信区间矩阵;其中,所述当前关联矩阵中的每个值对应所述当期置信区间矩阵中的一个置信区间。3.根据权利要求2所述的方法,其特征在于,所述基于所述目标数据矩阵中的各个所述特征数据间的关联性数据,将所述目标数据矩阵中具有关联性的各个所述特征数据组合为一个当前特征组合,以及将所述目标数据矩阵中独立的各个所述特征数据分别作为一个当前独立特征,包括:分别将每个所述目标数据矩阵中的所述特征数据作为一个节点;基于所述当期置信区间矩阵,将具有关联的每两个所述特征数据对应的节点进行连接,得到特征关联图;其中,不覆盖0的所述当期置信区间矩阵中的置信区间所对应的两个所述特征数据具有关联;分别将所述特征关联图中连接的各个所述节点对应的所述特征数据组合为一个所述当前特征组合,以及将所述特征关联图中各个独立的所述节点对应的所述特征数据分别作为一个当前独立特征。4.根据权利要求1所述的方法,其特征在于,所述将各个所述当前特征组合对应的隐向量内积以及各个所述当前独立特征输入预先训练好的预估模型中,通过所述预估模型进行计算,得到目标指标的当前预估值,包括:将各个所述当前特征组合对应的隐向量内积以及各个所述当前独立特征输入预先训练好的预估模型中,通过所述预估模型进行计算当前目标值;其中,所述当前目标值为预先确定的常量、各个所述当前独立特征的加权值以及各个所述当前特征组合对应的隐向量内积的总和;通过所述预估模型计算1除以1和所述当前目标值的指数函数值的和的结果,得到所述目标指标的当前预估值;其中,所述当前目标值的指数函数值为以当前目标值为指数,自然
常数为底数的指数函数的值的负数。5.根据权利要求1所述的方法,其特征在于,所述预估模型的训练方法,包括:获取多个样本数据矩阵;其中,一个所述样本矩阵包括多个特征数据;分别针对每个所述样本数据矩阵,确定所述样本数据矩阵中的各个所述特征数据间的关联性数据;基于所述样本数据矩阵中的各个所述特征数据间的关联性数据,将所述样本数据矩阵中具有关联性的各个所述特征数据组合为一个所述样本特征组合,以及将所述样本数据矩阵中独立的各个所...

【专利技术属性】
技术研发人员:周慧婷申亚坤谭莹坤余功菊
申请(专利权)人:中国银行股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1