分层因子分解机模型训练方法、信息推荐方法及相关设备技术

技术编号:32851887 阅读:9 留言:0更新日期:2022-03-30 19:09
本申请提供一种分层因子分解机模型训练方法、信息推荐方法及相关设备,该方法包括:将M组样本数据中的特征数据进行向量转换,获得每一特征数据的输入向量,每一组样本数据包括N个数据组,每一数据组包括至少两个特征数据;利用输入向量对待训练的分层因子分解机模型进行迭代训练,得到分层因子分解机模型;其中,待训练的分层因子分解机模型包括第一网络层和第二网络层,第一网络层的输入为输入向量,第一网络层的输出包括基于输入向量输出的线性项向量集和N个组合项向量集;第二网络层的输入为线性项向量集和N个组合项向量集。本申请实施例中,在保证模型预测精确度的同时,降低了模型的复杂度,提高了训练的效率。提高了训练的效率。提高了训练的效率。

【技术实现步骤摘要】
分层因子分解机模型训练方法、信息推荐方法及相关设备


[0001]本申请涉及神经网络
,尤其涉及一种分层因子分解机模型训练方法、信息推荐方法及相关设备。

技术介绍

[0002]互联网的出现和持续发展,带来信息和资讯的指数型增长。这给用户带来了大量的信息,但随着网上信息量的大幅增长,用户在面对大量信息时无法获得对自己真正有价值的部分,对信息的使用效率反而下降了。
[0003]为了提高信息推送的针对性,现有技术中,通常利用场感知因子分解机(Field-aware Factorization Machine,FFM)模型进行信息推荐,从而提高信息推送的针对性。FFM把相同性质的特征数据归于同一个数据组合中,按照级别分别计算当前特征数据与其它数据组合中的特征数据组合时的特征向量。由于,特征数据组合为2阶组合,从而存在作用微弱甚至无作用的特征数据组合,进而导致模型的复杂度较大,训练的效率较低。

技术实现思路

[0004]本申请实施例提供一种分层因子分解机模型训练方法、信息推荐方法及相关设备,以解决用于推荐信息的模型复杂度较大,训练的效率较低的问题。
[0005]为了解决上述技术问题,本申请是这样实现的:
[0006]第一方面,本申请实施例提供了一种分层因子分解机模型训练方法,包括:
[0007]将M组样本数据中的每一组样本数据的特征数据进行向量转换,获得每一所述特征数据的输入向量,每一组所述样本数据包括N个数据组,每一所述数据组包括至少两个所述特征数据,N和M均为大于1的整数
[0008]利用所述输入向量对待训练的分层因子分解机模型进行迭代训练,得到分层因子分解机模型;
[0009]其中,所述待训练的分层因子分解机模型包括第一网络层和第二网络层,所述第一网络层的输入为所述输入向量,所述第一网络层的输出包括基于所述输入向量输出的线性项向量集和N个组合项向量集,每一所述组合项向量集用于表示对应的数据组内所有目标特征数据的输入向量进行组合得到的向量矩阵,所述目标特征数据为所述数据组内的部分特征数据;所述第二网络层的输入为所述线性项向量集和所述N个组合项向量集,所述第二网络层的输出为基于所述线性项向量集和N个组合项向量集进行交叉项组合的目标输出结果。
[0010]第二方面,本申请实施例提供了一种信息推荐方法,包括:
[0011]将待推荐的目标信息以及目标用户的标识信息输入到分层因子分解机模型;
[0012]根据所述分层因子分解机模型输出的评分结果,确定是否向所述目标用户推荐所述目标信息;
[0013]其中,所述评分结果用于表示所述目标用户和所述目标信息之间的评分值,所述
分层因子分解机模型是通过上述分层因子分解机模型训练方法训练得到的。
[0014]第三方面,本申请实施例提供了一种分层因子分解机模型训练装置,包括:
[0015]转换模块,用于将M组样本数据中的每一组样本数据的特征数据进行向量转换获得每一所述特征数据的输入向量,每一组所述样本数据包括N个数据组,每一所述数据组包括至少两个所述特征数据,N和M均为大于1的整数;
[0016]训练模块,用于利用所述输入向量对待训练的分层因子分解机模型进行迭代训练,得到分层因子分解机模型;
[0017]其中,所述待训练的分层因子分解机模型包括第一网络层和第二网络层,所述第一网络层的输入为所述输入向量,所述第一网络层的输出包括基于所述输入向量输出的线性项向量集和N个组合项向量集,每一所述组合项向量集用于表示对应的数据组内所有目标特征数据的输入向量进行组合得到的向量矩阵,所述目标特征数据为所述数据组内的部分特征数据;所述第二网络层的输入为所述线性项向量集和所述N个组合项向量集,所述第二网络层的输出为基于所述线性项向量集和N个组合项向量集进行交叉项组合的目标输出结果。
[0018]第四方面,本申请实施例提供了一种信息推荐装置,包括:
[0019]输入模块,用于将待推荐的目标信息以及目标用户的标识信息输入到分层因子分解机模型;
[0020]推荐模块,用于根据所述分层因子分解机模型输出的评分结果,确定是否向所述目标用户推荐所述目标信息;
[0021]其中,所述评分结果用于表示所述目标用户和所述目标信息之间的评分值,所述分层因子分解机模型是通过上述分层因子分解机模型训练方法训练得到的。
[0022]第五方面,本申请实施例提供了一种电子设备,包括处理器、存储器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行时实现上述分层因子分解机模型训练方法的步骤,或者,所述计算机程序被所述处理器执行时实现上述信息推荐方法的步骤。
[0023]第六方面,本申请实施例提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述分层因子分解机模型训练方法的步骤,或者,所述计算机程序被所述处理器执行时实现上述信息推荐方法的步骤。
[0024]本申请实施例采用M组样本数据对双层网络的待训练的分层因子分解机模型训练,通过第一网络层输出线性项向量集和与N个数据组对应的N个组合项向量集,实现数据组内目标特征数据组合,这样可以减少网络的参数,降低模型的时间复杂度,提升训练效率;通过第二网络层对线性项向量集与N个组合项向量集进行全特征的间接组合,从而提升模型的特征学习能力,提升模型的预测精确度。因此,本申请实施例中,在保证模型预测精确度的同时,降低了模型的复杂度,提高了训练的效率。
附图说明
[0025]为了更清楚地说明本申请实施例的技术方案,下面将对本申请实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获
得其他的附图。
[0026]图1是本申请实施例提供的分层因子分解机模型训练方法的流程图;
[0027]图2是本申请实施例提供的分层因子分解机训练方法训练的分层因子分解机模型的结构图;
[0028]图3是本申请实施例提供的信息推荐方法的流程图;
[0029]图4是本申请实施例提供的分层因子分解机模型训练装置的结构图;
[0030]图5是本申请实施例提供的信息推荐装置的结构图;
[0031]图6是本专利技术实施例提供的电子设备的结构图。
具体实施方式
[0032]下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
[0033]参见图1,图1是本申请实施例提供的一种分层因子分解机模型训练方法的流程图,如图1所示,包括以下步骤:
[0034]步骤101,将M组样本数据中的每一组样本数据的特征数据本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种分层因子分解机模型训练方法,其特征在于,包括:将M组样本数据中的每一组样本数据的特征数据进行向量转换,获得每一所述特征数据的输入向量,每一组所述样本数据包括N个数据组,每一所述数据组包括至少两个所述特征数据,N和M均为大于1的整数;利用所述输入向量对待训练的分层因子分解机模型进行迭代训练,得到分层因子分解机模型;其中,所述待训练的分层因子分解机模型包括第一网络层和第二网络层,所述第一网络层的输入为所述输入向量,所述第一网络层的输出包括基于所述输入向量输出的线性项向量集和N个组合项向量集,每一所述组合项向量集用于表示对应的数据组内所有目标特征数据的输入向量进行组合得到的向量矩阵,所述目标特征数据为所述数据组内的特征数据;所述第二网络层的输入为所述线性项向量集和所述N个组合项向量集,所述第二网络层的输出为基于所述线性项向量集和N个组合项向量集进行组合的目标输出结果。2.根据权利要求1所述的方法,其特征在于,所述利用所述输入向量对待训练的分层因子分解机模型进行迭代训练,得到分层因子分解机模型的步骤,包括:在第L次迭代训练过程中,将目标样本数据的N个数据组对应的输入向量输入至所述第一网络层,目标样本数据为所述M组样本数据中的至少一组样本数据,L为正整数;所述第一网络层对每一所述特征数据的输入向量进行1阶线性变换,获得所述线性项向量集;所述第一网络层对每一所述数据组中的目标特征数据的输入向量进行2阶组合,并利用S型函数获得N个所述组合项向量集;所述第二网络层将所述线性项向量集中的每一向量与所述N个所述组合项向量集进行组合,并利用S型函数获得所述目标输出结果。3.根据权利要求2所述的方法,其特征在于,所述线性项向量集y
F
满足:其中,b
F
是线性项的偏置量,w
d
表示N个数据组中第d个特征数据的权重向量;x
d
表示N个数据组中第d个特征数据的输入向量,D表示N个数据组中所有特征数据的数量。4.根据权利要求3所述的方法,其特征在于,所述N个组合项向量集满足:其中,y
n
表示第n个数据组对应的组合项向量集,表示第n个数据组的特征组合权重矩阵,表示第n个数据组中第i个目标特征数据的输入向量。5.根据权利要求4所述的方法,其特征在于,所述目标输出结果y满足:其中,表示y
F
和y
n
的特征组合权重,i=1时,y
i
等于y
F
,i=1时,y
i
表示第i-1个数据组对应的组合项向量集。6.根据权利要求3所述的方法,其特征在于,所述第二网络层利用S型函数将所述线性
项向量集中的每一向量与所述N个所述组合项向量集进行组合,获得所述目标输出结果的步骤之后,所述方法还包括:将所述目标输出结果与所述目标样本数据进行比对,获得比对结果;基于所述比对结...

【专利技术属性】
技术研发人员:李长林蒋宁王洪斌吴海英赵立军
申请(专利权)人:马上消费金融股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1