分层因子分解机模型训练方法、信息推荐方法及相关设备技术

技术编号：32851887 阅读：9 留言：0更新日期：2022-03-30 19:09

本申请提供一种分层因子分解机模型训练方法、信息推荐方法及相关设备，该方法包括：将M组样本数据中的特征数据进行向量转换，获得每一特征数据的输入向量，每一组样本数据包括N个数据组，每一数据组包括至少两个特征数据；利用输入向量对待训练的分层因子分解机模型进行迭代训练，得到分层因子分解机模型；其中，待训练的分层因子分解机模型包括第一网络层和第二网络层，第一网络层的输入为输入向量，第一网络层的输出包括基于输入向量输出的线性项向量集和N个组合项向量集；第二网络层的输入为线性项向量集和N个组合项向量集。本申请实施例中，在保证模型预测精确度的同时，降低了模型的复杂度，提高了训练的效率。提高了训练的效率。提高了训练的效率。

全部详细技术资料下载

【技术实现步骤摘要】
分层因子分解机模型训练方法、信息推荐方法及相关设备

[0001]本申请涉及神经网络
，尤其涉及一种分层因子分解机模型训练方法、信息推荐方法及相关设备。

技术介绍

[0002]互联网的出现和持续发展，带来信息和资讯的指数型增长。这给用户带来了大量的信息，但随着网上信息量的大幅增长，用户在面对大量信息时无法获得对自己真正有价值的部分，对信息的使用效率反而下降了。
[0003]为了提高信息推送的针对性，现有技术中，通常利用场感知因子分解机(Field-aware Factorization Machine，FFM)模型进行信息推荐，从而提高信息推送的针对性。FFM把相同性质的特征数据归于同一个数据组合中，按照级别分别计算当前特征数据与其它数据组合中的特征数据组合时的特征向量。由于，特征数据组合为2阶组合，从而存在作用微弱甚至无作用的特征数据组合，进而导致模型的复杂度较大，训练的效率较低。

技术实现思路

[0004]本申请实施例提供一种分层因子分解机模型训练方法、信息推荐方法及相关设备，以解决用于推荐信息的模型复杂度较大，训练的效率较低的问题。
[0005]为了解决上述技术问题，本申请是这样实现的：
[0006]第一方面，本申请实施例提供了一种分层因子分解机模型训练方法，包括：
[0007]将M组样本数据中的每一组样本数据的特征数据进行向量转换，获得每一所述特征数据的输入向量，每一组所述样本数据包括N个数据组，每一所述数据组包括至少两个所述特征数据，N和M均为大于1的整数...

【技术保护点】

【技术特征摘要】
1.一种分层因子分解机模型训练方法，其特征在于，包括：将M组样本数据中的每一组样本数据的特征数据进行向量转换，获得每一所述特征数据的输入向量，每一组所述样本数据包括N个数据组，每一所述数据组包括至少两个所述特征数据，N和M均为大于1的整数；利用所述输入向量对待训练的分层因子分解机模型进行迭代训练，得到分层因子分解机模型；其中，所述待训练的分层因子分解机模型包括第一网络层和第二网络层，所述第一网络层的输入为所述输入向量，所述第一网络层的输出包括基于所述输入向量输出的线性项向量集和N个组合项向量集，每一所述组合项向量集用于表示对应的数据组内所有目标特征数据的输入向量进行组合得到的向量矩阵，所述目标特征数据为所述数据组内的特征数据；所述第二网络层的输入为所述线性项向量集和所述N个组合项向量集，所述第二网络层的输出为基于所述线性项向量集和N个组合项向量集进行组合的目标输出结果。2.根据权利要求1所述的方法，其特征在于，所述利用所述输入向量对待训练的分层因子分解机模型进行迭代训练，得到分层因子分解机模型的步骤，包括：在第L次迭代训练过程中，将目标样本数据的N个数据组对应的输入向量输入至所述第一网络层，目标样本数据为所述M组样本数据中的至少一组样本数据，L为正整数；所述第一网络层对每一所述特征数据的输入向量进行1阶线性变换，获得所述线性项向量集；所述第一网络层对每一所述数据组中的目标特征数据的输入向量进行2阶组合，并利用S型函数获得N个所述组合项向量集；所述第二网络层将所述线性项向量集中的每一向量与所述N个所述组合项向量集进行组合，并利用S型函数获得所述目标输出结果。3.根据权利要求2所述的方法，其特征在于，所述线性项向量集y
F
满足：其中，b
F
是线性项的偏置量，w
d
表示N个数据组中第d个特征数据的权重向量；x
d
表示N个数据组中第d个特征数据的输入向量，D表示N个数据组中所有特征数据的数量。4.根据权利要求3所述的方法，其特征在于，所述N个组合项向量集满足：其中，y
n
表示第n个数据组对应的组合项向量集，表示第n个数据组的特征组合权重矩阵，表示第n个数据组中第i个目标特征数据的输入向量。5.根据权利要求4所述的方法，其特征在于，所述目标输出结果y满足：其中，表示y
F
和y
n
的特征组合权重，i＝1时，y
i
等于y
F
，i＝1时，y
i
表示第i-1个数据组对应的组合项向量集。6.根据权利要求3所述的方法，其特征在于，所述第二网络层利用S型函数将所述线性
项向量集中的每一向量与所述N个所述组合项向量集进行组合，获得所述目标输出结果的步骤之后，所述方法还包括：将所述目标输出结果与所述目标样本数据进行比对，获得比对结果；基于所述比对结...

【专利技术属性】
技术研发人员：李长林，蒋宁，王洪斌，吴海英，赵立军，
申请(专利权)人：马上消费金融股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人