一种基于元路径上下文的推荐模型训练方法及装置制造方法及图纸

技术编号：19778425 阅读：24 留言：0更新日期：2018-12-15 11:21

本发明专利技术实施例提供了一种基于元路径上下文的推荐模型训练方法及装置。该方法包括：在样本信息平台中获得多个用户信息对；针对每个用户信息对，获得该用户信息对所对应的路径实例，并生成该用户信息对所对应样本用户表征信息、样本对象表征信息和元路径上下文表征信息；针对每个用户信息对，将上述三种信息进行拼接得到训练样本；将得到的多个训练样本作为输入，对预设神经网络模型进行训练，直至通过损失函数计算得到的函数值小于预设阈值时，完成神经网络模型的训练。与现有技术相比，应用本发明专利技术实施例提供的方案，训练得到的基于元路径上下文的推荐模型可以学习到更优化的特征，进而，可以提高基于该模型得到的推荐结果的准确性。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于元路径上下文的推荐模型训练方法及装置
本专利技术涉及计算机软件
，特别是涉及一种基于元路径上下文的推荐模型训练方法、装置及电子设备。
技术介绍
当前，随着网络技术的不断发展，越来越多的用户选择在互联网上进行各种日常活动，例如，购买商品、观看电影、阅读书籍等。伴随着网络技术发展，随之而来的是信息超载问题，用户感受到了的信息量过大，从而导致用户需要花费更多的时间和精力来获得自己想要的信息。以购买商品为例，随着电子商务规模的不断扩大，商品的种类在快速增长，用户需要花费大量的时间才能找到自己想买的商品。而这种需要浏览大量无关信息才能获得自身需要的信息的过程会极大地降低用户体验，进而，导致用户流失。为了解决上述问题，各种推荐系统应用而生。现有技术中，常见的推荐系统通常使用基于异质信息网络(HeterogeneousInformationNetwork，HIN)的推荐算法进行建模，并通过训练得到的推荐模型为用户提供个性化的推荐信息。所谓HIN是一个有向图G＝(V，ε)，其定义了一个实体类型映射Φ：V→A，以及一个边类型映射其中A和R分别代表预定义的实体类型集合以及边类型集合，且|A|+|R|＞2。在HIN中，网络模式用于描述网络中的一个元结构，即对象类型以及他们之间的交互关系。以电影推荐系统中的对应网络模式为例，对异质信息网络进行说明。如图1所示，在网络中包括多种不同类型的对象(如User，Movie，Director)，以及他们之间的语义关系(如User和Movie间的观看关系，User之间的朋友关系，以及Movie和Director之间的导演关系)。...

【技术保护点】
1.一种基于元路径上下文的推荐模型训练方法，其特征在于，所述方法包括：在样本信息平台中获得多个用户信息对，其中，每个用户信息对包括一个样本用户向量和一个样本对象向量，所述样本用户向量对应的样本用户与所述样本对象向量对应的样本对象具有交互关系；针对每个用户信息对，获得该用户信息对所对应的路径实例，作为样本路径实例，其中，所述路径实例为：该用户信息对所对应的样本用户访问样本对象的访问路径；针对每个用户信息对，生成样本用户向量对应的样本用户表征信息和样本对象向量对应的样本对象表征信息；针对每个用户信息对，利用与该用户信息对所对应的样本路径实例，生成该用户信息对所对应的元路径上下文表征信息；针对每个用户信息对，拼接该用户信息对所对应的样本用户表征信息、样本对象表征信息和元路径上下文表征信息，得到训练样本；将得到的多个训练样本作为输入，对预设神经网络模型进行训练，直至通过损失函数计算得到的函数值小于预设阈值时，完成所述神经网络模型的训练；其中，针对任一训练样本，所述神经网络模型的输出为：向该训练样本所对应样本用户，推荐的各个样本对象的推荐排行顺序。

【技术特征摘要】
1.一种基于元路径上下文的推荐模型训练方法，其特征在于，所述方法包括：在样本信息平台中获得多个用户信息对，其中，每个用户信息对包括一个样本用户向量和一个样本对象向量，所述样本用户向量对应的样本用户与所述样本对象向量对应的样本对象具有交互关系；针对每个用户信息对，获得该用户信息对所对应的路径实例，作为样本路径实例，其中，所述路径实例为：该用户信息对所对应的样本用户访问样本对象的访问路径；针对每个用户信息对，生成样本用户向量对应的样本用户表征信息和样本对象向量对应的样本对象表征信息；针对每个用户信息对，利用与该用户信息对所对应的样本路径实例，生成该用户信息对所对应的元路径上下文表征信息；针对每个用户信息对，拼接该用户信息对所对应的样本用户表征信息、样本对象表征信息和元路径上下文表征信息，得到训练样本；将得到的多个训练样本作为输入，对预设神经网络模型进行训练，直至通过损失函数计算得到的函数值小于预设阈值时，完成所述神经网络模型的训练；其中，针对任一训练样本，所述神经网络模型的输出为：向该训练样本所对应样本用户，推荐的各个样本对象的推荐排行顺序。2.根据权利要求1所述的方法，其特征在于，在所述针对每个用户信息对，利用与该用户信息对所对应的样本路径实例，生成该用户信息对所对应的元路径上下文表征信息的步骤之后，所述方法还包括：针对每个用户信息对，对该用户信息对所对应的样本用户表征信息、样本对象表征信息和元路径上下文表征信息进行增强处理；所述针对每个用户信息对，拼接该用户信息对所对应的样本用户表征信息、样本对象表征信息和元路径上下文表征信息，得到训练样本的步骤，包括：针对每个用户信息对，拼接该用户信息对所对应的增强后的样本用户表征信息、样本对象表征信息和元路径上下文表征信息，得到训练样本。3.根据权利要求1所述的方法，其特征在于，所述针对每个用户信息对，生成样本用户向量对应的样本用户表征信息和样本对象向量对应的样本对象表征信息的步骤，包括：针对每个用户信息对，利用第一预设公式，生成样本用户向量对应的样本用户表征信息和样本对象向量对应的样本对象表征信息；其中，所述第一预设公式为：xu＝PT·puyi＝QT·qi其中，xu为样本用户表征信息，P∈R|u|×d，pu∈R|u|×1，yi为样本对象表征信息，Q∈R|i|×d，Qi∈R|i|×1，d为预设维度；R为所述样本信息平台的隐形反馈矩阵，R∈Rn×m，n为所述样本信息平台中用户的数量，m为所述样本信息平台中对象的数量，n≥1，m≥1；u为样本用户向量，u＝(u1，u2，…，ua，…，un)，ua表示用户a的第一数字标识，所述第一数字标识用于表征用户a是否为样本用户，1≤a≤n，|u|为所述样本信息平台中的用户的数量；i为样本对象向量为：i＝(i1，i2，…，ib，…，im)，ib表示对象b的第二数字标识，所述第二数字标识用于保证信息b是否为样本对象，1≤b≤m，|i|为所述样本信息网络中的对象的数量。4.根据权利要求1所述的方法，其特征在于，所述针对每个用户信息对，获得该用户信息对所对应的路径实例，作为样本路径实例的步骤，包括：根据所述样本信息平台中存在的交互关系，建立交互网络，其中，所述交互网络中的每个节点标识该样本信息平台中的一个信息项目，两个相连的节点标识该两个节点标识的信息项目之间具有直接交互关系；利用预先建立的SVDFeature模型，获得所述交互网络中每个节点对应的节点向量；计算所述交互网络中任意两个相连的节点对应的节点向量的内积，作为由该两个节点中的一个节点转移到另一个节点的转移概率；针对每个用户信息对，确定与该用户信息对所对应的所有路径实例，并确定所述所有路径实例中的每一个路径实例对应的节点转移路线；针对每个用户信息对所对应的每个节点转移路线，计算从该节点转移路线中的第一个节点转移到最后一个节点的过程中，所涉及的转移概率的和；针对每个用户信息对，按照计算得到的转移概率的和，由大到小获取预设数量的节点转移路线对应的路径实例，作为样本路径实例。5.根据权利要求4所述的方法，其特征在于，所述针对每个用户信息对，利用与该用户信息对所对应的样本路径实例，生成与该用户信息对所对应的元路径上下文表征信息的步骤，包括：针对每个用户信息对，确定该用户信息对所对应的样本路径中的元路径；针对每个用户信息对，利用第二预设公式，生成与所该用户信息对所对应的每个样本路径实例的路径表征信息；其中，所述第二预设公式为：hp＝CNN(Xp；Θ)其中，p为一个样本路径实例，Xp为表示样本路径实例p的矩阵，Xp∈RL×d，CNN为卷积神经网络，Θ为CNN中的所有相关参数，hp为样本路径实例p的路径表征信息，d为预设维度，L为所确定的元路径中每条元路径包括的样本路径实例的数量；针对每个用户信息对，利用第三预设公式，生成确定的每个元路径的元路径表征信息；其中，所述第三预设公式为：...

【专利技术属性】
技术研发人员：石川，胡斌斌，
申请(专利权)人：北京邮电大学，
类型：发明
国别省市：北京,11

全部详细技术资料下载我是这个专利的主人