一种基于元路径上下文的推荐模型训练方法及装置制造方法及图纸

技术编号:19778425 阅读:24 留言:0更新日期:2018-12-15 11:21
本发明专利技术实施例提供了一种基于元路径上下文的推荐模型训练方法及装置。该方法包括:在样本信息平台中获得多个用户信息对;针对每个用户信息对,获得该用户信息对所对应的路径实例,并生成该用户信息对所对应样本用户表征信息、样本对象表征信息和元路径上下文表征信息;针对每个用户信息对,将上述三种信息进行拼接得到训练样本;将得到的多个训练样本作为输入,对预设神经网络模型进行训练,直至通过损失函数计算得到的函数值小于预设阈值时,完成神经网络模型的训练。与现有技术相比,应用本发明专利技术实施例提供的方案,训练得到的基于元路径上下文的推荐模型可以学习到更优化的特征,进而,可以提高基于该模型得到的推荐结果的准确性。

【技术实现步骤摘要】
一种基于元路径上下文的推荐模型训练方法及装置
本专利技术涉及计算机软件
,特别是涉及一种基于元路径上下文的推荐模型训练方法、装置及电子设备。
技术介绍
当前,随着网络技术的不断发展,越来越多的用户选择在互联网上进行各种日常活动,例如,购买商品、观看电影、阅读书籍等。伴随着网络技术发展,随之而来的是信息超载问题,用户感受到了的信息量过大,从而导致用户需要花费更多的时间和精力来获得自己想要的信息。以购买商品为例,随着电子商务规模的不断扩大,商品的种类在快速增长,用户需要花费大量的时间才能找到自己想买的商品。而这种需要浏览大量无关信息才能获得自身需要的信息的过程会极大地降低用户体验,进而,导致用户流失。为了解决上述问题,各种推荐系统应用而生。现有技术中,常见的推荐系统通常使用基于异质信息网络(HeterogeneousInformationNetwork,HIN)的推荐算法进行建模,并通过训练得到的推荐模型为用户提供个性化的推荐信息。所谓HIN是一个有向图G=(V,ε),其定义了一个实体类型映射Φ:V→A,以及一个边类型映射其中A和R分别代表预定义的实体类型集合以及边类型集合,且|A|+|R|>2。在HIN中,网络模式用于描述网络中的一个元结构,即对象类型以及他们之间的交互关系。以电影推荐系统中的对应网络模式为例,对异质信息网络进行说明。如图1所示,在网络中包括多种不同类型的对象(如User,Movie,Director),以及他们之间的语义关系(如User和Movie间的观看关系,User之间的朋友关系,以及Movie和Director之间的导演关系)。在HIN中,两个对象可以通过不同的语义路径连接起来,即元路径。同样以图1为例,对元路径进行说明。在图1中,可见User(用户)u1和Movie(电影)m2可以由多条元路径相连,如“u1-m1-u3-m2″(UMUM)“u1-m1-t1-m2″(UMTM)UMUM和UMTM路径均可以表示Useru1看过Moviem2,因为UMUM表示有着相同观影记录的Useru3看过Moviem2,UMTM表示Useru1看过与Moviem2相同类型的Moviem1。而现有技术中,在使用基于HIN的推荐算法训练推荐模型时,是在样本信息平台中,根据用户与对象的历史交互记录,直接提取用户与对象之间的交互特征,从而根据生成的用户表征信息和对象表征信息建模用户对对象的偏好,进而完成针对用户的个性化对象推荐。仍然以图1为例中的Useru1和Moviem2为例,在现有技术中,仅考虑了Useru1和Moviem2的交互关系,即Useru1看过Moviem2。显然,Useru1和Moviem2的交互关系可以通过多个元路径来表示,而这些不同的元路径会影响Useru1和Moviem2的交互关系。因此,由于现有技术中在训练推荐模型时,没有考虑到用户与对象之间的不同元路径对用户与对象的交互的影响,因此,现有技术中在训练推荐模型时会导致学习到的特征可能不是最优的,得到的推荐结果的准确性较低。
技术实现思路
本专利技术实施例的目的在于提供一种基于元路径上下文的推荐模型训练方法及装置,以提高推荐结果的准确性。具体技术方案如下:第一方面,本专利技术实施例提供了一种基于元路径上下文的推荐模型训练方法,所述方法包括:在样本信息平台中获得多个用户信息对,其中,每个用户信息对包括一个样本用户向量和一个样本对象向量,所述样本用户向量对应的样本用户与所述样本对象向量对应的样本对象具有交互关系;针对每个用户信息对,获得该用户信息对所对应的路径实例,作为样本路径实例,其中,所述路径实例为:该用户信息对所对应的样本用户访问样本对象的访问路径;针对每个用户信息对,生成样本用户向量对应的样本用户表征信息和样本对象向量对应的样本对象表征信息;针对每个用户信息对,利用与该用户信息对所对应的样本路径实例,生成该用户信息对所对应的元路径上下文表征信息;针对每个用户信息对,拼接该用户信息对所对应的样本用户表征信息、样本对象表征信息和元路径上下文表征信息,得到训练样本;将得到的多个训练样本作为输入,对预设神经网络模型进行训练,直至通过损失函数计算得到的函数值小于预设阈值时,完成所述神经网络模型的训练;其中,针对任一训练样本,所述神经网络模型的输出为:向该训练样本所对应样本用户,推荐的各个样本对象的推荐排行顺序。第二方面,本专利技术实施例提供了一种向用户推荐信息的方法,所述方法包括:在目标信息平台中,获取与目标用户对应的多个目标信息对,其中,所述目标信息对包括所述目标用户对应的用户向量和一个对象向量,每个目标信息对包括的对象向量不同;针对每个目标信息对,获得与该用户信息对所对应的路径实例;将所述多个目标信息对和与每个目标信息对所对应的路径实例输入到预设的推荐模型中进行检测,得到向所述目标用户推荐的、所述多个目标信息对所对应的对象中每个对象的推荐排行顺序,其中,所述推荐模型通过上述第一方面提供的一种基于元路径上下文的推荐模型训练方法中任一项所述的方法训练得到。第三方面,本专利技术实施例提供了一种基于元路径上下文的推荐模型训练装置,所述装置包括:信息获取模块,用于在样本信息平台中获得多个用户信息对,其中,每个用户信息对包括一个样本用户向量和一个样本对象向量,所述样本用户向量对应的样本用户与所述样本对象向量对应的样本对象具有交互关系;路径获取模块,用于针对每个用户信息对,获得该用户信息对所对应的路径实例,作为样本路径实例,其中,所述路径实例为:该用户信息对所对应的样本用户访问样本对象的访问路径;第一表征信息生成模块,用于针对每个用户信息对,生成样本用户向量对应的样本用户表征信息和样本对象向量对应的样本对象表征信息;第二表征信息生成模块,用于针对每个用户信息对,利用与该用户信息对所对应的样本路径实例,生成该用户信息对所对应的元路径上下文表征信息;样本获得模块,用于针对每个用户信息对,拼接该用户信息对所对应的样本用户表征信息、样本对象表征信息和元路径上下文表征信息,得到训练样本;模型训练模块,用于将得到的多个训练样本作为输入,对预设神经网络模型进行训练,直至通过损失函数计算得到的函数值小于预设阈值时,完成所述神经网络模型的训练;其中,针对任一训练样本,所述神经网络模型的输出为:向该训练样本所对应样本用户,推荐的各个样本对象的推荐排行顺序。第四方面,本专利技术实施例提供了一种向用户推荐信息的装置,所述装置包括:目标信息获取模块,用于在目标信息平台中,获取与目标用户对应的多个目标信息对,其中,所述目标信息对包括所述目标用户对应的用户向量和一个对象向量,每个目标信息对包括的对象向量不同;目标路径获得模块,用于针对每个目标信息对,获得与该用户信息对所对应的路径实例;推荐信息获得模块,用于将所述多个目标信息对和与每个目标信息对所对应的路径实例输入到预设的推荐模型中进行检测,得到向所述目标用户推荐的、所述多个目标信息对所对应的对象中每个对象的推荐排行顺序,其中,所述推荐模型通过上述第一方面提供的一种基于元路径上下文的推荐模型训练方法中任一项所述的方法训练得到。第五方面,本专利技术实施例提供了一种电子设备,包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器本文档来自技高网
...

【技术保护点】
1.一种基于元路径上下文的推荐模型训练方法,其特征在于,所述方法包括:在样本信息平台中获得多个用户信息对,其中,每个用户信息对包括一个样本用户向量和一个样本对象向量,所述样本用户向量对应的样本用户与所述样本对象向量对应的样本对象具有交互关系;针对每个用户信息对,获得该用户信息对所对应的路径实例,作为样本路径实例,其中,所述路径实例为:该用户信息对所对应的样本用户访问样本对象的访问路径;针对每个用户信息对,生成样本用户向量对应的样本用户表征信息和样本对象向量对应的样本对象表征信息;针对每个用户信息对,利用与该用户信息对所对应的样本路径实例,生成该用户信息对所对应的元路径上下文表征信息;针对每个用户信息对,拼接该用户信息对所对应的样本用户表征信息、样本对象表征信息和元路径上下文表征信息,得到训练样本;将得到的多个训练样本作为输入,对预设神经网络模型进行训练,直至通过损失函数计算得到的函数值小于预设阈值时,完成所述神经网络模型的训练;其中,针对任一训练样本,所述神经网络模型的输出为:向该训练样本所对应样本用户,推荐的各个样本对象的推荐排行顺序。

【技术特征摘要】
1.一种基于元路径上下文的推荐模型训练方法,其特征在于,所述方法包括:在样本信息平台中获得多个用户信息对,其中,每个用户信息对包括一个样本用户向量和一个样本对象向量,所述样本用户向量对应的样本用户与所述样本对象向量对应的样本对象具有交互关系;针对每个用户信息对,获得该用户信息对所对应的路径实例,作为样本路径实例,其中,所述路径实例为:该用户信息对所对应的样本用户访问样本对象的访问路径;针对每个用户信息对,生成样本用户向量对应的样本用户表征信息和样本对象向量对应的样本对象表征信息;针对每个用户信息对,利用与该用户信息对所对应的样本路径实例,生成该用户信息对所对应的元路径上下文表征信息;针对每个用户信息对,拼接该用户信息对所对应的样本用户表征信息、样本对象表征信息和元路径上下文表征信息,得到训练样本;将得到的多个训练样本作为输入,对预设神经网络模型进行训练,直至通过损失函数计算得到的函数值小于预设阈值时,完成所述神经网络模型的训练;其中,针对任一训练样本,所述神经网络模型的输出为:向该训练样本所对应样本用户,推荐的各个样本对象的推荐排行顺序。2.根据权利要求1所述的方法,其特征在于,在所述针对每个用户信息对,利用与该用户信息对所对应的样本路径实例,生成该用户信息对所对应的元路径上下文表征信息的步骤之后,所述方法还包括:针对每个用户信息对,对该用户信息对所对应的样本用户表征信息、样本对象表征信息和元路径上下文表征信息进行增强处理;所述针对每个用户信息对,拼接该用户信息对所对应的样本用户表征信息、样本对象表征信息和元路径上下文表征信息,得到训练样本的步骤,包括:针对每个用户信息对,拼接该用户信息对所对应的增强后的样本用户表征信息、样本对象表征信息和元路径上下文表征信息,得到训练样本。3.根据权利要求1所述的方法,其特征在于,所述针对每个用户信息对,生成样本用户向量对应的样本用户表征信息和样本对象向量对应的样本对象表征信息的步骤,包括:针对每个用户信息对,利用第一预设公式,生成样本用户向量对应的样本用户表征信息和样本对象向量对应的样本对象表征信息;其中,所述第一预设公式为:xu=PT·puyi=QT·qi其中,xu为样本用户表征信息,P∈R|u|×d,pu∈R|u|×1,yi为样本对象表征信息,Q∈R|i|×d,Qi∈R|i|×1,d为预设维度;R为所述样本信息平台的隐形反馈矩阵,R∈Rn×m,n为所述样本信息平台中用户的数量,m为所述样本信息平台中对象的数量,n≥1,m≥1;u为样本用户向量,u=(u1,u2,…,ua,…,un),ua表示用户a的第一数字标识,所述第一数字标识用于表征用户a是否为样本用户,1≤a≤n,|u|为所述样本信息平台中的用户的数量;i为样本对象向量为:i=(i1,i2,…,ib,…,im),ib表示对象b的第二数字标识,所述第二数字标识用于保证信息b是否为样本对象,1≤b≤m,|i|为所述样本信息网络中的对象的数量。4.根据权利要求1所述的方法,其特征在于,所述针对每个用户信息对,获得该用户信息对所对应的路径实例,作为样本路径实例的步骤,包括:根据所述样本信息平台中存在的交互关系,建立交互网络,其中,所述交互网络中的每个节点标识该样本信息平台中的一个信息项目,两个相连的节点标识该两个节点标识的信息项目之间具有直接交互关系;利用预先建立的SVDFeature模型,获得所述交互网络中每个节点对应的节点向量;计算所述交互网络中任意两个相连的节点对应的节点向量的内积,作为由该两个节点中的一个节点转移到另一个节点的转移概率;针对每个用户信息对,确定与该用户信息对所对应的所有路径实例,并确定所述所有路径实例中的每一个路径实例对应的节点转移路线;针对每个用户信息对所对应的每个节点转移路线,计算从该节点转移路线中的第一个节点转移到最后一个节点的过程中,所涉及的转移概率的和;针对每个用户信息对,按照计算得到的转移概率的和,由大到小获取预设数量的节点转移路线对应的路径实例,作为样本路径实例。5.根据权利要求4所述的方法,其特征在于,所述针对每个用户信息对,利用与该用户信息对所对应的样本路径实例,生成与该用户信息对所对应的元路径上下文表征信息的步骤,包括:针对每个用户信息对,确定该用户信息对所对应的样本路径中的元路径;针对每个用户信息对,利用第二预设公式,生成与所该用户信息对所对应的每个样本路径实例的路径表征信息;其中,所述第二预设公式为:hp=CNN(Xp;Θ)其中,p为一个样本路径实例,Xp为表示样本路径实例p的矩阵,Xp∈RL×d,CNN为卷积神经网络,Θ为CNN中的所有相关参数,hp为样本路径实例p的路径表征信息,d为预设维度,L为所确定的元路径中每条元路径包括的样本路径实例的数量;针对每个用户信息对,利用第三预设公式,生成确定的每个元路径的元路径表征信息;其中,所述第三预设公式为:...

【专利技术属性】
技术研发人员:石川胡斌斌
申请(专利权)人:北京邮电大学
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1