一种自动提取元路径的异构信息网络推荐方法技术

技术编号:38017501 阅读:10 留言:0更新日期:2023-06-30 10:44
本发明专利技术提出了一种自动提取元路径的异构信息网络推荐方法,包括以下步骤:S1,自动提取元路径:首先挖掘实体之间具有不同语义的路径实例,充分利用HIN中的实体关系。然后根据路径经过的实体类型对全部路径实例进行归类整理,从而获得自动挖掘出的元路径;S2,将所述元路径输入层次注意力网络中,得到用户的项目推荐列表。本发明专利技术从基于异构信息网络中的交互场景中自动挖掘出有意义的路径实例,路径实例能表示推荐过程和推荐原因;此外,还考虑了用户对各路径实例的偏好,然后将基于元路径的上下文纳入互动的三方交互建模的异构信息网络推荐模型,从而实现为用户匹配最适合的信息。从而实现为用户匹配最适合的信息。从而实现为用户匹配最适合的信息。

【技术实现步骤摘要】
一种自动提取元路径的异构信息网络推荐方法


[0001]本专利技术涉及异构信息网络推荐领域,特别是涉及一种自动提取元路径的异构信息网络推荐方法。

技术介绍

[0002]随着互联网时代的快速发展,大量的信息不断涌现,极大地便利了用户的交流与信息选择。但这也同时带来了信息过载的问题,信息过载极大地影响了人们获取有用信息的效率。而推荐系统旨在挖掘用户潜在兴趣,为用户匹配最适合的信息,从而解决信息过载问题,并挖掘长尾需求、提升用户体验。经过几十年的发展,推荐系统已经成功应用于电子商务、多媒体等服务场景。
[0003]异构信息网络(Heterogeneous Information Network,HIN)是一种通用的融合多源数据的方法。基于异构信息网络的推荐系统在信息融合、探索结构语义等方面具有显著优势,不仅可以有效缓解数据稀疏与冷启动问题,而且有助于提升推荐系统的准确性和可解释性,因此取得了广泛的关注与应用。
[0004]现有的大多数基于异构信息网络的推荐方法都利用元路径从异构信息网络获得丰富的用户和物品辅助信息。例如PathSim及其变体HeteSim是基于元路径的相似性测量方法。Pathsim能够在网络中找到对等对象(例如,找到相似领域和具有相似声誉的作者),这在许多情况下比基于随机游走的相似性度量更有意义。因为元路径引入了更多的背景信息,并且设计的元路径满足对称性等良好属性。这些优点使得元路径能够整合更多的语义信息,但元路径需要手动设计。但这两种方法仍然是矩阵分解等后续工作的基石。受益于元路径的高可读性和不同元路径的不同权重的优势,基于元路径的方法还具有坚实的可解释性的优势。
[0005]尽管现在已经有了不少利用元路径的工作,也在一定程度提高了推荐性能,但到目前为止仍然存在几个尚待解决的挑战。首先,现有的大部分基于路径的方法都是先由专业人员手工设计元路径模式后再按照模式寻找路径实例。这样的方法严重依赖人工输入一系列任务相关的元路径,这对于没有专业知识用户来说是困难的。更重要的是,人工设计的元路径往往无法覆盖所有可能的路径实例,这极大地阻碍了推荐质量的提高。除此之外,现有的基于异构信息网络的推荐算法,都在尽可能多地使用多元信息进行推荐,但是很少在推荐算法中学习路径或元路径的显式表示,无法直观地表示推荐过程。此外,MCRec虽然学习了元路径的上下文显式表示,但其在生成元路径上下文嵌入时,没有考虑到用户对各路径实例的偏好。

技术实现思路

[0006]本专利技术旨在至少解决现有技术中存在的技术问题,特别创新地提出了一种自动提取元路径的异构信息网络推荐方法。
[0007]为了实现本专利技术的上述目的,本专利技术提供了一种自动提取元路径的异构信息网络
推荐方法,包括以下步骤:
[0008]S1,自动提取元路径:首先挖掘实体之间具有不同语义的路径实例,充分利用HIN中的实体关系。然后根据路径经过的实体类型对全部路径实例进行归类整理,从而获得自动挖掘出的元路径;
[0009]S2,将所述元路径输入层次注意力网络中,得到用户的项目推荐列表。
[0010]进一步地,包括从S1提取的元路径中选择突出的路径:
[0011]选取路径长度小于设定阈值的路径;每对实体间(只考虑用户和项目间)可能存在数条路径,它们长度不一、顺序不同,拥有不同的语义信息。在这些路径中,长度相对较短的路径足以建模实体关系,而较长的路径可能会引入远端邻居,模糊语义意义,从而引入大量噪声。
[0012]和/或按照优先级进行路径筛选,保留优先级高的路径。在对路径实例进行归类整理后,每种元路径下可能存在数条路径,它们可能质量高低不一,保留全部的路径会引入不必要的语义信息,随机选择路径可能会保留质量不高的路径。计算路径的优先级对其筛选可以有效降低噪声对推荐的影响。
[0013]进一步地,利用预训练模型为每个具有用户

项目交互记录的节点学习潜在向量,然后计算路径实例中相邻节点的余弦相似度,取平均值作为路径的优先级。这样的优先级得分直接反映了两个节点之间的关联程度。
[0014]进一步地,在计算路径实例中相邻节点的余弦相似度时,对于每条路径实例,只计算其中前几对节点的相似度,而不计算最后一对节点相似度。因为当前面的节点顺序确定后,后面的节点顺序也相应确定,即能认为在一条路径实例中,前面的节点起了决定性作用。
[0015]进一步地,所述层次注意力网络包括:节点聚合成层、路径实例注意力层、元路径注意力层和预测层,
[0016]节点聚合成层节点聚合成层由若干卷积神经网络组成,路径实例注意力层和元路径注意力层都使用一层全连接网络来实现注意力机制。
[0017]进一步地,所述S2包括:
[0018]S2

1,在节点聚合成层中得到路径实例的嵌入,元路径φ下的路径实例p的嵌入定义如下:
[0019][0020]其中表示路径实例p的嵌入矩阵;
[0021]Conv1D表示卷积运算;
[0022]Θ是Conv1D中的所有相关参数;
[0023]S2

2,采用路径实例注意力层,自动学习不同路径实例的重要性:
[0024]元路径φ共有K个路径实例的嵌入,表示为通过一层全连接网络学习各路径实例对其所属元路径的重要性,然后将其归一化,再通过softmax函数得到权重系数
[0025][0026]表示元路径φ下的路径实例p的权重系数;
[0027]其中W
p
和W
k
分别是路径实例p的权重矩阵和路径实例k的权重矩阵;
[0028]表示元路径φ的路径实例p的嵌入;
[0029]b
p
和b
k
分别是路径实例p的偏置向量和路径实例k的偏置向量;
[0030]σ(W)是ReLU函数;
[0031]K为元路径φ下的路径实例数量;
[0032]因此,元路径φ的嵌入表示c
φ
通过其包含的路径实例与相应的系数进行聚合得到:
[0033][0034]S2

3,通过元路径注意力层,以交互中的用户

物品对的信息作为辅助信息,自动学习不同元路径的重要性,并相应地聚合S2

2的元路径的嵌入表示,学习基于上下文的元路径表示:
[0035]将用户嵌入、物品嵌入以及从路径实例注意力层获得的元路径φ的嵌入c
φ
为输入,使用一层全连接网络来变换语义特定的嵌入,每条元路径的重要性表示如下:
[0036]s
u,i,φ
=σ(W
u
·
e
u
+W
i
·
e
i
+W
φ
·
c
φ
+b)
ꢀꢀ
(4)
[0037]s
u,i,φ
表示元本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种自动提取元路径的异构信息网络推荐方法,其特征在于,包括以下步骤:S1,自动提取元路径:首先挖掘实体之间具有不同语义的路径实例,然后根据路径经过的实体类型对全部路径实例进行归类整理,从而获得元路径;S2,将所述元路径输入层次注意力网络中,得到用户的项目推荐列表。2.根据权利要求1所述的一种自动提取元路径的异构信息网络推荐方法,其特征在于,还包括从S1提取的元路径中选择突出的路径:选取路径长度小于设定阈值的路径;和/或按照优先级进行路径筛选,保留优先级高的路径。3.根据权利要求2所述的一种自动提取元路径的异构信息网络推荐方法,其特征在于,所述优先级的计算包括:利用预训练模型为每个具有用户

项目交互记录的节点学习潜在向量,然后计算路径实例中相邻节点的余弦相似度,取平均值作为路径的优先级。4.根据权利要求3所述的一种自动提取元路径的异构信息网络推荐方法,其特征在于,在计算路径实例中相邻节点的余弦相似度时,对于每条路径实例,不计算最后一对节点相似度。5.根据权利要求1所述的一种自动提取元路径的异构信息网络推荐方法,其特征在于,所述层次注意力网络包括:节点聚合成层、路径实例注意力层、元路径注意力层和预测层,节点聚合成层节点聚合成层由若干卷积神经网络组成,路径实例注意力层和元路径注意力层都使用一层全连接网络来实现注意力机制。6.根据权利要求1所述的一种自动提取元路径的异构信息网络推荐方法,其特征在于,所述S2包括:S2

1,在节点聚合成层中得到路径实例的嵌入,元路径φ下的路径实例p的嵌入定义如下:其中表示路径实例p的嵌入矩阵;Conv1D表示卷积运算;Θ是Conv1D中的所有相关参数;S2

2,采用路径实例注意力层,自动学习不同路径实例的重要性:元路径φ共有K个路径实例的嵌入,表示为通过一层全连接网络学习各路径实例对其所属元路径的重要性,然后将其归一化,再通过softmax函数得到权重系数例对其所属元路径的重要性,然后将其归一化,再通过softmax函数得到权重系数例对其所属元路径的重要性,然后将其归一化,再通过softmax函数得到权重系数表示元路径φ下的路径实例p的权重系数;其中W
p
和W
k
分别是路径实例p的权重矩阵和路径实例k的权重矩阵;表示元路径φ的路径实例p的嵌入;
b
p
和b
k
分别是路径实例p的偏置向量和路径实例k的偏置向量;σ(
·
)是ReLU函数;K为元路径φ下的路径实例数量;因此,元路径φ的嵌入表示c
φ
通过其包含的路径实例与相应的系数进行聚合得到:S2

3,通过元路径注意力层,以交互中的用户

物品对的信息作为辅助信息,自动学习不同元路径的重要性,并相应地聚合S2

2的元路径的嵌入表示,学习基于上下文的元路径表示:将用户嵌入、物品嵌入以及从路径实例注意力层获得的元路径φ的嵌入c
φ
为输入,使用一层全连接网络来变换语义特定的嵌入,...

【专利技术属性】
技术研发人员:张宜浩廖玮雯
申请(专利权)人:重庆理工大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1