【技术实现步骤摘要】
一种自动提取元路径的异构信息网络推荐方法
[0001]本专利技术涉及异构信息网络推荐领域,特别是涉及一种自动提取元路径的异构信息网络推荐方法。
技术介绍
[0002]随着互联网时代的快速发展,大量的信息不断涌现,极大地便利了用户的交流与信息选择。但这也同时带来了信息过载的问题,信息过载极大地影响了人们获取有用信息的效率。而推荐系统旨在挖掘用户潜在兴趣,为用户匹配最适合的信息,从而解决信息过载问题,并挖掘长尾需求、提升用户体验。经过几十年的发展,推荐系统已经成功应用于电子商务、多媒体等服务场景。
[0003]异构信息网络(Heterogeneous Information Network,HIN)是一种通用的融合多源数据的方法。基于异构信息网络的推荐系统在信息融合、探索结构语义等方面具有显著优势,不仅可以有效缓解数据稀疏与冷启动问题,而且有助于提升推荐系统的准确性和可解释性,因此取得了广泛的关注与应用。
[0004]现有的大多数基于异构信息网络的推荐方法都利用元路径从异构信息网络获得丰富的用户和物品辅助信息。例如PathSim及其变体HeteSim是基于元路径的相似性测量方法。Pathsim能够在网络中找到对等对象(例如,找到相似领域和具有相似声誉的作者),这在许多情况下比基于随机游走的相似性度量更有意义。因为元路径引入了更多的背景信息,并且设计的元路径满足对称性等良好属性。这些优点使得元路径能够整合更多的语义信息,但元路径需要手动设计。但这两种方法仍然是矩阵分解等后续工作的基石。受益于元路径的高可读性 ...
【技术保护点】
【技术特征摘要】
1.一种自动提取元路径的异构信息网络推荐方法,其特征在于,包括以下步骤:S1,自动提取元路径:首先挖掘实体之间具有不同语义的路径实例,然后根据路径经过的实体类型对全部路径实例进行归类整理,从而获得元路径;S2,将所述元路径输入层次注意力网络中,得到用户的项目推荐列表。2.根据权利要求1所述的一种自动提取元路径的异构信息网络推荐方法,其特征在于,还包括从S1提取的元路径中选择突出的路径:选取路径长度小于设定阈值的路径;和/或按照优先级进行路径筛选,保留优先级高的路径。3.根据权利要求2所述的一种自动提取元路径的异构信息网络推荐方法,其特征在于,所述优先级的计算包括:利用预训练模型为每个具有用户
‑
项目交互记录的节点学习潜在向量,然后计算路径实例中相邻节点的余弦相似度,取平均值作为路径的优先级。4.根据权利要求3所述的一种自动提取元路径的异构信息网络推荐方法,其特征在于,在计算路径实例中相邻节点的余弦相似度时,对于每条路径实例,不计算最后一对节点相似度。5.根据权利要求1所述的一种自动提取元路径的异构信息网络推荐方法,其特征在于,所述层次注意力网络包括:节点聚合成层、路径实例注意力层、元路径注意力层和预测层,节点聚合成层节点聚合成层由若干卷积神经网络组成,路径实例注意力层和元路径注意力层都使用一层全连接网络来实现注意力机制。6.根据权利要求1所述的一种自动提取元路径的异构信息网络推荐方法,其特征在于,所述S2包括:S2
‑
1,在节点聚合成层中得到路径实例的嵌入,元路径φ下的路径实例p的嵌入定义如下:其中表示路径实例p的嵌入矩阵;Conv1D表示卷积运算;Θ是Conv1D中的所有相关参数;S2
‑
2,采用路径实例注意力层,自动学习不同路径实例的重要性:元路径φ共有K个路径实例的嵌入,表示为通过一层全连接网络学习各路径实例对其所属元路径的重要性,然后将其归一化,再通过softmax函数得到权重系数例对其所属元路径的重要性,然后将其归一化,再通过softmax函数得到权重系数例对其所属元路径的重要性,然后将其归一化,再通过softmax函数得到权重系数表示元路径φ下的路径实例p的权重系数;其中W
p
和W
k
分别是路径实例p的权重矩阵和路径实例k的权重矩阵;表示元路径φ的路径实例p的嵌入;
b
p
和b
k
分别是路径实例p的偏置向量和路径实例k的偏置向量;σ(
·
)是ReLU函数;K为元路径φ下的路径实例数量;因此,元路径φ的嵌入表示c
φ
通过其包含的路径实例与相应的系数进行聚合得到:S2
‑
3,通过元路径注意力层,以交互中的用户
‑
物品对的信息作为辅助信息,自动学习不同元路径的重要性,并相应地聚合S2
‑
2的元路径的嵌入表示,学习基于上下文的元路径表示:将用户嵌入、物品嵌入以及从路径实例注意力层获得的元路径φ的嵌入c
φ
为输入,使用一层全连接网络来变换语义特定的嵌入,...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。