基于图卷积注意力机制的协同过滤推荐算法制造技术

技术编号:28718044 阅读:11 留言:0更新日期:2021-06-06 02:44
本发明专利技术公开了一种基于图卷积注意力机制的协同过滤推荐算法,该方法包括:首先是数据采集、处理以及划分数据集,其次是GACF模型的构建,最后是模型训练以及通过预测用户与项目之间的关联分数进行推荐。本发明专利技术提出的图卷积注意力机制协同过滤模型,首先利用图嵌入技术将用户

【技术实现步骤摘要】
基于图卷积注意力机制的协同过滤推荐算法


[0001]本专利技术属于计算机人工智能的
,尤其涉及一种基于图卷积注意力机制的协同过滤推荐算法。

技术介绍

[0002]在这个数据大爆炸的时代,为了缓解信息过载问题,推荐系统已经被广泛应用于个性化信息过滤。目前应用最广泛的推荐技术是协同过滤推荐算法,它基于相似的用户会对项目表现出相似的偏好这一假设,通过用户历史行为记录探索用户的隐性偏好,并根据用户的隐式偏好进行推荐。早期的推荐模型直接使用用户和项目的ID号作为嵌入向量,导致所学习的嵌入表达具有局限性。随后,许多研究者将用户ID以及它的交互记录作为嵌入向量(如SVD++模型、NAIS模型和GC

MC模型)提高了嵌入质量。但是,从用户

项目交互图的角度来看,SVD++和NAIS等模型仅仅利用了用户的一阶邻居进行嵌入学习,虽然GC

MC模型考虑了用户

项目的高阶连接性,但是此模型并未将这种高阶信息编码进嵌入表达的学习过程中,从而影响了推荐准确度。
[0003]数据稀疏性和冷启动问题影响了协同过滤技术的推荐性能。社交网络的出现,使得越来越多的推荐算法利用社交网络提供的丰富信息来缓解数据稀疏性和冷启动等问题。但是,传统的基于社交网络推荐算法往往会忽略用户

项目之间隐式关系,为了建模用户

项目信息网络的隐式关系,研究人员提出一系列的图嵌入(Graph embedding,GE)模型。卷积神经网络借助其强大的建模能力得到了快速发展,但卷积神经网络只能处理欧式空间数据(如文本、图像等)。用户

项目交互图是图结构数据,属于非欧式空间数据,不满足平移不变性。图卷积神经网络是一种针对图结构数据的深度学习模型,利用图卷积神经网络建模图上的复杂信息使其具有强大的特征表征能力,PinSage、NGCF和LightGCN等均为典型的图卷积协同过滤技术。但它们聚合邻居节点的特征方式完全依赖于图结构,不利于扩展到其他的图结构,从而局限了模型的泛化能力。

技术实现思路

[0004]基于以上现有技术的不足,本专利技术所解决的技术问题在于提供一种基于图卷积注意力机制的协同过滤推荐算法,更好的提高了推荐精度和模型的可解释性。
[0005]针对以往模型的缺陷,本专利技术提出的模型利用用户

项目交互图的拓扑结构,将用户

项目之间的高阶连接信息加入到嵌入表达的学习过程中,考虑了用户

项目之间的交互信息,以此揭示了用户/项目之间的耦合关系。
[0006]本专利技术的基于图卷积注意力机制的协同过滤推荐算法,包括以下步骤:
[0007]步骤1:数据采集、数据处理、数据集划分。
[0008]数据采集:本专利技术的数据集采用Gowalla数据集,此数据集包括29858条用户数据,40981条项目数据以及1027370条用户与项目交互数据。
[0009]数据处理:将采集到的欧式空间数据构造为非欧式空间数据(即图数据),主要做
法是将用户与项目之间的交互数据构造为用户

项目交互二部图。
[0010]数据集划分:将处理好的数据集随机选取80%的历史交互作为训练集,用于训练模型;其余作为测试集,用于评估模型的泛化能力。对于数据集中每一个可以观察到的用户项目交互,将其视为正样本,然后执行负采样策略为用户没有交互的项目配对负样本;
[0011]步骤2:模型的构建。
[0012]首先将用户

项目交互图中的交互信息映射到向量空间,然后通过图卷积网络学习用户

项目交互图的嵌入表达,利用交互图的拓扑结构对用户

项目的高阶连接信息进行建模。再利用注意力机制为邻居节点分配不同的权重,聚合邻居节点的特征信息可使邻居节点之间的权重仅依赖于节点之间的特征表达,从而提高模型的泛化能力,最后将图卷积层学习到的多个嵌入向量加权聚合捕获不同卷积层的嵌入影响。
[0013]步骤3:模型训练及项目推荐:
[0014]将步骤1中得到的训练集和测试集分别用于训练和评估步骤3中构建的模型,模型通过内积得到用户

项目之间的关联分数。最终根据得到的关联分数判断是否将项目推荐给用户。
[0015]可选的,在步骤S1中,首先下载Gowalla集,其次进行数据预处理,将采集到的欧式空间数据构造为非欧式空间数据(即图数据),主要做法是将用户与项目之间的交互数据构造为用户

项目交互二部图。最后,对于数据集中每一个可以观察到的用户项目交互,将其视为正样本,然后执行负采样策略为用户没有交互的项目配对负样本;
[0016]可选的,在步骤S2中,其计算方法如下:
[0017]S201:构造嵌入层(输入层):嵌入层主要包括用户ID嵌入和项目ID嵌入两部分。
[0018]S202:构造加入注意力机制的嵌入传播层:根据嵌入层传送的用户ID/项目ID匹配其一阶邻居ID作为嵌入传播层的输入,并将其目标节点与一阶邻居节点分别送入注意力机制和哈达玛积两个模块中进行学习,将学习到的嵌入向量再送入下一层的嵌入传播层,以此类推。
[0019]S203:构造预测层(输出层):预测用户与项目之间的关联分数。
[0020]可选的,在步骤S3中,其计算方法为:
[0021]将嵌入传播层学习到的嵌入向量合并为最终的嵌入向量,模型将最终的嵌入向量进行简单的内积处理得到用户与项目之间的关联分数进行预测,并为最终用户推荐可能感兴趣的项目。
[0022]由上,本专利技术的融合图卷积神经网络和注意力机制的协同过滤推荐方法至少具有如下有益效果:
[0023](1)、本专利技术考虑在用户

项目交互二部图中学习嵌入表示,在模型嵌入层便考虑了用户与项目之间的交互信息,通过嵌入传播在用户项目交互图上建模高阶连通性,使得模型可以学习到高维特征信息,以此获得更有效的嵌入,提高了推荐的准确性。
[0024](2)、本专利技术运用了注意力机制聚合邻居节点对目标用户的影响,使得在嵌入传播层学习到的邻居权重为可变权重,捕获了不同邻居节点的重要性影响,其次注意力机制这种聚合方式独立于图结构,提高了模型的泛化能力,使推荐系统具有更好的推荐效果和可解释性。
[0025](3)、本专利技术使用内积作为最后得到的用户嵌入和项目嵌入的交互函数,得到用户
与项目之间的关联分数,简化了模型的时间复杂度和空间复杂度,提高了模型的推荐性能。
[0026](4)、本专利技术是协同过滤技术与社交网络图数据推荐的结合,可以很好的解决数据稀疏性和冷启动问题。
[0027](5)、本专利技术使用图卷积神经网络(GCN)学习特征中每一维度之间的高阶交互关系,GCN强大的建模能力可以挖掘用户

项目交互图的局部/全局的特征信息,而且具有较少的本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.基于图卷积注意力机制的协同过滤推荐算法,其特征在于,包括以下步骤:步骤1:数据采集、数据处理、数据集划分;步骤2:模型的构建;首先将用户

项目交互图中的交互信息映射到向量空间,然后通过图卷积网络学习用户

项目交互图的嵌入表达,利用交互图的拓扑结构对用户

项目的高阶连接信息进行建模;再利用注意力机制为邻居节点分配不同的权重,聚合邻居节点的特征信息可使邻居节点之间的权重仅依赖于节点之间的特征表达,从而提高模型的泛化能力,最后将图卷积层学习到的多个嵌入向量加权聚合捕获不同卷积层的嵌入影响;步骤3:模型训练及项目推荐:将步骤1中得到的训练集和测试集分别用于训练和评估步骤3中构建的模型,模型通过内积得到用户

项目之间的关联分数,最终根据得到的关联分数判断是否将项目推荐给用户。2.如权利要求1所述的基于图卷积注意力机制的协同过滤推荐算法,其特征在于,在步骤S1中:首先下载Gowalla集,其次进行数据预处理,将采集到的欧式空间数据构造为非欧式空...

【专利技术属性】
技术研发人员:孟祥福朱金侠邢长征朱尧薛琪孙德伟王丹丹
申请(专利权)人:辽宁工程技术大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1