【技术实现步骤摘要】
一种基于Transformer模型的图卷积兴趣解耦方法
[0001]本专利技术涉及协同过滤技术,具体为基于模型的协同过滤算法;本专利技术涉及基于图卷积的表示学习方法,具体为LightGCN算法;本专利技术涉及基于Transformer的表示学习方法;本专利技术还涉及数据挖掘与深度学习等相关技术。
技术介绍
[0002]互联网的出现和普及给用户带来了大量的信息,满足了用户在信息时代对信息的需求,但随着网络的迅速发展而带来的网上信息量的大幅增长,使得用户在面对大量信息时无法从中获得对自己真正有用的那部分信息,对信息的使用效率反而降低了,这就是所谓的信息过载问题。
[0003]解决信息过载问题一个非常重要的办法便是推荐系统,它是根据用户的信息需求、兴趣等,将用户感兴趣的信息、物品等推荐给用户的个性化信息推荐系统。目前在推荐系统中使用最为广泛的方法是协同过滤(Collaborative Filtering,简称CF)思想,即分析用户
‑
物品的历史交互记录,来预测用户的下一个可能交互的物品,充分利用已有的用户交互数据找出最能满足用户兴趣的内容。而在CF的思想中最常用到的是基于模型的协同过滤(Model
‑
based Collaborative Filtering,简称MCF)算法,它的核心思想是用户和物品都具有一定的特征,影响着用户的选择;用户之所以选择某一个商品,是因为用户特征与物品特征相互匹配。基于这种思想,在模型建立的过程中,如果没有显性的用户/物品特征可以提取,那我们就要根据 ...
【技术保护点】
【技术特征摘要】
1.一种基于Transformer模型的图卷积兴趣解耦方法;其特征在于:包括以下步骤:S1、数据预处理:获取数据集,包括用户ID,物品ID,以及用户
‑
物品交互的标签;数据集中训练集和测试集正样本比例为4:1;训练集中正负样本的比例为1:1;S2、模型输入并映射至不同兴趣空间:将用户ID、物品ID以及历史交互记录分别转化为图模型中的节点、边信息,并为每一个节点初始化特征向量;通过全连接层将图结构映射至不同的兴趣空间,使得相同节点在不同的空间下特征表示不同;S3、多兴趣GCN:使用路由机制在不同的兴趣空间中迭代更新邻接矩阵,使得不同空间下的邻接矩阵变得不同,而邻接值则利用自身节点与其一阶邻居之间的亲和力进行更新;此时,不同空间下的图拓扑结构已经不同,我们使用LightGCN算法将不同空间下的用户与物品特征进行更新,使得在空间下的用户与物品的特征与某一兴趣所驱使下的交互息息相关;S4、Transformer兴趣兼容性:为研究不同兴趣空间之间的关联性,将某一空间下的节点特征视为局部特征,将其余空间下对应的节点特征视为全局特征,通过Transformer模型生成注意力值来更新每一个空间下的节点特征;S5、门控融合:将不同兴趣空间下的节点特征融合为单一特征,此时的节点中包含着将兴趣解耦后的特征信息,同时也包含着不同兴趣之间存在兼容性的特征信息;S6、优化方法和损失函数:损失函数由两部分组成,一部分为推荐预测使用的BPR损失函数以及由初始化参数组成的L2正则化项,另一部分是为保障不同兴趣空间趋于正交化的距离关联性函数,两者联合优化;S7、生成推荐列表:得到预测的用户
‑
物品交互得分后,针对每一个用户,对所有物品根据评分进行降序排序,将前N个物品生成一个列表推荐给用户。2.根据权利要求1所述的一种基于Transformer模型的图卷积兴趣解耦方法,其特征在于;把用户
‑
物品交互记录以隐反馈的方式做记录:即用户和物品有过交互,标签记为1,记为正样本,反之为0,记为负样本,如果数据集的交互是评分形式,可把评分过的物品,并且5分制评分大于等于4的标签记为1,记为正样本,其余为0,记为负样本;针对每一个用户,训练集和测试集的正样本比例为4:1,训练集中的正负样本比例为1:1。3.根据权利要求1所述的一种基于Transformer模型的图卷积兴趣解耦方法,其特征在于;读取数据集中所有的用户和物品以及其交互历史,将其转化为无向图结构中G=(V,E),其中V=v1,v2...v
M
...v
M+N
代表节点信息,M、N分别代表用户和物品总数量,E为用户与物品的历史交互的边信息;通过Xavier初始化为每一个节点随机生成特征向量,X
i
∈R
d
,i=1,2...M+N,R表示矩阵或向量,向量维度d设置为64;通过全连接层将图结构映射到不同的兴趣空间中其中W
k
、b
k
分别代表第k个兴趣空间下的权重矩阵和偏差向量,使用Xavier初始化生成,W
k
∈R
d*d
,b
k
∈R
d
;激活函数使用Relu函数,X=X1,X2...X
M+N
;Y
k
代表在第k个兴趣空间下全部节点的特征向量,k=1,2,3,4。4.根据权利要求1所述的一种基于Transformer模型的图卷积兴趣解耦方法,其特征在于:设置多兴趣GCN的层数L=0,1,2,以及每一层路由机制迭代次数t=0,1,2;每一个兴趣
空间的初始邻接矩阵是相同的,均为用户与物品的交互值,存在历史交互为1,无交互则为0;即A是根据输入交互数据生成的邻接矩阵,A∈R
(M+N)*(M+N)
;则代表第k个兴趣空间下第t次迭代算法更新后的邻接矩阵;在路由机制迭代中,首先使用softmax函数获得各空间下的兴趣分布,公式为各空间下的兴趣分布,公式为代表在邻接矩阵中用户u和物品i交互值;然后利用LightGCN算法,通过各空间下不同的归一化邻接矩阵更新节点特征,具体公式为接矩阵更新节点特征,具体公式为为邻接矩阵对应的度矩阵,代表第t次迭代后第k个特征空...
【专利技术属性】
技术研发人员:简萌,王拓,毋立芳,王掌权,石戈,相叶,李尊,
申请(专利权)人:北京工业大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。