一种用于图神经网络训练的单层增强负样本生成算法制造技术

技术编号：37072600 阅读：42 留言：0更新日期：2023-03-29 19:49

本发明专利技术公开了一种用于图神经网络训练的单层增强负样本生成算法，涉及深度图神经网络训练领域，可应用于互联网推荐系统等应用场景，包括：考虑协同过滤推荐任务的节点信息传播和聚合特点以及GNN过平滑问题，将信息论中的信息扁平化理论结合到负样本生成策略，提出单层增强的负样本合成策略，只跟踪样本的最强特征或是与目标最相关的关联，同时关注数据稠密度与聚合嵌入之间的关系，对具有不同稠密度特征的数据集选择不同层数的单层聚合嵌入进行正负样本嵌入插值，生成构造负样本，减轻了推荐系统模型训练中的过拟合，提高了模型的泛化能力；本发明专利技术算法可以直接插入现有的基于GNN的推荐算法中改善模型训练，使模型性能指标显著提高，节省计算开销。节省计算开销。节省计算开销。

全部详细技术资料下载

【技术实现步骤摘要】
一种用于图神经网络训练的单层增强负样本生成算法

[0001]本专利技术涉及深度图神经网络训练领域，可应用于互联网推荐系统等应用场景，具体而言，涉及一种用于图神经网络训练的单层增强负样本生成算法。

技术介绍

[0002]推荐系统为互联网时代的超负荷信息数据提供了用户个性化的筛选方式，并被广泛应用于购物推荐、电影推荐、短视频推荐、社交好友推荐等场景。如何从用户的历史交互信息中挖掘出用户特征、学习出用户的潜在偏好一直是深度学习推荐系统模型的重要研究方向。
[0003]目前，基于图神经网络(GNNs)的推荐方法利用多层消息传播和聚合机制从高维特征中提取出用户及物品的低维嵌入表示，根据低维嵌入对用户和项目之间的匹配程度打分并排序，最终达到良好的推荐预测结果。该方法通常采用一种基于正负样本的训练机制——针对某一用户将物品划分出用户感兴趣的部分作为正样本，将用户未观察到或是无偏好的部分作为负样本，通过目标函数扩大对正负样本的评分差值来训练推荐系统模型，学习用户的隐式偏好，生成更符合用户和项目的嵌入表示。
[0004]目前的...

【技术保护点】

【技术特征摘要】
1.一种用于图神经网络训练的单层增强负样本生成算法，其特征在于，包括以下步骤：S1、确定目标数据集Ω，包含用户集U＝{u}和物品集V＝{v}，以及用户的隐式反馈o
+
＝{(u,v
+
)∣u∈U,v
+
∈V}，其中v
+
表示与用户有交互的物品，初始化目标数据集Ω的用户物品的特征向量，获得传播聚合后目标用户及物品的L层嵌入表示，随机选择目标用户的s个负样本组成候选集Φ，目标用户的各层低维嵌入表示为物品嵌入表示为S2、计算目标数据集Ω的数据结构特征稠密度D，根据稠密度大小确定从GCN生成的L+1层嵌入中选出的某一层m的具体值，其嵌入表示为S3、处理随机系数λ
(m)
作为正负样本的m层混合系数；S4、根据随机系数λ
(m)
和嵌入对候选集S中的负样本，及与目标用户有过交互的正样本的第m层的嵌入进行混合插值，得到混合后的第m层嵌入S5、将混合后的第m层嵌入与其原始的其它层嵌入重新组合成完整的L+1层嵌入并参与池化，得到混合后合成负样本的完整嵌入表示通过组合池化目标用户的各层低维嵌入表示消除过平滑，得到目标用户的嵌入表示S6、根据目标用户的嵌入表示和混合后合成负样本的完整嵌入表示通过内积计算物品得分S7、根据物品得分对推荐系统模型的训练Loss函数进行更新。2.根据权利要求1所述用于图神经网络训练的单层增强负样本生成算法，其特征在于，步骤S1中，神经网络传播层数L＝{1,2,3,4}，候选集Φ的大小取值为{16,32,64}。3.根据权利要求2所述用于图神经网络...

【专利技术属性】
技术研发人员：周珂怡，蔡彪，
申请(专利权)人：成都理工大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人