一种基于多跳邻居负采样策略的推荐方法及系统技术方案

技术编号：40914022 阅读：2 留言：0更新日期：2024-04-18 14:41

本发明专利技术公开了一种基于多跳邻居负采样策略的推荐方法及系统，基于对比学习实现推荐，对比学习中采用基于高阶邻居的负采样策略，节点的多跳邻居被用作候选负样本，对于节点的结构邻居，选择k层图卷积神经网络(GCN)聚合的k跳邻居信息作为负样本(其中k为奇数)，该目标提取节点(用户或项目)的表示并嵌入邻居的表示。因此，本发明专利技术使用了一种更加简单高效的图对比学习方法来进行数据增强，结合图卷积网络获取邻居节点的嵌入来丰富自身节点的信息。该方法选择可靠、真实的硬负样本进行动态训练，从而减少选择假负样本的可能性，提高模型的泛化能力和鲁棒性。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术属于推荐系统的，涉及一种负采样技术，特别涉及一种基于高跳邻居负采样策略的推荐方法及系统。

技术介绍

1、随着互联网的快速发展，推荐系统对于解决信息过载问题和帮助用户获取有价值的信息至关重要。作为推荐系统的核心技术，协同过滤的目标是通过用户的历史交互信息了解用户的潜在偏好，并根据用户的偏好推荐用户可能喜欢的项目。观察到的用户项交互更容易从隐式用户反馈中获得，例如购买、点击、浏览和查看。然而，传统的推荐算法面临着数据稀疏和冷启动问题等挑战。为了解决这些问题，近年来出现了一些新的推荐算法，例如使用图卷积网络和对比学习等。

2、对比学习可视为一种机器学习范式，其工作原理是将属于同一分布的样本(正样本)在嵌入空间中彼此靠近地放置，同时将属于不同分布的样本(负样本)放置在嵌入空间中。由于不需要标记数据，对比学习可以解决数据稀疏的问题。这种方法可以显着提高推荐系统的性能。

3、在使用对比学习的方法中，目前主流的负采样方法仍然基于随机负采样，即从非交互节点中随机选择负样本。然而，使用随机负采样忽略了带来假负样本的潜在可能性。假负样本可能不会令用户反感。相反，它们可以代表用户的潜在兴趣，即假负样本可能是用户潜在喜欢的项目。在使用随机负采样的情况下，如果引入假负样本，这些样本很难学习，强制优化往往会导致过拟合。因此，在进行负采样时，需要避免引入假负样本，探索更有效的负采样策略，以避免假负噪声的危害。

技术实现思路

1、有鉴于此，本专利技术提出了一种基于高跳邻居负采样策

2、本专利技术采用的技术方案如下：

3、一方面，本专利技术提供了一种基于多跳邻居负采样策略的推荐方法，所述方法包括：

4、s1：对推荐系统的数据集进行处理，将用户和交互过的项目构造成二部图；

5、s2：将处理后的数据输入至多层图卷积网络中进行多跳邻居信息聚合，获取节点的嵌入；并使用最后一层的嵌入作为候选负样本，对每层图卷积网络添加随机均匀的噪声；

6、s3：对于获取的节点的嵌入，使用对比学习学习高质量的节点表示；

7、s4：得到的节点表示经过多任务训练，获取用户和不同项目之间的评分，根据评分最终预测用户和项目之间的推荐。

8、进一步地，使用对比学习学习高质量的节点表示，包括：针对正样本，对同一个节点添加随机均匀噪声获取到增强视图，对同一节点的不同视图之间进行对比学习。

9、进一步地，所述多层图卷积网络为三层图卷积网络。

10、进一步地，还包括：在负采样后使用自适应去噪，选取高质量的负样本。

11、进一步地，所述自适应去噪，包括：使用具有动态阈值的截断损失函数。

12、进一步地，对推荐系统的数据集进行处理，将用户和交互过的项目构造成二部图，包括：

13、给定用户集u＝{u}和项目集i＝{i}，对于用户和交互过的项目表示为反馈矩阵r∈{0,1}|u|×|i|；

14、如果用户和项目交互过则ru，i＝1，否则ru，i＝0；

15、基于交互数据r组织成一个交互图g＝{v,e}，其中v＝{u∪i}表示节点集合，e＝{(u，i)|u∈u，i∈i，ru，i＝1}表示边集合并由此构造邻接矩阵，实现将数据集转换为二维向量结构。

16、进一步地，多任务训练的损失函数包括对比损失函数、l2损失函数和贝叶斯损失函数。

17、又一方面，本专利技术还提供了一种基于多跳邻居负采样策略的推荐系统，所述系统包括：

18、预处理模块，对推荐系统的数据集进行处理，将用户和交互过的项目构造成二部图；

19、多跳邻居负采样模块，将处理后的数据输入至多层图卷积网络中进行多跳邻居信息聚合，获取节点的嵌入；并使用最后一层的嵌入作为候选负样本，对每层图卷积网络添加随机均匀的噪声；

20、对比学习模块，对于获取的节点的嵌入，使用对比学习学习高质量的节点表示；

21、推荐模块，得到的节点表示经过多任务训练，获取用户和不同项目之间的评分，根据评分最终预测用户和项目之间的推荐。

22、进一步地，还包括：去噪模块，在负采样后使用自适应去噪，选取高质量的负样本。

23、进一步地，所述去噪模块使用具有动态阈值的截断损失函数。

24、与现有技术相比，本专利技术的有益效果是：

25、1)本专利技术中基于对比学习实现推荐，对比学习中采用基于高阶邻居的负采样策略，节点的多跳邻居被用作候选负样本，对于节点的结构邻居，选择k层图卷积神经网络(gcn)聚合的k跳邻居信息作为负样本(其中k为奇数)，该目标提取节点(用户或项目)的表示并嵌入邻居的表示。因此，本专利技术使用了一种更加简单高效的图对比学习方法来进行数据增强，结合图卷积网络获取邻居节点的嵌入来丰富自身节点的信息。该方法选择可靠、真实的硬负样本进行动态训练，从而减少选择假负样本的可能性，提高模型的泛化能力和鲁棒性。

26、2)本专利技术使用了一种自适应去噪策略，利用截断损失来消除高损失样本，可以动态修剪具有较大损失的交互作用，可以很好的避免采取到假负样本，有效的去除假阴性噪声，减轻噪声对模型功能的损害。

本文档来自技高网...

【技术保护点】

1.一种基于多跳邻居负采样策略的推荐方法，其特征在于，所述方法包括：

2.根据权利要求1所述的方法，其特征在于，使用对比学习学习高质量的节点表示，包括：针对正样本，对同一个节点添加随机均匀噪声获取到增强视图，对同一节点的不同视图之间进行对比学习。

3.根据权利要求1所述的方法，其特征在于，所述多层图卷积网络为三层图卷积网络。

4.根据权利要求1所述的方法，其特征在于，还包括：在负采样后使用自适应去噪，选取高质量的负样本。

5.根据权利要求4所述的方法，其特征在于，所述自适应去噪，包括：使用具有动态阈值的截断损失函数。

6.根据权利要求1所述的方法，其特征在于，对推荐系统的数据集进行处理，将用户和交互过的项目构造成二部图，包括：

7.根据权利要求1所述的方法，其特征在于，多任务训练的损失函数包括对比损失函数、L2损失函数和贝叶斯损失函数。

8.一种基于多跳邻居负采样策略的推荐系统，其特征在于，所述系统包括：

9.根据权利要求8所述的系统，其特征在于，还包括：去噪模块，在负采样后使用自适应去噪，选取高质量的负样本。

10.根据权利要求9所述的系统，其特征在于，所述去噪模块使用具有动态阈值的截断损失函数。

...

【技术特征摘要】

1.一种基于多跳邻居负采样策略的推荐方法，其特征在于，所述方法包括：

3.根据权利要求1所述的方法，其特征在于，所述多层图卷积网络为三层图卷积网络。

4.根据权利要求1所述的方法，其特征在于，还包括：在负采样后使用自适应去噪，选取高质量的负样本。

5.根据权利要求4所述的方法，其特征在于，所述自适应去噪，包括：使用具有动态阈值的截断损...

【专利技术属性】
技术研发人员：张益嘉，张凯玉，桑国明，刘智，
申请(专利权)人：大连海事大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人