一种基于信息瓶颈的去偏推荐方法技术

技术编号：41333014 阅读：15 留言：0更新日期：2024-05-20 09:53

本发明专利技术公开了一种基于信息瓶颈的去偏推荐方法，包括：1.构造原始数据：用户对产品的交互矩阵，用户有偏属性矩阵；2.使用有偏属性编码器学习用户‑产品交互数据中的用户有偏表征；3.基于深度图神经网络学习用户和产品表征矩阵；4.基于信息瓶颈理论最小化用户表征与有偏表征，用户子图表征与有偏表征之间的互信息，计算损失函数；5.基于用户和产品表征矩阵重构交互矩阵，计算损失函数；6.联合步骤4‑步骤5的损失函数进行信息瓶颈学习，更新模型参数至模型收敛。本发明专利技术基于信息瓶颈的思想，在满足推荐任务的需求下学习无偏的用户表征，从而能有效减少推荐偏差，保证推荐的准确性。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及推荐领域，具体地来说是一种基于信息瓶颈的去偏推荐方法。

技术介绍

1、推荐系统已经渗透到现实生活的各个领域，无缝地提供个性化的内容。借助复杂的算法和以用户为中心的模型，这些系统在预测用户偏好、提升整体用户体验和参与度方面大放异彩。虽然推荐系统在向个人用户定制推荐方面取得了显著的成功，然而，基于数据驱动的推荐系统，容易受到历史交互数据偏差影响而产生有偏的推荐结果。

2、一个有偏的推荐系统是推荐结果向某一特定人群倾斜，如在职业推荐系统中，女性更容易被推荐低报酬的职业。传统的推荐方法只关注于提升推荐准确性，从而不可避免地放大了原有数据中存在的偏差，导致有偏的推荐结果。现有的以去偏为目标的推荐方法，没能够很好的做到推荐准确性和无偏性之间的权衡，从而没有达到理想的结果。如何在推荐准确性和无偏性之间的做出更好的权衡，是改善推荐系统偏差的一个关键性问题。

技术实现思路

1、本专利技术为解决现有技术的不足之处，提出了一种基于信息瓶颈的去偏推荐方法，鼓励模型从交互数据中学习有益推荐预测的信息，同时消除用户表征中的有偏信息，在推荐准确性和无偏性之间的做出更好的权衡。

2、本专利技术为解决技术问题采用如下技术方案：

3、本专利技术一种基于信息瓶颈的去偏推荐方法的特点在于，是按如下步骤进行：

4、步骤1、构造原始数据，包括：用户对产品的交互矩阵，用户有偏属性矩阵；

5、步骤1.1、令u表示用户集，且u＝{u1,…ua,…um}，ua

6、步骤1.2、令用户的二值有偏属性矩阵s＝{s1,…sa,…sm}，其中，sa∈{0,1}表示第a个用户ua的有偏属性值；根据有偏属性值，用户集u可以被划分为2个子集，即u0和u1，u0表示有偏属性值为0的用户子集，u1表示有偏属性值为1的用户子集；

7、步骤2、使用有偏属性编码器学习用户-产品交互数据中的用户有偏表征，从而对有偏属性编码器进行训练，得到最优参数及其对应的二值有偏属性表征es；

8、步骤3、利用深度图神经网络学习用户和产品表征矩阵，从而得到最终用户表征矩阵x和最终产品表征矩阵y；

9、步骤4、基于信息瓶颈理论最小化用户表征与有偏表征，用户子图表征与有偏表征之间的互信息，并计算损失函数：

10、步骤4.1、根据式(9)构建用户表征和有偏表征之间信息瓶颈损失函数lhsic：

11、

12、式(9)中，ub表示当前训练批次中用户集合，xa表示用户最终表征矩阵x中的第a行表征向量，hsic(,)表示希尔伯特-施密特独立性指标；表示第a个用户ua的二值有偏属性s的表征；

13、步骤4.2、根据式(10)计算用户的子图表征gu：

14、gu＝g(x1,…,xl,…,xl+1) (10)

15、式(10)中，xl表示用户在图神经网络第l层的表征，g()表示子图表征的聚合函数。

16、步骤4.3、根据式(11)构建用户子图表征gu和有偏表征es之间信息瓶颈损失函数l'hsic：

17、

18、式(11)中，表示用户的子图表征gu中的第a行子图表征向量；

19、步骤5、基于用户和产品表征矩阵重构交互矩阵，计算重构损失函数lrec；

20、步骤6、联合各个损失函数进行信息瓶颈学习，以更新网络参数至损失函数收敛，从而得到最优参数θ*，用于实现满足去偏要求的用户对产品推荐。

21、本专利技术所述的一种基于信息瓶颈的去偏推荐方法的特点也在于，所述步骤2包括：

22、步骤2.1、使用高斯分布随机初始化用户有偏表征矩阵c＝{c1,...,ca,...,cm}，其中，ca表示第a个用户ua的有偏表征；

23、使用高斯分布随机初始化产品有偏表征矩阵z＝{z1,...,zi,...,zn}，其中，zi表示第i个产品vi的有偏表征；

24、步骤2.2、构建有偏属性编码器；

25、将用户有偏表征矩阵c和产品有偏表征矩阵z输入有偏属性编码器，根据式(1)计算经过第k+1个图卷积层后输出的第a个用户ua的有偏表征和第i个产品vi的有偏表征

26、

27、式(1)中，ra表示第a个用户ua交互的产品集合，hi表示与第i个产品vi有交互的用户集合，表示第k个图卷积层后输出的第a个用户ua的有偏表征，第k个图卷积层后输出的第i个产品vi的有偏表征，|ra|表示第a个用户ua交互的产品集合大小，|hi|表示与第i个产品vi有交互的用户集合大小；当k＝1时，初始化

28、步骤2.3、构建有偏属性分类器；

29、利用式(2)计算第a个用户ua经过第k+1个图卷积层后得到的有偏属性预测值

30、

31、式(2)中，w表示有偏属性分类器的全连接层参数，表示第k+1个图卷积层后输出的第a个用户ua的有偏表征，σ()表示sigmoid激活函数。

32、步骤2.4、根据式(3)计算有偏属性编码器的损失函数；

33、

34、式(3)中，θs＝[c,z,w]为待学习参数；

35、步骤2.5、使用梯度下降法对有偏属性编码器进行训练，并最小化式(3)中的损失函数ls(θs)，直至损失函数收敛，从而得到对应的最优参数其中，c*表示最优的用户有偏表征矩阵，z*表示最优的产品有偏表征矩阵，w*表示最优的全连接层参数；

36、根据最优参数得到用户第a个用户ua的有偏表征

37、步骤2.6、利用式(4)计算二值有偏属性表征es；

38、

39、式(4)中，s∈{0,1}表示二值有偏属性值，us表示不同有偏属性值用户集合。

40、所述步骤3包括：

41、步骤3.1、使用高斯分布随机初始化用户表征矩阵p＝{p1,...,pa,...,pm}，其中，pa表示第a个用户ua的表征；使用高斯分布随机初始化产品协同表征矩阵q＝{q1,...,qi,...,qn}，其中，qi表示第i个产品vi的表征；

42、步骤3.2、根据式(5)计算连接矩阵a：

43、

44、步骤3.3、定义图神经网络共有l个卷积层，当前卷积层为l；

45、初始化第0层节点表征矩阵h0＝{p,本文档来自技高网...

【技术保护点】

1.一种基于信息瓶颈的去偏推荐方法，其特征在于，是按如下步骤进行：

2.根据权利要求1所述的一种基于信息瓶颈的去偏推荐方法，其特征在于，所述步骤2包括：

3.根据权利要求2所述的一种基于信息瓶颈的去偏推荐方法，其特征在于，所述步骤3包括：

4.根据权利要求3所述的一种基于信息瓶颈的去偏推荐方法，其特征在于，所述步骤5包括：

5.根据权利要求4所述的一种基于信息瓶颈的去偏推荐方法，其特征在于，所述步骤6包括：

6.一种电子设备，包括存储器以及处理器，其特征在于，所述存储器用于存储支持处理器执行权利要求1-5中任一所述去偏推荐方法的程序，所述处理器被配置为用于执行所述存储器中存储的程序。

7.一种计算机可读存储介质，计算机可读存储介质上存储有计算机程序，其特征在于，所述计算机程序被处理器运行时执行权利要求1-5中任一所述去偏推荐方法的步骤。

【技术特征摘要】

1.一种基于信息瓶颈的去偏推荐方法，其特征在于，是按如下步骤进行：

2.根据权利要求1所述的一种基于信息瓶颈的去偏推荐方法，其特征在于，所述步骤2包括：

3.根据权利要求2所述的一种基于信息瓶颈的去偏推荐方法，其特征在于，所述步骤3包括：

4.根据权利要求3所述的一种基于信息瓶颈的去偏推荐方法，其特征在于，所述步骤5包括：

5.根据权利要求4所述的一种基于信息...

【专利技术属性】
技术研发人员：吴乐，谢俊松，杨永晖，王子瀚，洪日昌，汪萌，
申请(专利权)人：合肥工业大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人