System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种基于信息瓶颈的去偏推荐方法技术_技高网

一种基于信息瓶颈的去偏推荐方法技术

技术编号:41333014 阅读:15 留言:0更新日期:2024-05-20 09:53
本发明专利技术公开了一种基于信息瓶颈的去偏推荐方法,包括:1.构造原始数据:用户对产品的交互矩阵,用户有偏属性矩阵;2.使用有偏属性编码器学习用户‑产品交互数据中的用户有偏表征;3.基于深度图神经网络学习用户和产品表征矩阵;4.基于信息瓶颈理论最小化用户表征与有偏表征,用户子图表征与有偏表征之间的互信息,计算损失函数;5.基于用户和产品表征矩阵重构交互矩阵,计算损失函数;6.联合步骤4‑步骤5的损失函数进行信息瓶颈学习,更新模型参数至模型收敛。本发明专利技术基于信息瓶颈的思想,在满足推荐任务的需求下学习无偏的用户表征,从而能有效减少推荐偏差,保证推荐的准确性。

【技术实现步骤摘要】

本专利技术涉及推荐领域,具体地来说是一种基于信息瓶颈的去偏推荐方法


技术介绍

1、推荐系统已经渗透到现实生活的各个领域,无缝地提供个性化的内容。借助复杂的算法和以用户为中心的模型,这些系统在预测用户偏好、提升整体用户体验和参与度方面大放异彩。虽然推荐系统在向个人用户定制推荐方面取得了显著的成功,然而,基于数据驱动的推荐系统,容易受到历史交互数据偏差影响而产生有偏的推荐结果。

2、一个有偏的推荐系统是推荐结果向某一特定人群倾斜,如在职业推荐系统中,女性更容易被推荐低报酬的职业。传统的推荐方法只关注于提升推荐准确性,从而不可避免地放大了原有数据中存在的偏差,导致有偏的推荐结果。现有的以去偏为目标的推荐方法,没能够很好的做到推荐准确性和无偏性之间的权衡,从而没有达到理想的结果。如何在推荐准确性和无偏性之间的做出更好的权衡,是改善推荐系统偏差的一个关键性问题。


技术实现思路

1、本专利技术为解决现有技术的不足之处,提出了一种基于信息瓶颈的去偏推荐方法,鼓励模型从交互数据中学习有益推荐预测的信息,同时消除用户表征中的有偏信息,在推荐准确性和无偏性之间的做出更好的权衡。

2、本专利技术为解决技术问题采用如下技术方案:

3、本专利技术一种基于信息瓶颈的去偏推荐方法的特点在于,是按如下步骤进行:

4、步骤1、构造原始数据,包括:用户对产品的交互矩阵,用户有偏属性矩阵;

5、步骤1.1、令u表示用户集,且u={u1,…ua,…um},ua表示第a个用户,m表示用户的总数,1≤a≤m;令v表示产品集,且v={v1,…,vi,…,vn},vi表示第i个产品,n表示产品的总数,1≤i≤n;令rai表示第a个用户ua对第i个产品vi的交互数据,则用户对产品的交互矩阵r={rai}m×n,如果第a个用户ua对第i个产品vi有交互记录,则rai=1,否则,rai=0;代表第a个用户ua和第i个产品vi的预测的交互关系;根据用户对产品的交互矩阵r,以用户和产品为节点,两者交互记录为边,构建用户-产品二部图g=<u,v,r>;

6、步骤1.2、令用户的二值有偏属性矩阵s={s1,…sa,…sm},其中,sa∈{0,1}表示第a个用户ua的有偏属性值;根据有偏属性值,用户集u可以被划分为2个子集,即u0和u1,u0表示有偏属性值为0的用户子集,u1表示有偏属性值为1的用户子集;

7、步骤2、使用有偏属性编码器学习用户-产品交互数据中的用户有偏表征,从而对有偏属性编码器进行训练,得到最优参数及其对应的二值有偏属性表征es;

8、步骤3、利用深度图神经网络学习用户和产品表征矩阵,从而得到最终用户表征矩阵x和最终产品表征矩阵y;

9、步骤4、基于信息瓶颈理论最小化用户表征与有偏表征,用户子图表征与有偏表征之间的互信息,并计算损失函数:

10、步骤4.1、根据式(9)构建用户表征和有偏表征之间信息瓶颈损失函数lhsic:

11、

12、式(9)中,ub表示当前训练批次中用户集合,xa表示用户最终表征矩阵x中的第a行表征向量,hsic(,)表示希尔伯特-施密特独立性指标;表示第a个用户ua的二值有偏属性s的表征;

13、步骤4.2、根据式(10)计算用户的子图表征gu:

14、gu=g(x1,…,xl,…,xl+1)      (10)

15、式(10)中,xl表示用户在图神经网络第l层的表征,g()表示子图表征的聚合函数。

16、步骤4.3、根据式(11)构建用户子图表征gu和有偏表征es之间信息瓶颈损失函数l'hsic:

17、

18、式(11)中,表示用户的子图表征gu中的第a行子图表征向量;

19、步骤5、基于用户和产品表征矩阵重构交互矩阵,计算重构损失函数lrec;

20、步骤6、联合各个损失函数进行信息瓶颈学习,以更新网络参数至损失函数收敛,从而得到最优参数θ*,用于实现满足去偏要求的用户对产品推荐。

21、本专利技术所述的一种基于信息瓶颈的去偏推荐方法的特点也在于,所述步骤2包括:

22、步骤2.1、使用高斯分布随机初始化用户有偏表征矩阵c={c1,...,ca,...,cm},其中,ca表示第a个用户ua的有偏表征;

23、使用高斯分布随机初始化产品有偏表征矩阵z={z1,...,zi,...,zn},其中,zi表示第i个产品vi的有偏表征;

24、步骤2.2、构建有偏属性编码器;

25、将用户有偏表征矩阵c和产品有偏表征矩阵z输入有偏属性编码器,根据式(1)计算经过第k+1个图卷积层后输出的第a个用户ua的有偏表征和第i个产品vi的有偏表征

26、

27、式(1)中,ra表示第a个用户ua交互的产品集合,hi表示与第i个产品vi有交互的用户集合,表示第k个图卷积层后输出的第a个用户ua的有偏表征,第k个图卷积层后输出的第i个产品vi的有偏表征,|ra|表示第a个用户ua交互的产品集合大小,|hi|表示与第i个产品vi有交互的用户集合大小;当k=1时,初始化

28、步骤2.3、构建有偏属性分类器;

29、利用式(2)计算第a个用户ua经过第k+1个图卷积层后得到的有偏属性预测值

30、

31、式(2)中,w表示有偏属性分类器的全连接层参数,表示第k+1个图卷积层后输出的第a个用户ua的有偏表征,σ()表示sigmoid激活函数。

32、步骤2.4、根据式(3)计算有偏属性编码器的损失函数;

33、

34、式(3)中,θs=[c,z,w]为待学习参数;

35、步骤2.5、使用梯度下降法对有偏属性编码器进行训练,并最小化式(3)中的损失函数ls(θs),直至损失函数收敛,从而得到对应的最优参数其中,c*表示最优的用户有偏表征矩阵,z*表示最优的产品有偏表征矩阵,w*表示最优的全连接层参数;

36、根据最优参数得到用户第a个用户ua的有偏表征

37、步骤2.6、利用式(4)计算二值有偏属性表征es;

38、

39、式(4)中,s∈{0,1}表示二值有偏属性值,us表示不同有偏属性值用户集合。

40、所述步骤3包括:

41、步骤3.1、使用高斯分布随机初始化用户表征矩阵p={p1,...,pa,...,pm},其中,pa表示第a个用户ua的表征;使用高斯分布随机初始化产品协同表征矩阵q={q1,...,qi,...,qn},其中,qi表示第i个产品vi的表征;

42、步骤3.2、根据式(5)计算连接矩阵a:

43、

44、步骤3.3、定义图神经网络共有l个卷积层,当前卷积层为l;

45、初始化第0层节点表征矩阵h0={p,本文档来自技高网...

【技术保护点】

1.一种基于信息瓶颈的去偏推荐方法,其特征在于,是按如下步骤进行:

2.根据权利要求1所述的一种基于信息瓶颈的去偏推荐方法,其特征在于,所述步骤2包括:

3.根据权利要求2所述的一种基于信息瓶颈的去偏推荐方法,其特征在于,所述步骤3包括:

4.根据权利要求3所述的一种基于信息瓶颈的去偏推荐方法,其特征在于,所述步骤5包括:

5.根据权利要求4所述的一种基于信息瓶颈的去偏推荐方法,其特征在于,所述步骤6包括:

6.一种电子设备,包括存储器以及处理器,其特征在于,所述存储器用于存储支持处理器执行权利要求1-5中任一所述去偏推荐方法的程序,所述处理器被配置为用于执行所述存储器中存储的程序。

7.一种计算机可读存储介质,计算机可读存储介质上存储有计算机程序,其特征在于,所述计算机程序被处理器运行时执行权利要求1-5中任一所述去偏推荐方法的步骤。

【技术特征摘要】

1.一种基于信息瓶颈的去偏推荐方法,其特征在于,是按如下步骤进行:

2.根据权利要求1所述的一种基于信息瓶颈的去偏推荐方法,其特征在于,所述步骤2包括:

3.根据权利要求2所述的一种基于信息瓶颈的去偏推荐方法,其特征在于,所述步骤3包括:

4.根据权利要求3所述的一种基于信息瓶颈的去偏推荐方法,其特征在于,所述步骤5包括:

5.根据权利要求4所述的一种基于信息...

【专利技术属性】
技术研发人员:吴乐谢俊松杨永晖王子瀚洪日昌汪萌
申请(专利权)人:合肥工业大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1