System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术涉及推荐领域,具体地来说是一种基于信息瓶颈的去偏推荐方法。
技术介绍
1、推荐系统已经渗透到现实生活的各个领域,无缝地提供个性化的内容。借助复杂的算法和以用户为中心的模型,这些系统在预测用户偏好、提升整体用户体验和参与度方面大放异彩。虽然推荐系统在向个人用户定制推荐方面取得了显著的成功,然而,基于数据驱动的推荐系统,容易受到历史交互数据偏差影响而产生有偏的推荐结果。
2、一个有偏的推荐系统是推荐结果向某一特定人群倾斜,如在职业推荐系统中,女性更容易被推荐低报酬的职业。传统的推荐方法只关注于提升推荐准确性,从而不可避免地放大了原有数据中存在的偏差,导致有偏的推荐结果。现有的以去偏为目标的推荐方法,没能够很好的做到推荐准确性和无偏性之间的权衡,从而没有达到理想的结果。如何在推荐准确性和无偏性之间的做出更好的权衡,是改善推荐系统偏差的一个关键性问题。
技术实现思路
1、本专利技术为解决现有技术的不足之处,提出了一种基于信息瓶颈的去偏推荐方法,鼓励模型从交互数据中学习有益推荐预测的信息,同时消除用户表征中的有偏信息,在推荐准确性和无偏性之间的做出更好的权衡。
2、本专利技术为解决技术问题采用如下技术方案:
3、本专利技术一种基于信息瓶颈的去偏推荐方法的特点在于,是按如下步骤进行:
4、步骤1、构造原始数据,包括:用户对产品的交互矩阵,用户有偏属性矩阵;
5、步骤1.1、令u表示用户集,且u={u1,…ua,…um},ua
6、步骤1.2、令用户的二值有偏属性矩阵s={s1,…sa,…sm},其中,sa∈{0,1}表示第a个用户ua的有偏属性值;根据有偏属性值,用户集u可以被划分为2个子集,即u0和u1,u0表示有偏属性值为0的用户子集,u1表示有偏属性值为1的用户子集;
7、步骤2、使用有偏属性编码器学习用户-产品交互数据中的用户有偏表征,从而对有偏属性编码器进行训练,得到最优参数及其对应的二值有偏属性表征es;
8、步骤3、利用深度图神经网络学习用户和产品表征矩阵,从而得到最终用户表征矩阵x和最终产品表征矩阵y;
9、步骤4、基于信息瓶颈理论最小化用户表征与有偏表征,用户子图表征与有偏表征之间的互信息,并计算损失函数:
10、步骤4.1、根据式(9)构建用户表征和有偏表征之间信息瓶颈损失函数lhsic:
11、
12、式(9)中,ub表示当前训练批次中用户集合,xa表示用户最终表征矩阵x中的第a行表征向量,hsic(,)表示希尔伯特-施密特独立性指标;表示第a个用户ua的二值有偏属性s的表征;
13、步骤4.2、根据式(10)计算用户的子图表征gu:
14、gu=g(x1,…,xl,…,xl+1) (10)
15、式(10)中,xl表示用户在图神经网络第l层的表征,g()表示子图表征的聚合函数。
16、步骤4.3、根据式(11)构建用户子图表征gu和有偏表征es之间信息瓶颈损失函数l'hsic:
17、
18、式(11)中,表示用户的子图表征gu中的第a行子图表征向量;
19、步骤5、基于用户和产品表征矩阵重构交互矩阵,计算重构损失函数lrec;
20、步骤6、联合各个损失函数进行信息瓶颈学习,以更新网络参数至损失函数收敛,从而得到最优参数θ*,用于实现满足去偏要求的用户对产品推荐。
21、本专利技术所述的一种基于信息瓶颈的去偏推荐方法的特点也在于,所述步骤2包括:
22、步骤2.1、使用高斯分布随机初始化用户有偏表征矩阵c={c1,...,ca,...,cm},其中,ca表示第a个用户ua的有偏表征;
23、使用高斯分布随机初始化产品有偏表征矩阵z={z1,...,zi,...,zn},其中,zi表示第i个产品vi的有偏表征;
24、步骤2.2、构建有偏属性编码器;
25、将用户有偏表征矩阵c和产品有偏表征矩阵z输入有偏属性编码器,根据式(1)计算经过第k+1个图卷积层后输出的第a个用户ua的有偏表征和第i个产品vi的有偏表征
26、
27、式(1)中,ra表示第a个用户ua交互的产品集合,hi表示与第i个产品vi有交互的用户集合,表示第k个图卷积层后输出的第a个用户ua的有偏表征,第k个图卷积层后输出的第i个产品vi的有偏表征,|ra|表示第a个用户ua交互的产品集合大小,|hi|表示与第i个产品vi有交互的用户集合大小;当k=1时,初始化
28、步骤2.3、构建有偏属性分类器;
29、利用式(2)计算第a个用户ua经过第k+1个图卷积层后得到的有偏属性预测值
30、
31、式(2)中,w表示有偏属性分类器的全连接层参数,表示第k+1个图卷积层后输出的第a个用户ua的有偏表征,σ()表示sigmoid激活函数。
32、步骤2.4、根据式(3)计算有偏属性编码器的损失函数;
33、
34、式(3)中,θs=[c,z,w]为待学习参数;
35、步骤2.5、使用梯度下降法对有偏属性编码器进行训练,并最小化式(3)中的损失函数ls(θs),直至损失函数收敛,从而得到对应的最优参数其中,c*表示最优的用户有偏表征矩阵,z*表示最优的产品有偏表征矩阵,w*表示最优的全连接层参数;
36、根据最优参数得到用户第a个用户ua的有偏表征
37、步骤2.6、利用式(4)计算二值有偏属性表征es;
38、
39、式(4)中,s∈{0,1}表示二值有偏属性值,us表示不同有偏属性值用户集合。
40、所述步骤3包括:
41、步骤3.1、使用高斯分布随机初始化用户表征矩阵p={p1,...,pa,...,pm},其中,pa表示第a个用户ua的表征;使用高斯分布随机初始化产品协同表征矩阵q={q1,...,qi,...,qn},其中,qi表示第i个产品vi的表征;
42、步骤3.2、根据式(5)计算连接矩阵a:
43、
44、步骤3.3、定义图神经网络共有l个卷积层,当前卷积层为l;
45、初始化第0层节点表征矩阵h0={p,本文档来自技高网...
【技术保护点】
1.一种基于信息瓶颈的去偏推荐方法,其特征在于,是按如下步骤进行:
2.根据权利要求1所述的一种基于信息瓶颈的去偏推荐方法,其特征在于,所述步骤2包括:
3.根据权利要求2所述的一种基于信息瓶颈的去偏推荐方法,其特征在于,所述步骤3包括:
4.根据权利要求3所述的一种基于信息瓶颈的去偏推荐方法,其特征在于,所述步骤5包括:
5.根据权利要求4所述的一种基于信息瓶颈的去偏推荐方法,其特征在于,所述步骤6包括:
6.一种电子设备,包括存储器以及处理器,其特征在于,所述存储器用于存储支持处理器执行权利要求1-5中任一所述去偏推荐方法的程序,所述处理器被配置为用于执行所述存储器中存储的程序。
7.一种计算机可读存储介质,计算机可读存储介质上存储有计算机程序,其特征在于,所述计算机程序被处理器运行时执行权利要求1-5中任一所述去偏推荐方法的步骤。
【技术特征摘要】
1.一种基于信息瓶颈的去偏推荐方法,其特征在于,是按如下步骤进行:
2.根据权利要求1所述的一种基于信息瓶颈的去偏推荐方法,其特征在于,所述步骤2包括:
3.根据权利要求2所述的一种基于信息瓶颈的去偏推荐方法,其特征在于,所述步骤3包括:
4.根据权利要求3所述的一种基于信息瓶颈的去偏推荐方法,其特征在于,所述步骤5包括:
5.根据权利要求4所述的一种基于信息...
【专利技术属性】
技术研发人员:吴乐,谢俊松,杨永晖,王子瀚,洪日昌,汪萌,
申请(专利权)人:合肥工业大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。