消除流行度偏差的推荐方法、系统、设备及存储介质技术方案

技术编号:37714394 阅读:11 留言:0更新日期:2023-06-02 00:09
本发明专利技术公开了一种消除流行度偏差的推荐方法、系统、设备及存储介质,它们是一一对应的方案,仿真中:针对图推荐模型进行流行度偏差消除,具体是基于训练图推荐模型后获得的初始表征,再进行后处理式的去偏操作,可以直接应用于不同的图推荐模型,具有较好的普适性。相比于其他消除流行度偏差的技术,本发明专利技术具有更好的整体推荐性能,提升了尾部冷门物品的推荐效果同时,又较好的保留了高热门物品的推荐性能。能。能。

【技术实现步骤摘要】
消除流行度偏差的推荐方法、系统、设备及存储介质


[0001]本专利技术涉及推荐系统
,尤其涉及一种消除流行度偏差的推荐方法、系统、设备及存储介质。

技术介绍

[0002]推荐系统目前已广泛应用于互联网相关场景中,有效解决了信息过载等问题。然而,当前的推荐系统面临着严重的偏差问题,例如流行度偏差。流行度偏差是指受欢迎的物品(高热门的物品)被推荐的频率超过了它们本身的受欢迎程度,部分高热门的物品占据了绝大部分曝光和点击,这使得推荐系统基于有偏数据训练后,对高热门物品更容易给出高预测得分,而简单地将不流行的物品(尾部冷门物品)给予较低的预测得分。流行度偏差问题主要有三种负面影响:1)影响了用户个性化推荐结果,损害了用户体验,尤其是小众偏好的用户;2)影响了大量尾部物品的曝光率;3)影响了电商平台针对性的物品推荐;总体来说,以上负面影响严重制约了推荐效果。因此,解决流行度偏差问题迫在眉睫。
[0003]基于图的推荐模型(即图推荐模型)是目前最为先进的协同过滤推荐模型,为用户和物品学习了更好的表征。图推荐模型核心模块是邻居聚合(亦称图卷积)模块,该核心模块在用户物品交互二部图上通过聚合邻居信息对目标用户/物品进行表征学习,以实现更加有效的协同效应捕捉。然而理论证明显示,图推荐模型的邻居聚合更容易放大流行度偏差效应,这使得应用图推荐模型时面临更加严重的流行度偏差问题。
[0004]当前解决流行度偏差问题的技术,主要有:(1)倾向性权重方法:根据物品流行度估计倾向性权重,对每条数据数据样本进行加权;(2)填充无偏数据:通过添加额外的无偏数据进行学习以纠正流行度偏差;(3)解耦表征:将用户点击行为分解为兴趣偏好和流行度两类效应并嵌入对应表征模型中,使得模型学习到更加鲁棒的兴趣偏好。这些技术虽然起到了有效的缓解流行度偏差的效应,提升了尾部冷门物品的推荐效果,但同时又极大降低了整体推荐性能,不适用于现实的推荐场景。

技术实现思路

[0005]本专利技术的目的是提供一种消除流行度偏差的推荐方法、系统、设备及存储介质,不仅提升尾部冷门物品的推荐效果,同时保证整体推荐性能提升,能够很好的适用于现实的推荐场景。
[0006]本专利技术的目的是通过以下技术方案实现的:一种消除流行度偏差的推荐方法,包括:利用用户集合与物品集合构造用户物品交互二部图,并利用用户物品交互二部图训练图推荐模型,完成训练后,获得所有用户与所有物品的初始表征;将所有用户与所有物品的初始表征分别输入至训练后的图推荐模型,训练后的图推荐模型的每一层中,通过聚类确定当前用户或当前物品所在聚类簇,结合聚类簇中邻居用户和/或物品的表征预测当前用户或当前物品的偏差放大效应,通过去除偏差放大效应,
获得当前用户或当前物品的理想表征,完成每一层的去偏操作;所有用户与所有物品完成所有层的去偏操作后,获得所有用户与所有物品的最终表征;对于每一用户,利用相应用户的最终表征与所有物品的最终表征,生成每一用户对应的物品推荐列表。
[0007]一种消除流行度偏差的推荐系统,包括:图数据构造与初始表征获取单元,用于利用用户集合与物品集合构造用户物品交互二部图,并利用用户物品交互二部图训练图推荐模型,完成训练后,获得所有用户与所有物品的初始表征;去偏操作与最终表征获取单元,用于将所有用户与所有物品的初始表征分别输入至训练后的图推荐模型,训练后的图推荐模型的每一层中,通过聚类确定当前用户或当前物品所在聚类簇,结合聚类簇中邻居用户和/或物品的表征预测当前用户或当前物品的偏差放大效应,通过去除偏差放大效应,获得当前用户或当前物品的理想表征,完成每一层的去偏操作;所有用户与所有物品完成所有层的去偏操作后,获得所有用户与所有物品的最终表征;物品推荐列表生成单元,用于对于每一用户,利用相应用户的最终表征与所有物品的最终表征,生成每一用户对应的物品推荐列表。
[0008]一种处理设备,包括:一个或多个处理器;存储器,用于存储一个或多个程序;其中,当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现前述的方法。
[0009]一种可读存储介质,存储有计算机程序,当计算机程序被处理器执行时实现前述的方法。
[0010]由上述本专利技术提供的技术方案可以看出,针对图推荐模型进行流行度偏差消除,具体是基于训练图推荐模型后获得的初始表征,再进行后处理式的去偏操作,可以直接应用于不同的图推荐模型,具有较好的普适性。相比于其他消除流行度偏差的技术,本专利技术具有更好的整体推荐性能,提升了尾部冷门物品的推荐效果同时,又较好的保留了高热门物品的推荐性能。
附图说明
[0011]为了更清楚地说明本专利技术实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域的普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他附图。
[0012]图1为本专利技术实施例提供的一种消除流行度偏差的推荐方法的流程图;图2为本专利技术实施例提供的Gowalla数据集中LightGCN模型与LightGCN+DAP生成的物品推荐列表上Top20中尾部物品占比结果图;图3为本专利技术实施例提供的Amazon

book数据集中LightGCN模型与LightGCN+DAP生成的物品推荐列表上Top20中尾部物品占比结果图;图4为本专利技术实施例提供的一种消除流行度偏差的推荐系统的示意图;图5为本专利技术实施例提供的一种处理设备的示意图。
具体实施方式
[0013]下面结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术的保护范围。
[0014]首先对本文中可能使用的术语进行如下说明:术语“和/或”是表示两者任一或两者同时均可实现,例如,X和/或Y表示既包括“X”或“Y”的情况也包括“X和Y”的三种情况。
[0015]术语“包括”、“包含”、“含有”、“具有”或其它类似语义的描述,应被解释为非排它性的包括。例如:包括某技术特征要素(如原料、组分、成分、载体、剂型、材料、尺寸、零件、部件、机构、装置、步骤、工序、方法、反应条件、加工条件、参数、算法、信号、数据、产品或制品等),应被解释为不仅包括明确列出的某技术特征要素,还可以包括未明确列出的本领域公知的其它技术特征要素。
[0016]下面对本专利技术所提供的一种消除流行度偏差的推荐方法、系统、设备及存储介质进行详细描述。本专利技术实施例中未作详细描述的内容属于本领域专业技术人员公知的现有技术。本专利技术实施例中未注明具体条件者,按照本领域常规条件或制造商建议的条件进行。
[0017]实施例一本专利技术实施例提供一种消除流行度偏差的推荐方法,如图1所示,其主要包括如下步骤:步骤1、利用用户集合与物品集合构造用户物品交互二部图,并利用用本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种消除流行度偏差的推荐方法,其特征在于,包括:利用用户集合与物品集合构造用户物品交互二部图,并利用用户物品交互二部图训练图推荐模型,完成训练后,获得所有用户与所有物品的初始表征;将所有用户与所有物品的初始表征分别输入至训练后的图推荐模型,训练后的图推荐模型的每一层中,通过聚类确定当前用户或当前物品所在聚类簇,结合聚类簇中邻居用户和/或物品的表征预测当前用户或当前物品的偏差放大效应,通过去除偏差放大效应,获得当前用户或当前物品的理想表征,完成每一层的去偏操作;所有用户与所有物品完成所有层的去偏操作后,获得所有用户与所有物品的最终表征;对于每一用户,利用相应用户的最终表征与所有物品的最终表征,生成每一用户对应的物品推荐列表。2.根据权利要求1所述的一种消除流行度偏差的推荐方法,其特征在于,所述利用用户集合与物品集合构造用户物品交互二部图包括:将用户集合U记为,将物品集合I记为,其中,M为用户数目,N为物品数目;构造用户物品交互二部图:将每一用户与每一物品分别作为一个节点,当用户与物品之间存在交互时,构建一条边连接用户与物品对应的节点。3.根据权利要求1所述的一种消除流行度偏差的推荐方法,其特征在于,对于第层,去偏操作包括:第层中,获得所有用户与所有物品的第层表征再进行聚类,对于当前用户或当前物品,确定所在的聚类簇,通过聚类簇中邻居用户和/或物品的表征预测当前用户或当前物品的第层偏差放大效应,再结合当前用户或当前物品的第层表征,获得当前用户或当前物品的第层理想表征,最终得到所有用户与所有物品的第层理想表征;其中,当=1时,当前用户或当前物品的第层表征通过当前用户或当前物品的初始表征获得;当>1,当前用户或当前物品的第层表征通过当前用户或当前物品的理想表征获得。4.根据权利要求1或3所述的一种消除流行度偏差的推荐方法,其特征在于,预测当前用户或当前物品的偏差放大效应的步骤包括:当前用户与当前物品均分别对应于用户物品交互二部图的一个节点,取任一节点记为节点v,在第层中,首先获得所有节点的第层表征,其中,每一节点对应一个用户或一个物品,当>1时,节点v的第层表征表示为:,为节点v的第层理想表征,作为一个整体,表示来自比节点v的度高的邻居节点的偏差效应,作为一个整体,表示来自比节点v的度低的邻居节点的偏差效应,度是指节点的一阶邻居数量;对所有节点的第层表征进行聚类,表示为,其中,P为聚类簇数目,记节点v处于第p个聚类簇,p=1,2,

,P;在第p个聚类簇,利用比节点v的度高的所...

【专利技术属性】
技术研发人员:何向南陈佳佳吴剑灿陈佳伟
申请(专利权)人:中国科学技术大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1