基于物品侧公平性增强的交互式推荐系统及方法技术方案

技术编号:44760612 阅读:20 留言:0更新日期:2025-03-26 12:44
本发明专利技术涉及基于物品侧公平性增强的交互式推荐系统及方法,属于大数据人工智能领域。该系统高、低两层智能体串联构成,任意一个智能体都为一个Actor‑Critic框架的强化学习网络。该方法采用分层学习方法,将引导过程分为宏观学习和微观学习两个阶段:在宏观学习阶段,高层智能体基于多步反馈制定面向公平性的目标,同时考虑物品方面的公平性和用户满意度,用于指导微观学习阶段;在微学习阶段,低层智能体将目标转换为针对单个用户定制的可执行操作,平衡了目标和用户满意度,并逐渐将用户偏好转向期望的目标。本发明专利技术方法增强了推荐系统中的物品方面的公平性,同时最大限度地减少了对用户满意度的干扰。

【技术实现步骤摘要】

本专利技术涉及基于物品侧公平性增强的交互式推荐系统及方法,属于大数据人工智能领域,尤其涉及基于物品侧公平性增强的交互式推荐。


技术介绍

1、交互式推荐系统(interactive recommender system,简称irs)是现代在线平台的重要工具,它通过实时提供个性化内容和相关项目建议来提高用户参与度。这些系统有效地跟踪和模拟不断变化的用户偏好,显著改善了从电子商务到直播平台等不同领域的用户体验。然而,尽管它们很有效,推荐系统仍然面临着与公平性相关的显著挑战。其中,用于训练这些模型的数据通常是不平衡的,推荐数据集具有稀疏性和长尾分布的特征。因此,少部分受欢迎的项目获得了不成比例的关注,而大量不太受欢迎(即长尾)的项目则遭受了不公平的曝光,从而降低了它们对用户的可见性。

2、为了解决提高长尾项目暴露公平性的挑战,研究人员提出了各种方法。例如,利用因果推理技术来减轻流行度偏差,在模型训练期间结合公平感知的正则化约束,或采用重新排名策略来调整推荐输出。对于动态环境,现有的工作通常利用强化学习(reinforcement learning,简称本文档来自技高网...

【技术保护点】

1.基于物品侧公平性增强的交互式推荐系统,针对任意用户u∈U、任意项目i∈I的场景,其中用户的集合为U,项目的集合为I,用户行为是统计用户和项目之间交互行为的n×m×k维的评分矩阵R,T=[T1,T2,…,Tk]为k个历史时刻构成的向量,其特征在于,由高、低两层智能体串联构成;所述的高层智能体为一个高层Actor-Critic框架的强化学习网络;所述的高层Actor-Critic框架的强化学习网络由一个高层Actor网络和一个高层Critic网络串联构成;所述的高层Actor网络由一个多层感知网络1;所述的高层Critic网络也为一个多层感知网络2;同理,所述的低层智能体为一个低层Act...

【技术特征摘要】

1.基于物品侧公平性增强的交互式推荐系统,针对任意用户u∈u、任意项目i∈i的场景,其中用户的集合为u,项目的集合为i,用户行为是统计用户和项目之间交互行为的n×m×k维的评分矩阵r,t=[t1,t2,…,tk]为k个历史时刻构成的向量,其特征在于,由高、低两层智能体串联构成;所述的高层智能体为一个高层actor-critic框架的强化学习网络;所述的高层actor-critic框架的强化学习网络由一个高层actor网络和一个高层critic网络串联构成;所述的高层actor网络由一个多层感知网络1;所述的高层critic网络也为一个多层感知网络2;同理,所述的低层智能体为一个低层actor-critic框架的强化学习网络;所述的低层actor-critic框架的强化学习网络由一个低层actor网络和一个低层critic网络串联构成;所述的低层actor网络由一个多层感知网络3;所述的低层critic网络也为一个多层感知网络4;

2.根据权利要求1所述的基于物品侧公平性增强的交互式推荐系统,其特征在于,所述的高层actor-critic框架的强化学习网络和低层actor-cr...

【专利技术属性】
技术研发人员:史晓雨夏崇珺尚明生甘捷
申请(专利权)人:中国科学院重庆绿色智能技术研究院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1