一种可调优的大语言模型主动推荐智能体系统技术方案

技术编号:46624127 阅读:0 留言:0更新日期:2025-10-14 21:19
本发明专利技术公开了一种可调优的大语言模型主动推荐智能体系统,所述系统包括:执行者‑顾问框架,由执行者模块和顾问模块构成,其中:所述顾问模块被配置为:基于用户历史数据、当前状态及环境奖励,生成结构化指导信号;所述执行者模块被配置为:根据当前状态和所述指导信号生成推荐动作;评论者模块,被配置为:计算状态值和动作优势值;优化模块,被配置为:基于所述动作优势值,通过直接偏好优化算法对执行者模块和顾问模块的基础大语言模型进行微调。本发明专利技术可在给出目标物品的情况下逐步挖掘用户的潜在兴趣,扩展用户兴趣边界,提高对目标物品的兴趣,能够适用于各大网络社交平台与电商平台等推荐场景。

【技术实现步骤摘要】

本申请涉及推荐系统,具体的说是一种可调优的大语言模型主动推荐智能体系统


技术介绍

1、随着数字内容的日益丰富,推荐系统成为提升用户体验和内容分发效率的重要工具,其本质上是以文本为核心的任务,需大量自然语言处理技术以解析物品信息并识别用户兴趣。传统推荐系统主要依据用户的历史行为进行建模,仅推荐用户较感兴趣的内容,以最大化短期点击率或满意度。然而,这类方法导致用户只接触到与自己观点、兴趣一致的信息,造成“信息茧房”效应,失去了解不同事物的能力和接触机会,使用户观点极化,进而削弱推荐生态系统的可持续发展性。

2、相比之下,主动推荐(proactive recommendation)是一类新兴的推荐策略,其核心目标在于在不损害用户体验的前提下,系统性地引导和培养用户的潜在兴趣。现有关于主动推荐的研究主要采用多步推荐策略以培养用户潜在兴趣,其目标在于通过多轮推荐引导用户逐步扩展兴趣,从而发掘用户潜在兴趣。典型工作如“影响力推荐系统”(influential recommender system, 简称irs),通过transformer模型学习用户兴趣本文档来自技高网...

【技术保护点】

1.一种可调优的大语言模型主动推荐智能体系统,其特征在于,所述可调优的大语言模型主动推荐智能体系统包括:

2.根据权利要求1所述的可调优的大语言模型主动推荐智能体系统,其特征在于,所述顾问模块的实现方式为:

3.根据权利要求1所述的可调优的大语言模型主动推荐智能体系统,其特征在于,所述执行者模块的实现方式为:

4.根据权利要求3所述的可调优的大语言模型主动推荐智能体系统,其特征在于,所述物品锚定机制包括:

5.根据权利要求1所述的可调优的大语言模型主动推荐智能体系统,其特征在于,所述评论者模块通过第三大型语言模型实例计算状态值:

...

【技术特征摘要】

1.一种可调优的大语言模型主动推荐智能体系统,其特征在于,所述可调优的大语言模型主动推荐智能体系统包括:

2.根据权利要求1所述的可调优的大语言模型主动推荐智能体系统,其特征在于,所述顾问模块的实现方式为:

3.根据权利要求1所述的可调优的大语言模型主动推荐智能体系统,其特征在于,所述执行者模块的实现方式为:

4.根据权利要求3所述的可调优的大语言模型主动推荐智能体系统,其特征在于,所述物品锚定机制包括:

5.根据权利要求1所述的可调优的大语言模型主动推荐智能体系统,其特征在于,所述评论者模块通过第三大型语言模型实例计算状态值:

6...

【专利技术属性】
技术研发人员:冯福利王铭泽高崇铭王文杰李阳阳
申请(专利权)人:中国科学技术大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1