一种信息推荐方法技术

技术编号:39494457 阅读:5 留言:0更新日期:2023-11-24 11:20
本申请公开了一种信息推荐方法

【技术实现步骤摘要】
一种信息推荐方法、装置、设备及存储介质


[0001]本专利技术涉及计算机
,特别涉及一种信息推荐方法

装置

设备及存储介质


技术介绍

[0002]当前,主要是利用了语言模型的文本生成能力,基于额外的信息生成解释性文本(例如基于标签匹配的规则或知识图谱上的某条连接路径),这种方案给推荐语言提供的信息只筛选了用户信息的一部分,而没有考虑到用户的全面特征,导致其个性化表达能力较弱

并且,另一方面,在金融领域中,对用户分析

归因

得出结论的思路这一链路是很重要的,而目前多数方案是基于单一或有限论据给出结论的,并未充分利用语言模型所的思维链(
Chain of Thought

CoT
)特性所带来的逻辑推理能力,使得最终提供的文本可信度较低


技术实现思路

[0003]有鉴于此,本专利技术的目的在于提供一种信息推荐方法

装置

设备及存储介质,能够有效提高信息推荐结果的可信度以及可解释性

其具体方案如下:第一方面,本申请提供了一种信息推荐方法,包括:基于采集到的用户画像信息执行相应的第一提示模板设计操作,得到用于补全用户画像信息的待训练提示模板;通过利用所述待训练提示模板及预设模型训练规则对预设语言模型进行模型微调,完成相应的模型训练操作,并得到相应的目标语言模型;当获取到相应的信息推荐请求时,基于所述目标语言模型以及所述信息推荐请求中的目标提示模板进行信息推荐,以得到与所述信息推荐请求对应的信息推荐结果

[0004]可选的,所述信息推荐方法,还包括:基于预设前置训练任务进行用户画像信息采集,并对得到的用户画像信息进行向量表征,得到与所述用户画像信息对应的向量信息;相应的,所述基于采集到的用户画像信息执行相应的第一提示模板设计操作,得到用于补全用户画像信息的待训练提示模板,包括:基于所述向量信息执行相应的第一提示模板设计操作,得到用于补全用户画像信息的待训练提示模板

[0005]可选的,所述通过利用所述待训练提示模板及预设模型训练规则对预设语言模型进行模型微调,包括:基于所述待训练提示模板以及与所述待训练提示模板对应的初始推荐信息对预设语言模型执行相应的第一模型微调操作,得到第一语言模型;通过确定与所述待训练提示模板对应的各推荐结果的满意度信息执行相应的推荐结果排序操作,以基于得到的排序结果构建相应的奖励模型;
利用预设近端策略优化算法得到与所述第一语言模型对应的建议信息,并通过所述奖励模型对所述建议信息进行评估,得到相应的评估信息;基于所述评估信息以及所述建议信息对所述第一语言模型执行相应的第二模型微调操作,以得到目标语言模型

[0006]可选的,所述通过确定与所述待训练提示模板对应的各推荐结果的满意度信息执行相应的推荐结果排序操作,包括:在确定与所述待训练提示模板对应的各推荐结果的满意度信息之后,基于得到的与各所述推荐结果分别对应的所述满意度信息对各所述推荐结果进行排序,以得到相应的排序结果

[0007]可选的,所述基于得到的排序结果构建相应的奖励模型,包括:基于得到的排序结果构建相应的训练样本,并根据所述训练样本得到相应的奖励模型

[0008]可选的,还包括:通过执行相应的第二提示模板设计操作,得到用于补全用户画像信息和
/
或生成投资建议的目标提示模板

[0009]可选的,所述基于所述目标语言模型以及所述信息推荐请求中的目标提示模板进行信息推荐,以得到与所述信息推荐请求对应的信息推荐结果,包括:基于所述目标语言模型以及所述信息推荐请求中的目标提示模板和相应的用户描述信息进行信息推荐,以基于得到的满足预设字数条件的文本信息确定与所述信息推荐请求对应的信息推荐结果

[0010]第二方面,本申请提供了一种信息推荐装置,包括:待训练模板获取模块,用于基于采集到的用户画像信息执行相应的第一提示模板设计操作,得到用于补全用户画像信息的待训练提示模板;模型微调模块,用于通过利用所述待训练提示模板及预设模型训练规则对预设语言模型进行模型微调,完成相应的模型训练操作,并得到相应的目标语言模型;信息推荐模块,用于当获取到相应的信息推荐请求时,基于所述目标语言模型以及所述信息推荐请求中的目标提示模板进行信息推荐,以得到与所述信息推荐请求对应的信息推荐结果

[0011]第三方面,本申请提供了一种电子设备,包括:存储器,用于保存计算机程序;处理器,用于执行所述计算机程序,以实现前述的信息推荐方法的步骤

[0012]第四方面,本申请提供了一种计算机可读存储介质,用于保存计算机程序,所述计算机程序被处理器执行时实现前述的信息推荐方法的步骤

[0013]可见,本申请中,先基于采集到的用户画像信息执行相应的第一提示模板设计操作,得到用于补全用户画像信息的待训练提示模板;然后通过利用所述待训练提示模板及预设模型训练规则对预设语言模型进行模型微调,完成相应的模型训练操作,并得到相应的目标语言模型;然后当获取到相应的信息推荐请求时,基于所述目标语言模型以及所述信息推荐请求中的目标提示模板进行信息推荐,以得到与所述信息推荐请求对应的信息推荐结果

本申请先通过利用基于采集到的用户画像信息得到的待训练提示模板进行模型微
调,以当接收到相应的信息推荐请求时基于得到的目标语言模型进行信息推荐,以完成响应

这样一来,能够有效提高模型的可靠性,进而提高信息推荐结果的可信度以及可解释性

附图说明
[0014]为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图

[0015]图1为本申请提供的一种信息推荐方法流程图;图2为本申请提供的一种信息推荐方法流程示意图;图3为本申请提供的一种具体的信息推荐方法流程图;图4为本申请提供的一种信息推荐装置结构示意图;图5为本申请提供的一种电子设备结构图

具体实施方式
[0016]下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚

完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例

基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围

[0017]当前,主要是利用了语言模型的文本生成能力,基于额外的信息生成解释性文本(例如基于标签匹配的规则或知识图谱本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.
一种信息推荐方法,其特征在于,包括:基于采集到的用户画像信息执行相应的第一提示模板设计操作,得到用于补全用户画像信息的待训练提示模板;通过利用所述待训练提示模板及预设模型训练规则对预设语言模型进行模型微调,完成相应的模型训练操作,并得到相应的目标语言模型;当获取到相应的信息推荐请求时,基于所述目标语言模型以及所述信息推荐请求中的目标提示模板进行信息推荐,以得到与所述信息推荐请求对应的信息推荐结果
。2.
根据权利要求1所述的信息推荐方法,其特征在于,还包括:基于预设前置训练任务进行用户画像信息采集,并对得到的用户画像信息进行向量表征,得到与所述用户画像信息对应的向量信息;相应的,所述基于采集到的用户画像信息执行相应的第一提示模板设计操作,得到用于补全用户画像信息的待训练提示模板,包括:基于所述向量信息执行相应的第一提示模板设计操作,得到用于补全用户画像信息的待训练提示模板
。3.
根据权利要求1所述的信息推荐方法,其特征在于,所述通过利用所述待训练提示模板及预设模型训练规则对预设语言模型进行模型微调,包括:基于所述待训练提示模板以及与所述待训练提示模板对应的初始推荐信息对预设语言模型执行相应的第一模型微调操作,得到第一语言模型;通过确定与所述待训练提示模板对应的各推荐结果的满意度信息执行相应的推荐结果排序操作,以基于得到的排序结果构建相应的奖励模型;利用预设近端策略优化算法得到与所述第一语言模型对应的建议信息,并通过所述奖励模型对所述建议信息进行评估,得到相应的评估信息;基于所述评估信息以及所述建议信息对所述第一语言模型执行相应的第二模型微调操作,以得到目标语言模型
。4.
根据权利要求3所述的信息推荐方法,其特征在于,所述通过确定与所述待训练提示模板对应的各推荐结果的满意度信息执行相应的推荐结果排序操作,包括:在确定与所述待训练提示模板对应的各推荐结果的满意度信息之后,基于得到的与各所述推荐结果分别对应...

【专利技术属性】
技术研发人员:王路路高岩
申请(专利权)人:浙江同花顺智能科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1