基于生成式大语言模型的信息推荐方法及相关装置制造方法及图纸

技术编号:39175951 阅读:10 留言:0更新日期:2023-10-27 08:23
本公开提供了一种基于生成式大语言模型的信息推荐方法及相关装置,涉及生成式模型、大语言模型、信息推荐、基于规划的控制生成等人工智能技术领域。该方法包括:获取用户的自然语言输入和用户的个性化信息;将自然语言输入和个性化信息作为输入数据,输入以基于规划的控制生成思想作为优化目标所训练得到的目标生成式大语言模型;其中,基于规划的控制生成思想指采用匹配于输入数据的预设规划器约束输出数据的生成,预设规划器记录有实现输入数据所对应信息获取需求的处理过程规划;将目标生成式大语言模型的自然语言输出作为推荐信息返回给用户。应用该方法可使模型的回复内容更符合用户偏好、可解释性更强。可解释性更强。可解释性更强。

【技术实现步骤摘要】
基于生成式大语言模型的信息推荐方法及相关装置


[0001]本公开涉及数据处理领域,具体涉及生成式模型、大语言模型、信息推荐、基于规划的控制生成等人工智能
,尤其涉及一种基于生成式大语言模型的信息推荐方法,以及配套的装置、电子设备、计算机可读存储介质及计算机程序产品。

技术介绍

[0002]大型语言模型(LLM,Large Language Model,其本质是生成式模型,也简称为生成式大语言模型),能够为许多下游任务(例如面向任务的对话和问题解答)生成类似人类的流畅响应。
[0003]在用户提出某项信息获取请求时,生成式大语言模型虽然能够理解其请求含义并进行回复,但往往这些回复无法结合用户的个性化信息(例如偏好等),且对于所返回的结果并没有相应的解释理由,使得用户无法得知模型具体是如何进行分析的,从而使得用户对结果的准确性存在质疑。也就是说当前的生成式大语言模型对用户问题的回复缺乏能够体现思维链(Chain Of Thoughts,COT)或分析链的结构或层次。

技术实现思路

[0004]本公开实施例提出了一种基于生成式大语言模型的信息推荐方法、装置、电子设备、计算机可读存储介质及计算机程序产品。
[0005]第一方面,本公开实施例提出了一种基于生成式大语言模型的信息推荐方法,包括:获取用户的自然语言输入和用户的个性化信息;将自然语言输入和个性化信息作为输入数据,输入以基于规划的控制生成思想作为优化目标所训练得到的目标生成式大语言模型;其中,基于规划的控制生成思想指采用匹配于输入数据的预设规划器约束输出数据的生成,预设规划器记录有实现输入数据所对应信息获取需求的处理过程规划;将目标生成式大语言模型的自然语言输出作为推荐信息返回给用户。
[0006]第二方面,本公开实施例提出了一种基于生成式大语言模型的信息推荐装置,包括:输入数据获取单元,被配置成获取用户的自然语言输入和用户的个性化信息;模型调用单元,被配置成将自然语言输入和个性化信息作为输入数据,输入以基于规划的控制生成思想作为优化目标所训练得到的目标生成式大语言模型;其中,基于规划的控制生成思想指采用匹配于输入数据的预设规划器约束输出数据的生成,预设规划器记录有实现输入数据所对应信息获取需求的处理过程规划;推荐信息返回单元,被配置成将目标生成式大语言模型的自然语言输出作为推荐信息返回给用户。
[0007]第三方面,本公开实施例提供了一种电子设备,该电子设备包括:至少一个处理器;以及与至少一个处理器通信连接的存储器;其中,存储器存储有可被至少一个处理器执行的指令,该指令被至少一个处理器执行,以使至少一个处理器执行时能够实现如第一方面描述的基于生成式大语言模型的信息推荐方法。
[0008]第四方面,本公开实施例提供了一种存储有计算机指令的非瞬时计算机可读存储
介质,该计算机指令用于使计算机执行时能够实现如第一方面描述的基于生成式大语言模型的信息推荐方法。
[0009]第五方面,本公开实施例提供了一种包括计算机程序的计算机程序产品,该计算机程序在被处理器执行时能够实现如第一方面描述的基于生成式大语言模型的信息推荐方法的步骤。
[0010]本公开所提供的基于生成式大语言模型的信息推荐方法,通过同时将用户描述其信息获取需求的自然语言输入与其个性化信息作为输入数据,并将该输入数据输入到以基于规划的控制生成(Controlled Generation Via Planning)思想作为优化目标所训练得到的目标生成式大语言模型中,以充分借助在采用基于规划的控制生成思想所采用匹配于输入数据的预设规划器约束输出数据的生成、该预设规划器用于记录实现该输入数据所对应信息获取需求的处理过程规划的特性,使得生成式大语言模型能够生成的自然语言输出能给体现其对该自然语言输出对应的信息获取需求的思考、分析和处理过程,并通过结合个性化信息对备选结果进行筛选,使得最终的自然语言输出更符合用户的个性化需求、具有更高的可解释性和可信度。
[0011]应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
附图说明
[0012]通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本公开的其它特征、目的和优点将会变得更明显:
[0013]图1是本公开可以应用于其中的示例性系统架构;
[0014]图2为本公开实施例提供的一种基于生成式大语言模型的信息推荐方法的流程图;
[0015]图3为本公开实施例提供的一种构建用于训练得到目标生成式大语言模型的训练样本的方法的流程图;
[0016]图4为本公开实施例提供的一种将自然语言输出作为推荐信息返回给用户的方法的流程示意图;
[0017]图5为本公开实施例提供的一种基于生成式大语言模型的信息推荐装置的结构框图;
[0018]图6为本公开实施例提供的一种适用于执行基于生成式大语言模型的信息推荐方法的电子设备的结构示意图。
具体实施方式
[0019]以下结合附图对本公开的示范性实施例做出说明,其中包括本公开实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本公开的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。需要说明的是,在不冲突的情况下,本公开中的实施例及实施例中的特征可以相互组合。
[0020]本公开的技术方案中,所涉及的用户个人信息的收集、存储、使用、加工、传输、提
供和公开等处理,均符合相关法律法规的规定,且不违背公序良俗。
[0021]图1示出了可以应用本公开的基于生成式大语言模型的信息推荐方法、装置、电子设备及计算机可读存储介质的实施例的示例性系统架构100。
[0022]如图1所示,系统架构100可以包括终端设备101、102、103,网络104和服务器105。网络104用以在终端设备101、102、103和服务器105之间提供通信链路的介质。网络104可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。
[0023]用户可以使用终端设备101、102、103通过网络104与服务器105交互,以接收或发送消息等。终端设备101、102、103和服务器105上可以安装有各种用于实现两者之间进行信息通讯的应用,例如信息推荐类应用、语音交互类应用、即时通讯类应用等。
[0024]终端设备101、102、103和服务器105可以是硬件,也可以是软件。当终端设备101、102、103为硬件时,可以是具有显示屏的各种电子设备,包括但不限于智能手机、平板电脑、膝上型便携计算机和台式计算机等等;当终端设备101、102、103为软件时,可以安装在上述所列举的电子设备中,其可以实现成多个软件或软件模块,也可以实现成单个软件或软件模块,在此不做具体限定。当服务器本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于生成式大语言模型的信息推荐方法,包括:获取用户的自然语言输入和所述用户的个性化信息;将所述自然语言输入和所述个性化信息作为输入数据,输入以基于规划的控制生成思想作为优化目标所训练得到的目标生成式大语言模型;其中,所述基于规划的控制生成思想指采用匹配于所述输入数据的预设规划器约束输出数据的生成,所述预设规划器记录有实现所述输入数据所对应信息获取需求的处理过程规划;将所述目标生成式大语言模型的自然语言输出作为推荐信息返回给所述用户。2.根据权利要求1所述的方法,其中,所述预设规划器包含多个用于处理所述输入数据所对应信息获取需求的处理步骤,各所述处理步骤均基于对相应的信息获取需求进行分步骤理解和规划后得到,所述处理步骤至少包含用于筛选匹配所述个性化信息的备选结果的个性化筛选步骤、以及用于对筛选后结果生成匹配所述个性化信息的推荐理由的理由生成步骤。3.根据权利要求2所述的方法,其中,所述处理步骤还可以包含下述至少一项:用于解析所述自然语言输入所对应信息获取需求所属类型的需求类型解析步骤;用于按照解析出的需求类型进行所有备选结果查询的结果查询步骤;用于重新总结所述自然语言输入所对应信息获取需求的需求复述步骤;用于融合上一步骤所分别得到的、存在关联的不同信息的融合步骤;用于去除重复内容的去重步骤。4.根据权利要求1所述的方法,还包括:构建用于训练得到所述目标生成式大语言模型的训练样本,所述构建用于训练得到所述目标生成式大语言模型的训练样本,包括:根据文本和意图相似性,对不同用户的自然语言输入进行聚类,得到多个聚类结果;分别从每个所述聚类结果中抽取第一数量的目标自然语言输入,并获取标注对象为所述目标自然语言输入标注的预设规划器;针对每个所述聚类结果,均将相应聚类结果下的目标自然语言输入和相应的预设规划器构成的真实样本对作为少样本提示,并通过具有代码生成能力的生成式大语言模型生成第二数量的增量样本对;其中,所述第二数量远大于所述第一数量;基于所述真实样本对和所述增量样本对构建所述训练样本。5.根据权利要求2

4任一项所述的方法,其中,所述预设规划器包括:基于编码指令形式构成的指令模板;其中,所述指令模板中包含多条用于处理所述输入数据所对应信息获取需求的处理指令,各所述处理指令均基于对相应的信息获取需求进行分步骤理解和规划后得到,所述处理指令包括对相应的应用程序编程接口的执行指令。6.根据权利要求2

4任一项所述的方法,其中,所述预设规划器包括:基于子提示形式构成的提示模板;其中,所述提示模板中包含用于处理所述输入数据所对应的整体信息获取需求拆分出的多条子提示,各所述子提示均基于对相应的信息获取需求进行分步骤理解和规划后得到,所述子提示包括对相应的应用程序编程接口的执行指令。7.根据权利要求1所述的方法,其中,用于训练得到所述目标生成式大语言模型的奖赏模型所采用的损失函数包括:基于对线上用户使用反馈构造得到的第一损失函数,和基于对用户搜索历史中的点击
行为反馈构造得到的第二损失函数;其中,所述第一损失函数基于均方误差函数构造得到、所述第二损失函数基于成对损失函数构造得到。8.根据权利要求1所述的方法,其中,所述将所述目标生成式大语言模型的自然语言输出作为推荐信息返回给所述用户,包括:获取所述目标生成式大语言模型生成的自然语言输出;根据所述自然语言输出的信息格式和/或信息量,确定匹配的推荐信息呈现形式;其中,所述推荐信息呈现形式包括:纯文本呈现形式、纯图像呈现形式、纯语音呈现形式、以及混合有文本、图像和语音中至少两种的混合呈现形式;将所述自然语言输出按照所述推荐信息呈现形式呈现给所述用户。9.一种基于生成式大语言模型的信息推荐装置,包括:输入数据获取单元,被配置成获取用户的自然语言输入和所述用户的个性化信息;模型调用单元,被配置成将所述自然语言输入和所述个性化信息作为输入数据,输入以基于规划的控制生成思想作为优化目标所训练得到的目标生成式大语言模型;其中,所述基于规划的控制生成思想指采用匹配于所述输入数据的预设规划器约束输出数据的生成,所...

【专利技术属性】
技术研发人员:黄际洲王少磊孙一博
申请(专利权)人:北京百度网讯科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1