推荐模型训练方法技术

技术编号：40073585 阅读：10 留言：0更新日期：2024-01-17 00:33

本说明书实施例提供推荐模型训练方法，其中所述推荐模型训练方法包括：基于预训练语言模型构建目标业务对应的初始推荐模型；在目标业务对应的历史业务信息中读取搜索方信息，并确定与搜索方信息具有业务关联关系的被推荐方信息；基于搜索方信息和被推荐方信息构建包含正样本和负样本的样本组；利用初始推荐模型对样本组包含的正样本和负样本进行处理，获得正样本对应的正分值序列，以及负样本对应的负分值序列；基于正分值序列和负分值序列计算损失值，并基于损失值对初始推荐模型进行调参，直至获得满足训练停止条件的目标推荐模型。后续执行推荐任务，能够在融入搜索方信息的基础上进行推荐，从而提高推荐的准确性，提高用户满意度。

全部详细技术资料下载

【技术实现步骤摘要】

本说明书实施例涉及计算机，特别涉及一种推荐模型训练方法。

技术介绍

1、随着互联网的快速发展，各互联网平台上的信息层出不穷，用户需要通过搜索引擎在海量信息中检索需要的内容。搜索引擎能够实现基于用户的输入内容进行搜索，匹配到与用户的输入内容关联度较高的信息并反馈，实现为用户提供信息推荐服务。

2、现有技术中，搜索引擎只基于用户输入的文本内容进行搜索，这会存在缺乏垂直领域语义泛化、无法很好的兼顾用户其他信息的问题。从而导致为用户推荐的内容质量较差，推荐准确度较低的问题。因此，亟需一种较为有效的方法以解决上述问题。

技术实现思路

1、有鉴于此，本说明书实施例提供了一种推荐模型训练方法。本说明书一个或者多个实施例同时涉及一种推荐模型训练装置，一种推荐模型应用方法，一种推荐模型应用装置，一种计算设备，一种计算机可读存储介质以及一种计算机程序，以解决现有技术中存在的技术缺陷。

2、根据本说明书实施例的第一方面，提供了一种推荐模型训练方法，包括：

3、基于预训练语言模型构建目标业务对应的初始推荐模型；

4、在所述目标业务对应的历史业务信息中读取搜索方信息，并确定与所述搜索方信息具有业务关联关系的被推荐方信息；

5、基于所述搜索方信息和所述被推荐方信息构建包含正样本和负样本的样本组；

6、利用所述初始推荐模型对所述样本组包含的所述正样本和所述负样本进行处理，获得所述正样本对应的正分值序列，以及所述负样本对应的负分值序列；>

7、基于所述正分值序列和所述负分值序列计算损失值，并基于所述损失值对所述初始推荐模型进行调参，直至获得满足训练停止条件的目标推荐模型。

8、根据本说明书实施例的第二方面，提供了一种推荐模型训练装置，包括：

9、模型构建模块，被配置为基于预训练语言模型构建目标业务对应的初始推荐模型；

10、确定模块，被配置为在所述目标业务对应的历史业务信息中读取搜索方信息，并确定与所述搜索方信息具有业务关联关系的被推荐方信息；

11、样本构建模块，被配置为基于所述搜索方信息和所述被推荐方信息构建包含正样本和负样本的样本组；

12、处理模块，被配置为利用所述初始推荐模型对所述样本组包含的所述正样本和所述负样本进行处理，获得所述正样本对应的正分值序列，以及所述负样本对应的负分值序列；

13、训练模块，被配置为基于所述正分值序列和所述负分值序列计算损失值，并基于所述损失值对所述初始推荐模型进行调参，直至获得满足训练停止条件的目标推荐模型。

14、根据本说明书实施例的第三方面，提供了一种信息搜索方法，包括：

15、获取搜索方在目标业务关联的信息推荐平台输入的搜索方信息；

16、确定所述信息推荐平台包含的被推荐方信息；

17、将所述被推荐方信息和所述搜索方信息输入目标推荐模型进行处理，获得目标被推荐方信息；

18、根据所述目标被推荐方信息生成搜索反馈信息，并通过所述信息推荐平台反馈至所述搜索方。

19、根据本说明书实施例的第四方面，提供了一种信息搜索装置，包括：

20、获取模块，被配置为获取搜索方在目标业务关联的信息推荐平台输入的搜索方信息；

21、确定模块，被配置为确定所述信息推荐平台包含的被推荐方信息；

22、处理模块，被配置为将所述被推荐方信息和所述搜索方信息输入目标推荐模型进行处理，获得目标被推荐方信息；

23、反馈模块，被配置为根据所述目标被推荐方信息生成搜索反馈信息，并通过所述信息推荐平台反馈至所述搜索方。

24、根据本说明书实施例的第五方面，提供了一种模型训练方法，应用于云侧设备，包括：

25、响应于端侧设备提交的模型训练请求基于预训练语言模型构建目标业务对应的初始推荐模型；

26、在所述目标业务对应的历史业务信息中读取搜索方信息，并确定与所述搜索方信息具有业务关联关系的被推荐方信息；

27、基于所述搜索方信息和所述被推荐方信息构建包含正样本和负样本的样本组；

28、利用所述初始推荐模型对所述样本组包含的所述正样本和所述负样本进行处理，获得所述正样本对应的正分值序列，以及所述负样本对应的负分值序列；

29、基于所述正分值序列和所述负分值序列计算损失值，并基于所述损失值对所述初始推荐模型进行调参，直至获得满足训练停止条件的目标推荐模型；

30、将所述目标推荐模型反馈至所述端侧设备。

31、根据本说明书实施例的第六方面，提供了一种模型训练装置，应用于云侧设备，包括：

32、构建模块，被配置为响应于端侧设备提交的模型训练请求基于预训练语言模型构建目标业务对应的初始推荐模型；

33、确定模块，被配置为在所述目标业务对应的历史业务信息中读取搜索方信息，并确定与所述搜索方信息具有业务关联关系的被推荐方信息；

34、构建模块，被配置为基于所述搜索方信息和所述被推荐方信息构建包含正样本和负样本的样本组；

35、处理模块，被配置为利用所述初始推荐模型对所述样本组包含的所述正样本和所述负样本进行处理，获得所述正样本对应的正分值序列，以及所述负样本对应的负分值序列；

36、训练模块，被配置为基于所述正分值序列和所述负分值序列计算损失值，并基于所述损失值对所述初始推荐模型进行调参，直至获得满足训练停止条件的目标推荐模型；

37、反馈模块，被配置为将所述目标推荐模型反馈至所述端侧设备。

38、根据本说明书实施例的第五方面，提供了一种推荐模型应用方法，应用于计算节点，包括：

39、在接收到针对待搜索信息提交的信息搜索请求的情况下，将所述待搜索信息，以及与所述待搜索信息对应的待推荐信息输入至所述目标预训练语言模型，获得所述待搜索信息对应的待搜索向量，以及所述待推荐信息对应的待推荐向量；

40、将所述待搜索向量输入至所述搜索方处理模型，获得待搜索意图向量；

41、基于所述被推荐方预测模型对所述待搜索意图向量和所述待推荐向量进行处理，根据处理结果确定所述信息搜索请求对应的反馈信息；

42、其中，所述计算节点部署目标预训练语言模型，搜索方处理模型和被推荐方预测模型，通过对上述方法中的目标推荐模型进行拆分得到。

43、根据本说明书实施例的第六方面，提供了一种推荐模型应用装置，应用于计算节点，包括：

44、接收模块，被配置为在接收到针对待搜索信息提交的信息搜索请求的情况下，将所述待搜索信息，以及与所述待搜索信息对应的待推荐信息输入至所述目标预训练语言模型，获得所述待搜索信息对应的待搜索向量，以及所述待推荐信息对应的待推荐向量；

45、输入模块，被配置为将所述待搜索向量输入至所述搜索方处理模型，获得待搜索意图向量；

46本文档来自技高网...

【技术保护点】

1.一种推荐模型训练方法，包括：

2.根据权利要求1所述的方法，所述基于所述搜索方信息和所述被推荐方信息构建包含正样本和负样本的样本组，包括：

3.根据权利要求2所述的方法，所述在所述被推荐方信息中进行第一阶段采样，根据采样结果确定负样本信息，包括：

4.根据权利要求2所述的方法，所述在所述被推荐方信息中进行第一阶段采样，根据采样结果确定负样本信息，包括：

5.根据权利要求1所述的方法，所述基于预训练语言模型构建目标业务对应的初始推荐模型，包括：

6.根据权利要求1所述的方法，所述利用所述初始推荐模型对所述样本组包含的所述正样本和所述负样本进行处理，获得所述正样本对应的正分值序列，以及所述负样本对应的负分值序列，包括：

7.根据权利要求6所述的方法，所述利用所述初始推荐模型中包含的网络层对所述搜索方语义向量，所述正样本向量和所述负样本向量进行处理，获得所述正样本对应的正分值序列，以及所述负样本对应的负分值序列，包括：

8.根据权利要求7所述的方法，所述将所述搜索方嵌入向量和所述正样本嵌入向量输入至

9.根据权利要求1所述的方法，在所述样本组为至少两个，且所述样本组中包含至少一个负样本情况下，所述基于所述正分值序列和所述负分值序列计算损失值，包括：

10.一种推荐模型应用方法，应用于计算节点，包括：

11.一种信息搜索方法，包括：

12.一种模型训练方法，应用于云侧设备，包括：

13.一种计算设备，包括：

14.一种计算机可读存储介质，其存储有计算机可执行指令，该计算机可执行指令被处理器执行时实现权利要求1至12任意一项所述方法的步骤。

...

【技术特征摘要】

1.一种推荐模型训练方法，包括：

2.根据权利要求1所述的方法，所述基于所述搜索方信息和所述被推荐方信息构建包含正样本和负样本的样本组，包括：

3.根据权利要求2所述的方法，所述在所述被推荐方信息中进行第一阶段采样，根据采样结果确定负样本信息，包括：

4.根据权利要求2所述的方法，所述在所述被推荐方信息中进行第一阶段采样，根据采样结果确定负样本信息，包括：

5.根据权利要求1所述的方法，所述基于预训练语言模型构建目标业务对应的初始推荐模型，包括：

7.根据权利要求6所述的方法，所述利用所述初始推荐模型中包含的网络层对所述搜索方语义向量，所述正样本向量和所述负样本向量进行处理，获得所述正样本对应的正分值序列，以...

【专利技术属性】
技术研发人员：周康，
申请(专利权)人：杭州阿里云飞天信息技术有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人