基于扩散模型增强的序列推荐模型的训练方法和装置制造方法及图纸

技术编号：40204723 阅读：3 留言：0更新日期：2024-02-02 22:16

本公开提供了一种基于扩散模型增强的序列推荐模型的训练方法和装置，涉及数据处理技术领域，旨在训练性能优良的序列推荐模型。所述方法包括：获取历史交互序列；获取扩散模型输出的所述历史交互序列的多个增强交互序列；根据所述多个增强交互序列与所述历史交互序列的相似度，确定每个所述增强交互序列对应的训练难度；按照训练难度从易到难的顺序，利用所述多个增强交互序列和所述历史交互序列，对初始序列推荐模型进行训练，得到训练好的序列推荐模型。

全部详细技术资料下载

【技术实现步骤摘要】

本公开涉及数据处理，特别是涉及一种基于扩散模型增强的序列推荐模型的训练方法和装置。

技术介绍

1、序列推荐旨在根据用户的一系列历史交互行为向用户推荐个性化的新交互项目，是当前互联网信息服务系统中广泛采用的推荐策略。

2、然而，相关技术的序列推荐方法往往极大地受限于真实世界场景中的数据稀疏问题，尤其是冷启动等场景下，缺乏大量有效的用户交互行为，导致推荐系统无法充分挖掘用户意图，从而限制了推荐性能。

技术实现思路

1、鉴于上述问题，本公开实施例提供了一种基于扩散模型增强的序列推荐模型的训练方法和装置，以便克服上述问题或者至少部分地解决上述问题。

2、本公开实施例的第一方面，提供了一种基于扩散模型增强的序列推荐模型的训练方法，所述方法包括：

3、获取历史交互序列；

4、获取扩散模型输出的所述历史交互序列的多个增强交互序列；

5、根据所述多个增强交互序列与所述历史交互序列的相似度，确定每个所述增强交互序列对应的训练难度；

6、按照训练难度从易到难的顺序，利用所述多个增强交互序列和所述历史交互序列，对初始序列推荐模型进行训练，得到训练好的序列推荐模型。

7、可选地，所述按照训练难度从易到难的顺序，利用所述多个增强交互序列和所述历史交互序列，对初始序列推荐模型进行训练，得到训练好的序列推荐模型，包括：

8、按照训练难度从易到难的顺序，每次从所述多个增强交互序列和所述历史交互序列中确定出一个序列，将所

9、获取所述序列中，所述子序列的下一目标序列元素；

10、根据所述下一目标序列元素，以及所述初始序列推荐模型预测的下一序列元素，建立第一损失函数；

11、基于所述第一损失函数对所述初始序列推荐模型进行训练，得到训练好的所述序列推荐模型。

12、可选地，所述扩散模型的训练步骤至少包括：

13、将所述历史交互序列输入初始扩散模型，得到所述历史交互序列的编码，所述初始扩散模型包括噪声添加模块和去噪模块；

14、所述噪声添加模块在每个时间步，向所述历史交互序列的编码中添加噪声，得到目标编码；

15、所述去噪模块预测在所述每个时间步添加的噪声；

16、所述去噪模块根据预测的在所述每个时间步添加的噪声，对所述目标编码进行去噪处理，得到预测的增强交互序列的编码；

17、根据所述每个时间步添加的噪声，以及预测的所述每个时间步添加的噪声，建立第二损失函数，基于所述第二损失函数对所述初始扩散模型进行训练，得到训练好的所述扩散模型。

18、可选地，所述扩散模型包括去噪模块；所述获取扩散模型输出的所述历史交互序列的多个增强交互序列，包括：

19、将所述历史交互序列输入所述扩散模型，得到所述历史交互序列的编码；

20、所述去噪模块根据所述历史交互序列的编码，生成所述多个增强交互序列的编码；

21、对所述多个增强交互序列的编码进行解码，得到所述多个增强交互序列。

22、可选地，在所述得到训练好的序列推荐模型之后，所述方法还包括：

23、获取目标历史交互序列；

24、将所述目标历史交互序列输入训练好的所述序列推荐模型，得到预测的待推荐序列元素。

25、本公开实施例的第二方面，提供了一种基于扩散模型增强的序列推荐模型的训练装置，所述装置包括：

26、获取模块，用于获取历史交互序列；

27、增强模块，用于获取扩散模型输出的所述历史交互序列的多个增强交互序列；

28、确定模块，用于根据所述多个增强交互序列与所述历史交互序列的相似度，确定每个所述增强交互序列对应的训练难度；

29、训练模块，用于按照训练难度从易到难的顺序，利用所述多个增强交互序列和所述历史交互序列，对初始序列推荐模型进行训练，得到训练好的序列推荐模型。

30、可选地，所述训练模块具体用于执行：

31、按照训练难度从易到难的顺序，每次从所述多个增强交互序列和所述历史交互序列中确定出一个序列，将所述序列的子序列输入所述初始序列推荐模型，得到所述初始序列推荐模型预测的所述子序列的下一序列元素，所述子序列为所述序列中排在前列的多个序列元素组成；

32、获取所述序列中，所述子序列的下一目标序列元素；

33、根据所述下一目标序列元素，以及所述初始序列推荐模型预测的下一序列元素，建立第一损失函数；

34、基于所述第一损失函数对所述初始序列推荐模型进行训练，得到训练好的所述序列推荐模型。

35、可选地，所述扩散模型的训练步骤至少包括：

36、将所述历史交互序列输入初始扩散模型，得到所述历史交互序列的编码，所述初始扩散模型包括噪声添加模块和去噪模块；

37、所述噪声添加模块在每个时间步，向所述历史交互序列的编码中添加噪声，得到目标编码；

38、所述去噪模块预测在所述每个时间步添加的噪声；

39、所述去噪模块根据预测的在所述每个时间步添加的噪声，对所述目标编码进行去噪处理，得到预测的增强交互序列的编码；

40、根据所述每个时间步添加的噪声，以及预测的所述每个时间步添加的噪声，建立第二损失函数，基于所述第二损失函数对所述初始扩散模型进行训练，得到训练好的所述扩散模型。

41、可选地，所述扩散模型包括去噪模块；所述增强模块具体用于执行：

42、将所述历史交互序列输入所述扩散模型，得到所述历史交互序列的编码；

43、所述去噪模块根据所述历史交互序列的编码，生成所述多个增强交互序列的编码；

44、对所述多个增强交互序列的编码进行解码，得到所述多个增强交互序列。

45、可选地，在所述得到训练好的序列推荐模型之后，所述装置还包括：

46、目标获取模块，用于获取目标历史交互序列；

47、预测模块，用于将所述目标历史交互序列输入训练好的所述序列推荐模型，得到预测的待推荐序列元素。

48、本公开实施例的第三方面，提供了一种电子设备，包括：处理器；用于存储所述处理器可执行指令的存储器；其中，所述处理器被配置为执行指令，以实现如第一方面的基于扩散模型增强的序列推荐模型的训练方法。

49、本公开实施例的第四方面，提供了一种计算机可读存储介质，当计算机可读存储介质中的指令由电子设备的处理器执行时，使得所述电子设备能够执行如第一方面的基于扩散模型增强的序列推荐模型的训练方法。

50、本公开实施例包括以下优点：

51、本公开实施例中，利用扩散模型生成了历史交互序列的多个增强交互序列，实现了数据增强；利本文档来自技高网...

【技术保护点】

1.一种基于扩散模型增强的序列推荐模型的训练方法，其特征在于，所述方法包括：

2.根据权利要求1所述的方法，其特征在于，所述按照训练难度从易到难的顺序，利用所述多个增强交互序列和所述历史交互序列，对初始序列推荐模型进行训练，得到训练好的序列推荐模型，包括：

3.根据权利要求1所述的方法，其特征在于，所述扩散模型的训练步骤至少包括：

4.根据权利要求1所述的方法，其特征在于，所述扩散模型包括去噪模块；所述获取扩散模型输出的所述历史交互序列的多个增强交互序列，包括：

5.根据权利要求1-4任一所述的方法，其特征在于，在所述得到训练好的序列推荐模型之后，所述方法还包括：

6.一种基于扩散模型增强的序列推荐模型的训练装置，其特征在于，所述装置包括：

7.根据权利要求6所述的装置，其特征在于，所述训练模块具体用于执行：

8.根据权利要求6所述的装置，其特征在于，所述扩散模型的训练步骤至少包括：

9.根据权利要求6所述的装置，其特征在于，所述扩散模型包括去噪模块；所述增强模块具体用于执行：

...

【技术特征摘要】

1.一种基于扩散模型增强的序列推荐模型的训练方法，其特征在于，所述方法包括：

3.根据权利要求1所述的方法，其特征在于，所述扩散模型的训练步骤至少包括：

4.根据权利要求1所述的方法，其特征在于，所述扩散模型包括去噪模块；所述获取扩散模型输出的所述历史交互序列的多个增强交互序列，包括：

5.根据权利要求1-4任一所述的方法...

【专利技术属性】
技术研发人员：王鑫，朱文武，孙立峰，吴子豪，
申请(专利权)人：清华大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人