System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 模型训练方法、视频推荐方法、装置、设备和介质制造方法及图纸_技高网

模型训练方法、视频推荐方法、装置、设备和介质制造方法及图纸

技术编号:40119848 阅读:7 留言:0更新日期:2024-01-23 20:29
本申请实施例提出了一种模型训练方法、视频推荐方法、装置、电子设备和计算机存储介质,该方法包括:获取多个训练样本;利用初始视频推荐模型对每个训练样本进行提取处理,得到用户对目标短视频的第一视频兴趣向量和对目标物品的第一物品兴趣向量;利用初始视频推荐模型对第一视频兴趣向量进行解耦处理,得到第一视频内容兴趣向量和第一视频物品兴趣向量;基于第一视频兴趣向量、第一物品兴趣向量、第一视频内容兴趣向量和第一视频物品兴趣向量,确定总损失函数;基于总损失函数,对初始视频推荐模型进行训练,得到视频推荐模型。

【技术实现步骤摘要】

本申请涉及计算机,尤其涉及一种模型训练方法、视频推荐方法、装置、电子设备和计算机存储介质。


技术介绍

1、目前,对于电商平台而言,短视频是一种新兴内容类型,侧重于以各种视频展示形式介绍物品,如普通用户的使用经验分享、物品供应商或商家制作的情景喜剧广告等。短视频具有以下关键优势:1)为用户提供高质量的短视频,可以实现不同的泛娱乐体验,显著增加用户对电商平台的粘性。2)制作精良的短视频会吸引用户对相关物品的兴趣,促进用户的购物行为。3)短视频为商家进行品牌推广和网络营销提供了优质的渠道。

2、相关技术中,为提升电商场景下短视频的推荐效果,通常会应用娱乐性场景的短视频推荐方法,然而,电商场景短视频与娱乐性场景短视频具有较大差异性,如果直接应用娱乐性场景的短视频推荐方法,则会降低电商场景下短视频的推荐效果,降低短视频的推荐准确性。


技术实现思路

1、本申请实施例提供一种模型训练方法、视频推荐方法、装置、电子设备和计算机存储介质。

2、本申请的技术方案是这样实现的:

3、本申请实施例提供了一种模型训练方法,所述方法包括:

4、获取多个训练样本,每个训练样本包括用户的短视频行为序列、物品行为序列和已曝光的其中一个目标短视频;

5、利用初始视频推荐模型对所述每个训练样本进行提取处理,得到所述用户对所述目标短视频的第一视频兴趣向量和对目标物品的第一物品兴趣向量;所述目标物品为所述目标短视频中的物品;

6、利用初始视频推荐模型对所述第一视频兴趣向量进行解耦处理,得到第一视频内容兴趣向量和第一视频物品兴趣向量;

7、基于所述第一视频兴趣向量、所述第一物品兴趣向量、所述第一视频内容兴趣向量和所述第一视频物品兴趣向量,确定总损失函数;基于所述总损失函数,对所述初始视频推荐模型进行训练,得到视频推荐模型。

8、本申请实施例提供了一种视频推荐方法,所述方法包括:

9、获取目标用户的特征数据;所述特征数据包括所述目标用户的短视频行为序列、物品行为序列和候选短视频集合;所述候选短视频集合包括多个待推荐的候选短视频;

10、利用视频推荐模型对所述特征数据进行处理,得到所述目标用户对各候选短视频的第二视频兴趣向量、第二视频内容兴趣向量、第二视频物品兴趣向量和对候选物品的第二物品兴趣向量;所述候选物品为所述候选短视频中的物品;

11、基于所述第二视频兴趣向量、所述第二物品兴趣向量、所述第二视频内容兴趣向量和所述第二视频物品兴趣向量,确定预测结果;所述预测结果包括所述目标用户对所述多个候选短视频的点击概率;

12、根据所述预测结果,对所述目标用户进行短视频推荐。

13、本申请实施例提出了一种模型训练装置,所述装置包括第一获取模块、处理模块和训练模块,其中,

14、第一获取模块,用于获取多个训练样本,每个训练样本包括用户的短视频行为序列、物品行为序列和已曝光的其中一个目标短视频;

15、处理模块,用于利用初始视频推荐模型对所述每个训练样本进行提取处理,得到所述用户对所述目标短视频的第一视频兴趣向量和对目标物品的第一物品兴趣向量;所述目标物品为所述目标短视频中的物品;利用初始视频推荐模型对所述第一视频兴趣向量进行解耦处理,得到第一视频内容兴趣向量和第一视频物品兴趣向量;

16、训练模块,用于基于所述第一视频兴趣向量、所述第一物品兴趣向量、所述第一视频内容兴趣向量和所述第一视频物品兴趣向量,确定总损失函数;基于所述总损失函数,对所述初始视频推荐模型进行训练,得到视频推荐模型。

17、本申请实施例提供了一种视频推荐装置,所述装置包括第二获取模块、预测模块和推荐模块,其中,

18、第二获取模块,用于获取目标用户的特征数据;所述特征数据包括所述目标用户的短视频行为序列、物品行为序列和候选短视频集合;所述候选短视频集合包括多个待推荐的候选短视频;

19、预测模块,用于利用视频推荐模型对所述特征数据进行处理,得到所述目标用户对各候选短视频的第二视频兴趣向量、第二视频内容兴趣向量、第二视频物品兴趣向量和对候选物品的第二物品兴趣向量;所述候选物品为所述候选短视频中的物品;基于所述第二视频兴趣向量、所述第二物品兴趣向量、所述第二视频内容兴趣向量和所述第二视频物品兴趣向量,确定预测结果;所述预测结果包括所述目标用户对所述多个候选短视频的点击概率;

20、推荐模块,用于根据所述预测结果,对所述目标用户进行短视频推荐。

21、本申请实施例提供一种电子设备,所述设备包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现前述所述的模型训练方法或视频推荐方法。

22、本申请实施例提供一种计算机存储介质,所述计算机存储介质存储有计算机程序;所述计算机程序被执行后能够实现前述所述的模型训练方法或视频推荐方法。

23、本申请实施例提出了一种模型训练方法、视频推荐方法、装置、电子设备和计算机存储介质,该方法包括:获取多个训练样本,每个训练样本包括用户的短视频行为序列、物品行为序列和已曝光的其中一个目标短视频;利用初始视频推荐模型对所述每个训练样本进行提取处理,得到所述用户对所述目标短视频的第一视频兴趣向量和对目标物品的第一物品兴趣向量;所述目标物品为所述目标短视频中的物品;利用初始视频推荐模型对所述第一视频兴趣向量进行解耦处理,得到第一视频内容兴趣向量和第一视频物品兴趣向量;基于所述第一视频兴趣向量、所述第一物品兴趣向量、所述第一视频内容兴趣向量和所述第一视频物品兴趣向量,确定总损失函数;基于所述总损失函数,对所述初始视频推荐模型进行训练,得到视频推荐模型。

24、可以看出,本申请实施例根据各个训练样本的短视频行为序列、物品行为序列和已曝光的短视频对应确定各个用户的视频兴趣向量和物品兴趣向量,这些兴趣后续可用于确定模型损失,即,模型训练过程中不仅考虑到用户与短视频的交互,还考虑到用户与物品的交互,也就是说,本申请实施例能够利用用户与物品的行为数据帮助识别用户的短视频兴趣偏好,可以解决相关技术中因仅考虑用户与视频交互导致推荐效果不佳的问题;另外,通过对视频兴趣向量进行解耦,可以确定出用户对物品本身的兴趣和对视频内容的兴趣,即模型训练过程中还考虑到用户对物品本身和对视频内容的兴趣差异性,如此,可以提升模型的可解释性,确保模型的视频推荐效果。

本文档来自技高网...

【技术保护点】

1.一种模型训练方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述基于所述第一视频兴趣向量、所述第一物品兴趣向量、所述第一视频内容兴趣向量和所述第一视频物品兴趣向量,确定总损失函数,包括:

3.根据权利要求2所述的方法,其特征在于,所述基于所述MMD损失、所述第一视频兴趣向量、所述第一物品兴趣向量、所述第一视频内容兴趣向量和所述第一视频物品兴趣向量,确定所述总损失函数,包括:

4.根据权利要求3所述的方法,其特征在于,所述基于所述MMD损失、所述互信息损失、所述第一视频兴趣向量、所述第一物品兴趣向量、所述第一视频内容兴趣向量和所述第一视频物品兴趣向量,确定所述总损失函数,包括:

5.根据权利要求4所述的方法,其特征在于,所述每个训练样本还包括用户基本特征,所述基于所述MMD损失、所述互信息损失、所述重构损失、所述第一物品兴趣向量和所述第一视频内容兴趣向量,确定所述总损失函数,包括:

6.根据权利要求5所述的方法,其特征在于,所述每个训练样本还包括上下文特征和标签信息,所述标签信息用于指示用户是否点击过所述目标短视频,所述根据所述整体偏好向量、所述视频偏好向量、所述物品偏好向量、所述用户基本特征、所述目标短视频特征和所述目标物品特征,确定交叉熵损失,包括:

7.根据权利要求5或6所述的方法,其特征在于,所述基于所述MMD损失、所述互信息损失、所述重构损失和所述交叉熵损失,确定所述总损失函数,包括:

8.一种视频推荐方法,其特征在于,所述方法包括:

9.一种模型训练装置,其特征在于,所述装置包括:

10.一种视频推荐装置,其特征在于,所述装置包括:

11.一种电子设备,其特征在于,所述设备包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现权利要求1至8任一项所述的方法。

12.一种计算机存储介质,其上存储有计算机程序,其特征在于,该计算机程序被处理器执行时实现权利要求1至8任一项所述的方法。

...

【技术特征摘要】

1.一种模型训练方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述基于所述第一视频兴趣向量、所述第一物品兴趣向量、所述第一视频内容兴趣向量和所述第一视频物品兴趣向量,确定总损失函数,包括:

3.根据权利要求2所述的方法,其特征在于,所述基于所述mmd损失、所述第一视频兴趣向量、所述第一物品兴趣向量、所述第一视频内容兴趣向量和所述第一视频物品兴趣向量,确定所述总损失函数,包括:

4.根据权利要求3所述的方法,其特征在于,所述基于所述mmd损失、所述互信息损失、所述第一视频兴趣向量、所述第一物品兴趣向量、所述第一视频内容兴趣向量和所述第一视频物品兴趣向量,确定所述总损失函数,包括:

5.根据权利要求4所述的方法,其特征在于,所述每个训练样本还包括用户基本特征,所述基于所述mmd损失、所述互信息损失、所述重构损失、所述第一物品兴趣向量和所述第一视频内容兴趣向量,确定所述总损失函数,包括:

6.根据权利要求5所述的方...

【专利技术属性】
技术研发人员:何俊佑邓立曦邢凤陈召新唐烨丁卓冶徐夙龙胡景贺
申请(专利权)人:北京沃东天骏信息技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1