一种模型训练方法、视频推荐方法、装置及电子设备制造方法及图纸

技术编号:39272245 阅读:10 留言:0更新日期:2023-11-07 10:51
本发明专利技术实施例提供了一种模型训练方法、视频推荐方法、装置及电子设备,所述方法包括:获取样本用户的样本用户属性特征、样本用户观看的样本视频的样本视频属性特征和样本用户观看样本视频时的样本上下文特征,样本用户对应有行为标签;将样本用户属性特征中目标维度的维度特征输入第一待训练模型中进行权重预测得到预测权重;利用预测权重更新第二待训练模型的权重;将样本用户属性特征、样本视频属性特征和样本上下文特征输入第二待训练模型中进行行为预测得到预测行为标签;根据行为标签和预测行为标签计算第二待训练模型的损失,根据损失对第一待训练模型和第二待训练模型的参数调整。应用本发明专利技术技术方案,实现了为用户更准确的推荐视频。更准确的推荐视频。更准确的推荐视频。

【技术实现步骤摘要】
一种模型训练方法、视频推荐方法、装置及电子设备


[0001]本专利技术涉及视频推荐
,特别是涉及一种模型训练方法、视频推荐方法、装置及电子设备。

技术介绍

[0002]在视频推荐领域,为了对召回的多个待推荐视频进行排序,在排序阶段,针对各待推荐视频,需要融合该待推荐视频各个维度的特征,比如用户是否观看、观看时长、视频的类型等等,充分拟合用户偏好,以使用户偏好更好的匹配视频内容,进而实现对该待推荐视频精确的打分。
[0003]相关技术中,为实现视频的准确推荐,获取一段时间内用户的属性数据以及视频的属性数据,用户的属性数据比如用户年龄、性别、是否观看,视频的属性数据比如视频标识、视频类型。然后,将用户的属性数据以及视频的属性数据作为训练样本,将视频的点击率、点赞率作为训练样本的标签,训练神经网络模型,再利用所训练的神经网络模型对各待推荐视频的点击率、点赞率进行预测,根据预测得到的各待推荐视频的点击率、点赞率,计算各待推荐视频的得分,最后,根据得分对各待推荐视频进行排序,将排序第一或排序靠前的N个待推荐视频推荐给用户。
[0004]然而,在上述实现视频推荐的过程中,虽然是利用用户的属性数据、视频的属性数据、以及视频的点击率、点赞率训练的神经网络模型,使得神经网络模型的训练特征多样化,也就是训练特征千人千面,但是,在视频推荐的过程中,不同用户使用的仍然是相同的神经网络模型,即神经网络模型是千人一面的,这依然容易导致视频推荐准确度不高的问题。尤其在短视频场景中,因用户的属性数据存在长尾分布的现象,使得训练得到的神经网络模型的预测结果容易受活跃用户的属性数据的影响,进而影响视频推荐的准确度。

技术实现思路

[0005]本专利技术实施例的目的在于提供一种模型训练方法、视频推荐方法、装置及电子设备,以实现为用户更准确的推荐视频。具体技术方案如下:
[0006]在本专利技术实施的第一方面,首先提供了一种模型训练方法,所述方法包括:
[0007]获取样本用户的样本用户属性特征、所述样本用户观看的样本视频的样本视频属性特征、以及所述样本用户观看所述样本视频时的样本上下文特征,所述样本用户对应有行为标签,所述行为标签用于表示所述样本用户对所述样本视频的实际操作信息,所述样本上下文特征用于表征所述样本用户观看所述样本视频时的环境特征;
[0008]将所述样本用户属性特征中目标维度的维度特征输入第一待训练模型中进行权重预测,得到所述样本用户的预测权重;
[0009]利用所述预测权重更新第二待训练模型的权重;
[0010]将所述样本用户属性特征、所述样本视频属性特征以及所述样本上下文特征输入第二待训练模型中进行行为预测,得到所述样本用户针对所述样本视频的预测行为标签;
[0011]根据所述行为标签以及所述预测行为标签,计算所述第二待训练模型的损失,并根据所述损失对所述第一待训练模型以及所述第二待训练模型的参数进行调整;其中,所述第一待训练模型与所述第二待训练模型的结构相同。
[0012]在一种可能的实施方式中,所述样本用户属性特征包括:所述样本用户的用户ID、年龄、性别、VIP属性、登录属性、观看历史行为属性、点击历史行为属性以及长期画像、短期画像中的至少一种;所述样本视频属性特征包括:视频ID、视频类型、视频上传用户ID、视频上传用户属性中的至少一种;所述样本上下文特征包括:节假日、时间、地点、季节、天气中的至少一种;所述目标维度的维度特征为所述样本用户属性特征中的部分特征;所述行为标签包括:点击率、观看时长以及完播率中的至少一种。
[0013]在一种可能的实施方式中,所述第一待训练模型输出预测权重的个数是根据所述第二待训练模型的层数确定的,每一预测权重的维度与所述第二待训练模型对应层权重的维度相同。
[0014]在一种可能的实施方式中,所述将所述样本用户属性特征中目标维度的维度特征输入第一待训练模型中进行权重预测,得到所述样本用户的预测权重,包括:将所述样本用户属性特征中目标维度的维度特征输入第一待训练模型中,分别针对所述第二待训练模型中除输入层和输出层之外的各层进行权重预测,得到所述样本用户的多个预测权重;
[0015]所述利用所述预测权重更新第二待训练模型的权重,包括:针对所述第二待训练模型中除输入层和输出层之外的各层,将该层的权重更新为该层权重与对应的预测权重的乘积。
[0016]在本专利技术实施的第二方面,提供了一种视频推荐方法,所述方法包括:
[0017]获取目标用户的目标用户属性特征;
[0018]将所述目标用户属性特征中目标维度的维度特征输入预先训练好的第一模型中进行权重预测,得到目标预测权重;
[0019]利用所述目标预测权重更新预先训练好的第二模型的权重;其中,所述预先训练好的第一模型和所述预先训练好的第二模型为采用上述第一方面所述的方法训练得到的;
[0020]针对每一待排序视频,获取该待排序视频对应的候选用户属性特征、候选视频属性特征、以及候选上下文特征;
[0021]将所述候选用户属性特征、所述候选视频属性特征以及所述候选上下文特征输入所述预先训练好的第二模型中进行行为预测,得到所述目标用户针对该待排序视频的目标行为标签;所述目标行为标签用于表示所述目标用户对待排序视频的实际操作信息;
[0022]基于各目标行为标签,计算各待排序视频的得分;
[0023]根据所述得分对各所述待排序视频进行排序,并根据排序结果,向所述目标用户推荐目标视频。
[0024]在一种可能的实施方式中,所述目标用户属性特征包括:所述目标用户的用户ID、年龄、性别、VIP属性、登录属性、观看历史行为属性、点击历史行为属性以及长期画像、短期画像中的至少一种;所述目标维度的维度特征为所述目标用户属性特征中的部分特征;所述候选用户属性特征包括:用户点击率、平均播放时长、点赞率中的至少一种;所述候选视频属性特征包括:视频ID、视频类型、视频上传用户ID、视频上传用户属性中的至少一种;所述候选上下文特征包括:当前时间、地点、天气、网络环境中的至少一种;所述目标行为标签
包括:点击率、观看时长以及完播率中的至少一种。
[0025]在本专利技术实施的第三方面,还提供了一种模型训练装置,所述装置包括:
[0026]第一数据获取模块,用于获取样本用户的样本用户属性特征、所述样本用户观看的样本视频的样本视频属性特征、以及所述样本用户观看所述样本视频时的样本上下文特征,所述样本用户对应有行为标签,所述行为标签用于表示所述样本用户对所述样本视频的实际操作信息,所述样本上下文特征用于表征所述样本用户观看所述样本视频时的环境特征;
[0027]第一权重预测模块,用于将所述样本用户属性特征中目标维度的维度特征输入第一待训练模型中进行权重预测,得到所述样本用户的预测权重;
[0028]第一权重更新模块,用于利用所述预测权重更新第二待训练模型的权重;
[0029]第一行为预测模块,用于将所述样本用户本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种模型训练方法,其特征在于,所述方法包括:获取样本用户的样本用户属性特征、所述样本用户观看的样本视频的样本视频属性特征、以及所述样本用户观看所述样本视频时的样本上下文特征,所述样本用户对应有行为标签,所述行为标签用于表示所述样本用户对所述样本视频的实际操作信息,所述样本上下文特征用于表征所述样本用户观看所述样本视频时的环境特征;将所述样本用户属性特征中目标维度的维度特征输入第一待训练模型中进行权重预测,得到所述样本用户的预测权重;利用所述预测权重更新第二待训练模型的权重;将所述样本用户属性特征、所述样本视频属性特征以及所述样本上下文特征输入第二待训练模型中进行行为预测,得到所述样本用户针对所述样本视频的预测行为标签;根据所述行为标签以及所述预测行为标签,计算所述第二待训练模型的损失,并根据所述损失对所述第一待训练模型以及所述第二待训练模型的参数进行调整;其中,所述第一待训练模型与所述第二待训练模型的结构相同。2.根据权利要求1所述的方法,其特征在于,所述样本用户属性特征包括:所述样本用户的用户ID、年龄、性别、VIP属性、登录属性、观看历史行为属性、点击历史行为属性以及长期画像、短期画像中的至少一种;所述样本视频属性特征包括:视频ID、视频类型、视频上传用户ID、视频上传用户属性中的至少一种;所述样本上下文特征包括:节假日、时间、地点、季节、天气中的至少一种;所述目标维度的维度特征为所述样本用户属性特征中的部分特征;所述行为标签包括:点击率、观看时长以及完播率中的至少一种。3.根据权利要求2所述的方法,其特征在于,所述第一待训练模型输出预测权重的个数是根据所述第二待训练模型的层数确定的,每一预测权重的维度与所述第二待训练模型对应层权重的维度相同。4.根据权利要求3所述的方法,其特征在于,所述将所述样本用户属性特征中目标维度的维度特征输入第一待训练模型中进行权重预测,得到所述样本用户的预测权重,包括:将所述样本用户属性特征中目标维度的维度特征输入第一待训练模型中,分别针对所述第二待训练模型中除输入层和输出层之外的各层进行权重预测,得到所述样本用户的多个预测权重;所述利用所述预测权重更新第二待训练模型的权重,包括:针对所述第二待训练模型中除输入层和输出层之外的各层,将该层的权重更新为该层权重与对应的预测权重的乘积。5.一种视频推荐方法,其特征在于,所述方法包括:获取目标用户的目标用户属性特征;将所述目标用户属性特征中目标维度的维度特征输入预先训练好的第一模型中进行权重预测,得到目标预测权重;利用所述目标预测权重更新预先训练好的第二模型的权重;其中,所述预先训练好的第一模型和所述预先训练好的第二模型为采用权利要求1

4任一方法训练得到的;针对每一待排序视频,获取该待排序视频对应的候选用户属性特征、候选视频属性特征、以及候选上下文特征;将所述候选用户属性特征、所述候选视频属性特征以及所述候选上下文特征输入所述
预先训练好的第二模型中进行行为预测,得到所述目标用户针对该待排序视频的目标行为标签;所述目标行为标签用于表示所述目标用户对待排序视频的实际操作信息;基于各目标行为标签,计算各待排序视频的得分;根据所述得分对各所述待排序视频进行排序,并根据排序结果,向所述目标用户推荐目标视频。6.根据权利要求5所述的方法,其特征在于,所述目标用户属性特征包括...

【专利技术属性】
技术研发人员:赵明明查强
申请(专利权)人:北京奇艺世纪科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1