一种模型训练方法、内容推荐方法、装置及电子设备制造方法及图纸

技术编号:39290760 阅读:8 留言:0更新日期:2023-11-07 10:59
本发明专利技术实施例提供了一种模型训练方法、内容推荐方法、装置及电子设备,方法包括:获取关联同一内容数据库的不同应用程序下样本用户的第一用户属性特征、样本内容属性特征及样本上下文特征;针对每一应用程序,获取该应用程序下样本用户的第二用户属性特征,将第二用户属性特征输入第一待训练模型中得到预测权重;将第一用户属性特征、样本内容属性特征及样本上下文特征输入第二待训练模型中,利用预测权重调整第二待训练模型的稀疏特征,预测样本用户行为得到预测行为标签;根据行为标签和预测行为标签计算第二待训练模型的损失,根据损失调整第一待训练模型和第二待训练模型的参数。应用本发明专利技术方案,实现了模型的充分训练,为用户准确推荐内容。户准确推荐内容。户准确推荐内容。

【技术实现步骤摘要】
一种模型训练方法、内容推荐方法、装置及电子设备


[0001]本专利技术涉及内容推荐
,特别是涉及一种模型训练方法、内容推荐方法、装置及电子设备。

技术介绍

[0002]在视频推荐领域,视频推荐系统通常存在多个分支入口,对应多个应用程序或者对应一个应用程序的多个接口,将每一分支对应一种场景。相关技术中,为了在不同场景中为用户准确的推荐视频,针对不同的场景,分别训练排序模型,然后,在不同的场景中利用针对该场景所训练的排序模型对待推荐视频进行排序,之后根据排序结果向用户推荐视频。
[0003]针对不同的场景,分别训练排序模型,模型训练成本高,且因排序模型是针对单一场景训练的,存在小场景流量小的问题,使得训练所采用的样本数量有限,可能导致排序模型训练不充分,进而影响视频推荐结果。

技术实现思路

[0004]本专利技术实施例的目的在于提供一种模型训练方法、内容推荐方法、装置及电子设备,以实现充分训练模型,为用户准确的推荐内容。具体技术方案如下:
[0005]在本专利技术实施的第一方面,首先提供了一种模型训练方法,所述方法包括:
[0006]获取关联同一内容数据库的不同应用程序下样本用户的第一用户属性特征、所述样本用户已访问样本内容的样本内容属性特征、以及所述样本用户访问所述样本内容时的样本上下文特征,所述样本用户对应有行为标签,所述行为标签用于表示所述样本用户访问所述样本内容的实际操作信息,所述样本上下文特征用于表征所述样本用户访问所述样本内容时的环境特征;
[0007]针对每一应用程序,获取该应用程序下所述样本用户的第二用户属性特征;
[0008]将该应用程序下所述样本用户的第二用户属性特征输入第一待训练模型中进行权重预测,得到该应用程序下所述样本用户的预测权重;
[0009]将所述样本用户的第一用户属性特征、所述样本内容属性特征以及所述样本上下文特征输入第二待训练模型中,利用所述预测权重对所述第二待训练模型的稀疏特征进行调整,对所述样本用户进行行为预测,得到该应用程序下所述样本用户针对所述样本内容的预测行为标签;
[0010]根据所述行为标签以及所述预测行为标签,计算所述第二待训练模型的损失,并根据所述损失对所述第一待训练模型以及所述第二待训练模型的参数进行调整。
[0011]在一种可能的实施方式中,所述第一用户属性特征包括:所述样本用户的用户ID、年龄、性别、VIP属性、登录属性、观看历史行为属性、点击历史行为属性以及长期画像、短期画像中的至少一种;所述样本内容属性特征包括:内容ID、内容类型、内容上传用户ID、内容上传用户属性中的至少一种;所述样本上下文特征包括:节假日、时间、地点、季节、天气中
的至少一种。
[0012]在一种可能的实施方式中,所述行为标签包括:点击率、观看时长、评论率、点赞率以及完播率中的至少一种;所述第二用户属性特征包括:场景ID,场景人均播放时长,所述样本用户的VIP属性、登录属性、观看历史行为属性、点击历史行为属性以及长期画像、短期画像中的至少一种。
[0013]在一种可能的实施方式中,所述利用所述预测权重对所述第二待训练模型的稀疏特征进行调整,包括:
[0014]对所述样本用户的第一用户属性特征、所述样本内容属性特征以及所述样本上下文特征进行拼接,得到第二待训练模型的稀疏特征;
[0015]将所述预测权重作为所述第二待训练模型的稀疏特征的Embedding权重。
[0016]在一种可能的实施方式中,所述第一待训练模型与所述第二待训练模型的结构相同。
[0017]在本专利技术实施的第二方面,提供了一种内容推荐方法,所述方法包括:
[0018]获取目标应用程序中目标用户的目标用户属性特征;
[0019]针对每一待排序内容,获取该待排序内容对应的候选用户属性特征、候选内容属性特征以及候选上下文特征;
[0020]将所述目标用户属性特征输入预先训练好的第一模型中进行权重预测,得到所述目标用户在所述目标应用程序中的目标预测权重;
[0021]针对每一待排序内容,将该待排序内容对应的候选用户属性特征、候选内容属性特征以及候选上下文特征输入预先训练好的第二模型中,利用所述目标预测权重对所述第二模型的稀疏特征进行调整,对所述目标用户进行行为预测,得到所述目标用户在所述目标应用程序中针对该待排序内容的目标行为标签;其中,所述目标行为标签用于表示所述目标用户对待排序内容的实际操作信息;所述预先训练好的第一模型和所述预先训练好的第二模型为采用上述第一方面所述的方法训练得到的;
[0022]基于各目标行为标签,计算各待排序内容的得分;
[0023]根据所述得分对各所述待排序内容进行排序,并根据排序结果,向所述目标用户推荐目标内容。
[0024]在一种可能的实施方式中,所述目标用户属性特征包括:场景ID,场景人均播放时长,所述目标用户的VIP属性、登录属性、观看历史行为属性、点击历史行为属性以及长期画像、短期画像中的至少一种;所述候选用户属性特征包括:用户点击率、平均播放时长、点赞率中的至少一种;所述候选内容属性特征包括:内容ID、内容类型、内容上传用户ID、内容上传用户属性中的至少一种;所述候选上下文特征包括:当前时间、地点、天气、网络环境中的至少一种;所述目标行为标签包括:点击率、观看时长、评论率、点赞率以及完播率中的至少一种。
[0025]在一种可能的实施方式中,所述利用所述目标预测权重对所述第二模型的稀疏特征进行调整,包括:
[0026]对所述待排序内容对应的候选用户属性特征、候选内容属性特征以及候选上下文特征进行拼接,得到第二模型的稀疏特征;
[0027]将所述目标预测权重作为所述第二模型的稀疏特征的Embedding权重。
[0028]在本专利技术实施的第三方面,还提供了一种模型训练装置,所述装置包括:
[0029]第一数据获取模块,用于获取关联同一内容数据库的不同应用程序下样本用户的第一用户属性特征、所述样本用户已访问样本内容的样本内容属性特征、以及所述样本用户访问所述样本内容时的样本上下文特征,所述样本用户对应有行为标签,所述行为标签用于表示所述样本用户访问所述样本内容的实际操作信息,所述样本上下文特征用于表征所述样本用户访问所述样本内容时的环境特征;
[0030]第二数据获取模块,用于针对每一应用程序,获取该应用程序下所述样本用户的第二用户属性特征;
[0031]第一权重预测模块,用于将该应用程序下所述样本用户的第二用户属性特征输入第一待训练模型中进行权重预测,得到该应用程序下所述样本用户的预测权重;
[0032]第一行为预测模块,用于将所述样本用户的第一用户属性特征、所述样本内容属性特征以及所述样本上下文特征输入第二待训练模型中,利用所述预测权重对所述第二待训练模型的稀疏特征进行调整,对所述样本用户进行行为预测,得到该应用程序下所述样本用户针对所述样本内容的预测行为标签;
[0033本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种模型训练方法,其特征在于,所述方法包括:获取关联同一内容数据库的不同应用程序下样本用户的第一用户属性特征、所述样本用户已访问样本内容的样本内容属性特征、以及所述样本用户访问所述样本内容时的样本上下文特征,所述样本用户对应有行为标签,所述行为标签用于表示所述样本用户访问所述样本内容的实际操作信息,所述样本上下文特征用于表征所述样本用户访问所述样本内容时的环境特征;针对每一应用程序,获取该应用程序下所述样本用户的第二用户属性特征;将该应用程序下所述样本用户的第二用户属性特征输入第一待训练模型中进行权重预测,得到该应用程序下所述样本用户的预测权重;将所述样本用户的第一用户属性特征、所述样本内容属性特征以及所述样本上下文特征输入第二待训练模型中,利用所述预测权重对所述第二待训练模型的稀疏特征进行调整,对所述样本用户进行行为预测,得到该应用程序下所述样本用户针对所述样本内容的预测行为标签;根据所述行为标签以及所述预测行为标签,计算所述第二待训练模型的损失,并根据所述损失对所述第一待训练模型以及所述第二待训练模型的参数进行调整。2.根据权利要求1所述的方法,其特征在于,所述第一用户属性特征包括:所述样本用户的用户ID、年龄、性别、VIP属性、登录属性、观看历史行为属性、点击历史行为属性以及长期画像、短期画像中的至少一种;所述样本内容属性特征包括:内容ID、内容类型、内容上传用户ID、内容上传用户属性中的至少一种;所述样本上下文特征包括:节假日、时间、地点、季节、天气中的至少一种。3.根据权利要求1所述的方法,其特征在于,所述行为标签包括:点击率、观看时长、评论率、点赞率以及完播率中的至少一种;所述第二用户属性特征包括:场景ID,场景人均播放时长,所述样本用户的VIP属性、登录属性、观看历史行为属性、点击历史行为属性以及长期画像、短期画像中的至少一种。4.根据权利要求1

3任一所述的方法,其特征在于,所述利用所述预测权重对所述第二待训练模型的稀疏特征进行调整,包括:对所述样本用户的第一用户属性特征、所述样本内容属性特征以及所述样本上下文特征进行拼接,得到第二待训练模型的稀疏特征;将所述预测权重作为所述第二待训练模型的稀疏特征的Embedding权重。5.根据权利要求1所述的方法,其特征在于,所述第一待训练模型与所述第二待训练模型的结构相同。6.一种内容推荐方法,其特征在于,所述方法包括:获取目标应用程序中目标用户的目标用户属性特征;针对每一待排序内容,获取该待排序内容对应的候选用户属性特征、候选内容属性特征以及候选上下文特征;将所述目标用户属性特征输入预先训练好的第一模型中进行权重预测,得到所述目标用户在所述目标应用程序中的目标预测权重;针对每一待排序内容,将该待排序内容对应的候选用户属性特征、候选内容属性特征以及候选上下文特征输入预先训练好的第二模型中,利用所述目标预测权重对所述第二模
型的稀疏特征进行调整,对所述目标用户进行行为预测,得到所述目标用户在所述目标应用程序中针对该待排序内容的目标行为标签;其中,所述目标行为标签用于表示所述目标用户对待排序内容的实际操作信息;所述预先训练好的第一模型和所述预先训练好的第二模型为采用权利要求1

5任一方法训练得到的;基于各目标行为标签,计算各待排序内容的得分;根据所述得分对各所述待排序内容进行排序,并根据排序结果,向所述目标用户推荐目标内容。7.根据权利要求6所述的方法,其特征在于,所述目标用户属性特征包括:场景ID,场景人均播放时长,所述目标用户的VIP属性、登录属性、观看历史行为属性、点击历史行为属性以及长期画像、短期画像中的至少一种;所述候选用户属...

【专利技术属性】
技术研发人员:赵明明查强
申请(专利权)人:北京奇艺世纪科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1