视频推送模型的训练方法、装置、服务器及存储介质制造方法及图纸

技术编号:30632417 阅读:15 留言:0更新日期:2021-11-04 00:02
本公开关于一种视频推送模型的训练方法、装置、服务器及存储介质,该方法包括:获取样本账户的账户信息和所述样本账户对推送的视频信息的实际操作信息;将所述账户信息和所述视频信息输入视频操作预测模型,得到所述样本账户对所述视频信息的预测操作信息;根据所述预测操作信息以及所述实际操作信息,对所述视频操作预测模型进行训练;根据训练后的所述视频操作预测模型,得到多个所述样本账户对目标视频信息的预测操作信息,作为待训练的视频推送模型的训练样本数据;根据所述训练样本数据,对所述待训练的视频推送模型进行训练。采用本方法,能够提高视频推送模型的训练效率。能够提高视频推送模型的训练效率。能够提高视频推送模型的训练效率。

【技术实现步骤摘要】
视频推送模型的训练方法、装置、服务器及存储介质


[0001]本公开涉及计算机
,尤其涉及一种视频推送模型的训练方法、装置、服务器及存储介质。

技术介绍

[0002]随着计算机技术的发展,各种用于浏览视频的应用程序层出不穷,越来越多的账户选择通过应用程序来浏览视频;为了实现视频的精准推送,一般是通过训练用于推送视频的模型来确定推送给账户的视频。
[0003]相关技术中,对用于推送视频的模型的训练方式,一般是通过采集线上的大量视频操作样本数据,对用于推送视频的模型进行反复训练,直至用于推送视频的模型达到收敛;但是,通过采集线上的大量视频操作样本数据的过程比较繁琐,导致模型的训练时间较长,从而造成模型的训练效率较低。

技术实现思路

[0004]本公开提供一种视频推送模型的训练方法、装置、服务器及存储介质,以至少解决相关技术中模型的训练效率较低的问题。本公开的技术方案如下:
[0005]根据本公开实施例的第一方面,提供一种视频推送模型的训练方法,包括:
[0006]获取样本账户的账户信息和所述样本账户对推送的视频信息的实际操作信息;
[0007]将所述账户信息和所述视频信息输入视频操作预测模型,得到所述样本账户对所述视频信息的预测操作信息;
[0008]根据所述预测操作信息以及所述实际操作信息,对所述视频操作预测模型进行训练;
[0009]根据训练后的所述视频操作预测模型,得到多个所述样本账户对目标视频信息的预测操作信息,作为待训练的视频推送模型的训练样本数据;
[0010]根据所述训练样本数据,对所述待训练的视频推送模型进行训练。
[0011]在一示例性实施例中,所述将所述账户信息和所述视频信息输入视频操作预测模型,得到所述样本账户对所述视频信息的预测操作信息,包括:
[0012]从所述视频信息中提取出所述样本账户在预设时刻之前依次操作过的第一视频信息以及所述样本账户在所述预设时刻操作过的第二视频信息;
[0013]获取所述账户信息的账户信息特征编码和所述第一视频信息的第一视频信息特征编码;
[0014]将所述账户信息特征编码和所述第一视频信息特征编码输入所述视频操作预测模型中的账户状态编码网络,得到所述样本账户在所述预设时刻的账户状态编码;
[0015]将所述第二视频信息的第二视频信息特征编码和所述账户状态编码输入所述视频操作预测模型中的操作预测网络,得到所述样本账户在所述预设时刻对所述第二视频信息的预测操作信息。
[0016]在一示例性实施例中,所述将所述账户信息特征编码和所述第一视频信息特征编码输入所述视频操作预测模型中的账户状态编码网络,得到所述样本账户在所述预设时刻的账户状态编码,包括:
[0017]将所述第一视频信息特征编码输入所述账户状态编码网络中的第一网络,得到所述预设时刻的视频状态编码;
[0018]将所述账户信息特征编码和所述视频状态编码输入所述账户状态编码网络中的第二网络,得到所述样本账户在所述预设时刻的账户状态编码。
[0019]在一示例性实施例中,所述将所述第二视频信息特征编码和所述账户状态编码输入所述视频操作预测模型中的操作预测网络,得到所述样本账户对所述第二视频信息的预测操作信息,包括:
[0020]将所述第二视频信息特征编码和所述账户状态编码输入所述视频操作预测模型中的操作预测网络,得到所述样本账户对所述第二视频信息的多个操作行为概率;
[0021]根据所述多个操作行为概率所对应的预设权重,对所述多个操作行为概率进行加权处理,得到所述样本账户对所述第二视频信息的目标操作概率,对应作为所述样本账户在所述预设时刻对所述第二视频信息的预测操作信息。
[0022]在一示例性实施例中,所述样本账户对目标视频信息的预测操作信息包括所述样本账户在各个所述预设时刻对目标视频信息的预测操作信息;
[0023]所述根据所述训练样本数据,对所述待训练的视频推送模型进行训练,包括:
[0024]获取所述目标视频信息的目标视频信息特征编码;
[0025]将所述账户信息特征编码和所述目标视频信息特征编码输入所述待训练的视频推送模型中的账户状态编码网络,得到所述样本账户在各个所述预设时刻的目标账户状态编码;
[0026]将所述目标视频信息特征编码和所述目标账户状态编码输入所述待训练的视频推送模型中的操作预测网络,得到所述样本账户在各个所述预设时刻对所述目标视频信息的目标预测操作信息;
[0027]将所述目标预测操作信息输入预设的视频推送评价模型,得到所述样本账户在各个所述预设时刻对所述目标视频信息的操作反馈值;
[0028]根据所述目标账户状态编码、所述样本账户在各个所述预设时刻对所述目标视频信息的预测操作信息、所述目标预测操作信息和所述操作反馈值,对所述待训练的视频推送模型和所述预设的视频推送评价模型进行反复训练,直到所述待训练的视频推送模型和所述预设的视频推送评价模型均满足收敛条件。
[0029]根据本公开实施例的第二方面,提供一种视频推送方法,包括:
[0030]获取待推送账户的账户信息;
[0031]将所述待推送账户的账户信息输入训练完成的视频推送模型,得到所述待推送账户的推送视频信息;所述训练完成的视频推送模型根据上述所述的视频推送模型的训练方法得到;
[0032]将所述推送视频信息推送至所述待推送账户。
[0033]在一示例性实施例中,将所述推送视频信息推送至所述待推送账户,包括:
[0034]按照所述训练完成的视频推送模型输出所述推送视频信息的顺序,将所述推送视
频信息进行排列,得到排列后的推送视频信息;
[0035]将所述排列后的推送视频信息推送至所述待推送账户。
[0036]根据本公开实施例的第三方面,提供一种视频推送模型的训练装置,包括:
[0037]信息获取单元,被配置为执行获取样本账户的账户信息和所述样本账户对推送的视频信息的实际操作信息;
[0038]信息预测单元,被配置为执行将所述账户信息和所述视频信息输入视频操作预测模型,得到所述样本账户对所述视频信息的预测操作信息;
[0039]预测模型训练单元,被配置为执行根据所述预测操作信息以及所述实际操作信息,对所述视频操作预测模型进行训练;
[0040]样本数据获取单元,被配置为执行根据训练后的所述视频操作预测模型,得到多个所述样本账户对目标视频信息的预测操作信息,作为待训练的视频推送模型的训练样本数据;
[0041]推送模型训练单元,被配置为执行根据所述训练样本数据,对所述待训练的视频推送模型进行训练。
[0042]在一示例性实施例中,所述信息预测单元,还被配置为执行从所述视频信息中提取出所述样本账户在预设时刻之前依次操作过的第一视频信息以及所述样本账户在所述预设时刻操作过的第二视频信息;获取所述账户信息的账户信息特征编码和所述第一视频信息的本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种视频推送模型的训练方法,其特征在于,包括:获取样本账户的账户信息和所述样本账户对推送的视频信息的实际操作信息;将所述账户信息和所述视频信息输入视频操作预测模型,得到所述样本账户对所述视频信息的预测操作信息;根据所述预测操作信息以及所述实际操作信息,对所述视频操作预测模型进行训练;根据训练后的所述视频操作预测模型,得到多个所述样本账户对目标视频信息的预测操作信息,作为待训练的视频推送模型的训练样本数据;根据所述训练样本数据,对所述待训练的视频推送模型进行训练。2.根据权利要求1所述的视频推送模型的训练方法,其特征在于,所述将所述账户信息和所述视频信息输入视频操作预测模型,得到所述样本账户对所述视频信息的预测操作信息,包括:从所述视频信息中提取出所述样本账户在预设时刻之前依次操作过的第一视频信息以及所述样本账户在所述预设时刻操作过的第二视频信息;获取所述账户信息的账户信息特征编码和所述第一视频信息的第一视频信息特征编码;将所述账户信息特征编码和所述第一视频信息特征编码输入所述视频操作预测模型中的账户状态编码网络,得到所述样本账户在所述预设时刻的账户状态编码;将所述第二视频信息的第二视频信息特征编码和所述账户状态编码输入所述视频操作预测模型中的操作预测网络,得到所述样本账户在所述预设时刻对所述第二视频信息的预测操作信息。3.根据权利要求2所述的视频推送模型的训练方法,其特征在于,所述将所述账户信息特征编码和所述第一视频信息特征编码输入所述视频操作预测模型中的账户状态编码网络,得到所述样本账户在所述预设时刻的账户状态编码,包括:将所述第一视频信息特征编码输入所述账户状态编码网络中的第一网络,得到所述预设时刻的视频状态编码;将所述账户信息特征编码和所述视频状态编码输入所述账户状态编码网络中的第二网络,得到所述样本账户在所述预设时刻的账户状态编码。4.根据权利要求2所述的视频推送模型的训练方法,其特征在于,所述将所述第二视频信息特征编码和所述账户状态编码输入所述视频操作预测模型中的操作预测网络,得到所述样本账户在所述预设时刻对所述第二视频信息的预测操作信息,包括:将所述第二视频信息特征编码和所述账户状态编码输入所述视频操作预测模型中的操作预测网络,得到所述样本账户对所述第二视频信息的多个操作行为概率;根据所述多个操作行为概率所对应的预设权重,对所述多个操作行为概率进行加权处理,得到所述样本账户对所述第二视频信息的目标操作概率,对应作为所述样本账户在所述预设时刻对所述第二视频信息的预测操作信息。5.根据权利要求2所述的视频推送模型的训练方法,其特征在于,所述样本账户对目标视频信息的预测操作信息包括所述样本账户在各个所述预设时刻对目标视频信息的预测操作信息;所述根据所述训练样本数据,对所述待训练的视频推送模型...

【专利技术属性】
技术研发人员:王琳叶璨黄俊逸胥凯闫阳辉
申请(专利权)人:北京达佳互联信息技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1