训练视频特征提取模型和视频推荐的方法和装置制造方法及图纸

技术编号:34796703 阅读:23 留言:0更新日期:2022-09-03 20:02
本申请公开了一种训练视频特征提取模型和视频推荐的方法和装置,属于计算机技术领域。该方法包括:基于待训练的视频特征提取模型对目标样本视频的属性信息进行特征提取,得到视频特征信息,基于待训练的账户特征提取模型对样本账户对应的视频类型偏好信息进行特征提取,得到账户特征信息;将视频特征信息、账户特征信息输入待训练的视频相似度预测模型,输出预测相似度;基于预测相似度和基准相似度对待训练的视频特征提取模型、待训练的账户特征提取模型和待训练的视频相似度预测模型进行调参。采用本申请,可以基于目标样本视频本身的属性特征和播放过该目标样本视频的样本账户的视频类型偏好信息得到较为准确的视频特征信息。特征信息。特征信息。

【技术实现步骤摘要】
训练视频特征提取模型和视频推荐的方法和装置


[0001]本申请涉及计算机
,特别涉及一种训练视频特征提取模型和视频推荐的方法和装置。

技术介绍

[0002]当前,在一些具有视频播放功能的应用程序中,当用户观看完一个视频后,会在该视频的播放页面中为用户推荐与该视频相似的其他视频,以提高用户的使用体验。通常的确定相似视频的方法是先对视频特征提取模型进行训练,然后使用训练完成的视频特征提取模型对每个视频进行特征提取,从而得到每个视频对应的视频特征信息,再基于视频特征信息计算每个视频与最新播放视频之间的相似度,最后将相似度高的视频推荐给用户。
[0003]当前的对视频特征提取模型进行训练的方法是:获取目标样本视频的属性信息和视频类型,将目标样本视频的属性信息输入待训练的视频特征提取模型从而得到输出的目标样本视频对应的视频特征信息,然后将目标样本视频对应的视频特征信息输入待训练的分类模型中,从而得到输出的目标样本视频对应的预测视频类型,最后,基于目标样本视频的视频类型和预测视频类型对待训练的视频特征提取模型和待训练的分类模型进行训练,从而得到训练完成的视频特征提取模型。
[0004]但上述训练方法较为粗糙,使用上述视频特征提取模型得到的视频特征信息是与用户没有任何关联的特征信息,其视频特征信息可能会较为不准确,在使用该视频特征信息确定相似视频并向用户进行推荐后,推荐的效果可能会较差。

技术实现思路

[0005]本申请实施例提供了一种训练视频特征提取模型和视频推荐的方法,能够解决现有技术中训练方法较为粗糙,导致得到的视频特征信息可以会较为不准确的问题。
[0006]第一方面,提供了一种训练视频特征提取模型的方法,所述方法包括:
[0007]获取样本账户播放过的目标样本视频的属性信息、所述目标样本视频对应的参考样本视频、以及所述目标样本视频与所述参考样本视频的基准相似度;
[0008]基于待训练的视频特征提取模型对所述属性信息进行特征提取,得到视频特征信息,基于待训练的账户特征提取模型对所述样本账户对应的视频类型偏好信息进行特征提取,得到账户特征信息;
[0009]将所述视频特征信息、所述账户特征信息输入待训练的视频相似度预测模型,输出所述目标样本视频与所述参考样本视频的预测相似度;
[0010]基于所述预测相似度和所述基准相似度,对所述待训练的视频特征提取模型、所述待训练的账户特征提取模型和所述待训练的视频相似度预测模型进行调参;
[0011]若满足预设结束条件,则将调参后的视频特征提取模型确定为训练完成的视频特征提取模型。
[0012]在一种可能的实现方式中,所述参考样本视频包括正样本视频和负样本视频,所
述目标样本视频与所述参考样本视频的基准相似度包括所述目标样本视频与所述正样本视频的第一基准相似度、以及所述目标样本视频与所述负样本视频的第二基准相似度;
[0013]获取所述目标样本视频对应的参考样本视频、以及所述目标样本视频与所述参考样本视频的基准相似度,包括:
[0014]获取所述样本账户播放过、且与所述目标样本视频满足播放时间接近条件的视频,作为所述目标样本视频对应的正样本视频,其中,所述第一基准相似度为第一数值;
[0015]获取除了所述目标样本视频和所述正样本视频之外的视频,作为所述目标样本视频对应的负样本视频,其中,所述第二基准相似度为第二数值,所述第二数值小于所述第一数值。
[0016]在一种可能的实现方式中,所述获取所述样本账户播放过、且与所述目标样本视频满足播放时间接近条件的视频,作为所述目标样本视频对应的正样本视频,包括:
[0017]获取所述样本账户播放过、且播放时间点与所述目标样本视频的播放时间点之间的时间差值小于预设时差阈值的至少一个视频,作为待定正样本视频;
[0018]基于播放时间点,将所述待定正样本视频按顺序排列,得到待定正样本视频序列;
[0019]将在所述待定正样本视频序列中,与所述目标样本视频之间间隔视频的数目小于预设数目的待定正样本视频,确定为所述目标样本视频对应的正样本视频。
[0020]在一种可能的实现方式中,所述目标样本视频的属性信息包括所述目标样本视频的标识信息和所述目标样本视频的边信息,其中,所述目标样本视频的标识信息用于表示所述目标样本视频的唯一标志,所述目标样本视频的边信息是与所述目标样本视频的视频内容相关联的信息;
[0021]所述获取样本账户播放过的目标样本视频的属性信息,包括:
[0022]在视频库中获取所述目标样本视频的标识信息、以及所述目标样本视频对应的图像数据和音频数据;
[0023]对所述目标样本视频对应的图像数据进行图像识别处理,并对所述目标样本视频对应的音频数据进行音频识别处理,得到所述目标样本视频的边信息。
[0024]在一种可能的实现方式中,所述方法还包括:
[0025]获取所述样本账户的历史播放数据,所述历史播放数据包括在历史时段内所述样本账户播放过的历史视频和每个历史视频对应的播放时长占比,所述历史视频对应的播放时长占比是所述历史视频的播放时长与所述历史视频的总时长的比值;
[0026]将对应的播放时长占比大于或等于播放时长占比阈值的历史视频,确定为所述样本账户对应的历史偏好视频;
[0027]基于每个历史偏好视频对应的视频类型,确定所述样本账户对应的视频类型偏好信息。
[0028]在一种可能的实现方式中,所述待训练的视频特征提取模型包括待训练的第一参数矩阵,所述待训练的账户特征提取模型包括待训练的第二参数矩阵;
[0029]所述基于待训练的视频特征提取模型对所述属性信息进行特征提取,得到视频特征信息,包括:
[0030]对所述属性信息进行哈希计算,得到所述属性信息对应的第一哈希值;
[0031]在所述待训练的第一参数矩阵中获取所述第一哈希值对应的第一特征信息,作为
所述视频特征信息;
[0032]所述基于待训练的账户特征提取模型对所述样本账户对应的视频类型偏好信息进行特征提取,得到账户特征信息,包括:
[0033]对所述视频类型偏好信息进行哈希计算,得到所述视频类型偏好信息对应的第二哈希值;
[0034]在所述待训练的第二参数矩阵中获取所述第二哈希值对应的第二特征信息,作为所述账户特征信息。
[0035]在一种可能的实现方式中,所述视频相似度预测模型包括隐藏层和分类层;
[0036]所述基于所述视频特征信息、所述账户特征信息和待训练的视频相似度预测模型,确定所述目标样本视频与所述参考样本视频的预测相似度,包括:
[0037]将所述视频特征信息和所述账户特征信息,输入待训练的隐藏层,得到组合特征信息;
[0038]将所述组合特征信息输入待训练的分类层,得到所述目标样本视频与所述参考样本视频的预测相似度。
[0039]第二方面,提供了一种视频推荐的方法,所述方本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种训练视频特征提取模型的方法,其特征在于,所述方法包括:获取样本账户播放过的目标样本视频的属性信息、所述目标样本视频对应的参考样本视频、以及所述目标样本视频与所述参考样本视频的基准相似度;基于待训练的视频特征提取模型对所述属性信息进行特征提取,得到视频特征信息,基于待训练的账户特征提取模型对所述样本账户对应的视频类型偏好信息进行特征提取,得到账户特征信息;将所述视频特征信息、所述账户特征信息输入待训练的视频相似度预测模型,输出所述目标样本视频与所述参考样本视频的预测相似度;基于所述预测相似度和所述基准相似度,对所述待训练的视频特征提取模型、所述待训练的账户特征提取模型和所述待训练的视频相似度预测模型进行调参;若满足预设结束条件,则将调参后的视频特征提取模型确定为训练完成的视频特征提取模型。2.根据权利要求1所述的方法,其特征在于,所述参考样本视频包括正样本视频和负样本视频,所述目标样本视频与所述参考样本视频的基准相似度包括所述目标样本视频与所述正样本视频的第一基准相似度、以及所述目标样本视频与所述负样本视频的第二基准相似度;获取所述目标样本视频对应的参考样本视频、以及所述目标样本视频与所述参考样本视频的基准相似度,包括:获取所述样本账户播放过、且与所述目标样本视频满足播放时间接近条件的视频,作为所述目标样本视频对应的正样本视频,其中,所述第一基准相似度为第一数值;获取除了所述目标样本视频和所述正样本视频之外的视频,作为所述目标样本视频对应的负样本视频,其中,所述第二基准相似度为第二数值,所述第二数值小于所述第一数值。3.根据权利要求2所述的方法,其特征在于,所述获取所述样本账户播放过、且与所述目标样本视频满足播放时间接近条件的视频,作为所述目标样本视频对应的正样本视频,包括:获取所述样本账户播放过、且播放时间点与所述目标样本视频的播放时间点之间的时间差值小于预设时差阈值的至少一个视频,作为待定正样本视频;基于播放时间点,将所述待定正样本视频按顺序排列,得到待定正样本视频序列;将在所述待定正样本视频序列中,与所述目标样本视频之间间隔视频的数目小于预设数目的待定正样本视频,确定为所述目标样本视频对应的正样本视频。4.根据权利要求1所述的方法,其特征在于,所述目标样本视频的属性信息包括所述目标样本视频的标识信息和所述目标样本视频的边信息,其中,所述目标样本视频的标识信息用于表示所述目标样本视频的唯一标志,所述目标样本视频的边信息是与所述目标样本视频的视频内容相关联的信息;所述获取样本账户播放过的目标样本视频的属性信息,包括:在视频库中获取所述目标样本视频的标识信息、以及所述目标样本视频对应的图像数据和音频数据;对所述目标样本视频对应的图像数据进行图像识别处理,并对所述目标样本视频对应
的音频数据进行音频识别处理,得到所述目标样本视频的边信息。5.根据权利要求1所述的方法,其特征在于,所述方法还包括:获取所述样本账户的历史播放数据,所述历史播放数据包括在历史时段内所述样本账户播放过的历史视频和每个历史视频对应的播放时长占比,所述历史视频对应的播放时长占比是所述历史视频的播放时长与所述历史视频的总时长的比值;将对应的播放时长占比大于或等于播放时长占比阈值的历...

【专利技术属性】
技术研发人员:王朋
申请(专利权)人:腾讯音乐娱乐科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1