一种视频媒资推荐排序方法、装置及电子设备制造方法及图纸

技术编号:34422713 阅读:13 留言:0更新日期:2022-08-06 15:49
本发明专利技术提供一种视频媒资推荐排序方法、装置及电子设备,所述方法包括:构建用于媒资预测的特征矩阵;所述特征矩阵由视频媒资特征、用户特征以及交叉特征构成;将所述特征矩阵输入目标视频排序模型,得到所述目标视频排序模型输出的待预测媒资的排序值;根据所述排序值获得视频媒资推荐排序结果。本申请的实施例,根据视频媒资特征、用户特征以及交叉特征构建特征矩阵,将特征矩阵输入已完成训练的目标视频排序模型进行预测,从而获得待预测媒资的推荐排序结果,实现模型训练、在线预测、推荐结果查看一体化,能够降低研究人员的学习成本,提高视频媒资推荐排序效率,从而提升模型在线预测性能。测性能。测性能。

【技术实现步骤摘要】
一种视频媒资推荐排序方法、装置及电子设备


[0001]本专利技术涉及视频媒资推荐领域,特别是指一种视频媒资推荐排序方法、装置及电子设备。

技术介绍

[0002]实时视频媒资推荐系统在提高用户付费订购,以及增加用户粘性方面发挥着不可忽视的作用。现有的视频媒资推荐系统的技术方案涉及多个不同的技术栈的使用,很难快速将模型部署落地,让客户查看推荐效果。同时开发人员需要同时了解数据处理,模型调优,模型部署等多个方面知识,对开发人员要求很高,很难在短时间内构建推荐模型,导致现有的用于视频推荐的模型在线预测性能较差。

技术实现思路

[0003]本专利技术的目的是提供一种视频媒资推荐排序方法、装置及电子设备,用以解决现有技术中用于视频推荐的模型在线预测性能较差的问题。
[0004]为达到上述目的,本专利技术的实施例提供一种视频媒资推荐排序方法,包括:
[0005]构建用于媒资预测的特征矩阵;所述特征矩阵由视频媒资特征、用户特征以及交叉特征构成;
[0006]将所述特征矩阵输入目标视频排序模型,得到所述目标视频排序模型输出的待预测媒资的排序值;
[0007]根据所述排序值获得视频媒资推荐排序结果。
[0008]可选地,在构建用于媒资预测的特征矩阵之后,所述方法还包括:
[0009]在接收到预测请求的情况下,由缓冲池中获取所述目标视频排序模型;
[0010]其中,所述缓冲池中包括至少两个视频排序模型,每个所述视频排序模型的版本不同,所述目标视频排序模型为版本最高的视频排序模型。
[0011]可选地,所述方法还包括:
[0012]根据数据特征构建模型训练数据,所述数据特征包括:视频媒资特征、用户特征以及交叉特征;
[0013]利用所述模型训练数据对轻型梯度提升(Light Gradient Boosting Machine,LGBM)模型进行模型训练,获得视频排序模型。
[0014]可选地,所述方法还包括:
[0015]将所述视频排序模型的模型实例,存储至缓冲池中。
[0016]可选地,所述根据数据特征构建模型训练数据,包括:
[0017]根据用户观看数据、用户订购数据以及冷门负样例媒资,构建视频媒资特征和用户特征,并构建三元组,所述三元组包括:用户ID、媒资ID以及指示用户是否点击的标签;
[0018]根据所述三元组关联所述用户特征和所述视频媒资特征,获得第一特征数据;
[0019]根据所述第一特征数据计算交叉特征;
[0020]其中,所述第一特征数据和所述交叉特征作为所述模型训练数据。
[0021]可选地,利用所述模型训练数据对轻型梯度提升LGBM模型进行模型训练,获得视频排序模型,包括:
[0022]配置轻型梯度提升LGBM模型的模型参数,获得初始模型;其中,所述模型参数包括:学利率、迭代次数、模型叶子个数、模型评估模块的评价指标以及验证器的交叉验证函数;
[0023]利用所述模型训练数据对所述初始模型进行训练,获得所述视频排序模型。
[0024]可选地,所述构建用于媒资预测的特征矩阵,包括:
[0025]获取缓存的视频媒资特征和用户特征;
[0026]根据所述视频媒资特征和用户特征计算交叉特征;
[0027]利用所述视频媒资特征、用户特征以及交叉特征构建所述特征矩阵。
[0028]可选地,所述方法还包括:
[0029]根据所述视频媒资推荐排序结果,获取媒资信息;
[0030]根据所述媒资信息渲染应用程序界面。
[0031]可选地,所述视频媒资特征包括以下至少一项:
[0032]媒资的付费情况、媒资所属年代、媒资的语言、媒资的类型、媒资所属牌照方、媒资的订购数量、媒资观看量、媒资观看量的排名、媒资的评分、媒资的标签列表、在标签列表基础上使用词频逆向文本频率向量构建的标签文本特征向量、在标签列表基础上使用词向量构建的文本特性向量、使用词向量构建的媒资编码ID向量。
[0033]可选地,所述用户特征包括以下至少一项:
[0034]用户所在地区编码、用户观看视频列表、在观看视频列表基础上使用词向量构建的用户观看向量、用户观看标签列表、在观看标签列表基础上使用词向量构建的用户标签向量、用户观看视频的个数、使用词频逆向文本频率向量构建的用户标签文本特征向量、用户观看的视频类型。
[0035]可选地,所述交叉特征包括以下至少一项:
[0036]用户观看的视频类型与媒资的类型的一致性;
[0037]用户特征中的第一特征与媒资特征中的第二特征的余弦点积,所述第一特征为:在观看视频列表基础上使用词向量构建的用户观看向量,所述第二特征为使用词向量构建的媒资编码ID向量;
[0038]用户特征中的第三特征与媒资特征中的第四特征的余弦点积,所述第三特征为:在观看标签列表基础上使用词向量构建的用户标签向量,所述第四特征为:在标签列表基础上使用词向量构建的文本特征向量;
[0039]用户特征中的第五特征与媒资特征中的第六特征的余弦点积,所述第五特征为:使用词频逆向文本频率向量构建的用户标签文本特征向量,所述第六特征为:在标签列表基础上使用词频逆向文本频率向量构建的标签文本特征向量。
[0040]为达到上述目的,本专利技术的实施例提供一种视频媒资推荐排序装置,包括:
[0041]特征矩阵构建模块,用于构建用于媒资预测的特征矩阵;所述特征矩阵由视频媒资特征、用户特征以及交叉特征构成;
[0042]排序预测模块,用于将所述特征矩阵输入目标视频排序模型,得到所述目标视频
排序模型输出的待预测媒资的排序值;
[0043]结果生成模块,用于根据所述排序值获得视频媒资推荐排序结果。
[0044]可选地,所述装置还包括:
[0045]第一获取模块,用于在接收到预测请求的情况下,由缓冲池中获取所述目标视频排序模型;
[0046]其中,所述缓冲池中包括至少两个视频排序模型,每个所述视频排序模型的版本不同,所述目标视频排序模型为版本最高的视频排序模型。
[0047]可选地,所述装置还包括:
[0048]训练数据构建模块,用于根据数据特征构建模型训练数据,所述数据特征包括:视频媒资特征、用户特征以及交叉特征;
[0049]模型训练模块,用于利用所述模型训练数据对轻型梯度提升LGBM模型进行模型训练,获得视频排序模型。
[0050]可选地,所述装置还包括:
[0051]存储模块,用于将所述视频排序模型的模型实例,存储至缓冲池中。
[0052]可选地,所述训练数据构建模块包括:
[0053]第一构建单元,用于根据用户观看数据、用户订购数据以及冷门负样例媒资,构建视频媒资特征和用户特征,并构建三元组,所述三元组包括:用户ID、媒资ID以及指示用户是否点击的标签;
[0054]特征关联单元,用于根据所述三元组关联所本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种视频媒资推荐排序方法,其特征在于,包括:构建用于媒资预测的特征矩阵;所述特征矩阵由视频媒资特征、用户特征以及交叉特征构成;将所述特征矩阵输入目标视频排序模型,得到所述目标视频排序模型输出的待预测媒资的排序值;根据所述排序值获得视频媒资推荐排序结果。2.根据权利要求1所述的方法,其特征在于,在构建用于媒资预测的特征矩阵之后,所述方法还包括:在接收到预测请求的情况下,由缓冲池中获取所述目标视频排序模型;其中,所述缓冲池中包括至少两个视频排序模型,每个所述视频排序模型的版本不同,所述目标视频排序模型为版本最高的视频排序模型。3.根据权利要求1所述的方法,其特征在于,所述方法还包括:根据数据特征构建模型训练数据,所述数据特征包括:视频媒资特征、用户特征以及交叉特征;利用所述模型训练数据对轻型梯度提升LGBM模型进行模型训练,获得视频排序模型。4.根据权利要求3所述的方法,其特征在于,所述方法还包括:将所述视频排序模型的模型实例,存储至缓冲池中。5.根据权利要求3所述的方法,其特征在于,所述根据数据特征构建模型训练数据,包括:根据用户观看数据、用户订购数据以及冷门负样例媒资,构建视频媒资特征和用户特征,并构建三元组,所述三元组包括:用户ID、媒资ID以及指示用户是否点击的标签;根据所述三元组关联所述用户特征和所述视频媒资特征,获得第一特征数据;根据所述第一特征数据计算交叉特征;其中,所述第一特征数据和所述交叉特征作为所述模型训练数据。6.根据权利要求3所述的方法,其特征在于,利用所述模型训练数据对轻型梯度提升LGBM模型进行模型训练,获得视频排序模型,包括:配置轻型梯度提升LGBM模型的模型参数,获得初始模型;其中,所述模型参数包括:学利率、迭代次数、模型叶子个数、模型评估模块的评价指标以及验证器的交叉验证函数;利用所述模型训练数据对所述初始模型进行训练,获得所述视频排序模型。7.根据权利要求1所述的方法,其特征在于,所述构建用于媒资预测的特征矩阵,包括:获取缓存的视频媒资特征和用户特征;根据所述视频媒资特征和用户特征计算交叉特征;利用所述视频媒资特征、用户特征以及交叉特征构建所述特征矩阵。8.根据权利要求1所述的方法,其特征在于,所述方法还包括:根据所述视频媒资推荐排序结果,获取媒资信息;根据所述媒资信息渲染应用程序界面。9.根据权利要求1或3所述的方法,其特征在于,所述视频媒资特征包括以下至少一项:媒资的付费情况、媒资所属年代、媒资的语言、媒资的类型、媒资所属牌照方、媒资的订购数量、媒资观看量、媒资观看量的排名、媒资的评分、...

【专利技术属性】
技术研发人员:钱钧
申请(专利权)人:中国移动通信集团有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1