视频推荐方法、服务器和可读存储介质技术

技术编号:28492906 阅读:12 留言:0更新日期:2021-05-19 22:19
本发明专利技术实施例涉及视频推荐领域,公开了一种视频推荐方法、服务器和可读存储介质。本发明专利技术中,视频推荐方法,包括:获取输入向量;输入向量用于表征目标用户的用户特征和待推荐的各视频的视频特征,用户特征至少包括目标用户对观看过的若干视频的观看时长;根据输入向量和预先训练的点击概率预测模型,确定目标用户对待推荐的各视频的点击概率;其中,点击概率预测模型根据各视频样本的样本特征训练得到,样本特征至少包括视频样本中的视频被观看的观看时长;根据目标用户对所述待推荐的各视频的点击概率,对用户推荐待推荐的各视频,使得可以降低训练复杂度、缩短训练周期、降低资源消耗量,提高了预测的点击概率的准确性和合理性。性。性。

【技术实现步骤摘要】
视频推荐方法、服务器和可读存储介质


[0001]本专利技术实施例涉及视频推荐领域,特别涉及一种视频推荐方法、服务器和可读存储介质。

技术介绍

[0002]对于视频网站而言,推荐系统扮演者举足轻重的角色。一个优秀的推荐系统能够增加用户的粘性,为网站带来丰厚的收益。推荐系统在收到用户请求后,会利用排序算法对候选视频进行打分,然后将这些视频按照分值由高到低进行排序,最后将得分最高的N条视频作为推荐结果返回。对于视频推荐领域,通常使用点击率和观看时长共同评价推荐算法。为了同时提升这两个指标,当前业内多采用融合点击概率预估模型和观看时长预估模型,需要对两种模型分别进行训练,然后,再基于单独训练好的两种模型进行线性融合或是函数融合。
[0003]然而,专利技术人发现,相关技术种至少存在如下技术问题:无论是线性融合还是函数融合,均需要先训练至少两个独立的模型,再进行融合,但训练复杂,训练周期长,消耗资源大。

技术实现思路

[0004]本专利技术实施方式的目的在于提供一种视频推荐方法、服务器和可读存储介质,使得可以降低训练复杂度、缩短训练周期、降低资源消耗量,提高了预测的点击概率的准确性和合理性。
[0005]为解决上述技术问题,本专利技术的实施方式提供了一种视频推荐方法,包括:获取输入向量;其中,所述输入向量用于表征目标用户的用户特征和待推荐的各视频的视频特征,所述用户特征至少包括所述目标用户对观看过的若干视频的观看时长;根据所述输入向量和预先训练的点击概率预测模型,确定所述目标用户对所述待推荐的各视频的点击概率;其中,所述点击概率预测模型根据各视频样本的样本特征训练得到,所述样本特征至少包括所述视频样本中的视频被观看的观看时长;根据所述目标用户对所述待推荐的各视频的点击概率,对所述用户推荐所述待推荐的各视频。
[0006]本专利技术的实施方式还提供了一种服务器,包括:至少一个处理器;以及,与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行上述的视频推荐方法。
[0007]本专利技术的实施方式还提供了一种计算机可读存储介质,存储有计算机程序,所述计算机程序被处理器执行时实现上述的视频推荐方法。
[0008]本专利技术实施方式,获取输入向量;其中,输入向量用于表征目标用户的用户特征和待推荐的各视频的视频特征,用户特征至少包括目标用户对观看过的若干视频的观看时长;根据输入向量和预先训练的点击概率预测模型,确定目标用户对待推荐的各视频的点
击概率。考虑到,在实际场景下,用户对某个视频是否点击,不仅取决于该视频本身,还取决于与该视频同时展现的其它视频,因此,本专利技术实施方式中点击概率预测模型输入了目标用户的用户特征和待推荐的所有视频的视频特征,可以同时预测目标用户对待推荐的所有视频的点击概率,使得预测更符合实际。另外,点击概率预测模型根据各视频样本的样本特征训练得到,样本特征至少包括视频样本中的视频被观看的观看时长,即本专利技术实施方式中以点击概率预测模型为基础,将观看时长作为样本特征融入训练过程,从而实现通过训练一个模型同时优化点击概率和观看时长两种指标,与相关技术中分别训练两个模型相比训练效率和资源使用率至少提升50%。,即降低了训练复杂度、缩短了训练周期、降低了资源消耗量,还提高了预测的点击概率的准确性和合理性。根据目标用户对待推荐的各视频的点击概率,对用户推荐待推荐的各视频,有利于提高用户对所推荐的视频的点击率,提高对用户的推荐体验。
[0009]另外,所述视频样本对应有样本权重,所述样本权重基于所述视频样本中的视频被观看的观看时长确定。考虑到相关技术中,通常不为视频样本设置权重,或者可以理解为每个样本权重固定设置为1.0,相当于认为每个视频样本对最终训练的模型贡献相等。而本专利技术实施方式中,基于视频样本中的视频被观看的观看时长确定视频样本的样本权重,即将对于视频的观看时长融入到模型的训练过程中,区分了不同视频样本对模型的贡献度,有利于更加合理的完成点击概率预测模型的训练。
[0010]另外,样本权重通过如下公式确定:
[0011][0012]其中,所述w为所述样本权重,所述Δt为预设的固定时间间隔,所述T为预设的观看时长上限,所述t为所述视频样本被观看的观看时长。也就是说,对于用户点击后观看不超过T秒的样本,样本权重随着观看时长的增长呈对数增长。即,w与t之间不是线性关系,而是以Δt为底的对数关系。Δt负责调节w随t的变化趋势,Δt变化越大,w随t的变化越明显。可以理解的是,当t<Δt时,w<1,这意味着即使视频被点击,如果播放时间很短即用户的观看时长很短,生成的视频样本可信度比较低,对应的样本权重也比较低,在训练重要程度可能会低于其它视频样本。而观看时长超过T秒的样本,样本权重一律设置为log
Δt
(T+1),有利于限制w的最大值,避免造成视频样本间样本权重差异过大的情况。因此,通过上述公式可以更加合理的得到不同视频样本的样本权重,从而更加合理的完成对于点击概率预测模型的训练,以进一步提高利用点击概率预测模型预测的目标用户对待推荐的各视频的点击概率的合理性的准确性。
[0013]另外,所述点击概率预测模型的损失函数的表达式如下:
[0014][0015]其中,L为通过所述损失函数计算的损失值,S为所述视频样本的总数,y
k,i
为第k个视频样本的标签向量的第i维分量,p
i
(x
k
)为基于所述第k个视频样本预测的第i个视频的点击概率,w
k
为所述第k个视频样本对应的样本权重,N为需要预测点击概率的视频的数量。考虑到,目前传统的损失计算方式认为每个视频样本的损失对整体样本集的损失的“贡献”是相同的。然而,在真实场景下,不同视频样本的损失其实对整体样本集损失的影响应该是有
差别的。因此,本专利技术实施方式中,在损失函数中增加了样本权重,以区分每个视频样本的损失对整体样本集的损失的“贡献”,提高了利用损失函数计算得到的损失值的合理性。通过训练使模型损失L达到最小值,能够使得此刻样本集内每个视频样本的观看时长(对数)*点击率(对数)的和达到最大值,进一步方便了实现同时优化观看时长和点击概率两个指标的目的。
[0016]另外,所述视频样本标注的标签为所述视频样本中的视频的ID标签,所述用户特征还包括所述目标用户观看过的若干视频的视频ID,所述样本特征还包括所述视频样本中的用户观看过的若干视频的视频ID。考虑到,传统的点击概率预估模型通常将推荐问题抽象为一个二分类模型,即视频样本的标签为{0,1},标签为0的样本称为负样本,表示用户不会点击某个视频;反之,称为正样本例,表示用户会点击某个视频。而本专利技术实施方式中,模型将推荐问题抽象为多分类模型,直接将视频样本的视频ID作为样本标签,因此,训练时只需要正样本,无需负样本,能够在训练过程中显著减少视频样本数量,大幅度提升训练效率。而且,由于用户特征还包括本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种视频推荐方法,其特征在于,包括:获取输入向量;其中,所述输入向量用于表征目标用户的用户特征和待推荐的各视频的视频特征,所述用户特征至少包括所述目标用户对观看过的若干视频的观看时长;根据所述输入向量和预先训练的点击概率预测模型,确定所述目标用户对所述待推荐的各视频的点击概率;其中,所述点击概率预测模型根据各视频样本的样本特征训练得到,所述样本特征至少包括所述视频样本被观看的观看时长;根据所述目标用户对所述待推荐的各视频的点击概率,对所述目标用户推荐所述待推荐的各视频。2.根据权利要求1所述的视频推荐方法,其特征在于,所述视频样本对应有样本权重,所述样本权重基于所述视频样本被观看的观看时长确定。3.根据权利要求2所述的视频推荐方法,其特征在于,所述样本权重通过如下公式确定:其中,所述w为所述样本权重,所述Δt为预设的固定时间间隔,所述T为预设的观看时长上限,所述t为所述视频样本被观看的观看时长。4.根据权利要求2或3所述的视频推荐方法,其特征在于,所述点击概率预测模型的损失函数的表达式如下:其中,L为通过所述损失函数计算的损失值,S为所述视频样本的总数,y
k,i
为第k个视频样本的标签向量的第i维分量,p
i
(x
k
)为基于所述第k个视频样本预测的第i个视频的点击概率,w
k
为所述第k个视频样本对应的样本权重,N为需要预测点击概率的视频的数量。5.根据权利要求1所述的视频推荐方法,其特征在于,所述根据所述输入向量和预先训练的点击概率预测模型,确定所述目标用户对所述待推荐的各视频的点击概率,包括:根据所述输入向量和所述点击概率预测模型中的特征权重矩阵,获取输入特征权重向量;将所述输入特征权重向量输入所述点击概率预测模型中的神经网络,得到目标用户向量;根据...

【专利技术属性】
技术研发人员:曹跃
申请(专利权)人:中国移动通信集团有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1