一种视频播放完整度预测方法及装置制造方法及图纸

技术编号:23149316 阅读:58 留言:0更新日期:2020-01-18 13:33
本发明专利技术公开了一种视频播放完整度预测方法及装置,属于大数据及深度学习技术领域。所述方法包括:输入用户视频播放特征向量的待测数据;通过预设视频播放完整度预测模型进行计算;输出所述待测数据的视频播放完整度值,其中,所述预设视频播放完整度预测模型是通过用户视频播放训练数据训练得到的,所述用户视频播放特征向量至少包括用户特征向量和视频特征向量。本发明专利技术通过引入播放完整度改进策略,对用户视频播放完整度预测,在观看时长这一重要信息流方面获取了用户更贴近真实的兴趣数据,提升了对用户兴趣的识别准确度,从而提升了推荐的真实相关度,实现了用户观看时长和满意度的较大提升。

A prediction method and device of video playback integrity

【技术实现步骤摘要】
一种视频播放完整度预测方法及装置
本专利技术涉及大数据及深度学习
,特别涉及一种视频播放完整度预测方法及装置。
技术介绍
视频推荐系统就是在海量用户和视频的基础上,依托大数据分析和人工智能技术,通过研究用户的兴趣偏好构建视频推荐系统,将用户感兴趣的高质量视频推荐给目标用户,解决信息过载问题,达到千人千面的效果,提升用户停留时长和满意度。视频推荐系统通常包括召回和排序两个阶段,召回阶段就是从海量视频里选出一部分候选集,排序阶段就是对召回阶段的候选集进行更精准的统一计算,从候选集中筛选出用户最感兴趣的少量优质视频。目前有些视频播放平台注册用户数达数亿,日均UV(UniqueVisitor,独立访问用户数)超过千万,移动端日均播放量则更高。为了使得用户在海量视频中发现自己感兴趣的内容。通过收集多个维度的数据(包含用户的基本信息、用户的播放历史、视频的属性、环境的属性等),构建推荐系统,将用户和潜在喜欢的视频联系起来。短视频推荐可以使用的信息较少,一般只有标题和视频类别等信息,目前常用的排序模型采用CTR(Click-Through-Rate,点击通过率)预估的方法。基于点击模型可能助长了标题党,这样并不能带来用户停留时长的提升,影响用户观看时长和满意度的提升。而观看时长作为信息流的重要优化目标,因此在短视频排序模型迫切需要引入播放完整度优化,提升推荐的真实相关度,以达到用户观看时长和满意度的提升。
技术实现思路
为了解决现有技术的问题,本专利技术实施例提供了一种视频播放完整度预测方法及装置,通过引入播放完整度改进策略,对用户视频播放完整度预测,在观看时长这一重要信息流方面获取了用户更贴近真实的兴趣数据,提升了对用户兴趣的识别准确度,从而提升了推荐的真实相关度,实现了用户观看时长和满意度的较大提升。所述技术方案如下:一方面,提供了一种视频播放完整度预测方法,所述方法包括:输入用户视频播放特征向量的待测数据;通过预设视频播放完整度预测模型进行计算;输出所述待测数据的视频播放完整度值,其中,所述预设视频播放完整度预测模型是通过用户视频播放训练数据训练得到的,所述用户视频播放特征向量至少包括用户特征向量和视频特征向量。进一步地,所述方法还包括:收集用户视频播放信息数据;对所述用户视频播放信息数据进行筛选,获取筛选结果;对所述筛选结果进行特征提取,生成所述用户视频播放特征向量的待测数据。进一步地,收集所述用户视频播放信息数据,包括:获取包括用户信息、用户播放历史信息、视频信息及用户客户端信息在内的所述用户视频播放信息数据;和/或,对所述用户视频播放信息数据进行筛选,获取筛选结果,包括:利用包括用户协同、用户搜索、主题模型、热门推荐、用户画像和视频标签的多通道召回方式,对所述用户视频播放信息数据进行筛选,获取筛选结果;和/或,对所述筛选结果进行特征提取,生成所述用户视频播放特征向量的待测数据,包括:利用通过word2vec模型和IDF权值训练对预设海量语料库训练得到的词向量,对所述筛选结果中的视频标题和视频分类标签进行分词,生成视频词向量,然后根据所述用户播放历史信息结合时间衰减进行词向量计算,生成用户词向量。进一步地,所述预设视频播放完整度预测模型包含三个隐藏层的DNN。进一步地,所述预设视频播放完整度预测模型是通过将所述用户视频播放训练数据输入训练得到的,其中,所述用户视频播放训练数据为自变量,所述用户观看历史视频播放完整度值为因变量,所述用户视频播放训练数据是根据用户播放历史信息构建的历史用户向量、历史视频向量组合的特征向量。进一步地,所述方法还包括:对所述待测数据的视频播放完整度值进行由高到低的排序操作,获取topN的视频排序结果,将所述视频排序结果根据优先级别推荐给对应用户,其中N为大于1的整数。另一方面,提供了一种视频播放完整度预测装置,所述装置包括模型计算模块,所述模型计算模块用于:输入用户视频播放特征向量的待测数据,通过预设视频播放完整度预测模型进行计算,输出所述待测数据的视频播放完整度值,其中,所述预设视频播放完整度预测模型是通过用户视频播放训练数据训练得到的,所述用户视频播放特征向量至少包括用户特征向量和视频特征向量。进一步地,所述装置还包括数据收集模块、数据筛选模块和向量生成模块,所述数据收集模块收集所述用户视频播放信息数据;所述数据筛选模块对所述用户视频播放信息数据进行筛选,获取筛选结果;所述向量生成模块对所述筛选结果进行特征提取,生成所述用户视频播放特征向量的待测数据。进一步地,所述数据收集模块获取包括用户信息、用户播放历史信息、视频信息及用户客户端信息在内的所述用户视频播放信息数据;和/或,所述数据筛选模块利用包括用户协同、用户搜索、主题模型、热门推荐、用户画像和视频标签的多通道召回方式,对所述用户视频播放信息数据进行筛选,获取筛选结果;和/或,所述向量生成模块对所述筛选结果进行特征提取,生成所述用户视频播放特征向量的待测数据,包括:利用通过word2vec模型和IDF权值训练对预设海量语料库训练得到的词向量,对所述筛选结果中的视频标题和视频分类标签进行分词,生成视频词向量,然后根据所述用户播放历史信息结合时间衰减进行词向量计算,生成用户词向量。进一步地,所述装置还包括数据推荐模块,所述数据推荐模块用于对所述待测数据的视频播放完整度值进行由高到低的排序操作,获取topN的视频排序结果,将所述视频排序结果根据优先级别推荐给对应用户,其中N为大于1的整数。本专利技术实施例提供的技术方案带来的有益效果是:1、通过一改传统的CTR预估方法,引入视频播放完整度指标,通过训练好的预设视频播放完整度预测模型针对不同用户的视频播放完整度进行预测,通过视频播放完整度的预测结果,在观看时长这一重要信息流方面获取了用户更贴近真实的兴趣数据,提升了对用户兴趣的识别准确度,从而提升了推荐的真实相关度,实现了用户观看时长和满意度的较大提升;2、通过用户画像向量化表示,结合用户行为的时间衰减体现用户的兴趣转移,并且用户画像过程中,过滤掉热点视频和误点视频,避免对用户真实兴趣的影响,用户画像更准确;3、通过收集用户行为数据、视频质量、视频信息等相关数据,有效地进行了用户特征、视频属性等进行向量化表示,各时段播放视频占比,各类别占比,以及其他环境信息等,通过深度学习建模并针对用户未观看视频预测可能的播放完整度,在短视频推荐排序模型的应用,将不同特征和不同数据源融合,取得不错的效果,提升了用户的平均观看时长;4、通过构建用户特征、视频特征、上下文特征以及客户端分类等特征,采用深度学习建模,通过ABTest,在随机选择的10%的用户群体应用播放完整度预估方式,通过最终报表对比CTR、日均播放量、用户平均播放完整度等指标。最终在CTR微降的情况下,带来用户平均播放完整度和日均播放量较大程度的提升;5、在视频推荐领域采用T本文档来自技高网...

【技术保护点】
1.一种视频播放完整度预测方法,其特征在于,所述方法包括:/n输入用户视频播放特征向量的待测数据;/n通过预设视频播放完整度预测模型进行计算;/n输出所述待测数据的视频播放完整度值,/n其中,所述预设视频播放完整度预测模型是通过用户视频播放训练数据训练得到的,所述用户视频播放特征向量至少包括用户特征向量和视频特征向量。/n

【技术特征摘要】
1.一种视频播放完整度预测方法,其特征在于,所述方法包括:
输入用户视频播放特征向量的待测数据;
通过预设视频播放完整度预测模型进行计算;
输出所述待测数据的视频播放完整度值,
其中,所述预设视频播放完整度预测模型是通过用户视频播放训练数据训练得到的,所述用户视频播放特征向量至少包括用户特征向量和视频特征向量。


2.根据权利要求1所述的方法,其特征在于,所述方法还包括:
收集用户视频播放信息数据;
对所述用户视频播放信息数据进行筛选,获取筛选结果;
对所述筛选结果进行特征提取,生成所述用户视频播放特征向量的待测数据。


3.根据权利要求2所述的方法,其特征在于,
收集所述用户视频播放信息数据,包括:获取包括用户信息、用户播放历史信息、视频信息及用户客户端信息在内的所述用户视频播放信息数据;和/或,
对所述用户视频播放信息数据进行筛选,获取筛选结果,包括:利用包括用户协同、用户搜索、主题模型、热门推荐、用户画像和视频标签的多通道召回方式,对所述用户视频播放信息数据进行筛选,获取筛选结果;和/或,
对所述筛选结果进行特征提取,生成所述用户视频播放特征向量的待测数据,包括:利用通过word2vec模型和IDF权值训练对预设海量语料库训练得到的词向量,对所述筛选结果中的视频标题和视频分类标签进行分词,生成视频词向量,然后根据所述用户播放历史信息结合时间衰减进行词向量计算,生成用户词向量。


4.根据权利要求1所述的方法,其特征在于,所述预设视频播放完整度预测模型包含三个隐藏层的DNN。


5.根据权利要求4所述的方法,其特征在于,所述预设视频播放完整度预测模型是通过将所述用户视频播放训练数据输入训练得到的,其中,所述用户视频播放训练数据为自变量,所述用户观看历史视频播放完整度值为因变量,所述用户视频播放训练数据是根据用户播放历史信息构建的历史用户向量、历史视频向量组合的特征向量。


6.根据权利要求1所述的方法,其特征在...

【专利技术属性】
技术研发人员:许良武
申请(专利权)人:苏宁云计算有限公司
类型:发明
国别省市:江苏;32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1