一种视频推荐方法、装置、电子设备及可读存储介质制造方法及图纸

技术编号:24456419 阅读:159 留言:0更新日期:2020-06-10 15:41
本说明书公开了一种视频推荐方法、装置、电子设备及可读存储介质,其中,视频推荐方法包括:获取用户的历史点播数据;从历史点播数据中提取对应用户的兴趣特征;根据视频节目的观看时长比获取兴趣特征中视频节目与每个聚类中心之间的相似度;根据相似度确定视频节目的隐因子向量;根据损失函数确定视频节目喜爱度偏离值、用户喜爱度偏离值、用户隐性因子向量、用户对视频节目的隐因子向量;根据视频节目的隐因子向量、用户观看过的所有视频节目的总数、视频节目喜爱度偏离值、用户喜爱度偏离值、用户隐性因子向量、用户对视频节目的隐因子向量获得用户对每个节目的喜爱度预测值;根据喜爱度预测值向对应用户推荐视频节目。

A video recommendation method, device, electronic equipment and readable storage medium

【技术实现步骤摘要】
一种视频推荐方法、装置、电子设备及可读存储介质
本说明书涉及机器学习
,特别涉及一种视频推荐方法、装置、电子设备及可读存储介质。
技术介绍
视频推荐技术本质上是一种信息过滤技术。它从海量的数据中找到用户感兴趣的部分,并将其推荐给用户,这在用户没有明确需求或者数据量过多的情况下,能够更好的为用户服务,解决信息过载的问题。例如,用户并不确定的想看哪一部电影,只是想看一部让自己感兴趣的电影,推荐系统能够主动的使用机器学习的技术去挖掘出用户的兴趣、偏好,从而在海量的数据当中过滤出用户感兴趣的内容,并将其推荐给用户。随着直播和短视频的兴起,视频内容呈爆炸式的增长,如何给用户提供个性化和高效的视频推荐服务受到越来越多的关注。按照数学原理的不同,可将视频推荐算法分为矩阵分解算法和协同过滤算法。矩阵分解算法策略是将大的原始数据集组成的特征矩阵等价成两个或者三个较小的矩阵相乘的形式,以降低时间复杂度和空间复杂度;协同过滤算法策略是,分析系统里已经存在了的用户群之前的行为,根据相似用户或者相似视频之间的联系,对目前用户最喜欢或者最感兴趣的视频做预测。矩阵分解推荐算法从隐性反馈数据集中学习到用户的隐向量和节目的隐向量,即通过隐性特征将用户和节目联系起来了,但是没有显式的考虑用户的历史行为对用户评分预测的影响;协同过滤推荐算法采用历史评分数据来构建用户对节目的喜好度,但是不能深入挖掘背后的隐性因素,通常推荐精确度不高。
技术实现思路
为了在降低视频推荐的复杂度的基础上还提高视频推荐的准确率,本说明书提供一种视频推荐方法、装置、电子设备及可读存储介质。为实现上述目的,本说明书实施方式提供一种视频推荐方法,包括:获取用户的历史点播数据;从所述历史点播数据中提取对应用户的兴趣特征;其中,所述兴趣特征包括:视频节目、用户观看某个视频节目的观看时长比;根据所述视频节目的观看时长比获取所述兴趣特征中视频节目与每个聚类中心之间的相似度;其中,所述聚类中心利用样本视频节目数据进行聚类获得;根据所述相似度确定视频节目的隐因子向量;确定视频节目喜爱度偏离值、用户喜爱度偏离值、用户的隐因子向量、用户和所观看的视频节目之间的隐因子向量;根据所述视频节目的隐因子向量、用户观看过的所有视频节目的总数、所述视频节目喜爱度偏离值、所述用户喜爱度偏离值、所述用户的隐性因子向量、所述用户和所观看的视频节目之间的隐因子向量获得用户对每个节目的喜爱度预测值;根据所述喜爱度预测值确定向对应用户终端推荐的视频节目。优选地,所述用户观看过的所有视频节目的总数通过用户的历史行为统计获取。优选地,根据所述喜爱度预测值确定向对应用户终端推荐的视频节目的步骤包括:将所述用户观看过的视频节目剔除掉;按所述喜爱度预测值的大小对剩余的视频节目降序排列,根据排列结果生成推荐列表;将所述推荐列表中排在前面的视频节目的数据发送至用户终端。优选地,确定视频节目喜爱度偏离值、用户喜爱度偏离值、用户的隐因子向量、用户和所观看的视频节目之间的隐因子向量的步骤包括:对损失函数利用随机梯度下降法求解,确定当所述损失函数取最小值时对应的视频节目喜爱度偏离值、用户喜爱度偏离值、用户的隐因子向量、用户和所观看的视频节目之间的隐因子向量。优选地,所述用户观看某个视频节目的观看时长比等于用于观看某个视频节目的时长除以对应视频节目的总时长。优选地,所述相似度通过曼哈顿街区距离公式、欧式距离公式或皮尔逊公式获取。优选地,根据所述相似度确定视频节目的隐因子向量的步骤包括:从所述视频节目与每个聚类中心之间的相似度中获取最大相似度、最小相似度;将所述视频节目与每个聚类中心之间的相似度均除以所述最大相似度或所述最小相似度,获得归一化结果值;将归一化结果值与阈值比较,将小于阈值的归一化结果值置于零,将大于等于的阈值的归一化结果值保持不变,得到的结果值构成的向量为所述视频节目的隐因子向量。为实现上述目的,本说明书实施方式提供一种视频推荐装置,包括:历史点播数据获取单元,用于获取用户的历史点播数据;兴趣特征提取单元,用于从所述历史点播数据中提取对应用户的兴趣特征;其中,所述兴趣特征包括:视频节目、用户观看某个视频节目的观看时长比;相似度获取单元,用于根据所述视频节目的观看时长比获取所述兴趣特征中视频节目与每个聚类中心之间的相似度;其中,所述聚类中心利用样本视频节目数据进行聚类获得;第一参数确定单元,用于根据所述相似度确定视频节目的隐因子向量;第二参数确定单元,用于确定视频节目喜爱度偏离值、用户喜爱度偏离值、用户的隐因子向量、用户和所观看的视频节目之间的隐因子向量;喜爱度预测值单元,用于根据所述视频节目的隐因子向量、用户观看过的所有视频节目的总数、所述视频节目喜爱度偏离值、所述用户喜爱度偏离值、所述用户的隐性因子向量、所述用户和所观看的视频节目之间的隐因子向量获得用户对每个节目的喜爱度预测值;推荐单元,用于根据所述喜爱度预测值确定向对应用户终端推荐的视频节目。优选地,所述喜爱度预测值单元通过用户的历史行为统计获取所述用户观看过的所有视频节目的总数。优选地,所述推荐单元包括:剔除模块,用于将所述用户观看过的视频节目剔除掉;推荐列表获取模块,用于按所述喜爱度预测值的大小对剩余的视频节目降序排列,根据排列结果生成推荐列表;视频节目发送模块,用于将所述推荐列表中排在前面的视频节目的数据发送至用户终端。优选地,所述第二参数确定单元进一步用于对损失函数利用随机梯度下降法求解,确定当所述损失函数取最小值时对应的视频节目喜爱度偏离值、用户喜爱度偏离值、用户的隐因子向量、用户和所观看的视频节目之间的隐因子向量。优选地,所述兴趣特征提取单元获取的用户观看某个视频节目的观看时长比等于用于观看某个视频节目的时长除以对应视频节目的总时长。优选地,所述相似度获取单元通过曼哈顿街区距离公式、欧式距离公式或皮尔逊公式获取相似度。优选地,所述第一参数确定单元包括:最大、最小相似度获取模块,用于从所述视频节目与每个聚类中心之间的相似度中获取最大相似度、最小相似度;归一化模块,用于将所述视频节目与每个聚类中心之间的相似度均除以所述最大相似度或所述最小相似度,获得归一化结果值;置零模块,用于将归一化结果值与阈值比较,将小于阈值的归一化结果值置于零,将大于等于的阈值的归一化结果值保持不变,得到的结果值构成的向量为所述视频节目的隐因子向量。为实现上述目的,本说明书实施方式提供一种电子设备,包括存储器、处理器以及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述所述的视频推荐方法。为实现上述目的,本说明书实施方式提供一种可读存储介质,其上存储有计算机程序,所述计算机程序被执行时实现上述所述的视频本文档来自技高网...

【技术保护点】
1.一种视频推荐方法,其特征在于,包括:/n获取用户的历史点播数据;/n从所述历史点播数据中提取对应用户的兴趣特征;其中,所述兴趣特征包括:视频节目、用户观看某个视频节目的观看时长比;/n根据所述视频节目的观看时长比获取所述兴趣特征中视频节目与每个聚类中心之间的相似度;其中,所述聚类中心利用样本视频节目数据进行聚类获得;/n根据所述相似度确定视频节目的隐因子向量;/n确定视频节目喜爱度偏离值、用户喜爱度偏离值、用户的隐因子向量、用户和所观看的视频节目之间的隐因子向量;/n根据所述视频节目的隐因子向量、用户观看过的所有视频节目的总数、所述视频节目喜爱度偏离值、所述用户喜爱度偏离值、所述用户的隐性因子向量、所述用户和所观看的视频节目之间的隐因子向量获得用户对每个节目的喜爱度预测值;/n根据所述喜爱度预测值确定向对应用户终端推荐的视频节目。/n

【技术特征摘要】
1.一种视频推荐方法,其特征在于,包括:
获取用户的历史点播数据;
从所述历史点播数据中提取对应用户的兴趣特征;其中,所述兴趣特征包括:视频节目、用户观看某个视频节目的观看时长比;
根据所述视频节目的观看时长比获取所述兴趣特征中视频节目与每个聚类中心之间的相似度;其中,所述聚类中心利用样本视频节目数据进行聚类获得;
根据所述相似度确定视频节目的隐因子向量;
确定视频节目喜爱度偏离值、用户喜爱度偏离值、用户的隐因子向量、用户和所观看的视频节目之间的隐因子向量;
根据所述视频节目的隐因子向量、用户观看过的所有视频节目的总数、所述视频节目喜爱度偏离值、所述用户喜爱度偏离值、所述用户的隐性因子向量、所述用户和所观看的视频节目之间的隐因子向量获得用户对每个节目的喜爱度预测值;
根据所述喜爱度预测值确定向对应用户终端推荐的视频节目。


2.如权利要求1所述的方法,其特征在于,所述用户观看过的所有视频节目的总数通过用户的历史行为统计获取。


3.如权利要求1所述的方法,其特征在于,根据所述喜爱度预测值确定向对应用户终端推荐的视频节目的步骤包括:
将所述用户观看过的视频节目剔除掉;
按所述喜爱度预测值的大小对剩余的视频节目降序排列,根据排列结果生成推荐列表;
将所述推荐列表中排在前面的视频节目的数据发送至用户终端。


4.如权利要求1所述的方法,其特征在于,确定视频节目喜爱度偏离值、用户喜爱度偏离值、用户的隐因子向量、用户和所观看的视频节目之间的隐因子向量的步骤包括:
对损失函数利用随机梯度下降法求解,确定当所述损失函数取最小值时对应的视频节目喜爱度偏离值、用户喜爱度偏离值、用户的隐因子向量、用户和所观看的视频节目之间的隐因子向量。


5.如权利要求1所述的方法,其特征在于,所述用户观看某个视频节目的观看时长比等于用于观看某个视频节目的时长除以对应视频节目的总时长。


6.如权利要求1所述的方法,其特征在于,所述相似度通过曼哈顿街区距离公式、欧式距离公式或皮尔逊公式获取。


7.如权利要求1所述的方法,其特征在于,根据所述相似度确定视频节目的隐因子向量的步骤包括:
从所述视频节目与每个聚类中心之间的相似度中获取最大相似度、最小相似度;
将所述视频节目与每个聚类中心之间的相似度均除以所述最大相似度或所述最小相似度,获得归一化结果值;
将归一化结果值与阈值比较,将小于阈值的归一化结果值置于零,将大于等于的阈值的归一化结果值保持不变,得到的结果值构成的向量为所述视频节目的隐因子向量。


8.一种视频推荐装置,其特征在于,包括:
历史点播数据获取单元,用于获取用户的历史点播数据;
兴趣特征提取单元,用于从所述历史点播数据中提取对应用户的兴趣特征;其中,所述兴趣特征包括:视频节目、用户观看某个视频节目的观看时长比;
相似度获取...

【专利技术属性】
技术研发人员:王兴军马力
申请(专利权)人:清华大学深圳研究生院
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1