基于流行度和社交网络的个性化用户原创视频预取方法及系统技术方案

技术编号:10306714 阅读:189 留言:0更新日期:2014-08-08 07:37
本发明专利技术公开了一种基于流行度和社交网络的个性化用户原创视频预取方法及系统。该方法先收集视频流行度信息,用户之间社交关系,视频之间关联关系以及用户历史行为信息;基于流行度信息,将用户原创视频分为热门视频和长尾视频;计算用户对热门视频的偏好度并排序,生成热门视频预取列表;构建图模型,实现用户和视频的相关度测量,为用户生成长尾视频预取列表;加权线性融合热门视频预取列表和长尾视频预取列表,构建个性化的混合预取模型;在保证用户当前观看视频流畅的情况下,基于个性化混合预取模型,为用户预取排名靠前的一部或多部视频。本系统提高了用户原创视频预取的命中率和准确度,提升了用户原创视频服务的质量,改进了用户的观看体验。

【技术实现步骤摘要】
基于流行度和社交网络的个性化用户原创视频预取方法及系统
本专利技术涉及一种基于流行度和社交网络的个性化用户原创视频预取方法及系统,属于视频预取的

技术介绍
随着Web2.0时代的到来,用户不再是单纯的信息接收者,而是同时成为了了信息的发布者,以优酷网和土豆网为代表,基于用户原创内容的视频网站受到广大用户的高度追捧,但是多组研究结果都表明用户的观看体验不能让人满意,播放产生的时延占视频时长的比重较高。减少视频播放时延的相关方法包括:提高服务器的软硬件性能,增加网络带宽,基于网络代理和基于内容分发网络,然而这些方法都有相应的劣势,相比之下视频预取技术能够很好的降低用户可感受时延,同时产生较小的开销。但是由于基于用户原创内容的视频服务在用户行为和视频内容上具有很多区别于传统视频服务的特点,例如视频数量很多,视频长度较短,内容数据较少,极快的内容产生速度,不同的流行度分布以及社会网络的存在。因此传统的视频预取算法并不能够很好的适用于用户原创内容视频服务。用户原创视频的流行度分布表现出极端的不平衡,一部分视频有着很高的流行度,选择观看这部分视频时,用户通常考虑视频的流行度以及是否符合自己的兴趣。另一部分视频虽然流行度不高,却通过不同的传播途径,被感兴趣的用户观看,主要的传播途径包括用户之间的社交关系以及视频之间的关联关系。因此,有必要提出一种能够综合考虑不同流行度视频,充分利用用户社交关系,视频关联关系,视频流行度信息以及用户历史行为数据的,适用于用户原创视频的视频预取方法和系统,以有效的提高视频预取的命中率和准确度,提升用户原创视频服务的质量,改进用户的观看体验。
技术实现思路
本专利技术所要解决的技术问题是提供一种基于流行度和社交网络的个性化用户原创视频预取方法及系统。该方法及系统提高了视频预取的命中率和准确度,提升用户原创视频服务的质量,改进了用户的观看体验。为了达到上述目的,根据本专利技术的一方面,本专利技术提供了一种基于流行度和社交网络的用户原创视频预取方法,包括如下步骤:1)信息获取:获取用户对视频的历史行为信息,用户与用户之间的社交关系,视频与视频之间的关联关系以及原创视频的流行度信息;2)视频分类:基于用户原创视频的流行度信息,将视频分为热门视频和长尾视频两类;3)热门视频预取列表生成:基于原创视频的流行度信息以及用户历史行为信息,计算用户对热门视频的偏好度,根据偏好度降序排序,为用户生成热门视频预取列表;4)图模型构建:基于获取的用户历史行为信息,用户之间的社交关系以及视频之间的关联关系构建图模型,其中的每一个节点或边拥有与实际物理类型一致的节点或关系类型,每一条边拥有与实际关系强度一致的边权值;5)长尾视频预取列表生成:基于图模型,利用基于最短路径权值的相关度测量方法,测量用户和视频的相关度,根据相关度降序排序,为用户生成长尾视频预取列表;6)混合预取模型生成:基于获取的用户的历史行为信息,对热门视频预取列表和长尾视频预取列表进行加权线性融合,构建个性化的混合预取模型;7)生成预取视频列表:在保证用户当前观看视频流畅的情况下,基于个性化混合预取模型,为用户预取排在最靠前的一部或多部视频推荐。在上述用户原创视频预取方法中,所述信息获取步骤包括:若在应用系统中存在用户与用户之间的社交关系或者视频与视频之间的关联关系,则获取这些信息,若无,则无需获取;用户对视频的历史行为信息包括用户对视频的观看,分享,上传或收藏行为。在上述用户原创视频预取方法中,在所述热门视频预取列表生成步骤之前还包括:对用户历史行为数据进行预处理步骤,具体为:只保留用户对视频肯定的信息;在非评分系统中,包括用户对视频的观看、分享、收藏以及上传信息。在上述用户原创视频预取方法中,其所述视频分类步骤具体为:首先,利用视频观看次数衡量视频流行度,按照视频流行度从高到低排序;其次,累计观看次数占总观看次数80%,流行度排名前10%的视频为热门视频,若流行度排名前10%的视频累计观看次数不足总观看次数的80%,根据流行度排名向后扩展热门视频,直至满足累计观看次数占总观看次数80%;最后,排除所有热门视频,剩余视频为长尾视频。在上述用户原创视频预取方法中,其所述热门视频预取列表生成步骤中,偏好度计算的具体过程为:首先,利用视频观看次数计算视频流行度;其次,利用用户历史行为信息计算用户对视频的兴趣因子;最后,结合流行度和兴趣因子,计算用户的视频的偏好度。在上述用户原创视频预取方法中,其所述图模型构建步骤具体为:首先,将用户实体及视频实体映射为图中相应的节点,并且用实体的类型作为相应节点的类型;其次,若用户之间存在社交关系,则在对应的节点之间添加边,边的权值代表社交关系强度,若视频之间存在关联关系,则在对应的节点之间添加边,边的权值代表关联关系强度;最后,若用户对视频有肯定行为信息,则在用户与该视频间添加边,边的权值代表肯定行为的强度。在上述用户原创视频预取方法中,其所述长尾视频预取列表生成步骤中,相关度计算的具体过程为:首先,计算得到节点之间的最短路径,若节点之间不存在路径,相关度为0;其次,计算单条最短路径的权值;最后,采用最短路径的权值之和作为节点之间的相关度。在上述用户原创视频预取方法中,其所述混合预取模型生成步骤具体为:利用用户历史行为信息,分别计算用户对热门视频及长尾视频的行为数量占总行为数量的比例,将计算结果作为热门视频预取列表和长尾视频预取列表的权值,对热门视频预取列表和长尾视频预取列表进行加权线性融合。此外,本专利技术提供了一种基于流行度和社交属性的个性化用户原创视频预取系统,包括:信息获取模块,用于获取用户对视频的历史行为信息,用户与用户之间的社交关系,视频与视频之间的关联关系以及视频自身的流行度信息;预处理模块,用于保留肯定的信息;视频分类模块,用于基于用户原创视频的流行度信息,将视频分为热门视频和长尾视频两类;热门视频预取列表生成模块,用于基于视频流行度和用户历史行为信息,计算用户对热门视频的偏好度,生成热门视频预取列表;图模型构建模块,用于基于用户对视频的历史行为信息,用户之间的社交关系以及视频之间关联关系构建含有节点类型以及边权值的图模型;长尾视频预取列表生成模块,用于基于图模型,利用基于最短路径权值的相关度测量方法,计算用户和长尾视频的相关度,生成长尾视频预取列表;混合预取模型生成模块,用于基于用户历史行为信息,计算热门视频预取权值及长尾视频预取权值,加权线性融合热门视频预取列表和长尾视频预取列表,生成个性化混合预取模型;视频预取模块,用于在保证用户当前观看视频流畅的情况下,基于个性化混合模型,为用户预取排在最靠前的一个或多个视频。本专利技术提出了一种基于流行度和社交网络的个性化用户原创视频预取方法及系统。第一次基于用户原创视频流行度的分布将视频分为热门视频和长尾视频两类,根据用户观看这两类视频的不同特点,充分利用用户社交关系,视频关联关系,视频流行度信息以及用户历史行为数据,挖掘了用户对未观看视频的偏好程度,对两类视频分别生成视频预取列表,通过混合预取模型加权线性融合这两类视频预取列表。因此有效的提高了视频预取的命中率和准确度,提升了用户原创视频服务的质量,改进了用户的观看体验。附图说明图1为本专利技术基于流行度和社交本文档来自技高网
...
基于流行度和社交网络的个性化用户原创视频预取方法及系统

【技术保护点】
一种基于流行度和社交网络的个性化用户原创视频预取方法,其特征在于,包括以下步骤:1)信息获取:获取用户对视频的历史行为信息,用户与用户之间的社交关系,视频与视频之间的关联关系以及原创视频的流行度信息;2)视频分类:基于获取的原创视频的流行度信息,将视频分为热门视频和长尾视频两类;3)生成热门视频预取列表:基于获取的原创视频的流行度信息及用户历史行为信息,计算用户对热门视频的偏好度,根据偏好度降序排序,为用户生成热门视频预取列表;4)图模型构建:基于获取的用户历史行为信息,用户之间的社交关系以及视频之间的关联关系构建图模型,其中的每一个节点或每一条边拥有与实际物理类型一致的节点类型或关系类型,每一条边拥有与实际关系强度一致的边权值;5)生成长尾视频预取列表:基于图模型,利用基于最短路径权值的相关度测量方法,测量用户和视频的相关度,根据相关度降序排序,为用户生成长尾视频预取列表;6)构建个性化混合预取模型:基于获取的用户的历史行为信息,对热门视频预取列表和长尾视频预取列表进行加权线性融合,构建个性化的混合预取模型;7)视频预取:在保证用户当前观看视频流畅的情况下,基于个性化混合预取模型,为用户预取排在最靠前的一部或多部视频。...

【技术特征摘要】
1.一种基于流行度和社交网络的个性化用户原创视频预取方法,其特征在于,包括以下步骤:1)信息获取:获取用户对视频的历史行为信息,用户与用户之间的社交关系,视频与视频之间的关联关系以及原创视频的流行度信息;2)视频分类:基于获取的原创视频的流行度信息,将视频分为热门视频和长尾视频两类;3)生成热门视频预取列表:基于获取的原创视频的流行度信息及用户历史行为信息,计算用户对热门视频的偏好度,根据偏好度降序排序,为用户生成热门视频预取列表;4)图模型构建:基于获取的用户历史行为信息,用户之间的社交关系以及视频之间的关联关系构建图模型,其中的每一个节点或每一条边拥有与实际物理类型一致的节点类型或关系类型,每一条边拥有与实际关系强度一致的边权值;5)生成长尾视频预取列表:基于图模型,利用基于最短路径权值的相关度测量方法,测量用户和视频的相关度,根据相关度降序排序,为用户生成长尾视频预取列表;6)构建个性化混合预取模型:基于获取的用户的历史行为信息,对热门视频预取列表和长尾视频预取列表进行加权线性融合,构建个性化的混合预取模型;7)视频预取:在保证用户当前观看视频流畅的情况下,基于个性化混合预取模型,为用户预取排在最靠前的一部或多部视频。2.根据权利要求1所述的个性化用户原创视频预取方法,其特征在于,步骤1)的信息获取过程中,对于用户与用户之间的社会关系以及视频与视频之间的关联关系,若在应用系统中存在,则获取这些信息;若没有,则无需获取。3.根据权利要求1或2所述的个性化用户原创视频预取方法,其特征在于,在所述步骤3)热门视频预取列表生成之前,还包括对用户历史行为信息进行预处理的步骤,具体为:只保留用户对视频肯定的信息;在非评分系统中,包括用户对视频的观看、分享、收藏以及上传信息。4.根据权利要求3所述的个性化用户原创视频预取方法,其特征在于,所述步骤2)视频分类的具体过程为:2.1)根据用户对视频的行为,构建用户-视频关系矩阵R,如果用户i对视频j有过观看、收藏、上传或者分享行为,Rij为1,否则Rij为0,R是一个m×n维的矩阵,m为系统中用户数量,n为系统中视频数量;2.2)根据流行度分布对视频进行分类:首先,利用视频观看次数衡量视频流行度,具体如公式(1),Pk=log(Mk+1)(1)其中Pk表示视频k的流行度,Mk表示视频k被观看的次数;其次,按照视频流行度从高到低排序,累计观看次数占总观看次数80%,流行度排名前10%的视频为热门视频,若流行度排名前10%的视频累计观看次数不足总观看次数的80%,根据流行度排名向后扩展热门视频,直至满足累计观看次数占总观看次数80%;最后,排除所有热门视频,剩余视频为长尾视频,表示热门视频集合,表示长尾视频集合。5.根据权利要求4中所述的个性化用户原创视频预取方法,其特征在于,步骤3)热门视频预取列表生成中,所述偏好度计算的具体过程为:3.1)根据视频k的流行度Pk,计算用户i对视频k的兴趣因子Ii(k),具体如公式(2),其中表示用户i有过肯定行为视频的集合,表示和视频k最相似的N部视频的集合,Sim(k,j)表示视频k和视频j的相似度;3.2)相似度采用余弦相似度计算得到,具体如公式(3),其中N(k)表示喜欢视频k的用户集合,并按最大值进行归一化,具体如公式(4)最后利用公式(5)计算用户i对热门视频k的偏好度Si(k)Si(k)=Pk×Ii(k)(5)。6.根据权利要求5所述的个性化用户原创视频预取方法,其特征在于,步骤4)图模型构建的具体过程为:首先,将用户实...

【专利技术属性】
技术研发人员:叶保留徐轩绚陆桑璐
申请(专利权)人:南京大学镇江高新技术研究院
类型:发明
国别省市:江苏;32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1