一种获取推荐视频的方法和系统技术方案

技术编号:14345872 阅读:77 留言:0更新日期:2017-01-04 17:03
本发明专利技术适用于信息处理技术领域,提供了一种获取推荐视频的方法和系统,所述方法包括:根据预设的筛选条件获取用户群观看的视频集合;根据预设的视频支持度阈值从所述视频集合获取视频频繁项集,并对所述视频频繁项集按所述视频支持度进行排序;基于Fp-growth的Spark并行算法从排序后的视频频繁项集中获取推荐视频项集。通过本发明专利技术,可以降低获取推荐视频的计算复杂度,减少计算时间。

【技术实现步骤摘要】

本专利技术属于信息处理
,尤其涉及一种获取推荐视频的方法和系统
技术介绍
在视频网站上观看视频已经成为人们生活的一部分,现有的视频网站通常是根据用户群观看视频的历史记录来推荐其可能感兴趣的视频。然而,现有技术在获取推荐视频时,需要根据历史记录对整个视频数据库进行搜索,计算量庞大,而且耗时较长。
技术实现思路
鉴于此,本专利技术实施例提供一种获取推荐视频的方法和系统,以解决现有技术在获取推荐视频时,存在的计算量庞大、耗时较长的问题。本专利技术实施例是这样实现的,一种获取推荐视频的方法,所述方法包括以下步骤:根据预设的筛选条件获取用户群观看的视频集合;根据预设的视频支持度阈值从所述视频集合获取视频频繁项集,并对所述视频频繁项集按所述视频支持度进行排序;基于Fp-growth的Spark并行算法从排序后的视频频繁项集中获取推荐视频项集。本专利技术实施例的另一目的在于提供一种获取推荐视频的系统,所述系统包括:视频集合获取单元,用于根据预设的筛选条件获取用户群观看的视频集合;视频频繁项集及排序获取单元,用于根据预设的视频支持度阈值从所述视频集合获取单元获取的视频集合中获取视频频繁项集,并对所述视频频繁项集按所述视频支持度进行排序;推荐视频项集获取单元,用于基于Fp-growth的Spark并行算法从所述视频频繁项集及排序获取单元获取的排序后的视频频繁项集中获取推荐视频项集。本专利技术实施例根据预设的筛选条件获取用户群观看的视频集合,并根据预设的视频支持度阈值从所述视频集合获取视频频繁项集,对所述视频频繁项集按所述视频支持度进行排序,最后基于Fp-growth的Spark并行算法从排序后的视频频繁项集中获取推荐视频项集。与现有技术相比,本专利技术实施例需要根据所述筛选条件以及视频支持度阈值先筛选出视频频繁项集,再基于Fp-growth的Spark并行算法对所述视频频繁项集进行并行计算,降低了获取推荐视频的计算复杂度,减少了计算时间。附图说明为了更清楚地说明本专利技术实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。图1是本专利技术实施例提供的获取推荐视频方法的流程图;图2是本专利技术实施例提供的获取推荐视频系统的结构图。具体实施方式为了使本专利技术的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本专利技术进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本专利技术,并不用于限定本专利技术。为了说明本专利技术所述的技术方案,下面通过具体实施例来进行说明。实施例一如图1所示为本专利技术实施例提供的获取推荐视频方法的流程图,所述方法包括以下步骤:步骤S101,根据预设的筛选条件获取用户群观看的视频集合。在本专利技术实施例中,根据预设的视频筛选条件,从用户群观看视频的网站的服务器,获取用户群观看的视频集合。其中,所述筛选条件包括但不限于以下至少一项:观看视频时长、观看视频的时间段、视频拖动频率以及单次拖动视频最大时长。步骤S102,根据预设的视频支持度阈值从所述视频集合中获取视频频繁项集,并对所述视频频繁项集按所述视频支持度进行排序。在本专利技术实施例中,预先设定视频支持度阈值,从所述视频集合中获取符合所述视频支持度阈值的视频频繁项集,并对所述视频频繁项集中的视频项按照视频支持度进行排序,得到视频频繁项集。如表1中的视频频繁项集排序为[g(4)、d(4)、b(3)、c(3)、n(3)、q(3)]。用户视频名称周几时间段U1g、b、d、e、h、n、q2AMU1b、c、d、g、m、n、p2AMU2c、g、i、k、p2AMU1c、d、l、t、q2AMU3b、g、d、f、m、q、n、o2AM表1上述表1为用户群观看的视频集合。表2是根据预设的视频支持度阈值从表1的视频集合中筛选的视频频繁项集以及该视频频繁项集按视频支持度进行的降序排列。其中,预设的视频支持度阈值为“视频支持度≥3”。视频项视频支持度g4d4b3c3n3q3表2步骤S103,基于Fp-growth的Spark并行算法从排序后的视频频繁项集中获取推荐视频项集。在本专利技术实施例中,Fp-growth的Spark并行算法为基于Map-Reduce模型实现的分布式算法。基于Fp-growth的Spark并行算法从排序后的视频频繁项集中获取推荐视频项集具体可以包括:1、在Map映射阶段,按照所述排序获取所述视频频繁项集中每个视频项的条件模式基。在本专利技术实施例中,所述Spark并行算法分为Map映射阶段和Reduce规约阶段。在Map阶段,按照所述排序获取所述视频频繁项集中每个视频项的条件模式基。如表3所示即为获取的条件模式基:表32、在Reduce规约阶段,根据Spark算法中Shuffle函数的洗牌机制,将相同视频项的条件模式基规约到一起,并根据所述视频支持度阈值从所述规约到一起的条件模式基中获取所述每个视频项的局部Fp-tree。在本专利技术实施例中,在Reduce阶段,Shuffle函数将视频频繁项集中的视频项按随机顺序重新排列,重新排列的相同视频项的条件模式基被规约到一起,按照上述的视频支持度阈值,获取每个视频项的局部Fp-tree(即表4中在Reduce输入端输入视频项的条件模式基,经过规约后在Reduce的输出端输出局部Fp-tree)。表4所示为根据表3在Reduce阶段获取的每个视频项的局部Fp-tree。表43、对所述视频频繁项集中所有的视频项,通过视频项的局部Fp-tree获取所述视频项的推荐视频项子集。在本专利技术实施例中,选择一视频项x,从所述视频项x的局部Fp-tree中找到所述视频项x所有长路径,对所述所有长路径上的节点找出所有组合方式,并对所述节点进行合并获取视频项x的第一频繁项集,将所述第一频繁项集与视频项x合并,得到第二频繁项集,即第二频繁项集为第一频繁项集加上视频项x,第二频繁项集即为视频项x的推荐视频项子集,所述节点为视频项x的局部Fp-tree中与视频项x相关的视频项。4、将所述推荐视频项子集进行合并,获得推荐视频项集。在本专利技术实施例中,如表2所示,视频频繁项集中包括:g、d、b、c、n、q,对每一个视频项可以获取推荐视频项子集,可记为:g′、d′、b′、c′、n′、q′,则最终的推荐视频项集为:g′+d′+b′+c′+n′+q′。在具体的使用过程中,根据用户群已观看的视频,假设为g,则可以从推荐视频项集中获取与g相关的推荐视频,向用户群发送该推荐视频。对于推荐视频还可对其按照频繁度进行排序,并且可以只推荐频繁度高的视频。作为本专利技术的一个可选实施例,所述方法还包括:设置推荐视频更新频率,根据所述更新频率对所述推荐视频项集进行更新。在本专利技术实施例中,可以预设一推荐视频更新频率(如:24小时更新一次),按照该推荐视频更新频率重复步骤S101~S103对推荐视频项集进行更新,从而使得用户群群可以及时的获取最新的推荐视频。实施例二如图2所示为本专利技术实施例提供的获取推荐视频系统的结构图,为了便于说明,仅示出与本专利技术实施例相关的部分。所述获取推荐视频系统可以是内置于智能终端(例如手机、平板本文档来自技高网...
一种获取推荐视频的方法和系统

【技术保护点】
一种获取推荐视频的方法,其特征在于,所述方法包括:根据预设的筛选条件获取用户群观看的视频集合;根据预设的视频支持度阈值从所述视频集合获取视频频繁项集,并对所述视频频繁项集按所述视频支持度进行排序;基于Fp‑growth的Spark并行算法从排序后的视频频繁项集中获取推荐视频项集。

【技术特征摘要】
1.一种获取推荐视频的方法,其特征在于,所述方法包括:根据预设的筛选条件获取用户群观看的视频集合;根据预设的视频支持度阈值从所述视频集合获取视频频繁项集,并对所述视频频繁项集按所述视频支持度进行排序;基于Fp-growth的Spark并行算法从排序后的视频频繁项集中获取推荐视频项集。2.如权利要求1所述的方法,其特征在于,在基于Fp-growth的Spark并行算法从排序后的视频频繁项集中获取推荐视频项集之后,所述方法还包括:设置推荐视频更新频率,根据所述更新频率对所述推荐视频项集进行更新。3.如权利要求1所述的方法,其特征在于,所述筛选条件包括以下至少一项:观看视频时长、观看视频的时间段、视频拖动频率和单次拖动视频最大时长。4.如权利要求1至3任一项所述的方法,其特征在于,所述基于Fp-growth的Spark并行算法从排序后的视频频繁项集中获取推荐视频项集包括:在Map映射阶段,按照所述排序获取所述视频频繁项集中每个视频项的条件模式基;在Reduce规约阶段,根据Spark算法中Shuffle函数的洗牌机制,将相同视频项的条件模式基规约到一起,并根据所述视频支持度阈值从所述规约到一起的条件模式基中获取所述每个视频项的局部Fp-tree;对所述视频频繁项集中所有的视频项,通过视频项的局部Fp-tree获取所述视频项的推荐视频项子集;将所述推荐视频项子集进行合并,获得推荐视频项集。5.一种获取推荐视频的系统,其特征在于,所述系统包括:视频集合获取单元,用...

【专利技术属性】
技术研发人员:谢冰王巍
申请(专利权)人:TCL集团股份有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1