一种视频推荐方法及系统技术方案

技术编号:15329690 阅读:97 留言:0更新日期:2017-05-16 13:18
本发明专利技术属于数据处理领域,提供了一种视频推荐方法及系统。所述方法包括:根据用户的评分数据,建立用户和视频之间的关系;根据用户和视频之间的关系挖掘聚类中心点,建立用户聚类中心和视频之间的关联,从而进行基于全部聚类中心点的协同过滤算法,得出推荐结果;根据协同算法得出的结果,向指定用户推荐视频。在本发明专利技术中,通过基于全部聚类中心点的协同过滤算法,克服了现有协同过滤算法会遇到特征稀疏的问题,提高了推荐的准确性和对大规模数据的适应能力。

Video recommendation method and system

The invention belongs to the field of data processing, and provides a video recommendation method and system. The method comprises: according to user rating data, to establish a relationship between the user and the video; clustering center according to the relationship between the user and the video, the user can establish the association between the clustering center and video, so as to carry out collaborative filtering algorithm based on all clustering centers, the recommended results; according to the collaborative algorithm results. Recommended video to the designated user. In the invention, the collaborative filtering algorithm based on clustering all center points, to overcome the existing collaborative filtering algorithms have characteristics of sparse problem, improve the recommendation accuracy and ability to adapt to the large-scale data.

【技术实现步骤摘要】
一种视频推荐方法及系统
本专利技术属于数据处理领域,尤其涉及一种视频推荐方法及系统。
技术介绍
目前个性化推荐系统已广泛用于书籍、论文、音乐和电影等商品及内容的推荐上,而且个性化推荐系统的内部结构也发生了巨大变化。现有的推荐方法是根据用户对不同项目的兴趣爱好,基于用户对不同项目的这些信息,产生一个个性化的推荐列表,把用户没有接触过的视频、书籍、商品等对象推荐给用户。在学术界,个性化推荐的研究很多是依赖于协同过滤方法。协同过滤的思想主要分为基于用户(User-based)的协同过滤和基于项目(Item-based)的协同过滤两种,两者的最大区别在于目标邻近集合的选取范围恰好相反。基于用户(User-based)的协同过滤算法是通过计算用户间的相似度以获得目标用户的最邻近用户集,并根据最邻近用户集的评分来预测目标用户对未知项目的评分,然后把预测评分较高的项目作为推荐项目反馈给目标用户。系统通过学习用户的历史兴趣内容来进行相关节目的兴趣预测,需要为用户构建模型来过滤内容,这种方法简单快速。但是计算最近邻的方法通常有稀疏性和扩展性差的问题。
技术实现思路
鉴于此,本专利技术实施例提供一种视频推荐方法及系统,以更好的应对现有视频推荐系统遇到的数据稀疏性问题,从而更准确得为用户推荐视频。本专利技术实施例的第一方面,提供了一种视频推荐的方法,所述方法包括:建立全体用户和视频之间的关系;根据所述全体用户和视频之间的关系,建立用户聚类中心和视频之间的关联;基于全部所述用户聚类中心对应的所述关联,执行协同过滤算法;根据所述协同过滤算法得出的结果,向目标用户推荐视频。本专利技术实施例的第二方面,提供一个视频推荐的系统,所述系统包括:输入交互模块,用于建立全体用户和视频之间的关系;推荐计算模块,用于根据所述全体用户和视频之间的关系,计算用户聚类中心和视频之间的关联,采用基于全部所述用户聚类中心对应的所述关联,执行协同过滤算法,得出推荐结果;输出推荐模块,用于根据计算出的推荐结果,向目标用户推荐视频。本专利技术实施例与现有技术相比存在的有益效果是:通过基于全部聚类中心点的协同过滤算法,克服了现有协同过滤算法会遇到的特征稀疏的问题,提高了推荐的准确性和对大规模数据的适应能力。附图说明为了更清楚地说明本专利技术实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。图1是本专利技术实施例提供的视频推荐方法的实现流程图;图2是本专利技术实施例提供的视频推荐方法S102的具体实现流程图;图3是本专利技术实施例提供的全体用户的视频评分矩阵;图4是本专利技术实施例提供的视频推荐方法的加权示意图;图5是本专利技术实施例提供的迭代计算方法S204的具体实现流程图;图6是本专利技术实施例提供的视频推荐系统的系统框图。具体实施方式下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。本专利技术实施例根据所述全体用户和视频之间的关系,建立用户聚类中心和视频之间的关联;基于全部所述用户聚类中心对应的所述关联,执行协同过滤算法;根据所述协同过滤算法得出的结果,向目标用户推荐视频。为了说明本专利技术所述的技术方案,下面通过具体实施例来进行说明。参见图1,是本专利技术实施例提供的视频推荐方法的实现流程图,包括以下步骤:在步骤S101中,建立全体用户和视频之间的关系。全体用户指的是所有应用本系统观看过视频的用户。视频指的是本系统内所有的视频。其中,视频作为被推荐的对象,包括电影、电视剧、综艺节目等。本系统包括:网站或者电视系统等。本专利技术实施例可以采用用户为视频打分的方式,建立用户和视频之间的关系。当我们已经建立起用户和视频之间的关系之后,就可以利用评分数据,建立起一个全体用户对视频的评分矩阵,为了方便说明,在此,把这个矩阵命名为本系统的第一视频评分矩阵。需要说明的是,用户和视频之间的关系,可以由多种参数决定,比如:用户对视频的评分,用户实际观看视频的时长,用户观看视频的次数等。任意以上参数都可以建立用户与视频之间的关系。在步骤S102中,根据所述全体用户和视频之间的关系,建立用户聚类中心和视频之间的关联。当得到了全体用户对视频的评分数据之后,由于评分数据的数据量非常大,会导致视频推荐算法的运算时间过长,成本过高,因此很难直接应用这些数据对目标用户进行推荐。在本专利技术实施例中,以评分数据为例,在全体用户的评分数据基础上,找到几个“明星用户”,从而得到明星用户所对应的评分数据。建立起“明星用户”和视频之间的联系,这样庞大的数据量就会被大大的简化,便于后续的计算。需要说明的是,以上提及的“明星用户"并不是真正意义上的用户,而是基于普通用户的评分数据挖掘出来的少量具有代表性的虚拟用户,相当于用户聚类中心。在“明星用户”的获取过程中,用到了每个普通用户的评分数据,亦即每个用户都参与到了“明星用户”的选取过程中,所以“明星用户”对视频的喜好,即用户聚类中心对视频的喜好,能够在一定程度上代表普通用户对视频的喜好,从而提高了推荐结果的准确性。在步骤S103中,基于全部所述用户聚类中心对应的所述关联,执行协同过滤算法。本专利技术实施例中涉及的协同过滤算法,实际上是通过不断地更新用户聚类中心的视频评分矩阵,从而实现对“明星用户”的挖掘。在此,为了方便说明,称用户聚类中心的视频评分矩阵为第二视频评分矩阵,对协同过滤算法的具体执行过程将在下文实施例中进行详细阐述。在步骤S104中,根据所述协同过滤算法得出的结果,向目标用户推荐视频。如上文所述,基于全部所述用户聚类中心对应的所述关联,执行协同过滤算法。如图2所示,本专利技术实施例提供的视频推荐方法S103的具体实现如下:在S201中,根据全体用户对视频的评分数据,构建第一视频评分矩阵。具体地,设用户集合U={u1,u2,…,un}和视频集合I={I1,I2,…,Im},rij代表用户ui对电影Ij的评分,用户评分矩阵可以表示为一个n×m的矩阵,如图3便是一个典型的全体用户对视频的评分矩阵,即第一视频评分矩阵。rij数值所代表的用户对视频的满意度评分,可以人为地指定。通常的做法是把分数取值限制在特定的整数区间内。例如可以把rij设置为0到5的整数,其中0代表喜爱程度未知(即用户未对该视频评分),1代表最不喜欢,5代表最喜欢,其他分值代表对视频的喜爱程度在1至5之间依次递增。在S202中,根据所述第一视频评分矩阵,任意选取若干用户作为初始用户聚类中心,得到被选用户的全部评分数据,将被选用户和其评分数据组成第二视频评分矩阵。在S203中,计算初始用户聚类中心和全体用户的相似矩阵。具体地,有多种求相关系数的方式,比如:皮尔逊相关系数法,杰卡德相关系数法,余弦距离法,欧式距离法。在本专利技术实施例中,通过两种方式求出所述相似矩阵。第一种采用皮尔逊相关系数。皮尔逊相关系数算法首先会找出两个用户都曾评分过的视频,然后计算两者的评分总和与平方和。本文档来自技高网...
一种视频推荐方法及系统

【技术保护点】
一种视频推荐方法,其特征在于,包括:建立全体用户和视频之间的关系;根据所述全体用户和视频之间的关系,建立用户聚类中心和视频之间的关联;基于全部所述用户聚类中心对应的所述关联,执行协同过滤算法;根据所述协同过滤算法得出的结果,向目标用户推荐视频。

【技术特征摘要】
1.一种视频推荐方法,其特征在于,包括:建立全体用户和视频之间的关系;根据所述全体用户和视频之间的关系,建立用户聚类中心和视频之间的关联;基于全部所述用户聚类中心对应的所述关联,执行协同过滤算法;根据所述协同过滤算法得出的结果,向目标用户推荐视频。2.根据权利要求1所述的方法,其特征在于,所述建立全体用户和视频之间的关系,包括:获取所述全体用户对视频的评分。3.根据权利要求1所述的方法,其特征在于,所述根据所述全体用户和视频之间的关系,建立用户聚类中心和视频之间的关联,包括:根据所述全体用户对视频的评分,构建第一视频评分矩阵;根据所述第一视频评分矩阵,任意选取若干用户作为初始用户聚类中心,得到被选用户的全部评分数据,将被选用户和其评分数据组成第二视频评分矩阵。4.根据权利要求3所述的方法,其特征在于,所述执行协同过滤算法,包括:计算所述初始用户聚类中心和所述全体用户的相似矩阵;经过迭代计算不断更新所述第二视频评分矩阵,以及不断更新所述相似矩阵。根据预设的相似度阀值,过滤与目标用户的相似度低于所述相似度阀值的用户聚类中心;根据过滤后的用户聚类中心,选取其在所述第二视频评分矩阵中的评分数据,以及所述相似矩阵中的数据,加权平均计算出所述目标用户对其未评分视频的评分;根据所述目标用户对其未评分视频的评分,得出推荐结果。5.根据权利要求4所述的方法,其特征在于,所述迭代计算是一个三重循环的计算过程,包括:最内层循环:根据当前的所述第二视频评分矩阵、当前的所述相似矩阵,以及所述第一视频评分矩阵,计算得出数据,包括:计算所述全体用户的评分估值;计算所述全体用户对视频的评分与所述评分估值之间的误差值;更新用户聚类中心的评分数据;中间层循环:根据所述最内层循环计算得出的最新用户聚类中心的评分矩阵,更新每一个用户聚类中心的评分期望值;最外层循环:根据最内层循环和第二层循环更新的参数,更新所述相似矩阵。6.一种视频推荐系统,其特征在于,包括:输入交互模块,用于建立全体用户和视频之间的关系...

【专利技术属性】
技术研发人员:冯研
申请(专利权)人:TCL集团股份有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1