一种视频聚类推荐方法和装置制造方法及图纸

技术编号:12999947 阅读:69 留言:0更新日期:2016-03-10 12:52
本发明专利技术提供了一种视频聚类推荐方法包括:根据所有用户对视频的评分数目,对视频进行排序得到视频集n为视频个数;按照视频的评分数目,从高到低依次计算每个视频与评分数目比较高的视频,进行集合差异度计算;获取所计算的集合差异度最小值,如果所述集合差异度最小值小于预设的阈值,则将所述集合差异度最小值对应的评分数目比较高的视频,与视频合并为一个视频集合类。本发明专利技术进行在聚类时能够有效的避免多次迭代运算,不容易受到异常值影响,大大的提高了分类效率以及聚类质量。

【技术实现步骤摘要】

本专利技术属于视频聚类领域,尤其涉及一种视频聚类推荐方法和装置
技术介绍
随着互联网资源的不断丰富,人们在查看多媒体资源,比如观看视频,或者播放音 乐文件时,需要在海量的多媒体资源中进行文件的查找,需要花费较多的时间获取用户喜 欢的多媒体数据。 为提高用户获取喜欢的多媒体文件,比如视频数据等,现有的视频推荐方法一般 基于聚类技术和协同过滤推荐算法一起,通过聚类技术,将搜索目标对象最近邻居的范围 缩小到与目标对象相似性程度最高的几个聚类,可以有效的减少计算量,提高实时响应能 力。 现有的K-means等分割聚类算法,需要进行多次迭代运算,计算效率比较低,并且 容易受到异常值的影响,导致聚类结果质量不高。
技术实现思路
本专利技术的目的在于提供一种视频聚类推荐方法,以解决现有的分割聚类算法,需 要进行多次迭代运算,计算效率比较低,并且容易受到异常值的影响,导致聚类结果质量不 高的问题。 第一方面,本专利技术实施例提供了一种视频聚类推荐方法,所述方法包括: 根据所有用户对视频的评分数目,对视频进行排序得到视频集巧、 Cl......C? ) ,η为视频个数; 按照视频的评分数目,从高到低依次计算每个视频cf与评分数目比?0较高的视 频,或者由评分数目比?η较高的视频构成视频集合类,进行集合差异度计算; 获取所计算的集合差异度最小值,如果所述集合差异度最小值小于预设的阈值, 则将所述集合差异度最小值对应的评分数目比Cf较高的视频,或者由评分数目比cf较高 的视频构成的视频集合类,与视频C?合并为一个视频集合类,其中,〇〈i〈n+l。 结合第一方面,在第一方面的第一种可能实现方式中,按照视频的评分数目,从高 到低依次计算每个视频?°与评分数目比cf较高的视频,或者由评分数目比cf较高的视频 构成视频集合类,进行集合差异度计算步骤包括: 计算视频g与视频??的集合差异度SFD(C2e); 当所述集合差异度SFD(C;\Ct)小于预设的阈值时,则将视频与视频Cf合并 为视频集合类烊,当所述集合差异度SFD((6f:,cf)大于预设的阈值时,则将视频cf与视频 cf分别生成新的视频集合类^与匀: 对于视频@ (〇<j<n):,将其与比C;1的评分数目较多的视频构成的视频集合类 进行集合差异度计算。 结合第一方面,在第一方面的第二种可能实现方式中,计算所述集合差异度的公 式为:,其中K为用户对视频集N中的评论个数由多到少所选择的 用户数,所述I为视频所属的类别数,所述G为比较的两个视频的共有的视频类别数。 结合第一方面,在第一方面的第三种可能实现方式中,在获取所计算的集合差异 度最小值后,所述方法还包括: 如果所述集合差异度最小值大于预设的阈值,则将所述视频G生成新的视频集合 类唸。 结合第一方面,在第一方面的第四种可能实现方式中,在得到视频集合类后,所述 方法还包括: 接收用户输入的目标视频,查找目标视频所属的视频集合类; 查找所述视频集合类中,没有被所述用户评分的新视频集合,在所述新视频集合 中根据相似性计算公式得到最近邻视频集合; 根据用户输入的视频评分矩阵R与所述最近邻视频集合中的每个视频,计算所述 最近邻视频集合中的每个视频的预测评分,根据所述预设评分推荐一个或者多个视频。 结合第一方面的第四种可能实现方式,在第一方面的第五种可能实现方式中, 结合第一方面的第四种可能实现方式,在第一方面的第五种可能实现方式中,所 述查找所述视频集合类中,没有被所述用户评分的新视频集合,在所述新视频集合中根据 相似性计算公式得到最近邻视频集合步骤包括: 统计用户u在所述视频集合类中已评分的视频集合Iu,所述视频集合类为P,则没 有被所述用户评分的新抑颇隹合为Τ' = P-T, 根据公式「计算目标视频i与所述新视频集合中 的每个视频j的相似度,根据所述相似度选择预定个数视频作为所述目标视频的最近邻视 频集合,其中U为用户集合。 结合第一方面的第四种可能实现方式,在第一方面的第六种可能实现方式中,所 述根据用户输入的视频评分矩阵R与所述最近邻视频集合中的每个视频,计算所述最近邻 视频集合中的每个视频的预测评分步骤包括: 根据公式计算所述最近邻视频集合中的每个视频的预 测评分,其中sim(i,j)为目标视频i与所述新视频集合中的每个视频j的相似度,RUi]为用 户输入的视频的评分矩阵中用户对视频j的评分数据。 第二方面,本专利技术实施例提供了一种视频聚类推荐装置,所述装置包括: 排序单元,用于根据所有用户对视频的评分数目,对视频进行排序得到视频集 N(Cf、0…·C),11为视频个数; 差异度计算单元,用于按照视频的评分数目,从高到低依次计算每个视频Cf与评 分数目比Cf较高的视频,或者由评分数目比< 较高的视频构成视频集合类,进行集合差异 度计算; 视频集合类生成单元,用于获取所计算的集合差异度最小值,如果所述集合差异 度最小值小于预设的阈值,则将所述集合差异度最小值对应的评分数目比?°较高的视频, 或者由评分数目比c?较高的视频构成的视频集合类,与视频c?合并为一个视频集合类,其 中,0〈i〈n+l。 结合第二方面,在第二方面的第一种可能实现方式中,所述差异度计算单元包 括: 第一计算子单元,用于计算视频0与视频Cf的集合差异度SFD(Ctg); 比较子单元,用于当所述集合差异度SFDicfXt)小于预设的阈值时,则将视频 C20与视频01()合并为视频集合类(: 11,当所述集合差异度证0(0;3〇大于预设的阈值时,则 将视频《与视频ef分别生成新的视频集合类炫与0; 第二计算子单元,用于对于视频< (0<j<n).,将其与比eg的评分数目较多的视 频构成的视频集合类进行集合差异度计算。 结合第二方面,在第二方面的第二种可能实现方式中,所述装置还包括: 视频集合类查找单元,用于接收用户输入的目标视频,查找目标视频所属的视频 集合类; 最近邻视频集合计算单元,用于查找所述视频集合类中,没有被所述用户评分的 新视频集合,在所述新视频集合中根据相似性计算公式得到最近邻视频集合; 预测推荐单元,用于根据用户输入的视频评分矩阵R与所述最近邻视频集合中的 每个视频,计算所述最近邻视频集合中的每个视频的预测评分,根据所述预设评分推荐一 个或者多个视频。 在本专利技术中,根据用户对视频的评分数目,选择将评分数目较少的视频,与评分数 目相对较多的视频,或者与视频集合类进行集合差异度计算,所述视频集合类由评分数目 相对较多的视频构成,当所述差异度计算的最小值小于当前第1页1 2 3 4 本文档来自技高网...

【技术保护点】
一种视频聚类推荐方法,其特征在于,所述方法包括:根据所有用户对视频的评分数目,对视频进行排序得到视频集n为视频个数;按照视频的评分数目,从高到低依次计算每个视频与评分数目比较高的视频,或者由评分数目比较高的视频构成视频集合类,进行集合差异度计算;获取所计算的集合差异度最小值,如果所述集合差异度最小值小于预设的阈值,则将所述集合差异度最小值对应的评分数目比较高的视频,或者由评分数目比较高的视频构成的视频集合类,与视频合并为一个视频集合类,其中,0<i<n+1。

【技术特征摘要】

【专利技术属性】
技术研发人员:冯研
申请(专利权)人:TCL集团股份有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1