一种基于用户搜索内容的多媒体推荐方法及系统技术方案

技术编号:14239412 阅读:37 留言:0更新日期:2016-12-21 14:54
本发明专利技术公开一种基于用户搜索内容的多媒体推荐方法及系统,主要是根据建立的查询‑多媒体分类矩阵对用户评分矩阵的特征项进行赋权,得到改进后的用户评分矩阵,然后结合基于用户查询向量的用户相似性以及基于用户评分矩阵的用户相似性计算得到用户总体相似性。本发明专利技术通过提取并量化用户搜索关键字记录中蕴含的用户对特定多媒体类型的喜好程度信息,引入用户查询向量集,并作为目标用户对多媒体项目的初始评分,从而在解决了传统协同过滤算法的冷启动和特征稀疏的问题。另外本发明专利技术将用户查询向量的用户相似性以及基于用户评分矩阵的用户相似性相结合,计算得到用户总体相似性,解决了传统协同过滤算法的推荐精度不足的问题。

Multimedia recommendation method and system based on user search content

The invention discloses a method and system for multimedia content search based on user recommendation method, mainly according to the weighted query classification matrix to establish multimedia user rating matrix feature, users get the score of the improved matrix, then combined with the user query similarity and similarity calculated overall similarity score matrix of user user user based on the amount of users based on the. The present invention through the extraction and quantification of users to search keywords for the particular record contains multimedia types of preference information, the user query vector set, and as the target users of the project initial score, so as to solve the traditional collaborative filtering algorithm and sparse feature of cold start problem. In addition the user queries the user similarity and similarity score matrix by combining user user based on the user overall similarity calculation, to solve the traditional collaborative filtering recommendation algorithm accuracy problem.

【技术实现步骤摘要】

本专利技术涉及内容推荐领域,尤其涉及一种基于用户搜索内容的多媒体推荐方法及系统
技术介绍
个性化推荐系统目前已广泛用于书籍、论文、音乐和电影等商品及内容的推荐上,而且个性化推荐系统的内部结构也发生了巨大变化。随着推荐内容的多元化发展,原始的推荐技术也在与时俱进地快速发展,例如协同过滤、基于内容信息和迁移学习等推荐技术在这样的大环境下应运而生。个性化推荐系统根据推荐内容的不同可分为三种类型:第一类推荐系统应用于电子商务网站上,其向用户推荐符合自身喜好的商品,这类推荐系统称为电子商务个性化推荐系统或电商推荐系统,亚马逊、淘宝和京东等大型电商网站均使用这类推荐系统;第二类推荐系统应用于当今流行的社交网络上,其向用户推荐其相关的社会关系或兴趣圈子中可能会感兴趣的用户、群组和新闻等相关信息,如Facebook、新浪微博和人人网等社交网络门户均使用这类推荐系统;第三类推荐系统应用于垂直分享类门户网站中,其向用户推荐用户可能感兴趣的类目及内容,如Netflix、时光网和豆瓣网等多媒体消费类垂直门户均使用这类推荐系统。协同过滤推荐算法主要分为基于用户(User-based)的协同过滤和基于项目(Item-based)的协同过滤两种,两者的最大区别在于目标邻近集合的选取范围恰好相反。基于用户(User-based)的协同过滤算法是通过计算用户间的相似度以获得目标用户的最邻近用户集,并根据最邻近用户集的评分来预测目标用户对未知项目的评分,然后把预测评分较高的项目作为推荐项目反馈给目标用户;而基于项目的协同过滤算法则是通过计算不同项目间的相似性,然后选择与目标用户喜欢的项目具有较高相似性的项目作为推荐内容反馈给目标用户。传统的协同过滤推荐系统算法虽然在一定程度上完成了推荐功能,但也存在着以下问题:1、基于用户评估矩阵的相似性计算过程中,特征稀疏和冷启动问题比较突出;2、目前绝大部分个性化推荐系统主要是针对用户的显式输入数据如性别、年龄、住址、爱好标签等进行相似度的相关计算,而未考虑用户的隐式输入数据对相似度计算的影响;3、协同过滤算法自身不具备自适应性,用户评价项中的零值不能通过算法自身的调整来实现权值重赋,导致推荐精度的下降甚至无法推荐等问题。因此,现有技术还有待于改进和发展。
技术实现思路
鉴于上述现有技术的不足,本专利技术的目的在于提供一种基于用户搜索内容的多媒体推荐方法及系统,旨在解决现有推荐方法存在冷启动、特征稀疏以及精度不足的问题。本专利技术的技术方案如下:一种基于用户搜索内容的多媒体推荐方法,其中,包括:步骤A、收集用户的搜索关键字记录和打分记录,并根据搜索关键字记录生成用户查询向量集,以及根据打分记录生成用户评分矩阵;步骤B、建立多媒体分类标签词典,根据多媒体分类标签词典将用户查询向量集转换为查询-多媒体分类矩阵,然后根据所述查询-多媒体分类矩阵对用户评分矩阵的特征项进行赋权,得到改进后的用户评分矩阵;步骤C、遍历用户查询向量集中的每个用户查询向量,计算得到基于用户查询向量的用户相似性;并根据改进后的用户评分矩阵计算得到基于用户评分矩阵的用户相似性;步骤D、根据所述基于用户查询向量的用户相似性以及基于用户评分矩阵的用户相似性计算得到用户总体相似性,并依据用户总体相似性选取与目标用户相似度最大的若干个用户作为目标用户的近邻用户集;步骤E、根据近邻用户集中的用户对目标用户未评价项目的评价,预测目标用户对其未评价项目的评价,并按照评分从高到低排序,挑选排名靠前的若干多媒体内容作为推荐结果推送给目标用户。所述的基于用户搜索内容的多媒体推荐方法,其中,所述步骤B具体包括:B1、定义多媒体类别;B2、建立多媒体分类标签词典;B3、根据多媒体分类标签词典将用户查询向量集转换为查询-多媒体分类矩阵;B4、根据所述查询-多媒体分类矩阵中的分类查询信息计算出用户对不同类别多媒体的偏好程度;B5、根据所述偏好程度对用户评分矩阵的特征项进行赋权得到改进后的用户评分矩阵。所述的基于用户搜索内容的多媒体推荐方法,其中,所述步骤C中,计算得到基于用户查询向量的用户相似性的步骤具体包括:C1、将用户查询向量集中的各用户查询向量中的词语元素表示为8位编码形式;C2、遍历每个用户查询向量的所有词语元素,记录每个词语元素所在分支节点层的节点总数和其所在段落行的同义词项数;C3、根据所述节点总数和同义词项数,计算两个词语元素的义项之间的相似度;C4、根据所述义项的相似度,计算相应词语元素之间的相似度;C5、遍历全部的用户查询向量,记录每个用户查询向量的同义词集合以及该同义词集合中各同义词出现的数目,结合词语元素之间的相似度,计算任意两个用户查询向量之间的相似度,并作为基于用户查询向量的用户相似性Sims(U1,U2)。所述的基于用户搜索内容的多媒体推荐方法,其中,所述步骤C中,基于用户评分矩阵的用户相似性按如下公式计算: Sim E ( U 1 , U 2 ) = Σ k = 1 m ( r 1 k - r 1 ‾ ) * ( r 2 k - r 2 ‾ ) Σ k = 1 m ( r 本文档来自技高网
...
一种基于用户搜索内容的多媒体推荐方法及系统

【技术保护点】
一种基于用户搜索内容的多媒体推荐方法,其特征在于,包括:步骤A、收集用户的搜索关键字记录和打分记录,并根据搜索关键字记录生成用户查询向量集,以及根据打分记录生成用户评分矩阵;步骤B、建立多媒体分类标签词典,根据多媒体分类标签词典将用户查询向量集转换为查询‑多媒体分类矩阵,然后根据所述查询‑多媒体分类矩阵对用户评分矩阵的特征项进行赋权,得到改进后的用户评分矩阵;步骤C、遍历用户查询向量集中的每个用户查询向量,计算得到基于用户查询向量的用户相似性;并根据改进后的用户评分矩阵计算得到基于用户评分矩阵的用户相似性;步骤D、根据所述基于用户查询向量的用户相似性以及基于用户评分矩阵的用户相似性计算得到用户总体相似性,并依据用户总体相似性选取与目标用户相似度最大的若干个用户作为目标用户的近邻用户集;步骤E、根据近邻用户集中的用户对目标用户未评价项目的评价,预测目标用户对其未评价项目的评价,并按照评分从高到低排序,挑选排名靠前的若干多媒体内容作为推荐结果推送给目标用户。

【技术特征摘要】
1.一种基于用户搜索内容的多媒体推荐方法,其特征在于,包括:步骤A、收集用户的搜索关键字记录和打分记录,并根据搜索关键字记录生成用户查询向量集,以及根据打分记录生成用户评分矩阵;步骤B、建立多媒体分类标签词典,根据多媒体分类标签词典将用户查询向量集转换为查询-多媒体分类矩阵,然后根据所述查询-多媒体分类矩阵对用户评分矩阵的特征项进行赋权,得到改进后的用户评分矩阵;步骤C、遍历用户查询向量集中的每个用户查询向量,计算得到基于用户查询向量的用户相似性;并根据改进后的用户评分矩阵计算得到基于用户评分矩阵的用户相似性;步骤D、根据所述基于用户查询向量的用户相似性以及基于用户评分矩阵的用户相似性计算得到用户总体相似性,并依据用户总体相似性选取与目标用户相似度最大的若干个用户作为目标用户的近邻用户集;步骤E、根据近邻用户集中的用户对目标用户未评价项目的评价,预测目标用户对其未评价项目的评价,并按照评分从高到低排序,挑选排名靠前的若干多媒体内容作为推荐结果推送给目标用户。2.根据权利要求1所述的基于用户搜索内容的多媒体推荐方法,其特征在于,所述步骤B具体包括:B1、定义多媒体类别;B2、建立多媒体分类标签词典;B3、根据多媒体分类标签词典将用户查询向量集转换为查询-多媒体分类矩阵;B4、根据所述查询-多媒体分类矩阵中的分类查询信息计算出用户对不同类别多媒体的偏好程度;B5、根据所述偏好程度对用户评分矩阵的特征项进行赋权得到改进后的用户评分矩阵。3.根据权利要求1所述的基于用户搜索内容的多媒体推荐方法,其特征在于,所述步骤C中,计算得到基于用户查询向量的用户相似性的步骤具体包括:C1、将用户查询向量集中的各用户查询向量中的词语元素表示为8位编码形式;C2、遍历每个用户查询向量的所有词语元素,记录每个词语元素所在分支节点层的节点总数和其所在段落行的同义词项数;C3、根据所述节点总数和同义词项数,计算两个词语元素的义项之间的相似度;C4、根据所述义项的相似度,计算相应词语元素之间的相似度;C5、遍历全部的用户查询向量,记录每个用户查询向量的同义词集合以及该同义词集合中各同义词出现的数目,结合词语元素之间的相似度,计算任意两个用户查询向量之间的相似度,并作为基于用户查询向量的用户相似性Sims(U1,U2)。4.根据权利要求3所述的基于用户搜索内容的多媒体推荐方法,其特征在于,所述步骤C中,基于用户评分矩阵的用户相似性按如下公式计算: Sim E ( U 1 , U 2 ) = Σ k = 1 m ( r 1 k - r 1 ‾ ) * ( r 2 k - r 2 ‾ ) Σ k = 1 m ( r 1 k - r 1 ‾ ) 2 * Σ k = 1 m ( r 2 k - r 2 ‾ ) 2 ]]>其中,(r11,r12,r13,..,r1m)为用户U1的评分向量,(r21,r22,r23,..,r2m)为用户U2的评分向量,分别表示用户U1、U2对多媒体各项目的平均评分值。5.根据权利要求4所述的基于用户搜索内容的多媒体推荐方法,其特征在于,所述步骤D中,用户总体相似性计算公式如下:Simuser(U1,U2)=ω×SimE(U1,U2)+(1-ω)×SimS(U1,U2),ω是调节系数,且ω<0.5。6.根据权利要求5所述的基于用户搜索内容的多媒体推荐方法,其特征在于,所述步骤E中,目标用户i对项目j的预测评分rij按照...

【专利技术属性】
技术研发人员:冯研
申请(专利权)人:TCL集团股份有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1