当前位置: 首页 > 专利查询>东华大学专利>正文

一种基于物品内容特征的改进协同过滤推荐方法技术

技术编号:19177483 阅读:21 留言:0更新日期:2018-10-17 00:23
本发明专利技术涉及一种基于物品内容特征的改进协同过滤推荐方法,包括以下步骤:读取数据集,并拆分数据集,获取用户评分记录以及物品点击量数据;计算物品与物品之间的共现矩阵以及每个物品点击量均值;计算物品点击量影响因子,该因子与物品之间的点击量差值成反相关;物品相似度与物品点击量因子相乘得到改进后的物品相似度,最终生成相似度矩阵;针对目标用户,找到K个相似的物品,根据兴趣度计算公式计算用户对物品的兴趣程度;最后根据用户对物品的兴趣度排序,推荐最感兴趣的前N个物品。本发明专利技术有效提高推荐的覆盖率,增加了推荐物品的多样性。

An improved collaborative filtering recommendation method based on content characteristics of items

The invention relates to an improved collaborative filtering recommendation method based on item content features, which comprises the following steps: reading a data set and splitting the data set to obtain user score records and item click data; calculating the co-occurrence matrix between the item and the item and the average click value of each item; calculating the click shadow of the item. Sound factor is inversely related to the difference of clicks between items; the improved item similarity is obtained by multiplying item similarity with clicks of items, and the similarity matrix is finally generated; K similar items are found for the target users, and the degree of interest of the users is calculated according to the interest degree formula. Then, according to the user's interest ordering, recommend the most interested N items. The invention effectively improves the recommended coverage and increases the diversity of the recommended articles.

【技术实现步骤摘要】
一种基于物品内容特征的改进协同过滤推荐方法
本专利技术涉及商品推荐
,特别是涉及一种基于物品内容特征的改进协同过滤推荐方法。
技术介绍
推荐系统(RecommendationSystem,RS),简单来说就是根据用户的日常行为,自动预测用户的喜好,为用户提供更多完善的服务。协同过滤技术是目前推荐系统中最成功和应用最广泛的技术,在理论研究和实践中都取得了快速的发展,它根据用户的历史选择信息和相似性关系,收集与用户兴趣爱好相同的其他用户的评价信息来产生推荐。推荐系统使用了一系列不同的技术,主要可以分为以下两类:基于内容(content-based)的推荐,主要依据的是推荐项的性质。基于协同过滤(collaborativefiltering)的推荐,主要依据的是用户或者物品之间的相似性。而基于协同过滤的推荐系统用可以分为两类:基于物品(item-based)的推荐系统,主要依据的是物品与物品之间的相似性。基于用户(user-based)的推荐系统,主要依据的是用户与用户之间的相似性。
技术实现思路
本专利技术所要解决的技术问题是提供一种基于物品内容特征的改进协同过滤推荐方法,能够增加推荐物品的多样性。本专利技术解决其技术问题所采用的技术方案是:提供一种基于物品内容特征的改进协同过滤推荐方法,包括以下步骤:(1)读取数据集,并拆分数据集,获取用户评分记录以及物品点击量数据;(2)计算物品与物品之间的共现矩阵以及每个物品点击量均值;(3)计算物品点击量影响因子;(4)物品相似度与物品点击量影响因子相乘得到改进后的物品相似度,最终生成相似度矩阵;(5)针对目标用户,找到K个相似的物品,计算用户对相似的物品的兴趣程度;(6)根据用户对相似的物品的兴趣度进行排序,推荐最感兴趣的前N个物品。所述步骤(4)中物品相似度计算方式为:其中,N(i)是喜欢物品i的用户数,N(j)是喜欢物品j的用户数,N(u)表示用户喜欢的物品集合,S为物品点击量影响因子。所述步骤(5)中用户对相似的物品的兴趣程度的计算方式为:其中,Puj表示用户u对物品j的兴趣,N(u)表示用户喜欢的物品集合,S(j,k)表示和物品j最相似的K个物品集合,wji表示物品j和物品i的相似度,rui表示用户u对物品i的兴趣。有益效果由于采用了上述的技术方案,本专利技术与现有技术相比,具有以下的优点和积极效果:本专利技术通过引入用户活跃度对数的倒数和物品特征内容影响因子来修正物品相似度,从而有效提高推荐的覆盖率,即增加了推荐物品的多样性。附图说明图1是本专利技术的流程图;图2是本专利技术与现有技术在不同k值下的评测指标对比图。具体实施方式下面结合具体实施例,进一步阐述本专利技术。应理解,这些实施例仅用于说明本专利技术而不用于限制本专利技术的范围。此外应理解,在阅读了本专利技术讲授的内容之后,本领域技术人员可以对本专利技术作各种改动或修改,这些等价形式同样落于本申请所附权利要求书所限定的范围。本专利技术的实施方式涉及一种基于物品内容特征的改进协同过滤推荐方法,如图1所示,包括以下步骤:读取数据集,并拆分数据集,获取用户评分记录以及物品点击量数据;计算物品与物品之间的共现矩阵以及每个物品点击量均值;计算物品点击量影响因子,该因子与物品之间的点击量差值成反相关;物品相似度与物品点击量因子相乘得到改进后的物品相似度,最终生成相似度矩阵;针对目标用户,找到K个相似的物品,根据兴趣度计算公式计算用户对物品的兴趣程度;最后根据用户对物品的兴趣度排序,推荐最感兴趣的前N个物品。本实施方式的主要内容如下:1)物品相似度初步定义:其中,N(i)是喜欢物品i的用户数,|N(i)∩N(j)|是同时喜欢物品i和物品j的用户数。分母是惩罚物品i和j的权重,因此惩罚了热门物品和很多物品相似的可能性。2)在得到物品相似度之后,ItemCF通过以下公式计算用户u对未产生行为的物品j的感兴趣程度。其中,Puj表示用户u对物品j的兴趣,N(u)表示用户喜欢的物品集合,S(j,k)表示和物品j最相似的k个物品集合(j是这个集合中的某一个物品),wji表示物品j和物品i的相似度,rui表示用户u对物品i的兴趣(对于隐反馈数据集,如果用户u对物品i有过行为,即可令rui=1。)该公式的含义是,和用户历史上感兴趣的物品越相似的物品,越有可能在用户的推荐列表中获得比较高的排名。3)两个物品之间相似度的产生是由于用户同时对它们都感兴趣,仅仅计算余弦相似度显得过于粗糙。本实施方式引入用户活跃度对数的倒数和物品特征内容(点击量)影响因子S来修正物品相似度Wij:从公式中可以看出,对活跃用户做出了相应的惩罚。4)利用改进的相似度计算公式计算物品与物品之间的相似度矩阵,并进行归一化处理。5)最后根据Puj计算用户对物品的兴趣程度,并推荐用户最感兴趣的N的物品。下面通过一个具体的实施例来进一步说明本专利技术。相似度计算是协同过滤算法的核心步骤之一,采用不同的相似度计算方式,最终的推荐结果均不一致。但是在实际购物中,有些商品是用户经常需要购买的,比如蔬菜、肉类、常见水果等,如果每个用户每天都喜欢购买一种商品,那么不同种类商品中最热门的两个商品相似度会很高。这类问题被称为哈利波特问题,因为《哈利波特》这本书实在太过于热门。为了继续优化基于物品的协同过滤算法,本实施例提出了引入与物品相关的内容数据来解决该问题。根据普通用户购物习惯,在登录网上商城首页后,首先会浏览整个商城有哪些商品,然后选择自己需要或者喜欢的商品,最终实际购买的商品并不会很多。但是用户却在购物的过程点击浏览了很多商品,用户的点击量一定程度也反映了该商品的受关注程度。基于上述分析,在计算商品相似度过程中引入商品点击量影响因子。假设物品A和物品B的用户点击量分别是ca和cb,A和B的点击量越相近,物品相似度的影响因子越大,反之,影响因子则变小。为了提高推荐结果的准确性和多样性,在较为冷门的商品中,最应该推荐的是点击量较高的商品。定义商品点击量均值为商品点击量影响因子定义为:则改进后的物品相似度计算公式为:如图2所示,与现有技术对比来看,在使得现有算法性能最好的K值下,改进后的推荐方法准确率和召回率相近,但是覆盖率要比现有算法的指标好的多,因此具有良好的应用价值。本文档来自技高网...

【技术保护点】
1.一种基于物品内容特征的改进协同过滤推荐方法,其特征在于,包括以下步骤:(1)读取数据集,并拆分数据集,获取用户评分记录以及物品点击量数据;(2)计算物品与物品之间的共现矩阵以及每个物品点击量均值;(3)计算物品点击量影响因子;(4)物品相似度与物品点击量影响因子相乘得到改进后的物品相似度,最终生成相似度矩阵;(5)针对目标用户,找到K个相似的物品,计算用户对相似的物品的兴趣程度;(6)根据用户对相似的物品的兴趣度进行排序,推荐最感兴趣的前N个物品。

【技术特征摘要】
1.一种基于物品内容特征的改进协同过滤推荐方法,其特征在于,包括以下步骤:(1)读取数据集,并拆分数据集,获取用户评分记录以及物品点击量数据;(2)计算物品与物品之间的共现矩阵以及每个物品点击量均值;(3)计算物品点击量影响因子;(4)物品相似度与物品点击量影响因子相乘得到改进后的物品相似度,最终生成相似度矩阵;(5)针对目标用户,找到K个相似的物品,计算用户对相似的物品的兴趣程度;(6)根据用户对相似的物品的兴趣度进行排序,推荐最感兴趣的前N个物品。2.根据权利要求1所述的基于物品内容特征的改进...

【专利技术属性】
技术研发人员:陈毅任正云文盼
申请(专利权)人:东华大学
类型:发明
国别省市:上海,31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1