当前位置: 首页 > 专利查询>中山大学专利>正文

一种基于面向对象聚类的协同过滤推荐方法技术

技术编号:19009170 阅读:56 留言:0更新日期:2018-09-22 09:02
本发明专利技术提供一种基于面向对象聚类的协同过滤推荐方法,包括以下步骤:读取用户对物品的历史评分数据、物品类型数据信息;通过优化的PMF模型生成用户评分预测矩阵;计算用户偏置因子、物品偏置因子、类型偏置因子,生成偏置因子预测矩阵;构建面向对象的特征样本,对面向对象的特征样本进行聚类编号,生成面向对象聚类结果;构建用户偏好矩阵;更新用户偏好矩阵中的偏好指标值,产生推荐列表。本发明专利技术提供的一种基于面向对象聚类的协同过滤推荐方法,使用偏好指标表示用户对物品兴趣度的推荐策略,同时,通过引入面向对象之间的相似性关系,缓解传统矩阵分解模型预测准确度不佳而造成推荐效果不理想的问题,提升推荐系统的推荐效果,并且该推荐方法可适用于多种场景。

A collaborative filtering recommendation method based on object oriented clustering

The invention provides a collaborative filtering recommendation method based on object-oriented clustering, which comprises the following steps: reading the historical score data and item type data information of the item by the user; generating the user score prediction matrix by the optimized PMF model; calculating the user bias factor, item bias factor and type bias factor, and generating Prediction matrix of bias factor is constructed; object-oriented feature samples are constructed, and object-oriented feature samples are clustered and numbered to generate object-oriented clustering results; user preference matrix is constructed; preference index values in user preference matrix are updated to generate recommendation list. The invention provides a collaborative filtering recommendation method based on object-oriented clustering, which uses preference index to represent the recommendation strategy of user's interest in items. At the same time, by introducing similarity relation between objects, the problem of poor prediction accuracy of traditional matrix decomposition model and unsatisfactory recommendation effect can be alleviated. The recommended effect of recommendation system can be improved, and the recommendation method can be applied to many scenarios.

【技术实现步骤摘要】
一种基于面向对象聚类的协同过滤推荐方法
本专利技术涉及个性化推荐
,更具体的,涉及一种基于面向对象聚类的协同过滤推荐方法。
技术介绍
步入二十一世纪,数据量的迅速增长以及信息技术的快速发展将我们从信息匮乏的时代带入了信息过载的时代。由于缺乏对事物的亲身体验和经历,信息过载使得人们在面对一些不了解的事物时往往难以抉择。推荐系统的出现恰好为这种问题提供了个性化的解决方案,它不仅帮助用户减少在茫茫物品中发现喜欢物品的时间花费,同时有利于将物品快速准确地呈列在对其感兴趣用户的面前,实现生产者与消费者之间的双赢。推荐系统出现于20世纪90年代早期,作为一门研究学科,从它提出至今便一直受到研究者的广泛关注。由于推荐系统在市场经济下蕴藏着的巨大潜力,已有众多商业公司投身于推荐系统研究的热潮中。当前,推荐系统主要运用到的推荐算法可分为基于内容的推荐算法和协同过滤推荐算法。除此之外,还有包括基于知识的推荐算法,混合推荐算法等。与其它方法相比,协同过滤推荐算法以其结构简单、构建成本低、推荐效果好、应用领域广等特点受到研究者的广泛关注。同样在商业界,以亚马逊、Facebook、Youtube等为代表的众多互联网公司,凭借其推荐系统应用的协同过滤推荐算法而取得可观收益。但传统的协同过滤推荐算法存在稀疏性问题,即当推荐系统中数据量很大而用户的显式评分数据又很少时,矩阵分解模型预测准确度不佳,从而导致推荐系统的效果欠佳。
技术实现思路
本专利技术为克服上述现有技术中存在的矩阵分解模型预测准确度不佳及对于新物品无法推荐的问题,提供一种基于面向对象聚类的协同过滤推荐方法。为解决上述技术问题,本专利技术的技术方案如下:一种基于面向对象聚类的协同过滤推荐方法,包括以下步骤:S1:读取用户对物品的历史评分数据、物品类型数据信息;S2:根据用户对物品的历史评分数据,通过优化的PMF模型生成用户评分预测矩阵;S3:根据用户对物品的历史评分数据、物品类型信息数据,计算用户偏置因子、物品偏置因子、类型偏置因子,生成偏置因子预测矩阵;S4:利用物品类型信息构建面向对象的特征样本,并利用K-means聚类方法对面向对象的特征样本进行聚类编号,生成面向对象聚类结果;S5:利用用户评分预测矩阵以及偏置因子预测矩阵,构建用户偏好矩阵;S6:根据面向对象聚类结果,更新用户偏好矩阵中的偏好指标值,根据更新后的用户偏好指标值产生推荐列表。其中,所述步骤S2中优化的PMF模型训练函数表示为:其中,Iui表示矩阵中用户u对物品i的偏好指标;Rui表示矩阵R中用户u对物品i的历史评分数据;Uu表示用户偏置因子矩阵,Vi表示物品偏置因子矩阵;λ为矩阵的特征值;表示生成的用户预测评分,其中m表示表示用户对所有物品的平均评分,映射函数Map(x)表示为:映射函数Map(x)将预测值映射在1至5分的区间内。其中,所述步骤S3中包括对用户偏置因子、物品偏置因子、类型偏置因子的计算,构建构建偏置因子预测矩阵,其中,用户偏置因子的计算方式为:其中,|User(u)|表示由用户u已有的评分项所构成的集合大小,r表示数据集中的评分项;物品偏置因子的计算方式为:其中,|Item(i)|表示物品i得到的用户评分项所构成的集合大小,r表示数据集中的评分项;类型偏置因子的计算方式为:其中,|Genre(g)|表示由属于类型g的物品评分项所构成的集合大小,r表示数据集中的评分项;所述构建偏置因子预测矩阵的过程如下:初始化一个矩阵B,矩阵的行数为用户的数量,矩阵的行数为物品的数量,矩阵B中第u行第i列的项表示由用户u偏置因子、物品i偏置因子、物品i对应物品类型g偏置因子生成的用户u对物品i的预测评分其计算方式为:其中,取用户偏置因子、物品偏置因子、类型偏置因子的平均值作为其结果。其中,所述步骤S4利用物品类型信息构建面向对象的特征样本的步骤如下:初始化一个全零的面向对象类型矩阵S,矩阵行数为面向对象的数量M,矩阵列数为物品类型的种类数N;统计物品类型信息中物品编号对应的对象编号及物品类型编号<itemid,genreid,objectid>,去除其中的物品编号,生成对象编号及物品类型编号<genreid,objectid>;根据生成对象编号及物品类型编号<genreid,objectid>,找到其在矩阵S中对应的位置并在数量上加一,其中objectid表示矩阵对应的行数,genreid表示矩阵对应的列数;完成对物品类型信息的导入后,矩阵中的行向量即表示对应的面向对象的特征样本,其中,矩阵中第i行第j列Sij项,即表示对象i对应的属于类型j的物品数量。其中,所述利用k-means聚类方法对面向对象的特征样本进行聚类并生成聚类结果的过程如下:取矩阵S中的行向量作为面向对象特征样本,以欧几里得距离作为相似度测度,具体计算方法为:其中,dist(X,Y)表示矩阵X与矩阵Y的欧式距离,sim(X,Y)矩阵X与矩阵Y之间的相似度;利用k-means对其进行相似度聚类,保存聚类后面向对象特征样本所属的聚类编号。其中,所述步骤S5的具体过程为:用户评分预测矩阵与偏置因子预测矩阵B进行矩阵相加,生成初始用户偏好矩阵I;其中,矩阵I中第u行第i列的Iui项表示用户u对物品i的偏好指标,具体表示为:其中,表示优化的PMF模型为用户u对物品i生成的预测评分,表示偏置因子预测矩阵中用户u对物品i生成的预测评分。其中,所述步骤S6更新用户偏好矩阵中的偏好指标值的过程如下:提取用户偏好矩阵中偏好指标最大的前50项物品作为初始推荐列表,根据用户当前关注的物品,找到物品对应的面向对象,并通过该面向对象对应的聚类编号找到与其对应聚类编号相同的其他面向对象;对于初始推荐列表中的物品,如果物品对应的面向对象与用户当前关注物品对应的面向对象聚类编号相同,则增加用户对该物品的偏好指标,具体公式为:I′ui=QIui其中,I′ui表示更新后的偏好指标,Q表示偏好指标加成权重,取值为1.2;根据更新后的偏好指标I′ui产生偏好指标值最高的前10项物品作为对用户的推荐结果。与现有技术相比,本专利技术技术方案的有益效果是:本专利技术提供的一种基于面向对象聚类的协同过滤推荐方法,使用偏好指标表示用户对物品兴趣度的推荐策略,同时,通过引入面向对象之间的相似性关系,缓解传统矩阵分解模型预测准确度不佳而造成推荐效果不理想的问题,提升推荐系统的荐效果。附图说明图1为基于面向对象聚类的协同过滤推荐方法流程图。图2为本专利技术中用户评分预测矩阵示例图。图3为本专利技术中偏置因子预测矩阵示例图。图4为本专利技术中面向对象类型矩阵示例图。图5为本专利技术中用户偏好矩阵示例图。具体实施方式附图仅用于示例性说明,不能理解为对本专利的限制;为了更好说明本实施例,附图某些部件会有省略、放大或缩小,并不代表实际产品的尺寸;对于本领域技术人员来说,附图中某些公知结构及其说明可能省略是可以理解的。下面结合附图和实施例对本专利技术的技术方案做进一步的说明。实施例1一种基于面向对象聚类的协同过滤推荐方法,包括以下步骤:S1:读取用户对物品的历史评分数据、物品类型数据信息;S2:根据用户对物品的历史评分数据,通过优化的PMF模本文档来自技高网...
一种基于面向对象聚类的协同过滤推荐方法

【技术保护点】
1.一种基于面向对象聚类的协同过滤推荐方法,其特征在于,包括以下步骤:S1:读取用户对物品的历史评分数据、物品类型数据信息;S2:根据用户对物品的历史评分数据,通过优化的PMF模型生成用户评分预测矩阵;S3:根据用户对物品的历史评分数据、物品类型信息数据,计算用户偏置因子、物品偏置因子、类型偏置因子,生成偏置因子预测矩阵;S4:利用物品类型信息构建面向对象的特征样本,并利用K‑means聚类方法对面向对象的特征样本进行聚类编号,生成面向对象聚类结果;S5:利用用户评分预测矩阵以及偏置因子预测矩阵,构建用户偏好矩阵;S6:根据面向对象聚类结果,更新用户偏好矩阵中的偏好指标值,根据更新后的用户偏好指标值产生推荐列表。

【技术特征摘要】
1.一种基于面向对象聚类的协同过滤推荐方法,其特征在于,包括以下步骤:S1:读取用户对物品的历史评分数据、物品类型数据信息;S2:根据用户对物品的历史评分数据,通过优化的PMF模型生成用户评分预测矩阵;S3:根据用户对物品的历史评分数据、物品类型信息数据,计算用户偏置因子、物品偏置因子、类型偏置因子,生成偏置因子预测矩阵;S4:利用物品类型信息构建面向对象的特征样本,并利用K-means聚类方法对面向对象的特征样本进行聚类编号,生成面向对象聚类结果;S5:利用用户评分预测矩阵以及偏置因子预测矩阵,构建用户偏好矩阵;S6:根据面向对象聚类结果,更新用户偏好矩阵中的偏好指标值,根据更新后的用户偏好指标值产生推荐列表。2.根据权利要求1所述的基于面向对象聚类的协同过滤推荐方法,其特征在于:所述步骤S2中优化的PMF模型训练函数表示为:其中,Iui表示矩阵中用户u对物品i的偏好指标;Rui表示矩阵R中用户u对物品i的历史评分数据;Uu表示用户偏置因子矩阵,Vi表示物品偏置因子矩阵;λ为矩阵的特征值;表示生成的用户预测评分,其中m表示表示用户对所有物品的平均评分,映射函数Map(x)表示为:映射函数Map(x)将预测值映射在1至5分的区间内。3.根据权利要求1所述的基于面向对象聚类的协同过滤推荐方法,其特征在于:所述步骤S3中包括对用户偏置因子、物品偏置因子、类型偏置因子的计算,构建构建偏置因子预测矩阵,其中,用户偏置因子的计算方式为:其中,|User(u)|表示由用户u已有的评分项所构成的集合大小,r表示数据集中的评分项;物品偏置因子的计算方式为:其中,|Item(i)|表示物品i得到的用户评分项所构成的集合大小,r表示数据集中的评分项;类型偏置因子的计算方式为:其中,|Genre(g)|表示由属于类型g的物品评分项所构成的集合大小,r表示数据集中的评分项;构建偏置因子预测矩阵的过程如下:初始化一个矩阵B,矩阵的行数为用户的数量,矩阵的行数为物品的数量,矩阵B中第u行第i列的项表示由用户u偏置因子、物品i偏置因子、物品i对应物品类型g偏置因子生成的用户u对物品i的预测评分其计算方式为:其中,取用户偏置因子、物品偏置因子、类型偏置因子的平均值作为其结果。4.根据权利要求1所述的基于面向对象聚类的协同过滤推荐方法,其特征在于:所述步骤S4利用物品类型信息构建面向对象的特征样本的步骤如下:初始化一个全零的面向对象类型矩阵S,矩阵行...

【专利技术属性】
技术研发人员:易敬之孙伟卢伟
申请(专利权)人:中山大学
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1