一种综合用户和项目评分及特征因素的推荐方法技术

技术编号:8131116 阅读:274 留言:0更新日期:2012-12-27 03:20
本发明专利技术是一种综合用户和项目评分及特征因素的推荐方法,主要解决协同过滤推荐算法中的冷启动及数据稀疏性问题。在选取的实验数据集上划分训练数据集和测试数据集;在训练数据集上分别计算基于用户及用户特征,基于项目及项目特征的相似度;选取适当权值将基于用户和用户特征的相似度结合起来;分别根据动态选取阈值方法和KNN方法计算用户最近邻矩阵,比较选取最优方法,利用推荐公式计算用户推荐结果;选取适能过当权值将基于项目和项目特征的相似度结合起来;分别根据动态选取阈值方法和KNN方法计算项目最近邻矩阵,比较选取最优方法,利用推荐公式计算项目推荐结果;选取适当权值将用户推荐结果和项目推荐结果结合起来。

【技术实现步骤摘要】

本专利技术是综合用户与项目各自评分数据及特征因素产生的推荐算法,主要解决传统推荐算法中的冷启动问题及数据稀疏性问题,属于推荐研究的

技术介绍
当今推荐系统使用的大多数技术主要划分为两类基于内容的推荐算法和协同过滤推荐算法。基于内容的推荐算法是指基于物品本身的属性特征信息进行相似度计算,而协同过滤推荐算法是指通过分析用户兴趣,在用户群中找到指定用户的相似兴趣用户,综合相似用户对某一信息的评价,形成系统对该指定用户对此信息的喜好程度预测。现有的推荐算法中普遍存在三大问题(1)数据稀疏性问题在项目数量很大,用 户评分的项目数量却很少时,就会产生很稀疏的评分矩阵。(2)冷启动问题新用户没有对任何项目评过分,新项目没有任何用户对它评过分。(3)可扩展性问题当系统规模变大时,推荐算法性能急剧下降,从而产生不准确推荐。协同过滤算法被普遍认为是最成功的推荐算法,但是它不能解决传统推荐算法中普遍存在的冷启动问题,当有新用户和新项目时,由于没有评分记录,就很难通过协同过滤算法产生很好的推荐效果,因此需要可以依据用户特征和项目特征而产生的推荐算法。同时,在现实应用中,项目数量巨大,而用户评分或购买的项目很小,这样导致用户评分矩阵非常稀疏,直接导致用户之间或者项目之间的相似度计算不准确,从而影响推荐精度,因此需要通过推荐算法预估用户评分,解决数据稀疏性问题。在推荐算法中,过多的关注用户或项目特征因素忽视评分数据,由于项目特征有限,很难有效的得到更多数据,而过多关注评分数据忽视用户或项目特征因素,由于是基于历史数据,对新用户或新项目都会产生冷启动问题,这样偏向任一方都有可能会导致推荐算法性能下降,因此需要综合考虑两者,借用权值来平衡特征因素和评分数据在推荐算法中的影响程度。
技术实现思路
技术问题本专利技术的目的是综合评分数据及特征因素产生推荐算法,解决传统推荐算法中的冷启动问题,并综合用户与项目进行推荐,在很大程度上缓解传统推荐算法中的数据稀疏性问题。技术方案本专利技术是一种通过结合用户和项目特征对协同过滤推荐算法进行改进的方法,通过引入用户和项目特征解决传统协同过滤推荐算法中的冷启动问题,同时,通过协调用户和项目对推荐最终结果影响的程度,在很大程度上缓解了传统协同过滤推荐算法中的数据稀疏性问题。本专利技术综合用户和项目评分及特征因素的推荐方法,结合评分数据和特征因素,并将用户和项目的最终推荐结果相结合,具体步骤如下步骤一,构造基于用户和基于用户特征的相似度模型SimUser1 (i, j),SimUser2Q,j)如下本文档来自技高网
...

【技术保护点】
一种综合用户和项目评分及特征因素的推荐方法,其特征在于:结合评分数据和特征因素,并将用户和项目的最终推荐结果相结合,具体步骤如下:步骤一,构造基于用户和基于用户特征的相似度模型SimUser1(i,j),SimUser2(i,j)如下:SimUser1(i,j)=Σc∈Ii,j(Ri,c-Ai)(Rj,c-Aj)Σc∈Ii,j(Ri,c-Ai)2Σc∈Ii,j(Rj,c-Aj)2Dis(i,j)=Σk=1n(ik-jk)2SimUser2(i,j)=11+Dis(i,j)其中Ri,c表示用户i对项目c的评分,Rj,c表示用户j对项目c的评分,Ii,j表示用户i和j都评过分的项目集合,Ai表示用户i对Ii,j集合中的所有项目评分的平均值,Aj表示用户j对Ii,j集合中的所有项目评分的平均值,Dis(i,j)等式中的n表示用户的特征数目,ik表示用户i的第k个特征值,jk表示用户j的第k个特征值;步骤二,选取权值ω将SimUser1(i,j)和SimUser2(i,j)结合起来,SimUser(i,j)=ω*SimUser1(i,j)+(1?ω)*SimUser2(i,j)其中权值ω的范围为0至1;步骤三,根据动态阈值或KNN方法计算用户最近邻居矩阵,利用推荐公式计算用户推荐结果,推荐公式如下:PUserut=Au+Σi=1c(Ri,t-Ai)SimUser(i,j)Σi=1cSimUser(i,j)其中Au表示用户u对项目的平均评分,c表示用户u的邻居数目,Ri,t表示u的邻居用户i对项目t的评分,Ai表示用户i对项目的平均评分,SimUser(i,j)表示用户i和j的相似度,PUserut表示用户u对项目t的推荐结果;步骤四:据上述步骤一,步骤二,步骤三同理得到项目推荐结果PItemut;步骤五:选取权值κ将用户推荐结果和项目推荐结果结合起来,Put=κ*PUserut+(1?κ)*PItemut其中权值κ的取值范围为0至1。...

【技术特征摘要】
1.一种综合用户和项目评分及特征因素的推荐方法,其特征在于结合评分数据和特征因素, 并将用户和项目的最終推荐结果相结合,具体步骤如下 步骤一,构造基于用户和基于用户特征的相似度模型SimUser1 (i, j), SimUser2Q, j)如下2.根据权利要求I所述的ー种综合用户和项目评分及特征因素的推荐方法,其特征在于所述步骤一的构造基于用户和基于用户特征的相似度模型的过程如下 输入原始训练数据集、用户评分矩阵、推荐算法考虑的用户特征总数 输出3.根据权利要求I所述的ー种综合用户和项目评分及特征因素的推荐方法,其特征在于所述步...

【专利技术属性】
技术研发人员:王晓军赵丽嫚
申请(专利权)人:南京邮电大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1