当前位置: 首页 > 专利查询>吴健专利>正文

一种优化近邻选择的协同过滤推荐方法及装置制造方法及图纸

技术编号:10953949 阅读:106 留言:0更新日期:2015-01-23 15:39
本发明专利技术公开了一种优化近邻选择的协同过滤推荐方法及装置,方法包括:确定用户相似度影响因子为包括不同用户各自评分比例及两个不同用户的共同评分比例,然后利用该用户相似度影响因子对现有的用户相似度值进行修正,利用修正后的用户相似度值及目标用户对项目的偏好程度计算公式来确定是否将项目推荐给目标用户。由于本发明专利技术考虑了用户共同评分项目和用户所有评分项目数目变化对用户相似度值的影响,因此相比于现有技术,本发明专利技术计算得出的最终结果更加准确。

【技术实现步骤摘要】
一种优化近邻选择的协同过滤推荐方法及装置
_ 本申请涉及协同过滤推荐
,更具体地说,涉及一种优化近邻选择的协同 过滤推荐方法及装置。
技术介绍
协同过滤(Collaborative Filtering)算法是推荐系统中应用最早的并且也是最 成功的技术之一,它根据其他近邻用户的喜好向目标用户推荐项目。协同过滤主要分为三 个步骤:用户的偏好描述、寻找最近邻用户、产生推荐。用户的偏好是由一个用户-项目相 关联的mXn阶评分矩阵R来描述的,传统的协同过滤算法都是采用相似性度量方法在评分 矩阵R上计算用户间的相似性,选择与目标用户最相似的top-k个用户组成最近邻集合,利 用这些最近邻集合来预测目标用户的未评分项目的评分。 常用的相似性度量方法有余弦相似性和皮尔森相关相似性。这两种相似度计算方 法都是基于用户-项目关联矩阵R(nXm)的。%与^分别表示用户扎与队已评分项目 集合,在获取1与队已评分项目交集^ 的情况下才能计算相关相似性,而且只有在交 集比较大时,计算出相似性可信度才比较高,相反在交集较小时计算出的相似度可信度较 小。在评分矩阵很稀疏的情况下,只考虑用户间共同评分的项目,容易导致用户基于很少的 共同评分而计算出较高的相似度,进而导致近邻计算的不准确。Herlocker等提出了一种基 于皮尔森相关相似性的改进方案,在计算用户比和U b相似性时增加用户共同评分数量的关 联权重因子,如下式:

【技术保护点】
一种优化近邻选择的协同过滤推荐方法,其特征在于,包括:构建用户和项目的关联矩阵;确定用户相似度影响因子ε,所述用户相似度影响因子包括不同用户各自评分比例及两个不同用户的共同评分比例;确定修正用户相似度值为:sim'(Ua,Ub)=ε×sim(Ua,Ub)其中,sim(Ua,Ub)由皮尔森相关相似度方法所确定;确定目标用户Ua对项目Ii的偏好程度Ra,i:Ra,i=Ra‾+ΣUb∈Usim′(Ua,Ub)×(Rb,i-Rb‾)ΣUb∈Usim′(Ua,Ub)]]>其中,表示用户Ua对所有评价项目的打分平均值,表示用户Ub对所有评价项目的打分平均值;根据所述偏好程度Ra,i来确定是否将项目Ii推荐给用户Ua。

【技术特征摘要】
1. 一种优化近邻选择的协同过滤推荐方法,其特征在于,包括: 构建用户和项目的关联矩阵; 确定用户相似度影响因子ε,所述用户相似度影响因子包括不同用户各自评分比例及 两个不同用户的共同评分比例; 确定修正用户相似度值为: sim'(Ua,Ub) = ε Xsim(Ua,Ub) 其中,sim(Ua,Ub)由皮尔森相关相似度方法所确定; 确定目标用户Ua对项目L的偏好程度Ra i :其中,I表示用户Ua对所有评价项目的打分平均值,^表示用户Ub对所有评价项目的 打分平均值; 根据所述偏好程度Raii来确定是否将项目Ii推荐给用户Ua。2. 根据权利要求1所述的方法,其特征在于,所述用户相似度影响因子ε为:其中,A _与k分别表示用户Ua与Ub已评分项目集合。3. 根据权利要求2所述的方法,其特征在于,在确定修正用户相似度值之后,还包括: 确定目标用户Ua选择用户U b作为最近邻的偏好计算公式为:其中,X为目标用户Ua和用户Ub共同评分的项目,Χ€(/^η/%),Ra, x表示用户Ua对项 目Ix的评分值,Rb,x表示用户Ub对项目I x的评分值, Setnegmive = {Rai e Ra \ Rai < RJ SetPosi,nv = {Rai e Ra I Rai >= Ra) Rai表示用户Ua对项目Ii的评分,Ra表示用户Ua对所有项目的评分集合,瓦表示用户 Ua所有评分项目的评分均值; 对所述修正用户相似度进行二次修正,确定二次修正用户相似度为: sim(Ua,Ub) = β X ε Xsim(Ua,Ub) 则所述确定目标用户Ua对项目I,的偏好程度Raii具体为:4. 根据权利要求3所述的方法,其特征在于,在确定修正用户相似度值时,sim(Ua,Ub) 由皮尔森相关相似度方法所确定:其中,Ra;k表示用户Ua对项目Ik的评分值,Rb;k表示用户U b对项目Ik的评分值,瓦和 &分别表示用户Ua和Ub各自所有评分项目的评分均值。5. 根据权利要求2所述的方法,其特征在于,所述根据所述偏好程度&,来确定是否将 项目Ii推荐给用户Ua包括: 判断偏好程度& i是否大于预设参考值,若是则确定将项目Ii推荐给用户Ua。6. -种优化...

【专利技术属性】
技术研发人员:吴健苏栋梁张宇
申请(专利权)人:吴健
类型:发明
国别省市:江苏;32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1