基于覆盖约简的个性化用户协同过滤推荐方法技术

技术编号:18972496 阅读:45 留言:0更新日期:2018-09-19 03:41
本发明专利技术公开一种基于覆盖约简的个性化用户协同过滤推荐方法,明确定义了目标用户的冗余用户的概念,根据覆盖粗糙集中覆盖约简可以移除冗余元素的功能,将目标用户的冗余用户移除,从而保证了目标用户的邻近用户的质量,从而利用这些高质量的邻近用户的评分信息实现为目标用户提供高精度和多样化的个性化推荐。

Personalized user collaborative filtering recommendation method based on coverage reduction

The invention discloses a personalized user collaborative filtering recommendation method based on coverage reduction, clearly defines the concept of redundant users of target users, removes redundant elements according to coverage reduction in coverage rough set, removes redundant users of target users, thus guaranteeing the quality of neighboring users of target users. By using these high-quality rating information of neighboring users, we can provide high-precision and diversified personalized recommendation for target users.

【技术实现步骤摘要】
基于覆盖约简的个性化用户协同过滤推荐方法
本专利技术涉及推荐系统领域,尤其涉及一种可提高推荐精确度且具有多样性的基于覆盖约简的个性化用户协同过滤推荐方法。
技术介绍
推荐系统能够通过用户的个人信息智能地感知用户的兴趣或需求,实现信息的高质量推荐,有效地解决了“信息过载”问题。用户协同过滤算法是推荐系统领域应用最广泛、最成功的技术之一,其假设如果用户在过去有相似的爱好,那么他们在将来也可能有相似的爱好,具有计算简单、效率及精度高等优点。但是,现有的用户协同过滤算法中,目标用户的邻近用户趋于拥有相同的爱好,所以通过这些邻近用户获得的预测评分高的物品往往集中于少量种类的物品,甚至仅仅是流行物品,因此其推荐的多样性往往不尽人意。
技术实现思路
本专利技术是为了解决现有技术所存在的上述技术问题,提供一种可提高推荐精确度且具有多样性的基于覆盖约简的个性化用户协同过滤推荐方法。本专利技术的技术解决方案是:一种基于覆盖约简的个性化用户协同过滤推荐方法,其特征在于依次按照如下步骤进行:步骤1.统计形成二维评分信息表:根据用户对物品的评分信息形成二维评分信息表RM={U,I,R∪{*}};所述二维评分信息表RM中,U表示用户的集合,I表示物品的集合,R∪{*}表示用户对物品的评分集合,其中*表示用户未对物品进行评分;令用户u∈U对物品i∈I的评分为ru,i∈R∪{*},并且用户u的平均评分为;θ为用户评分的阈值,如果ru,i≥θ,表明用户u喜欢物品i;用户u已评分的物品集合为Iu={i∈I|ru,i≠*};为用户u未评分的物品集合;物品属性矩阵为AM;在用户集合U中,如果存在用户a喜爱的物品集合包含于用户b喜爱的物品集合,那么用户a就称为目标用户的冗余用户;步骤2.利用覆盖约简算法对冗余用户进行约简:步骤2.1令物品集合I作为论域I,在论域I中,每个用户喜欢的物品组成一个集合;在物品属性矩阵AM中提取目标用户的喜爱属性:(1)式(1)中,m表示属性的数目,atm表示一个属性,avm表示属性atm的值;步骤2.2.利用获得的目标用户的喜爱属性,构建目标用户的决策集D,决策集D由具备喜爱属性的物品集合组成:(2)式(2)中,atm(i)=avm表示物品i在属性atm上的值为avm;步骤2.3.将论域I由物品集合缩减为目标用户的决策集D,即论域D;对于每一个用户u∈U,构建用户u在论域D上的喜爱物品集合Cu:(3)令C*=D-∪Cu,C={C1,C2…Cn,C*}构成了目标用户在论域D的一个覆盖C;步骤2.4利用覆盖约简算法,将冗余元素从覆盖C中约简,得到约简完毕后的覆盖reduct(C)及约简后的用户Ur:(4)步骤3.利用约简后的用户Ur构建目标用户au的候选邻近用户u;步骤4.计算目标用户和候选邻近用户的相似度,选取目标用户的邻近用户:利用皮尔森相似度量函数(5)计算目标用户au和候选邻近用户u∈Ur之间的相似度,(5)式(5)中,sim(au,u)表示目标用户au和候选邻近用户u∈Ur之间的相似度,Iau={i∈I|rau,i≠*}表示目标用户au评价过的物品集合,表示目标用户的平均评分值;然后选择相似度高的前K个候选邻近用户作为目标用户的邻近用户Nau(k);步骤5.对目标用户未评分物品进行预测评分:根据目标用户的邻近用户Nau(k)的评分信息,利用调整加权和函数(6)对目标用户au未评分的物品集合进行预测评分,得到目标用户的预测评分表;(6)式(6)中,Pau,i表示目标用户au对物品i的预测评分,Ui={u∈U|ru,i≠*}表示评价过物品i的用户集合;λ作为一个正则化因子:(7)步骤6.选取预测评分高的前N个物品作为推荐结果。本专利技术明确定义了目标用户的冗余用户的概念,根据覆盖粗糙集中覆盖约简可以移除冗余元素的功能,将目标用户的冗余用户移除,从而保证了目标用户的邻近用户的质量,从而利用这些高质量的邻近用户的评分信息实现为目标用户提供高精度和多样化的个性化推荐。附图说明图1为本专利技术实施例的流程示意图;图2为本专利技术实施例与对比例精确度度量(MAE和RMSE)随着目标用户的邻近用户数量的变化而相应的结果示意图。图3为本专利技术实施例与对比例多样性度量(Coverage)随着目标用户的邻近用户数量的变化而相应的结果示意图。具体实施方式本专利技术的一种基于覆盖约简的个性化用户协同过滤推荐方法,如图1所示依次按照如下步骤进行:步骤1.统计形成二维评分信息表:根据用户对物品的评分信息形成二维评分信息表RM={U,I,R∪{*}};所述二维评分信息表RM中,U表示用户的集合,I表示物品的集合,R∪{*}表示用户对物品的评分集合,其中*表示用户未对物品进行评分;令用户u∈U对物品i∈I的评分为ru,i∈R∪{*},并且用户u的平均评分为;θ为用户评分的阈值,如果ru,i≥θ,表明用户u喜欢物品i;用户u已评分的物品集合为Iu={i∈I|ru,i≠*};为用户u未评分的物品集合;物品属性矩阵为AM;在用户集合U中,如果存在用户a喜爱的物品集合包含于用户b喜爱的物品集合,那么用户a就称为目标用户的冗余用户;如:用户集合U={用户1,用户2,用户3,目标用户},物品集合I={物品1,物品2,物品3,物品4,物品5,物品6},评分R的取值范围为[1,5]。则二维评分信息表RM如表1所示:表1令用户评分的阈值等与3,评分大于等于3的物品作为用户的喜爱物品,由表1可知:用户1的喜爱物品为{物品2,物品4,物品6};用户2的喜爱物品为{物品4,物品6};用户3的喜爱物品为{物品2,物品3,物品6};目标用户的喜爱物品为{物品1,物品3,物品4};步骤2.利用覆盖约简算法对冗余用户进行约简:步骤2.1令物品集合I作为论域I,在论域I中,每个用户喜欢的物品组成一个集合;在物品属性矩阵AM中提取目标用户的喜爱属性:(1)式(1)中,m表示属性的数目,atm表示一个属性,avm表示属性atm的值;如令物品集合I={物品1,物品2,物品3,物品4,物品5,物品6}作为论域,表2表示物品的属性矩阵AM,根据表2和目标用户的喜爱物品集合,统计得到目标用户的喜爱物品所对应的属性值:喜剧=3,惊悚=2,动作=1,戏剧=1,音乐=1,选择统计值最大的两个属性作为目标用户的喜爱属性,则目标用户的喜爱属性为:[喜剧=1]∧[惊悚=1]∧[动作=0]∧[戏剧=0]∧[音乐=0]表2喜剧惊悚动作戏剧音乐物品110110物品211010物品311000物品411001物品500110物品611101步骤2.2.利用获得的目标用户的喜爱属性,构建目标用户的决策集D,决策集D由具备喜爱属性的物品集合组成:(2)式(2)中,atm(i)=avm表示物品i在属性atm上的值为avm;如用目标用户的喜爱属性:[喜剧=1]∧[惊悚=1]∧[动作=0]∧[戏剧=0]∧[音乐=0],构建目标用户的决策集D,该决策集由所有拥有(喜剧,惊悚)属性的物品构成,即:根据表2可得决策集D={物品2,物品3,物品4,物品6};步骤2.3.为了最大限度地消除目标用户的冗余用户,将论域I由物品集合缩减为目标用户的决策集D,即论域D;对于每一个用户u∈U,构建用户u在论域D上的喜爱物品集合Cu:(3)令C*=D-∪C本文档来自技高网...

【技术保护点】
1.一种基于覆盖约简的个性化用户协同过滤推荐方法,其特征在于依次按照如下步骤进行:步骤1.统计形成二维评分信息表:根据用户对物品的评分信息形成二维评分信息表RM={U,I,R∪{*}};所述二维评分信息表RM中,U表示用户的集合,I表示物品的集合,R∪{*}表示用户对物品的评分集合,其中*表示用户未对物品进行评分;令用户

【技术特征摘要】
1.一种基于覆盖约简的个性化用户协同过滤推荐方法,其特征在于依次按照如下步骤进行:步骤1.统计形成二维评分信息表:根据用户对物品的评分信息形成二维评分信息表RM={U,I,R∪{*}};所述二维评分信息表RM中,U表示用户的集合,I表示物品的集合,R∪{*}表示用户对物品的评分集合,其中*表示用户未对物品进行评分;令用户u∈U对物品i∈I的评分为ru,i∈R∪{*},并且用户u的平均评分为;θ为用户评分的阈值,如果ru,i≥θ,表明用户u喜欢物品i;用户u已评分的物品集合为Iu={i∈I|ru,i≠*};为用户u未评分的物品集合;物品属性矩阵为AM;在用户集合U中,如果存在用户a喜爱的物品集合包含于用户b喜爱的物品集合,那么用户a就称为目标用户的冗余用户;步骤2.利用覆盖约简算法对冗余用户进行约简:步骤2.1令物品集合I作为论域I,在论域I中,每个用户喜欢的物品组成一个集合;在物品属性矩阵AM中提取目标用户的喜爱属性:(1)式(1)中,m表示属性的数目,atm表示一个属性,avm表示属性atm的值;步骤2.2.利用获得的目标用户的喜爱属性,构建目标用户的决策集D,决策集D由具备喜爱属性的物品集合组成:D={i∈I|at1(i)=av1,at2(i)=av2,…,atm(i)=avm}(2)式(2)中,atm(i)=avm表示物品i在属性atm上的值为avm;步骤...

【专利技术属性】
技术研发人员:张志鹏任永功邹丽崔晓松
申请(专利权)人:辽宁师范大学
类型:发明
国别省市:辽宁,21

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1