一种利用高维辅助信息修正的内容推荐方法及推荐系统技术方案

技术编号:19692110 阅读:127 留言:0更新日期:2018-12-08 11:15
本发明专利技术公开了一种利用高维辅助信息修正的项目推荐方法,包括收集用户对项目的反馈行为和项目的高维辅助信息;建立基于项目相似度计算的目标函数及约束条件;利用局部保留投影方法,将所述的高维辅助信息的特征矩阵进行降维操作,映射为所述高维辅助信息的投影矩阵,并代入所述的目标函数;计算出所述的投影矩阵、项目相似度矩阵和用户对项目的预测评分矩阵;根据所述的预测评分矩阵,向用户推荐评分排名靠前的项目。本发明专利技术充分利用项目的高维辅助信息,提升了推荐方法及系统的准确度,将局部投影方法融入推荐模型的方法,同时提出了一种联合迭代优化的计算方法,有效地避开高维数据的缺点,改进推荐方法在实际应用中精度和效率。

【技术实现步骤摘要】
一种利用高维辅助信息修正的内容推荐方法及推荐系统
本专利技术属于互联网智能推荐
,具体涉及一种利用高维辅助信息修正的项目推荐方法及推荐系统。
技术介绍
为了帮助用户识别最适合个人特点的项目,项目排序任务中广泛使用了TOP-N推荐方法。其中代表性的方法包括了基于项目的k-最近邻方法,稀疏线性方法(SLIM)等等。在协同过滤算法中,基于项目的推荐方法已经被证明优于基于用户的推荐方法。基于项目的推荐方法的准确性主要依赖于所计算出的项目相似度的准确性。具体来说,项目相似度主要基于用户反馈来进行计算。传统的用户反馈包括购买记录,排名,评论,点击数等。然而,随着互联网的交互性逐步增强,很多项目中产生了大量的辅助信息,比如电影推荐系统里的电影评论、工作推荐系统里的申请人简历、垃圾邮件检测里的邮件内容、在线购物中的项目评价等。这些辅助信息包含中的大量项目相关特征,由此研究人员研发了众多基于辅助信息的混合算法来增加推荐系统的精确性。然而,这些辅助信息一般都具有高维的特点。例如,项目的文本描述中,如果将每一个在语料库中的词项都作为一维的话,那么整个文档就是高维的。此外,以图片或视频为形式的辅助信息的维度会更加高。现有的方法并没有关注到这一点,导致他们的精度和效率被高维严重制约。本专利技术关注于高维辅助信息,将高维的辅助信息通过数据规约集成进协同过滤推荐方法中,提出了一种利用高维辅助信息修正的项目推荐方法及推荐系统,利用数据规约的方法,有效地避开高维数据的缺点,大大改进推荐方法及系统在实际应用中精准度表现。
技术实现思路
本专利技术的第一目的在于提供一种利用高维辅助信息修正的项目推荐方法。本专利技术的第一目的是这样实现的,包括:步骤S1,收集用户对项目的反馈行为和项目的高维辅助信息;步骤S2,初始化用户行为反馈矩阵和项目高维辅助信息的特征矩阵;步骤S3,建立基于项目相似度计算的目标函数及约束条件;步骤S4,利用局部保留投影方法,将所述的高维辅助信息的特征矩阵进行降维操作,映射为所述的高维辅助信息的投影矩阵,并代入所述的目标函数;步骤S5,利用迭代收敛计算方法,计算出所述的投影矩阵和项目相似度矩阵;步骤S6,利用所述的用户行为反馈矩阵和所述的项目相似度矩阵,计算用户对项目的预测评分矩阵;步骤S7,根据所述的预测评分矩阵,向用户推荐评分排名靠前的项目。本专利技术的第二目的在于提供一种利用高维辅助信息修正的项目推荐方法的项目推荐系统。本专利技术的第二目的是这样实现的,包括:信息获取模块,信息规整模块,模型计算模块,评分计算模块,项目推荐模块,所述的信息获取模块用于收集用户对项目的反馈行为和项目的高维辅助信息;所述的信息规整模块用于将信息获取模块获取到的信息,规整为用户行为反馈矩阵和项目高维信息的特征矩阵;所述的模型计算模块包括模型建立模块,高维降维模块和结果计算模块,所述的模型建立模块用于建立基于项目相似度计算的目标函数及约束条件,所述的高维降维模块利用局部保留投影方法,将所述的高维信息的特征矩阵进行降维操作,映射为所述的高维辅助信息的投影矩阵,所述的结果计算模块利用迭代收敛计算方法,计算出所述的投影矩阵和项目相似度矩阵;所述的评分计算模块利用所述的用户行为反馈矩阵和所述的项目相似度矩阵,计算用户对项目的预测评分矩阵;所述的项目推荐模块根据所述的预测评分矩阵,向用户推荐评分排名靠前的项目。与现有技术相比,本专利技术具有以下技术效果:1、本专利技术充分利用高维辅助信息,挖掘出高辅助信息中对项目推荐的有用信息,大大提升了推荐方法及系统的准确度;2、本专利技术提供了一种将局部投影方法融入推荐模型的方法,同时提出了一种联合迭代优化的计算方法,可以同步的进行局部投影操作和计算项目相似度,使得本专利技术的推荐结果计算的精度和效率大大提升。附图说明图1为本专利技术中一种利用高维辅助信息修正的项目推荐方法的流程示意图;图2为本专利技术中项目推荐方法的模型求解流程图;图3为本专利技术中一种利用高维辅助信息修正的项目推荐系统的结构示意图;图中:1-信息获取模块,2-信息规整模块,3-模型计算模块,4-评分计算模块,5-项目推荐模块,301-模型建立模块,302-高维降维模块,303-结果计算模块,S1~S7为项目推荐方法的流程步骤,S101~S106为模型求解的流程步骤。具体实施方式下面结合附图对本专利技术作进一步的说明,但不以任何方式对本专利技术加以限制,基于本专利技术教导所作的任何变换或替换,均属于本专利技术的保护范围。如附图1所示本专利技术的一种利用高维辅助信息修正的项目推荐方法,包括:步骤S1,收集用户对项目的反馈行为和项目的高维辅助信息;步骤S2,初始化用户行为反馈矩阵和项目高维信息的特征矩阵;步骤S3,建立基于项目相似度计算的目标函数及约束条件;步骤S4,利用局部保留投影方法,将所述的高维信息的特征矩阵进行降维操作,映射为所述的高维辅助信息的投影矩阵,并代入所述的目标函数;步骤S5,利用迭代收敛计算方法,计算出所述的投影矩阵和项目相似度矩阵;步骤S6,利用所述的用户行为反馈矩阵和所述的项目相似度矩阵,计算用户对项目的预测评分矩阵;步骤S7,根据所述的预测评分矩阵,向用户推荐评分排名靠前的项目。所述的用户反馈包括购买记录,排名,评论,点击数等,所述的高维辅助信息包括电影推荐系统里的电影评论、工作推荐系统里的申请人简历、垃圾邮件检测里的邮件内容、在线购物中的项目评价等。辅助信息一般都具有高维的特点。例如,项目的文本描述中,如果将每一个在语料库中的词项(term)都作为一维的话,那么整个文档就是高维的。此外,以图片或视频为形式的辅助信息的维度会更加高。所述的用户反馈矩阵为R,大小为m×n,矩阵第u行i列代表了第i个项目是否被用户u购买、观看或者排名,是为1否为0。所述的项目高维信息的特征矩阵为F,大小为n×d,d为辅助信息的维度。所述的目标函数为:其中S代表项目相似度矩阵,大小为n×n,矩阵每一元素都在[0,1]之间,W为投影矩阵,大小为d×k,被用来将d维信息投影进k维空间,k远小于d。所述的约束条件为:其具体推导过程如下所述,一个典型的推荐系统需要利用项目相似度来填补矩阵R,而辅助信息则可以被用来计算项目相似度。利用S的范式,并结合了特征矩阵F,可形成如下目标:其中,并且sj是S矩阵的第j列,代表了第j个项目和其他项目的相似度。的限制避免了当R非常稀疏时,S趋近于0。目标函数中的用来学习S的系数矩阵并重构反馈矩阵。由于L1范式结果为常数,所以用L2范式规范S。α比率用来平衡两种信息的权重。在F中,fi被用来代表项目i的特征。特征的距离设定为欧氏距离||fi-fj||2。虽然相似度未知,但距离越远,相似度越小;距离越近,相似度越高。因此将正则化项设为||fi-fj||2si,j。所述的步骤S4中的局部保留投影(LPP)是非线性拉普拉斯特征映射的一种线性估计。该方法首先通过特征矩阵F来构造邻接图,这一过程中可以利用在公式(1)中学习到的相似度矩阵S。紧接着,需要解决广义特征向量问题:FTLFw=γFTDFw(2)其中D是一个对角矩阵,第i个对角元素为L是S的拉普拉斯矩阵,即投影矩阵W=(w1,w2,...,wk),其中特征向量wi对应特征值γi,且γ1≤...≤γd。线性组合FW代表了辅助信息在低本文档来自技高网...

【技术保护点】
1.一种利用高维辅助信息修正的项目推荐方法,其特征在于,所述方法包括:步骤S1,收集用户对项目的反馈行为和项目的高维辅助信息;步骤S2,初始化用户行为反馈矩阵和项目高维辅助信息的特征矩阵;步骤S3,建立基于项目相似度计算的目标函数及约束条件;步骤S4,利用局部保留投影方法,将所述的高维辅助信息的特征矩阵进行降维操作,映射为所述的高维辅助信息的投影矩阵,并代入所述的目标函数;步骤S5,利用迭代收敛计算方法,计算出所述的投影矩阵和项目相似度矩阵;步骤S6,利用所述的用户行为反馈矩阵和所述的项目相似度矩阵,计算用户对项目的预测评分矩阵;步骤S7,根据所述的预测评分矩阵,向用户推荐评分排名靠前的项目。

【技术特征摘要】
1.一种利用高维辅助信息修正的项目推荐方法,其特征在于,所述方法包括:步骤S1,收集用户对项目的反馈行为和项目的高维辅助信息;步骤S2,初始化用户行为反馈矩阵和项目高维辅助信息的特征矩阵;步骤S3,建立基于项目相似度计算的目标函数及约束条件;步骤S4,利用局部保留投影方法,将所述的高维辅助信息的特征矩阵进行降维操作,映射为所述的高维辅助信息的投影矩阵,并代入所述的目标函数;步骤S5,利用迭代收敛计算方法,计算出所述的投影矩阵和项目相似度矩阵;步骤S6,利用所述的用户行为反馈矩阵和所述的项目相似度矩阵,计算用户对项目的预测评分矩阵;步骤S7,根据所述的预测评分矩阵,向用户推荐评分排名靠前的项目。2.根据权利要求1所述的项目推荐方法,其特征在于,步骤S3中所述的目标函数为:,目标函数应最小化,约束条件为:并且,步骤S4中代入所述的目标函数后为:,约束条件为:,R为所述的用户反馈矩阵,F为所述的项目高维信息的特征矩阵,在F中,被用来代表项目i的特征,S为项目相似度矩阵,W为投影矩阵,比率用来平衡两种信息的权重,是用户给定的参数,表示矩阵F范数,即对矩阵所有元素求平方和开根号,即。3.根据权利要求2所述的项目推荐方法,其特征在于,步骤S5中的迭代收敛计算方法的步骤为:步骤S101,随机初始化项目相似度矩阵s和投影矩阵w;步骤S102,根据公式C1:计算项目似度矩阵s中的元素;步骤S103,根据公式C...

【专利技术属性】
技术研发人员:赵翔陈一帆李瑞琪葛斌肖卫东贺明科
申请(专利权)人:中国人民解放军国防科学技术大学
类型:发明
国别省市:湖南,43

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1