The invention provides a method for calculating item similarity based on a restricted Boltzmann machine, which comprises: (1) collecting user's score records of items in the system, and establishing a user's/item score matrix; and (2) setting the hyper-parameters of the model according to the calculation task, the hyper-parameters include the angle number K calculated by item similarity and the corresponding angle number K calculated by the item similarity. The number of eigenvalues of each angle; S3: Construct a restricted Boltzmann machine model for each angle, train the restricted Boltzmann machine with the item's user score record vector as the input of the model, get the eigenvalue activation probability vector value of each angle and the proportion of each angle in the similarity measure. Weight lambda k; S4: According to the eigenvalues of the main object at various angles to activate the probability vector value and weight lambda k, calculate the similarity between the main object and other items. The method for calculating the similarity of articles provided by the invention calculates the similarity between articles from various angles, and the calculated results are more accurate and more in line with the needs of users.
【技术实现步骤摘要】
一种基于受限玻尔兹曼机的物品相似度计算方法
本专利技术涉及的
为推荐系统,具体是关于推荐算法中一种物品相似度的计算方法。
技术介绍
现实中,每个用户对于物品都有自己的审视角度或者理解的侧重点,因此就导致站在不同的角度会将不同的物品相互关联起来,换句话说,就是物品之间的相似度存在于不同的审视角度或者理解的侧重点。举例来说,假如从性别的角度出发,电影《阿凡达》可能会和《敢死队》很相似,因为其中都具有很多打斗性的场景,因此对男性来说可能这两部电影在这个角度会更加相似一点。但是如果从整部影片的题材出发的话,电影《阿凡达》和《敢死队》就没有多大的相似性了,而《阿凡达》会和《骇客帝国》在影片的题材很相似。于是,从前面电影的例子来看,衡量物品之间的相似性可以从多个角度出发进行考虑,最后综合计算物品之间的相似度。目前,基于物品的相似度及用户行为进行推荐的协同过滤技术被广泛使用。常用的物品相似度计算有两类情况,一类是直接通过用户物品评分矩阵计算,分别有余弦相似度(cosinesimilarity)、皮尔逊系数(pearsoncorrelation)以及被Sarwar称为修正的余弦相似度(adjustcosinesimilarity)。二类是通过学习的方式来计算物品的相似度,分别有Ning等人提出的SLIM(SparseLinearMethodsforTop-NRecommenderSystems)方法,以及Christakopoulou等人提出的GLSLIM(LocalItem-ItemModelsforTop-NRecommendation)方法。2007年,Sal ...
【技术保护点】
1.一种基于受限玻尔兹曼机的物品相似度计算方法,其特征在于,具体包括如下步骤:S1:收集系统中用户对物品的评分记录,建立用户-物品评分矩阵;S2:根据计算任务设置模型的超参数,所述超参数包括物品相似度计算的角度数K和相应角度所具有特征值的个数;S3:针对每个角度构建一个受限玻尔兹曼机模型,用物品的用户评分记录向量作为模型的输入来进行受限玻尔兹曼机训练,得到各物品在各角度的特征值激活概率向量值和各角度在相似性度量中所占的权重λk;S4:根据主体物品在各角度的特征值激活概率向量值和权重λk,计算主体物品与其他物品之间的相似度。
【技术特征摘要】
1.一种基于受限玻尔兹曼机的物品相似度计算方法,其特征在于,具体包括如下步骤:S1:收集系统中用户对物品的评分记录,建立用户-物品评分矩阵;S2:根据计算任务设置模型的超参数,所述超参数包括物品相似度计算的角度数K和相应角度所具有特征值的个数;S3:针对每个角度构建一个受限玻尔兹曼机模型,用物品的用户评分记录向量作为模型的输入来进行受限玻尔兹曼机训练,得到各物品在各角度的特征值激活概率向量值和各角度在相似性度量中所占的权重λk;S4:根据主体物品在各角度的特征值激活概率向量值和权重λk,计算主体物品与其他物品之间的相似度。2.根据权利要求1所述的物品相似度计算方法,其特征在于,所述方法对受限玻尔兹曼机模型进行了参数化融合。3.根据权利要求2所述的受限玻尔兹曼机融合模型,其特征在于,所述受限玻尔兹曼机的融合有两层学习过程:K个角度所代表的受限玻尔兹曼机的并行训练学习和加权参数λk学习。4.根据权利要求3所述的受限玻尔兹曼机融合模型,其特征在于,所述受限玻尔兹曼机可见层中的可见单元代...
【专利技术属性】
技术研发人员:王国军,龙益农,刘湘勇,邢萧飞,
申请(专利权)人:广州大学,
类型:发明
国别省市:广东,44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。