基于评分LDA的协同过滤算法制造技术

技术编号：28707733 阅读：69 留言：0更新日期：2021-06-05 23:14

本发明专利技术公开了基于评分LDA的协同过滤算法，对所需进行评价的商品建立相关的用户参数，设置参数K为“兴趣个数”、参数R为“评分数目”、参数M为“用户人数”，且设置参数Θ表示兴趣的多项式分布，参数Ω表示在给定兴趣的情况下关于商品的多项式分布，设置Φ表示在给定兴趣的情况下关于评分的多项式分布，并额外设置α，β和λ分别表示Θ，Φ和Ω的超参，计算出用户对于某个商品评分的概率P(i，r|u)，然后根据P(i，r|u)来进行排序生成推荐列表。本申请所提出的RLDA算法和其他对比方法最大的不同点在于本文的模型是将评分因素直接加入模型，而不是分两步计算，在整体的计算过程中受稀疏性的影响较小，使得算法的准确性与可参考性得到显著提升。著提升。著提升。

全部详细技术资料下载

【技术实现步骤摘要】
基于评分LDA的协同过滤算法

[0001]本专利技术属于LDA算法
，更具体地说，尤其涉及基于评分LDA的协同过滤算法。

技术介绍

[0002]推荐系统的核心是推荐算法。算法的优劣，直接关系到推荐系统的质量。为了使推荐系统更好地满足消费者的需求，近年来，学者们提出了很多推荐算法。本节主要对与本文相关的算法进行介绍和分析，包括奇异值分解(SVD)，潜在狄利克雷(LDA)模型和iExpand算法。
[0003]随着潜在兴趣或潜在因素的增长，每个算法的效果均有所减弱，特别是SVD_Pure(即SVD算法，加Pure后缀是为了与后文的近邻相区别)算法。当k值较大的时候，随着k的增大，各个算法的效果均变差。主要是因为k的增大使这些算法过拟合。大多数情况下，本文的算法性能优于其他对比算法。随着潜在兴趣或潜在因子数目增长，RLDA的曲线和SVD_Neib(基于近邻的SVD)的曲线表现非常相像，都明显好于其他几个对比算法，特别是当潜在兴趣或潜在因子数目大的时候。但是，潜在兴趣或潜在因子数目增大RLDA和SVD_Neib的影响很小。反观其他的对比算法，随着潜在兴趣或潜在因子数目的增大，曲线急剧下降。潜在因素的增大，SVD_Pure容易过拟合，而SVD_Neib由于采用近邻的原因，具有很强的适应性。iExpand算法的曲线因为是基于LDA模型，所以曲线的走势和LDA很像。这也就意味着，iExpand算法的性能很大程度上取决于LDA模型。且各个算法在数据集Movielens100K上的表现要比在数据集Movielens1M上...

【技术保护点】

【技术特征摘要】
1.一种基于评分LDA的协同过滤算法，其特征在于：S1、对所需进行评价的商品建立相关的用户参数，设置参数K为“兴趣个数”、参数R为“评分数目”、参数M为“用户人数”；S2、基于独立性假设，定义兴趣t、商品i和评分r三者的联合分布，如下所示：P(t，i，r|α，β，λ)＝P(t|α，β，λ)
·
P(i，r|α，β，λ)＝P(t)
·
P(i|t)
·
P(r|t)＝Θ
t
·
Φ
t，i
·
Ω
t，r
；S3、在状态j的情况下，建立和来依次分别表示第k个兴趣，第i个商品，第r个评分和第u个用户，使用T表示兴趣、N表示商品以及R表示评分的数目，再利用和分别表示属于用户u的兴趣数目，商品分配给兴趣t的数目，评分分配给兴趣t的...

【专利技术属性】
技术研发人员：陈道泉，周秀泽，
申请(专利权)人：浙江机电职业技术学院，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人