当前位置: 首页 > 专利查询>王瑞琴专利>正文

一种基于信任计算和矩阵分解的推荐算法制造技术

技术编号:20117986 阅读:36 留言:0更新日期:2019-01-16 12:06
本发明专利技术公开了一种基于信任计算和矩阵分解的推荐算法。矩阵分解推荐模型是目前广泛使用的个性化推荐技术,然而普遍存在数据稀疏性、冷启动和抗攻击能力差等问题。本发明专利技术以社交网络中的社会同质性原理作为理论依据,根据用户的兴趣偏好是由其自身特质和朋友影响结果的启发式思想,提出一种简单有效的信任度量方法和一个信任加强的矩阵分解推荐算法。信任计算过程综合考虑了全局信任、局部信任、信任传递、多路信任组合等因素。在基于矩阵分解的用户建模过程中,利用信任邻居用户对当前用户的潜在因子向量加以扩展,同时利用用户间的信任关系对参数求解目标函数进行规格化约束,从而极大缓解了数据稀疏性和冷启动问题,并具有良好的抗攻击能力。

A Recommendation Algorithm Based on Trust Computing and Matrix Decomposition

The invention discloses a recommendation algorithm based on trust calculation and matrix decomposition. Matrix factorization recommendation model is a widely used personalized recommendation technology. However, there are many problems such as data sparsity, cold start and poor anti-attack ability. Based on the principle of social homogeneity in social networks and the heuristic idea that users'interests and preferences are influenced by their own characteristics and friends, a simple and effective trust measurement method and a matrix factorization recommendation algorithm for trust enhancement are proposed. The trust computing process takes into account the global trust, local trust, trust transfer, multi-channel trust combination and other factors. In the process of user modeling based on matrix decomposition, the potential factor vectors of current users are extended by trusted neighbor users, and the objective function of Parameter Solving is normalized by the trust relationship between users, which greatly alleviates the problem of data sparsity and cold start, and has good anti-attack ability.

【技术实现步骤摘要】
一种基于信任计算和矩阵分解的推荐算法
:本专利技术属于计算机人工智能领域,具体涉及基于用户信誉度的信任扩展方法和信任加强的矩阵分解协同推荐模型,用于解决推荐系统中的数据稀疏性问题和新用户的冷启动问题。
技术介绍
:在这个信息爆炸的时代,推荐系统作为一种有效的信息过滤技术在各种电子商务平台和社交网络中被广泛使用,如Amazon,eBay,Netflix等。自从2009年NetflixPrize百万美金竞赛以来,基于矩阵分解的协同推荐技术以其在大赛中的优异表现得到了业界的广泛关注。矩阵分解的核心思想认为用户的兴趣只受少数几个决定性因素的影响,因此通过将稀疏且高维的用户-项目评分矩阵分解为两个低维的矩阵,即用户特征矩阵和项目特征矩阵,然后用重构的低维矩阵就可以预测用户对项目的评分,这样可以在减少计算复杂度的同时提高推荐性能。然而在现实环境中,用户-项目评分矩阵往往非常稀疏,评分矩阵的极端稀疏性使得矩阵分解方法无法准确获得用户的偏好模型,从而影响评分预测和推荐的精度。鉴于此,研究者们纷纷提出各种改进策略,如矩阵填充、带偏置的矩阵分解、上下文感知的矩阵分解、联合矩阵分解等。然而以上方法并没有从根本上解决协同推荐中的数据稀疏性问题,因为它们使用的数据源并没有改变。根据社会影响理论中的“从众”性,用户在社交环境中的行为一方面是由用户自身的兴趣偏好决定的,另一方面则会受到周围人群的影响。近年来,随着社交网络的兴起和蓬勃发展,社交网络中产生了大量的用户数据,信任关系就是其中之一。用户间的信任关系和用户-项目间的交互行为是两个相对独立的数据源,利用社交信任关系来改善推荐系统的性能是本专利技术的主要动机。传统的协同过滤技术还存在冷启动问题,对于那些具有极少甚至没有历史评分数据的新用户,该方法往往很难为其做出正确的推荐。社交信任的引入可以缓解这一难题,根据社交选择与社会影响理论中的同质性原理,朋友之间往往具有相似的兴趣爱好,所以可以利用用户之间的信任关系辅助构建用户的偏好模型。抗攻击能力也是推荐系统需要关注的问题之一,基于历史评分的协同推荐技术显然存在安全隐患。恶意用户前期通过效仿目标用户的行为成为其相似邻居,后期通过实施恶意行为来对目标用户造成伤害。基于信任关系的协同推荐可以避免这个问题,只要恶意用户不属于目标用户的可信任朋友圈,他们就不可能对目标用户的评分预测产生任何影响。基于以上原因,我专利技术提出一种信任加强的推荐方法,采用低时高效的矩阵分解模型作为主框架,利用信任关系作为附加数据源,采用信任同质性原理对推荐模型进行扩展和约束,有效解决数据稀疏性问题、冷启动问题,全面提高推荐系统的性能和抗攻击能力。
技术实现思路
:首先,提出一种基于用户全局信誉度的信任计算方法,用以扩展用户的社会关系,缓解社交推荐中信任数据的稀疏性问题;然后,提出一种信任加强的矩阵分解模型,使用Top-K信任用户对当前用户的特征向量进行扩展,解决评分数据的稀疏性问题和新用户的冷启动问题;最后,进一步利用用户间的信任关系,对矩阵分解的目标优化函数进行规格化约束,提高评分预测和推荐的准确性。本专利技术的具体步骤为:1.信誉度敏感的信任计算众所周知,信任关系的引入是为了解决协同推荐系统中的数据稀疏性问题,然而在实际的应用环境中,信任关系本身也非常稀疏,很多评分数量极少的用户其维护的信任关系往往也很少,所以传统社交推荐算法的性能并不理想。为了缓解社交推荐中信任数据的稀疏性问题,本专利技术提出一种信誉度敏感的信任计算方法,来推理用户之间的间接信任度Sij,计算公式如下:其中,Trustee(ui)表示用户ui的直接信任用户集,rep(uk)表示用户ui的全局信誉度。在社交网络中,用户信誉度的度量方法有很多种,如基于网络结构分析的中心度指标Degree,Closeness,Betweenness和Eigenvector,以及PageRank,Hits等图论计算方法。以上信任扩展方法原理简单却含义丰富,其计算过程全面考虑了用户间的局部信任关系以及用户的全局信誉度在信任传递过程中的作用,而且分子项中的求和运算体现了多路信任的合成原理,计算得到的信任度处于[0,1]区间。2.基于矩阵分解的社交推荐鉴于PMF模型在协同推荐中的优异表现,本专利技术继续采用PMF作为评分预测的主框架,同时基于社会同质性原理,充分利用用户间的社交信任关系对矩阵分解模型进行扩展和约束。由社交同质性原理可知,社交网络中人们的行为不仅是由其自身的兴趣偏好决定,而且会受到其周围人群的影响,尤其是其所信任的朋友。因此,本专利技术在利用矩阵分解模型对用户特征进行建模时,将社交信任关系作为辅助信息,对当前用户的潜在特征向量进行扩展,扩展后的用户评分条件概率分布如下:其中,u表示评分均值,bi和bj分别表示用户ui和项目vj的偏置,Tk(i)表示用户ui的Top-K信任用户集,xl表示ui的第1个信任用户在ui特征建模过程中的贡献权重,该参数由训练过程学习得到。Trust-MF建模过程的图形描述如图1所示。本专利技术与已有方法具有本质区别,已有方法将社交信任作为附加信息对评分预测的计算过程进行调整,并没有对用户向量本身进行修改,而本专利技术方法是对用户特征向量的扩展,将原用户向量Ui变为Ui′,其中这样一来,用户建模过程中就隐含了信任传递的过程。根据概率分布原理,评分预测后验概率分布的对数形式如下:其中,N(i)是与用户ui具有信任关系的用户集,C是参数无关的常数项。最大化以上后验概率等价于求以下目标函数的极小值:其中,这里为了简单起见,设λU=λV=λ。目标函数的最后一项是基于信任关系的规格化约束因子,目的是使信任用户之间的特征向量尽量相似:当用户ui和ul之间的信任度比较高时,他们的特征向量Ui和Ul应该比较相似,即差值应该很小;当他们之间的信任度比较低时,其特征向量Ui和Ul之间可以具有较大差距。以上目标函数是非凸的,很难求得最优解,这里使用随机梯度下降法(SGD)来求其局部最优解。记当前评分预测误差为eij,通过遍历所有已知评分对超参数进行迭代更新。对于一个给定的训练样本Rij,各参数的更新规则如下:bi=bi+γ(eij-λbi)公式(7)bj=bj+γ(eij-λbj)公式(8)其中,T(i)是用户ui的信任用户集,B(i)是信任用户ui的用户集,γ是学习率,λS和λ是规格化因子,k是信任用户的个数。本专利技术的实验结果:实验测试选择Epinions通用数据集,该数据集由49,289个用户对139,738个项目的664,823个评分组成,同时包含用户声明的478,183个信任关系。实验比较使用两种测试指标:平均绝对误差(MAE)和均方根误差(RMSE)。为了说明本专利技术提出的Trust-MF算法在推荐性能方面的改善效果,在相同的实验环境下,将本专利技术与一系列当前流行的社交推荐算法和基于矩阵分解的推荐算法进行了比较,其中包括:·TrustCF:为了验证矩阵分解推荐方法的优越性,我们设计实现了一个基于用户信任关系的协同推荐算法,其中使用基于信任用户的KNN方法进行推荐;·bPMF:带偏置的矩阵分解算法,它在PMF算法的基础上增加了用户和项目的偏置调节因子对用户进行建模。该算法只利用用户-项目评分矩阵作为数据源进行推荐;·SoRec本文档来自技高网
...

【技术保护点】
1.一种基于信任计算和矩阵分解的协同推荐方法,其特征在于:包括信誉度敏感的信任计算模块和信任加强的矩阵分解模块,其中:所述信誉度敏感的信任计算模块,用于隐式信任关系的发现,进而扩展信任网络,解决信任数据的稀疏性问题;所述信任加强的矩阵分解模块,用于基于社会同质性原理,使用信任关系对传统的矩阵分解推荐方法进行扩展与约束,从而提高推荐性能。

【技术特征摘要】
1.一种基于信任计算和矩阵分解的协同推荐方法,其特征在于:包括信誉度敏感的信任计算模块和信任加强的矩阵分解模块,其中:所述信誉度敏感的信任计算模块,用于隐式信任关系的发现,进而扩展信任网络,解决信任数据的稀疏性问题;所述信任加强的矩阵分解模块,用于基于社会同质性原理,使用信任关系对传统的矩阵分解推荐方法进行扩展与约束,从而提高推荐性能。2.根据权利要求1所述的信誉度敏感的信任计算方...

【专利技术属性】
技术研发人员:王瑞琴
申请(专利权)人:王瑞琴
类型:发明
国别省市:浙江,33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1