当前位置: 首页 > 专利查询>华侨大学专利>正文

一种基于领域相关性自适应的协同过滤方法技术

技术编号:14182763 阅读:113 留言:0更新日期:2016-12-14 12:10
一种基于领域相关性自适应的协同过滤方法,包括如下步骤:(1)将辅助域和目标域的差异性作为正则化项引入传统模型,得到新的模型:其中:T是目标领域内有部分缺失项的评分矩阵,Z为目标域的填充矩阵,Z与T有相同的评分项;表示目标域的指标集,||·||F表示Frobenius范数,||·||*表示核范数,||Z||*为矩阵Z的所有奇异值之和;γ为正则化参数,η∈(0,1)表示辅助域和目标域的相似性;(2)然后使用定点迭代算法计算新模型的正则最优化解Z*=Z。本发明专利技术可应用于互联网推荐系统,通过自适应的估计两者相关性,并将其引入目标领域的预测模型,从而有效的实现知识迁移,提高目标领域的推荐精度。

A collaborative filtering method based on domain relevance adaptation

A collaborative filtering method based on adaptive domain, which comprises the following steps: (1) the difference between auxiliary and target domain as a regularization term into the traditional model, a new model: the T is the target in the field of score matrix partial deletion of the Z as the target filling matrix domain. Z and T have the same score; said the target domain of the index set, || ||F said Frobenius norm, || - ||* said nuclear norm, ||Z||* matrix Z all the singular value; gamma for the regularization parameter, and eta (0,1) said the similarity auxiliary and target domain; (2 then use the regular fixed-point iterative algorithm) a new model for calculating the optimum solution of Z* = Z. The invention can be applied to the Internet recommendation system, through the correlation estimation both adaptive and predictive model, the target domain, so as to effectively realize knowledge transfer, improve the recommendation accuracy of target area.

【技术实现步骤摘要】

本专利技术涉及信息处理技术中的数据挖掘方向领域,特别是一种基于领域相关性自适应的协同过滤方法,可应用于互联网推荐系统。
技术介绍
随着信息与物联网技术的日益发展,互联网满足了用户在信息时代对信息的需求,给人们带来便利的同时也带来了大量信息处理问题。用户在面对海量信息时无法从中获得对自己真正有用的那部分信息,使得对大数据的使用效率反而降低,出现了所谓的信息超载问题。解决信息超载问题一个非常有潜力的办法便是推荐系统。推荐系统在许多应用上扮演着重要角色,比如,在像亚马逊,淘宝等电子商务领域中,它可以帮助用户从大量的对象(如书籍、电影、音乐、笑话和网页)中筛选出感兴趣的产品或物品。近年来,协同过滤技术(CF)作为一种最有效的推荐算法之一,受到广泛的关注。当用户对项目进行评价后(如评分、评级或统计点击次数),可以生成一个用户-项目的评分矩阵。由于通常用户只对少量的项目进行评价,因此评分矩阵中包含大量的未知值即缺失值。协同过滤(CF)利用评分矩阵中的已知数据计算用户或项目间的相似度,并利用相似用户或项目的评分对缺失值进行预测,最终根据预测值将用户可能感兴趣的项目推荐给用户。传统的协同过滤技术包括基于项目的协同过滤算法、基于用户的协同过滤算法以及基于模型的协同过滤技术。近年来,以协同过滤技术为基础的高效推荐算法已经有进一步发展。其中,基于矩阵分解的协同过滤技术受到广泛的关注。对于包含缺失值的评分矩阵,矩阵分解技术通过将其近似分解成两个或三个低秩矩阵的乘积以实现对缺失值的预测。然而,当用户只在非常少量的项目上进行评价时,评分矩阵会非常的稀疏。此时,通常的矩阵分解技术很难适用。稀疏性问题也是协同过滤技术面临的主要挑战。迁移学习是一种解决此类问题的可行方法。虽然用户对当前目标领域的项目评分非常少,但用户可能会在其它的相关领域(称为辅助领域)对其他项目进行一些评价。迁移学习的目的在于利用辅助领域学习的知识,帮助对目标领域的评分进行预测。现有的迁移学习方法面临着下面的一些共性问题:(1)算法通常需要多个输入参数。现有的迁移学习方法大多基于矩阵分解技术提取辅助域的用户或项目特征,需要将维度做为输入参数。此外,还需要辅助域和目标域的相关性参数,以及两到三个正则项参数。参数的调试给算法在实际问题中的应用带来了很大的困难。(2)对辅助领域的数据要求较高。现有的迁移学习方法大多要求辅助域和目标域有着共同的用户;要求辅助域和目标域的项目有较强的相关性;要求用户对辅助域和目标域的项目有着类似的评价方式;要求辅助域和目标域的用户特征有着相同的维度。这些对辅助域的要求很大程度的降低了迁移学习方法的实用性。(3)对于大规模数据,一些迁移学习算法所需要的计算量太大。在实际应用中,通常涉及到处理海量用户对项目的评分,算法所需要的计算量过大直接限制了其实用性。
技术实现思路
本专利技术的主要目的在于克服现有技术中的上述缺陷,提出一种基于领域相关性自适应的协同过滤方法,通过自适应的计算辅助域和目标域的相关性,更为充分和有效的利用用户在辅助域的评分数据,从而帮助提高用户在目标领域的评分预测精度。本专利技术采用如下技术方案:一种基于领域相关性自适应的协同过滤方法,其特征在于,包括如下步骤:(1)将辅助域和目标域的差异性作为正则化项引入传统模型,得到新的模型: m i n Z { 1 2 | | P Ω ( T - Z ) | | F 2 + γ | | Z | | * - η γ | | F A T Z | | *本文档来自技高网
...
一种基于领域相关性自适应的协同过滤方法

【技术保护点】
一种基于领域相关性自适应的协同过滤方法,其特征在于,包括如下步骤:(1)将辅助域和目标域的差异性作为正则化项引入传统模型,得到新的模型:minZ{12||PΩ(T-Z)||F2+γ||Z||*-ηγ||FATZ||*};]]>其中:T是目标领域内有部分缺失项的评分矩阵,Z为目标域的填充矩阵,Z与T有相同的评分项;表示目标域的指标集,||·||F表示Frobenius范数,||·||*表示核范数,||Z||*为矩阵Z的所有奇异值之和;γ为正则化参数,η∈(0,1)表示辅助域和目标域的相似性;(2)然后使用定点迭代算法计算新模型的正则最优化解Z*=Z。

【技术特征摘要】
1.一种基于领域相关性自适应的协同过滤方法,其特征在于,包括如下步骤:(1)将辅助域和目标域的差异性作为正则化项引入传统模型,得到新的模型: m i n Z { 1 2 | | P Ω ( T - ...

【专利技术属性】
技术研发人员:王靖杜吉祥柳欣陈梦洁
申请(专利权)人:华侨大学
类型:发明
国别省市:福建;35

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1