同时融入社交关系和用户相似度的协同过滤方法技术

技术编号:15690948 阅读:67 留言:0更新日期:2017-06-24 03:45
本发明专利技术的目的在于解决现有技术所存在的问题,找到一种同时融入好友特征和相似用户特征的协同过滤方法,提高协同过滤方法的准确度,包括:获取用户‑物品评分矩阵,通过皮尔逊相关系数计算用户之间的相似度,建立用户相似度矩阵;获取用户‑用户关系矩阵,对原始用户‑用户关系矩阵进行归一化处理,得到归一化后的用户‑用户关系矩阵;根据用户相似度矩阵和归一化后的用户‑用户关系矩阵将相似用户特征和好友用户特征融入概率矩阵分解模型的用户特征,根据概率矩阵分解模型获取用户对物品的预测评分,根据预测评分为用户推荐物品。有益技术效果:使得推荐结果收好友用户特征和相似用户特征影响,提高协同过滤方法的准确度。

Collaborative filtering method incorporating social relations and user similarity

The aim of the invention is to solve the problems existed in the prior art, find a collaborative filtering method with friends features and similar user characteristics, improve the accuracy of collaborative filtering method, including: obtaining the user item rating matrix, through the Pearson correlation coefficient of similarity between users, establish user similarity matrix to obtain the user; the user relation matrix, the original user user relationship matrix is normalized to get the user user relationship matrix normalized; according to the user user user similarity matrix and relation matrix of the normalized similar user characteristics and user friend features into user feature probability matrix decomposition model, based on probability matrix decomposition model to predict user access the item score, according to the forecast score recommended items for users. The utility model has the advantages that the recommendation result is influenced by the characteristics of a good friend, a user and a similar user, and the accuracy of the collaborative filtering method is improved.

【技术实现步骤摘要】
同时融入社交关系和用户相似度的协同过滤方法
本专利技术涉及协同过滤方法,尤其涉及一种同时融入社交关系和用户相似度的协同过滤方法。
技术介绍
近年来,随着互联网产品中信息过载问题的愈发严重,许多产品中都迫切需要提供个性化推荐的功能。然而,传统的推荐技术只考虑了两种实体即“用户”和“物品”,而忽略了好友之间的社交关系对推荐结果的影响。为此,融入社交关系的推荐系统逐渐受到关注,当前已经有许多的科研和工程实践工作证明,社交关系的引入能够有效提高推荐系统的准确性和和个性化程度。目前,融入社交关系的推荐方法采用的推荐算法主要分成两大类:(1)基于内存的个性化社交推荐算法:把社交关系融入到传统的基于内存的推荐算法之中,比如在基于用户的最近邻推荐算法或者基于物品的最近邻推荐算法加入社交关系。(2)基于模型的个性化社交算法:把社交关系融入到传统的基于模型的推荐算法之中,比如在概率矩阵分解模型中加入社交关系。上述两类融入社交关系的推荐方法,只能分别融入社交关系或者用户相似度信息,无法同时对社交关系和用户相似度信息建模,而在真实的互联网产品应用场景之中,用户的兴趣偏好一方面会受到好友的影响,即社交关系的影响。其兴趣另一方面又趋向于相同兴趣偏好的用户,即受到高相似度用户的影响。所以本专利技术专利提出一种同时融入社交关系和用户相似度的协同过滤方法和系统,同时把社交关系和用户相似度信息融入到推荐算法之中,改进协同过滤方法的准确度。
技术实现思路
本专利技术的目的在于解决现有技术所存在的问题,找到一种同时融入社交关系和用户相似度的协同过滤方法,提高协同过滤方法的准确度。为了实现所述目的,本专利技术同时融入社交关系和用户相似度的协同过滤方法,同时融入社交关系和用户相似度的协同过滤方法,包括以下几个步骤:步骤一:获取用户-物品评分矩阵,通过皮尔逊相关系数计算用户之间的相似度,建立用户相似度矩阵;步骤二:获取用户-用户关系矩阵,对原始用户-用户关系矩阵进行归一化处理,得到归一化后的用户-用户关系矩阵;步骤三:根据用户相似度矩阵和归一化后的用户-用户关系矩阵将相似用户特征和好友用户特征融入概率矩阵分解模型的预测评分公式中,根据融入相似用户特征和好友用户特征的概率矩阵分解模型获取用户对物品的预测评分,根据预测评分为用户推荐物品。进一步的,步骤一中,用户之间相似度的计算公式为:其中,Siw为用户i与物品w的相似度,I为用户i和用户w的公共评分集合,Rij为用户i对物品j的评分,为用户i的评分均值,Rwj为用户w对物品j的评分,为用户w的评分均值。进一步的,步骤二中,对原始用户-用户关系矩阵进行归一化的过程为:通过归一化,使得Fi表示用户i的好友集合,Tiv为原始用户-用户关系矩阵中第i行第v列的元素表示用户i对用户v的关系。进一步的,步骤一中,设置相似度阈值,根据用户相似度矩阵选择与用户相似度高于相似度阈值的用户集合作为高相似度用户集合。进一步的,步骤一中,设置高相似度用户数目的阈值Y,根据用户相似度矩阵选择与用户相似度最高的Y个用户作为高相似度用户集合。进一步的,Y值等于用户的好友数量。进一步的,融入相似用户特征和好友用户特征的概率矩阵分解模型中:用户隐因子矩阵U的条件概率为:物品隐因子矩阵V的条件概率为:评分预测公式为:其中Vj为物品j的特征向量,Ui为用户i的特征向量,Uυ为用户υ的特征向量,Uw为用户w的特征向量,Vj为物品j的特征向量,Fi为用户i的好友集合,Ni为用户i的高相似度用户集合,Siw表示用户i和用户w之间的相似度,Tiv为用户i与物品w的归一化后的关系值,为用户i的特征向量与物品j的特征向量的内积,为用户w的特征向量与物品j的特征向量的内积,为用户υ的特征向量与物品j的特征向量的内积,λT和λS为可调权重参数,0<λT<1,0<λS<1,并且λT+λS≤1。由于评分预测公式是三部分的加权,λT或者λS的大小控制最后评分预测公式中哪一部分的权重影响较大,比如λT比较大,那说明评分预测公式中,好友评分影响较大;λS较大,则说明高相似度用户对评分影响较大。进一步的,根据融入相似用户特征和好友用户特征的概率矩阵分解模型获取用户对物品的预测评分的步骤包括:根据预测评分公式、用户隐因子矩阵的条件概率和物品隐因子矩阵的条件概率提出需要最大化的隐因子矩阵的后验概率:最大化上述概率函数,等价于最小化如下的损失目标函数,其中,U为用户隐因子矩阵,V为物品隐因子矩阵,R为用户-物品评分矩阵,T为归一化后的用户-用户关系矩阵,S为用户相似度矩阵,Rij为用户i对物品j的评分,Ui为用户i的特征向量,Uυ为用户υ的特征向量,Uw为用户w的特征向量,Vj为物品j的特征向量,Fi为用户i的好友集合,Ni为用户i的高相似度用户集合,Siw为用户i与物品w的归一化后的关系值,为用户i的特征向量与物品j的特征向量的内积,为用户w的特征向量与物品j的特征向量的内积,为用户υ的特征向量与物品j的特征向量的内积,表示Frobenius范数;采用随机梯度下降的方法优化损失目标函数,获得用户隐因子矩阵U和物品隐因子矩阵V,并使用预测评分。进一步的,根据预测评分为用户推荐物品的步骤包括:根据预测评分,对前预测评分前N高的物品进行推荐。通过实施本专利技术可以取得以下有益技术效果:将相似用户特征和好友用户特征融入概率矩阵分解模型的预测评分公式,根据融入相似用户特征和好友用户特征的概率矩阵分解模型获取用户对物品的预测评分,根据预测评分为用户推荐物品,概率矩阵分解模型的基础上引入社交关系和用户相似度信息,进而改进概率矩阵分解模型,并获得更好的推荐效果。附图说明图1是融入社交关系和用户相似度的协同过滤方法的流程图;图2为标准矩阵分解模型;图3为同时融入社交关系和用户相似度的概率矩阵分解模型;图4为同时融入社交关系和用户相似度的协同过滤系统的框图。具体实施方式为了便于本领域技术人员的理解,下面结合具体实施例对本专利技术作进一步的说明:如图1所示,本专利技术同时融入好友特征和相似用户特征的协同过滤方法,包括以下几个步骤:步骤一:获取用户-物品评分矩阵,通过皮尔逊相关系数计算用户之间的相似度,建立用户相似度矩阵。通过用户相似度矩阵获取高相似度用户合集。用户相似度矩阵建立过程为:获取用户-物品评分矩阵Rij为矩阵R中第i行,第j列的元素表示用户i对物品j的评分,一般用户物品评分数值标准为5分制、10分制、100分制等,通过皮尔逊相关系数计算用户之间的相似度,建立用户相似度矩阵S,计算公式为:其中,Siw为矩阵S中i行w列的元素用于表示用户i与物品w的相似度,I为用户i和用户w的公共评分集合,Rij为用户i对物品j的评分,为用户i的评分均值,Rwj为用户w对物品j的评分,为用户w的评分均值。高相似度用户集合一般可采用三种方式获取:第一种方法,设置相似度阈值,相似度高于阈值的所有用户为高相似度用户集合,比如阈值为0.5时,相似度高于0.5的所有用户挑选出来做高相似度用户集合。第二种方法,设置高相似度用户数目的阈值,比如阈值为10时,挑选相似度最高的10个用户做高相似度用户集合。第三种方法,对应用户好友的关系数量,比如一个用户有20个好友,那么我们对应的,选取20个高相似度用户作为高相似度用户集合,那么就可本文档来自技高网...
同时融入社交关系和用户相似度的协同过滤方法

【技术保护点】
同时融入社交关系和用户相似度的协同过滤方法,其特征在于,包括以下几个步骤:步骤一:获取用户‑物品评分矩阵,通过皮尔逊相关系数计算用户之间的相似度,建立用户相似度矩阵;步骤二:获取用户‑用户关系矩阵,对原始用户‑用户关系矩阵进行归一化处理,得到归一化后的用户‑用户关系矩阵;步骤三:根据用户相似度矩阵和归一化后的用户‑用户关系矩阵将相似用户特征和好友用户特征融入概率矩阵分解模型的预测评分公式中,根据融入相似用户特征和好友用户特征的概率矩阵分解模型获取用户对物品的预测评分,根据预测评分为用户推荐物品。

【技术特征摘要】
1.同时融入社交关系和用户相似度的协同过滤方法,其特征在于,包括以下几个步骤:步骤一:获取用户-物品评分矩阵,通过皮尔逊相关系数计算用户之间的相似度,建立用户相似度矩阵;步骤二:获取用户-用户关系矩阵,对原始用户-用户关系矩阵进行归一化处理,得到归一化后的用户-用户关系矩阵;步骤三:根据用户相似度矩阵和归一化后的用户-用户关系矩阵将相似用户特征和好友用户特征融入概率矩阵分解模型的预测评分公式中,根据融入相似用户特征和好友用户特征的概率矩阵分解模型获取用户对物品的预测评分,根据预测评分为用户推荐物品。2.如权利要求1所述的同时融入社交关系和用户相似度的协同过滤方法,其特征在于,步骤一中,用户之间相似度的计算公式为:其中,Siw为用户i与物品w的相似度,I为用户i和用户w的公共评分集合,Rij为用户i对物品j的评分,为用户i的评分均值,Rwj为用户w对物品j的评分,为用户w的评分均值。3.如权利要求1所述的同时融入社交关系和用户相似度的协同过滤方法,其特征在于,步骤二中,对原始用户-用户关系矩阵进行归一化的过程为:通过归一化,使得Fi表示用户i的好友集合,Tiv为原始用户-用户关系矩阵中第i行第v列的元素表示用户i对用户v的关系。4.如权利要求1所述的同时融入社交关系和用户相似度的协同过滤方法,其特征在于,步骤一中,设置相似度阈值,根据用户相似度矩阵选择与用户相似度高于相似度阈值的用户集合作为高相似度用户集合。5.如权利要求1所述的同时融入社交关系和用户相似度的协同过滤方法,其特征在于,步骤一中,设置高相似度用户数目的阈值Y,根据用户相似度矩阵选择与用户相似度最高的Y个用户作为高相似度用户集合。6.如权利要求5所述的同时融入社交关系和用户相似度的协同过滤方法,其特征在于,Y值等于用户的好友数量。7.如权利要求1~6中任意一项所述的同时融入好友用户特征和相似用户特征的协同过滤方法,其特征在于,融入相似用户特征和好友用户特征的概率矩阵分...

【专利技术属性】
技术研发人员:胡天磊王铖微孙辰进戴文华
申请(专利权)人:浙江浙大网新集团有限公司
类型:发明
国别省市:浙江,33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1