The invention discloses a collaborative filtering group recommendation method based on stochastic disturbing problems, mainly for the user group collaborative filtering recommendation process may expose privacy information, proposes a privacy group recommendation method, including the original user rating data disturbance, user preference, preference weights and frequency weight and through random disturbance processing technology to protect users privacy data to users of raw data, the user's interest and preference values form the common preference preference function group, weight and weight frequency of group preference value, collaborative filtering has common preference prediction score based on the group to meet the group recommended, but also can protect the user privacy data group. The demand.
【技术实现步骤摘要】
一种基于随机扰动技术的协同过滤群组推荐方法
本专利技术涉及隐私保护、推荐系统
,特别是一种基于随机扰动技术的协同过滤群组推荐方法。
技术介绍
互联网技术的产生及发展使得网络中海量信息成为可能,为方便用户选择所需信息,人们提出了推荐系统的概念。推荐系统由推荐服务提供者建立并通过收集用户数据来实现用户偏好预测,收集到的数据可能包含各种私人信息,如邮寄地址或者订单历史,因此用户偏好数据的隐私成为一个关注的问题。随着网络用户的发展和逐步增加,用户通过分享共同的兴趣爱好更容易形成一个群组并一起参加相关的活动,这种情况激发了群组推荐的需求。例如,推荐一个合适的餐厅给朋友群组聚餐,或者对同一个在线阅读社区的成员推荐相关书籍,这些都是典型的群组推荐系统所要实现的。然而群组成员通常会有自己的私人隐私喜好并不想被组内其他成员知道,因此群组推荐系统中就要考虑用户隐私信息保护的问题。随机扰动是一种通过对原始数据添加随机噪声来保护隐私的方法,这种方法产生的扰动数据可以被视为近似原始数据,原理是在原始数据上添加服从特定分布的扰动噪声达到对初始数据的模糊处理,虽然改变了原始数据,但对于有些计算的结果影响并不是很大,误差在一定的范围内可以被广泛的应用。协同过滤系统在个体用户推荐方面取得了巨大成功,近年来也逐步应用于向群组用户进行推荐,随着互联网的发展,群组用户也不断地增加,构建群组推荐系统向群组用户提供个性化推荐,减少他们搜集信息所耗费的时间和精力显得越来越重要。
技术实现思路
本专利技术所要解决的技术问题是克服现有技术的不足而提供一种基于随机扰动技术的协同过滤群组推荐方法,通过对群组 ...
【技术保护点】
一种基于随机扰动技术的协同过滤群组推荐方法,其特征在于,包括以下步骤:步骤一、构建共同偏好群组:首先根据用户评分越集中反映用户兴趣偏好的原则计算得到用户兴趣偏好并构造偏好矩阵Q,然后通过皮尔逊相关系数计算兴趣偏好相似度并通过聚类方法将用户构建成各个共同偏好群组g;步骤二、计算群组偏好值:首先将用户原始评分进行随机扰动处理得到扰动后的评分R′
【技术特征摘要】
1.一种基于随机扰动技术的协同过滤群组推荐方法,其特征在于,包括以下步骤:步骤一、构建共同偏好群组:首先根据用户评分越集中反映用户兴趣偏好的原则计算得到用户兴趣偏好并构造偏好矩阵Q,然后通过皮尔逊相关系数计算兴趣偏好相似度并通过聚类方法将用户构建成各个共同偏好群组g;步骤二、计算群组偏好值:首先将用户原始评分进行随机扰动处理得到扰动后的评分R′i,然后分别计算群组内用户的偏好作用权重w1和频度权重w2并根据这两个标准得出最后的群组偏好值rg;步骤三、计算共同偏好群组预测评分:利用群组偏好值rg和基于项的协同过滤方法得出群组的预测评分Pg,并且将预测评分最高的前K个项目推荐给步骤一构建成的群组g,K≥1。2.根据权利要求1所述的一种基于随机扰动技术的协同过滤群组推荐方法,其特征在于,所述步骤一具体如下:步骤1.1)计算用户偏好值:设u为任一用户,Iu表示用户u已评分的项类集合,A={a1,a2,...,an}表示经过项目划分生成的项类集合,n表示项类数目,对于ak表示第k个项类,1≤k≤n且k为整数,则称为u在ak项类上的用户偏好值;步骤1.2)计算偏好相似度:根据步骤1.1得到用户对每个项类的偏好值,据此构造出偏好矩阵Q,在Q上,采用协同过滤中的相似度度量方法皮尔逊相关系数来计算用户间的项类偏好相似性,将偏好相近的用户划分到同一个群组中;其中,u和v表示某两位用户,sim(u,v)表示这两个用户间的偏好相似性,和分别表示u和v对ak项类的偏好值,和分别表示u和v的偏好的平均值,步骤1.3)根据用户间的偏好相似性将用户划分成群组,利用k-means算法将用户划分成群组,将所有待划分用户中选择k个初始用户中心,然后根据欧氏距离计算公式和用户偏好相似性计算各用户与初始类中心的距离,将各用户移动到距离最近的初始类群中,重复计算所有用户与初始类中心的距离并调整用户到与其距离最近的类群中直到所有的用户不再变动,这样便将所有的用户划分成各个具有相似偏好的共同偏好群组。3.根据权利要求2所述的一种基于随机扰动技术的协同过滤群组推荐方法,其特征在于,所述步骤二具体如下:步骤2.1)用户评分扰动:设g={u1,u2,...,ue},ui表示群组中第i个用户,i∈[1,e],e表示群组中成员的数量,Ri=(ri1,ri2,...rin)表示群组中用户ui的评分向量,其中,rik表示用户ui的第k个评分;根据随机扰动技术,扰动后的评分R′i=(ri1+li1,ri2+li2,...rin+lin),其中,(li1,li2,...lin)表示一个服从均匀分布或者高斯分布的扰动噪声,lik表示对第k个评分添加的扰动噪声;步骤2.2)计算偏好作用权重:采用表示群组中所有成员评分的均值向量,采用表示群组中所有成员扰动评分的均值向量,其中,根据随机扰动技术的原理和皮尔逊相关系数,得出sim(Ri,Rmean)≈sim(R′i,R′mean),因此偏好作用权重计算如下:
【专利技术属性】
技术研发人员:王海艳,陆阳阳,骆健,
申请(专利权)人:南京邮电大学,
类型:发明
国别省市:江苏,32
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。