一种基于随机扰动技术的协同过滤群组推荐方法技术

技术编号:15746737 阅读:111 留言:0更新日期:2017-07-03 02:42
本发明专利技术公开了一种基于随机扰动技术的协同过滤群组推荐方法,主要针对协同过滤群组推荐过程中用户可能暴露隐私信息的等问题,提出一种隐私保护群组推荐方法,主要包括提出用户原始评分数据扰动处理,用户兴趣偏好值,偏好作用权重和频度权重,通过随机扰动技术对用户原始数据进行处理保护用户的隐私数据,用户兴趣偏好值形成共同偏好群组,偏好作用权重和频度权重得到群组偏好值,基于项的协同过滤得到共同偏好群组预测评分,满足了群组获得推荐的同时也可以保护群组内用户隐私数据的需求。

A method of collaborative filtering group recommendation based on stochastic perturbation technique

The invention discloses a collaborative filtering group recommendation method based on stochastic disturbing problems, mainly for the user group collaborative filtering recommendation process may expose privacy information, proposes a privacy group recommendation method, including the original user rating data disturbance, user preference, preference weights and frequency weight and through random disturbance processing technology to protect users privacy data to users of raw data, the user's interest and preference values form the common preference preference function group, weight and weight frequency of group preference value, collaborative filtering has common preference prediction score based on the group to meet the group recommended, but also can protect the user privacy data group. The demand.

【技术实现步骤摘要】
一种基于随机扰动技术的协同过滤群组推荐方法
本专利技术涉及隐私保护、推荐系统
,特别是一种基于随机扰动技术的协同过滤群组推荐方法。
技术介绍
互联网技术的产生及发展使得网络中海量信息成为可能,为方便用户选择所需信息,人们提出了推荐系统的概念。推荐系统由推荐服务提供者建立并通过收集用户数据来实现用户偏好预测,收集到的数据可能包含各种私人信息,如邮寄地址或者订单历史,因此用户偏好数据的隐私成为一个关注的问题。随着网络用户的发展和逐步增加,用户通过分享共同的兴趣爱好更容易形成一个群组并一起参加相关的活动,这种情况激发了群组推荐的需求。例如,推荐一个合适的餐厅给朋友群组聚餐,或者对同一个在线阅读社区的成员推荐相关书籍,这些都是典型的群组推荐系统所要实现的。然而群组成员通常会有自己的私人隐私喜好并不想被组内其他成员知道,因此群组推荐系统中就要考虑用户隐私信息保护的问题。随机扰动是一种通过对原始数据添加随机噪声来保护隐私的方法,这种方法产生的扰动数据可以被视为近似原始数据,原理是在原始数据上添加服从特定分布的扰动噪声达到对初始数据的模糊处理,虽然改变了原始数据,但对于有些计算的结果影响并不是很大,误差在一定的范围内可以被广泛的应用。协同过滤系统在个体用户推荐方面取得了巨大成功,近年来也逐步应用于向群组用户进行推荐,随着互联网的发展,群组用户也不断地增加,构建群组推荐系统向群组用户提供个性化推荐,减少他们搜集信息所耗费的时间和精力显得越来越重要。
技术实现思路
本专利技术所要解决的技术问题是克服现有技术的不足而提供一种基于随机扰动技术的协同过滤群组推荐方法,通过对群组中用户评分信息的扰动处理,来达到群组推荐过程中用户信息的保护,使用户在享受群组推荐的同时亦能保护个人的隐私信息。本专利技术为解决上述技术问题采用以下技术方案:根据本专利技术提出的一种基于随机扰动技术的协同过滤群组推荐方法,包括以下步骤:步骤一、构建共同偏好群组:首先根据用户评分越集中反映用户兴趣偏好的原则计算得到用户兴趣偏好并构造偏好矩阵Q,然后通过皮尔逊相关系数计算兴趣偏好相似度并通过聚类方法将用户构建成各个共同偏好群组g;步骤二、计算群组偏好值:首先将用户原始评分进行随机扰动处理得到扰动后的评分Ri',然后分别计算群组内用户的偏好作用权重w1和频度权重w2并根据这两个标准得出最后的群组偏好值rg;步骤三、计算共同偏好群组预测评分:利用群组偏好值rg和基于项的协同过滤方法得出群组的预测评分Pg,并且将预测评分最高的前K个项目推荐给步骤一构建成的群组g,K≥1。作为本专利技术所述的一种基于随机扰动技术的协同过滤群组推荐方法进一步优化方案,所述步骤一具体如下:步骤1.1)计算用户偏好值:设u为任一用户,Iu表示用户u已评分的项类集合,A={a1,a2,...,an}表示经过项目划分生成的项类集合,n表示项类数目,对于ak表示第k个项类,1≤k≤n且k为整数,则称为u在ak项类上的用户偏好值;步骤1.2)计算偏好相似度:根据步骤1.1得到用户对每个项类的偏好值,据此构造出偏好矩阵Q,在Q上,采用协同过滤中的相似度度量方法皮尔逊相关系数来计算用户间的项类偏好相似性,将偏好相近的用户划分到同一个群组中;其中,u和v表示某两位用户,sim(u,v)表示这两个用户间的偏好相似性,和分别表示u和v对ak项类的偏好值,和分别表示u和v的偏好的平均值,步骤1.3)根据用户间的偏好相似性将用户划分成群组,利用k-means算法将用户划分成群组,将所有待划分用户中选择k个初始用户中心,然后根据欧氏距离计算公式和用户偏好相似性计算各用户与初始类中心的距离,将各用户移动到距离最近的初始类群中,重复计算所有用户与初始类中心的距离并调整用户到与其距离最近的类群中直到所有的用户不再变动,这样便将所有的用户划分成各个具有相似偏好的共同偏好群组。作为本专利技术所述的一种基于随机扰动技术的协同过滤群组推荐方法进一步优化方案,所述步骤二具体如下:步骤2.1)用户评分扰动:设g={u1,u2,...,ue},ui表示群组中第i个用户,i∈[1,e],e表示群组中成员的数量,Ri=(ri1,ri2,...rin)表示群组中用户ui的评分向量,其中,rik表示用户ui的第k个评分;根据随机扰动技术,扰动后的评分Ri'=(ri1+li1,ri2+li2,...rin+lin),其中,(li1,li2,...lin)表示一个服从均匀分布或者高斯分布的扰动噪声,lik表示对第k个评分添加的扰动噪声;步骤2.2)计算偏好作用权重:采用表示群组中所有成员评分的均值向量,采用表示群组中所有成员扰动评分的均值向量,其中,根据随机扰动技术的原理和皮尔逊相关系数,得出sim(Ri,Rmean)≈sim(Ri',R'mean),因此偏好作用权重计算如下:步骤2.3)计算频度权重:取群组中某一用户ui,用表示该群组内用户产生评分的项,则该用户的频度权重如下:步骤2.4)计算群组偏好值:步骤2.2得到的偏好作用权重从均值角度体现用户对群组的作用,步骤2.3所得的频度权重从评分次数角度体现用户对群组的作用,将两者统筹考虑得到群组中该成员在群组偏好形成过程中所起的作用为进而计算得出群组g对于项目Ik的偏好值如下:作为本专利技术所述的一种基于随机扰动技术的协同过滤群组推荐方法进一步优化方案,所述步骤三具体如下:令表示g中任何成员都未评分的项目集合,I表示整个项目空间;对于任一项目根据随机扰动技术原理和皮尔逊相关系数得到公式(5),通过公式(5)计算Ip与其他项目Ik的相似性;其中,Ik表示项目空间中任一项目,sim(Ip,Ik)表示Ip和Ik的相似性,U'表示Ip和Ik都有评分的用户集合,表示用户u对Ip经过随机扰动处理后的评分,表示经过随机扰动处理后的项目Ip的平均评分,表示用户u对Ik经过随机扰动处理后的评分,表示经过随机扰动处理后的项目Ik的平均评分;选择相似性最高的前N个项目组成Ip的最近邻集合IN,N≥1;根据公式(6)计算得到群组g对IP的预测评分其中,和分别表示项目Ip和项目的随机扰动处理后的平均评分,表示Ip和之间的相似性,表示群组g对项目的偏好值评分;得到中所有项目的预测评分后,将预测评分最高的前K个项目推荐给群组g。作为本专利技术所述的一种基于随机扰动技术的协同过滤群组推荐方法进一步优化方案,所述用户兴趣偏好是指户已评分的项的类目数占所有项类目数的比值;所述群组偏好值是代表群组的兴趣偏好,由群组内所有成员相互作用产生;所述偏好作用权重是指群组中每个用户评分与群组中用户评分均值的相似性占所有用户评分与评分均值相似性和的比重;所述频度权重是指群组中每个用户产生评分的次数与所有用户产生评分次数和的比值。本专利技术采用以上技术方案与现有技术相比,具有以下技术效果:(1)将用户形成共同偏好群组:由于现实网络中,用户评分越集中和稠密的地方往往能反映用户的兴趣偏好,通过用户偏好值计算有效反映用户兴趣,然后通过偏好相似度计算和聚类,有效地将具有相似兴趣的用户形成群组;(2)保护了用户的数据隐私的同时能够实现推荐:在计算用户群组内偏好作用权重、频度权重、群组偏好值和共同偏好群组预测评分计算中,通过随机扰动技术的噪声添加,掩盖了用户了的原始数据,本文档来自技高网...
一种基于随机扰动技术的协同过滤群组推荐方法

【技术保护点】
一种基于随机扰动技术的协同过滤群组推荐方法,其特征在于,包括以下步骤:步骤一、构建共同偏好群组:首先根据用户评分越集中反映用户兴趣偏好的原则计算得到用户兴趣偏好并构造偏好矩阵Q,然后通过皮尔逊相关系数计算兴趣偏好相似度并通过聚类方法将用户构建成各个共同偏好群组g;步骤二、计算群组偏好值:首先将用户原始评分进行随机扰动处理得到扰动后的评分R′

【技术特征摘要】
1.一种基于随机扰动技术的协同过滤群组推荐方法,其特征在于,包括以下步骤:步骤一、构建共同偏好群组:首先根据用户评分越集中反映用户兴趣偏好的原则计算得到用户兴趣偏好并构造偏好矩阵Q,然后通过皮尔逊相关系数计算兴趣偏好相似度并通过聚类方法将用户构建成各个共同偏好群组g;步骤二、计算群组偏好值:首先将用户原始评分进行随机扰动处理得到扰动后的评分R′i,然后分别计算群组内用户的偏好作用权重w1和频度权重w2并根据这两个标准得出最后的群组偏好值rg;步骤三、计算共同偏好群组预测评分:利用群组偏好值rg和基于项的协同过滤方法得出群组的预测评分Pg,并且将预测评分最高的前K个项目推荐给步骤一构建成的群组g,K≥1。2.根据权利要求1所述的一种基于随机扰动技术的协同过滤群组推荐方法,其特征在于,所述步骤一具体如下:步骤1.1)计算用户偏好值:设u为任一用户,Iu表示用户u已评分的项类集合,A={a1,a2,...,an}表示经过项目划分生成的项类集合,n表示项类数目,对于ak表示第k个项类,1≤k≤n且k为整数,则称为u在ak项类上的用户偏好值;步骤1.2)计算偏好相似度:根据步骤1.1得到用户对每个项类的偏好值,据此构造出偏好矩阵Q,在Q上,采用协同过滤中的相似度度量方法皮尔逊相关系数来计算用户间的项类偏好相似性,将偏好相近的用户划分到同一个群组中;其中,u和v表示某两位用户,sim(u,v)表示这两个用户间的偏好相似性,和分别表示u和v对ak项类的偏好值,和分别表示u和v的偏好的平均值,步骤1.3)根据用户间的偏好相似性将用户划分成群组,利用k-means算法将用户划分成群组,将所有待划分用户中选择k个初始用户中心,然后根据欧氏距离计算公式和用户偏好相似性计算各用户与初始类中心的距离,将各用户移动到距离最近的初始类群中,重复计算所有用户与初始类中心的距离并调整用户到与其距离最近的类群中直到所有的用户不再变动,这样便将所有的用户划分成各个具有相似偏好的共同偏好群组。3.根据权利要求2所述的一种基于随机扰动技术的协同过滤群组推荐方法,其特征在于,所述步骤二具体如下:步骤2.1)用户评分扰动:设g={u1,u2,...,ue},ui表示群组中第i个用户,i∈[1,e],e表示群组中成员的数量,Ri=(ri1,ri2,...rin)表示群组中用户ui的评分向量,其中,rik表示用户ui的第k个评分;根据随机扰动技术,扰动后的评分R′i=(ri1+li1,ri2+li2,...rin+lin),其中,(li1,li2,...lin)表示一个服从均匀分布或者高斯分布的扰动噪声,lik表示对第k个评分添加的扰动噪声;步骤2.2)计算偏好作用权重:采用表示群组中所有成员评分的均值向量,采用表示群组中所有成员扰动评分的均值向量,其中,根据随机扰动技术的原理和皮尔逊相关系数,得出sim(Ri,Rmean)≈sim(R′i,R′mean),因此偏好作用权重计算如下:

【专利技术属性】
技术研发人员:王海艳陆阳阳骆健
申请(专利权)人:南京邮电大学
类型:发明
国别省市:江苏,32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1