The invention discloses a neighborhood recommendation method based on differential privacy protection. The method is as follows: firstly, in the training stage, the collected user's evaluation or preference for the item is transformed into the user's score matrix, which is used as the training set of the recommendation method model; secondly, the neighborhood-based recommendation method is used to establish a score prediction model to predict the user's score of the item, and the neighborhood-based recommendation method is used to predict the user's score of the item. Mean value, user bias and item bias under differential privacy protection are calculated. Neighbor selection method based on differential privacy protection based on exponential mechanism is used to select neighbors in the scoring prediction stage. Laplace noise is added to local sensitivity of similarity to perform differential privacy protection. The parameters of the model are compared with the trained privacy preserving model parameters to predict users' ratings of items. The invention can provide differential privacy protection for user's information when providing recommendation results, and has high recommendation accuracy.
【技术实现步骤摘要】
基于差分隐私保护的邻域推荐方法
本专利技术涉及数据分析与数据挖掘
,特别是一种基于差分隐私保护的邻域推荐方法。
技术介绍
当今社会,随着互联网和移动互联网的快速普及与发展,各类网络应用与移动App已经融入到人们日常工作生活的方方面面,例如即时通讯、社交网络、电子商务与电子支付等等,人们的日常工作与生活已经离不开互联网与移动互联网。网民数量与网站应用数量的飞速增长的同时,互联网上的各类信息也在加速增长中,在巨大的网民与网站基数下,每时每刻增加的信息数量已经超过一般人的承受能力。这使得在海量的互联网数据中,人们无法主动有效的找到、处理和利用自己想要的数据,这种情况被称作信息过载(InformationOverload)问题。在信息过载的时代,人们也在寻找解决信息处理与利用的有效方案。推荐系统不仅帮助人们更有效地获得想要的信息,也帮助信息提供者更好的将自己的信息推送到目标人群中,推荐系统已经成为当今互联网的重要环节。推荐系统的工作就是分析用户的喜好与使用习惯,建立用户与信息或产品之间的关系模型,再利用推荐方法完成相应的推荐。推荐系统在为用户建立定制化服务时,最基本的方法是通过用户自己设置自己想要的信息或产品的类型来获得推荐。推荐系统为了提供更准确的服务,使自己的推荐更符合用户的需求,需要收集大量的用户行为、使用习惯等信息来进行推荐,例如用户的浏览记录、购买信息、评分数据等信息。而且往往用户行为数据越丰富、越详细,构建的推荐模型就越准确。但是,在这大量的用户行为、使用习惯等信息中存在泄露用户个人隐私的风险。对于推荐系统来说,尽最大可能地保护用户的隐私安全与提 ...
【技术保护点】
1.一种基于差分隐私保护的邻域推荐方法,其特征在于,包括以下步骤:步骤1、在训练阶段,将已收集的用户对物品的评价或喜好,转化为用户‑评分矩阵,作为推荐方法模型的训练集;步骤2、通过差分隐私平均值和偏置项计算方法,计算出差分隐私保护下的平均值;步骤3、通过基于差分隐私的偏置项计算,计算出差分隐私保护下的用户偏置项和物品偏置项;步骤4、在评分预测阶段,利用基于指数机制的差分隐私保护邻居选择方法选择邻居;步骤5、利用相似度的局部敏感度,添加拉普拉斯噪声进行差分隐私保护;步骤6、最后利用评分预测模型与训练出的差分隐私保护模型参数,预测用户对物品的评分。
【技术特征摘要】
1.一种基于差分隐私保护的邻域推荐方法,其特征在于,包括以下步骤:步骤1、在训练阶段,将已收集的用户对物品的评价或喜好,转化为用户-评分矩阵,作为推荐方法模型的训练集;步骤2、通过差分隐私平均值和偏置项计算方法,计算出差分隐私保护下的平均值;步骤3、通过基于差分隐私的偏置项计算,计算出差分隐私保护下的用户偏置项和物品偏置项;步骤4、在评分预测阶段,利用基于指数机制的差分隐私保护邻居选择方法选择邻居;步骤5、利用相似度的局部敏感度,添加拉普拉斯噪声进行差分隐私保护;步骤6、最后利用评分预测模型与训练出的差分隐私保护模型参数,预测用户对物品的评分。2.根据权利要求1所述的基于差分隐私保护的邻域推荐方法,其特征在于,步骤1中所述的在训练阶段,将已收集的用户对物品的评价或喜好,转化为用户-评分矩阵,具体如下:将已收集的用于对物品的评价或喜好的,转化为n×m的用户-评分矩阵Rn×m,用户集U={u1,u2,...,un},其中n为用户总数,物品集I={i1,i2,...,im},其中m为物品总数,rui为用户u对物品i的评分。3.根据权利要求1所述的基于差分隐私保护的邻域推荐方法,其特征在于,步骤2中所述的通过差分隐私平均值计算方法,计算出差分隐私保护下的平均值,具体如下:(3.1)计算评分求和的敏感度:Δrsum=rmax-rmin,其中rmax表示评分中的最大值,rmin表示评分中的最小值;(3.2)计算评分计数的敏感度:Δrcount=1;(3.3)计算出差分隐私保护的评分和其中ε1为平均值计算的差分隐私预算,R表示评分矩阵,rui为评分矩阵中用户u对物品i的评分;(3.4)计算出差分隐私保护的评分计数|R|+Lap(2Δrcount/ε1);(3.5)计算差分隐私保护的评分平均值:4.根据权利要求1所述的基于差分隐私保护的邻域推荐方法,其特征在于,步骤3中所述的通过基于差分隐私的偏置项计算,计算出差分隐私保护下的用户偏置项和物品偏置项,具体如下:(4.1)对于每个评分rui计算如果||eui||大小超过了emax,则根据emax对eui进行截...
【专利技术属性】
技术研发人员:耿夏琛,侯君,李千目,
申请(专利权)人:南京理工大学,
类型:发明
国别省市:江苏,32
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。