一种基于差分隐私保护的矩阵分解推荐方法技术

技术编号:18445154 阅读:36 留言:0更新日期:2018-07-14 10:28
本发明专利技术公开了一种基于差分隐私保护的矩阵分解推荐方法。该方法如下:将已收集的用户对物品的评价或喜好,转化为用户‑评分矩阵,作为推荐方法模型的训练集;利用评分平均值、用户因子矩阵、物品因子矩阵、用户偏置项、物品偏置项预测用户对物品的评分情况;通过差分隐私平均值计算方法,计算出差分隐私保护下的用户评分的平均值;根据评分预测模型,建立最小化平方误差函数;利用差分隐私随机梯度下降方法,训练评分预测模型并在训练过程中添加差分隐私噪声,实现参数的差分隐私保护;利用评分预测模型与训练出的差分隐私保护模型参数,预测用户对物品的评分。本发明专利技术可以在提供推荐结果时,对用户的信息进行差分隐私保护,并具有较高的推荐准确度。

A matrix decomposition recommendation method based on differential privacy protection

The invention discloses a matrix decomposition recommendation method based on differential privacy protection. The method is as follows: the evaluation or preference of the collected users is converted to the user's score matrix as the training set of the recommended method model; the scoring average, the user factor matrix, the item factor matrix, the user bias term, the item bias term and the item bias item are used to predict the user's grading of the items, and through the differential privacy. The average value calculation method is used to calculate the average value of the user's score under the privacy protection of business travel, and the minimum square error function is set up according to the prediction model, and the difference privacy random gradient descent method is used to train the score prediction model and add the difference privacy noise in the training process to realize the differential privacy protection of the parameters. By using the score prediction model and the parameters of the differential privacy protection model, we can predict the user's score of the items. The invention can provide privacy protection to users' information while providing recommendation results, and has high recommendation accuracy.

【技术实现步骤摘要】
一种基于差分隐私保护的矩阵分解推荐方法
本专利技术涉及数据分析与数据挖掘
,特别是一种基于差分隐私保护的矩阵分解推荐方法。
技术介绍
当今社会,随着互联网和移动互联网的快速普及与发展,各类网络应用与移动App已经融入到人们日常工作生活的方方面面,例如即时通讯、社交网络、电子商务与电子支付等等,人们的日常工作与生活已经离不开互联网与移动互联网。网民数量与网站应用数量的飞速增长的同时,互联网上的各类信息也在加速增长中,在巨大的网民与网站基数下,每时每刻增加的信息数量已经超过一般人的承受能力。这使得在海量的互联网数据中,人们无法主动有效的找到、处理和利用自己想要的数据,这种情况被称作信息过载(InformationOverload)问题。在信息过载的时代,人们也在寻找解决信息处理与利用的有效方案。推荐系统不仅帮助人们更有效地获得想要的信息,也帮助信息提供者更好的将自己的信息推送到目标人群中,推荐系统已经成为当今互联网的重要环节。推荐系统的工作就是分析用户的喜好与使用习惯,建立用户与信息或产品之间的关系模型,再利用推荐方法完成相应的推荐。推荐系统在为用户建立定制化服务时,最基本的方法是通过用户自己设置自己想要的信息或产品的类型来获得推荐。推荐系统为了提供更准确的服务,使自己的推荐更符合用户的需求,需要收集大量的用户行为、使用习惯等信息来进行推荐,例如用户的浏览记录、购买信息、评分数据等信息。而且往往用户行为数据越丰富、越详细,构建的推荐模型就越准确。但是,在这大量的用户行为、使用习惯等信息中存在泄露用户个人隐私的风险。对于推荐系统来说,尽最大可能地保护用户的隐私安全与提升推荐系统的推荐准确度同等重要。因为更安全的隐私保护会减少用户分享自己隐私信息的担忧,使用户会更愿意提供自己的真实使用数据给推荐系统。而更丰富和准确的数据则会进一步提高推荐的准确度,提供更好的用户体验,从而进一步提高用户对推荐系统的信心与参与度,促成一个良性的循环。因此推荐系统的隐私保护研究,对于推动推荐系统良性发展,是具有非常重要的意义的。Dwork2006年提出了差分隐私机制。它首先定义了一个极为严格的攻击模型,通过对数据集中的原始信息或者统计数据添加噪声来实现对隐私的保护。因此即使攻击者拥有除目标隐私信息外的所有背景知识,隐私数据依然可以得到有效的保护。这些差分隐私的优点使得它受到国内外研究者的广泛研究。由于差分隐私保护在实际的使用过程中,大多是通过在数据集或者方法的输出结果中添加噪声来实现,如果不恰当的使用,则会造成数据集中添加噪声过大、数据可用性降低的问题。
技术实现思路
本专利技术的目的在于提供一种基于差分隐私保护的矩阵分解推荐方法,可以在提供推荐结果时,对用户的信息进行差分隐私保护,并能够保证较好的推荐准确度。实现本专利技术目的的技术解决方案是:一种基于差分隐私保护的矩阵分解推荐方法,包括以下步骤:步骤1、将已收集的用户对物品的评价或喜好,转化为用户-评分矩阵,作为推荐方法模型的训练集;步骤2、利用矩阵分解方法建立评分预测模型,利用评分平均值、用户因子矩阵、物品因子矩阵、用户偏置项、物品偏置项预测用户对物品的评分情况;步骤3、通过差分隐私平均值计算方法,计算出差分隐私保护下的用户评分的平均值;步骤4、根据评分预测模型,建立最小化平方误差函数;步骤5、利用差分隐私随机梯度下降方法,训练评分预测模型中的用户因子矩阵、物品因子矩阵、用户偏置项、物品偏置项,并在训练过程中向用户因子矩阵、物品因子矩阵、用户偏置项、物品偏置项中添加差分隐私噪声,实现参数的差分隐私保护;步骤6、利用评分预测模型与训练出的差分隐私保护模型参数,预测用户对物品的评分。进一步地,步骤1中所述的将已收集的用户对物品的评价或喜好,转化为用户-评分矩阵,具体如下:将已收集的用于对物品的评价或喜好的,转化为n×m的用户-评分矩阵Rn×m,用户集U={u1,u2,...,un},其中n为用户总数,物品集I={i1,i2,...,im},其中m为物品总数,rui为用户u对物品i的评分。进一步地,步骤2中所述的利用矩阵分解方法建立评分预测模型,具体如下:步骤4中所述的根据评分预测模型,建立最小化平方误差函数,具体如下:其中,rui表示用户u对物品i的评分,R表示评分矩阵,P表示用户因子矩阵,pu为用户因子矩阵中的向量,Q表示物品因子矩阵,qi表示物品因子矩阵中的向量;μ表示所有评分的平均数,用户偏置项bu表示用户u自身的打分倾向,物品偏置项bi表示物品i本身的所能得到的评价,而此时的则表示去掉偏置后用户的隐性因子u与物品的隐性因子i之间的关系;λ(||bu||2+||bi||2+||pu||2+||qi||2)为防止过拟合的正则项,正则化参数λ控制了正则化程度。进一步地,步骤3中所述的差分隐私平均值计算方法,具体如下:(3.1)计算评分求和的敏感度:Δrsum=rmax-rmin,其中rmax表示评分中的最大值,rmin表示评分中的最小值;(3.2)计算评分计数的敏感度:Δrcount=1;(3.3)计算出差分隐私保护的评分和其中ε1为平均值计算的差分隐私预算,R表示评分矩阵,rui为评分矩阵中用户u对物品i的评分;(3.4)计算出差分隐私保护的评分计数|R|+Lap(2Δrcount/ε1);(3.5)计算差分隐私保护的评分平均值:进一步地,步骤5中所述的差分隐私随机梯度下降方法,具体如下:(5.1)计算用户因子向量的敏感度sp=γ(emax·pmax+λ·qmax),其中sp表示用户因子向量敏感度,emax表示误差的最大值,pmax表示用户因子向量2范数的最大值,γ表示梯度下降速率,λ表示正则项,qmax表示物品因子向量2范数的最大值;(5.2)计算物品因子向量的敏感度sq=γ(emax·qmax+λ·pmax),其中sq表示物品因子向量敏感度,emax表示误差的最大值,pmax表示用户因子向量2范数的最大值,γ表示梯度下降速率,λ表示正则项,qmax表示物品因子向量2范数的最大值;(5.3)计算用户偏置项的敏感度sbu=γ(emax+λ·bumax),其中sbu表示用户偏置项敏感度,emax表示误差的最大值,γ表示梯度下降速率,λ表示正则项,bumax表示用户偏置项的最大值;(5.4)计算物品偏置项的敏感度sbi=γ(emax+λ·bimax),其中sbi表示用户偏置项敏感度,emax表示误差的最大值,γ表示梯度下降速率,λ表示正则项,bimax表示物品偏置项的最大值;(5.5)执行步骤(5.6)~(5.19)w次,其中w为随机梯度下降迭代次数;(5.6)对用户-物品评分矩阵中的每个用户u以及每个物品i执行步骤(5.7)~(5.11);(5.7)计算预测评分与实际评分的误差并令其中emax为误差截断参数;(5.8)更新物品因子向量其中γ为随机梯度下降学习参数;(5.9)更新用户因子向量(5.10)更新用户偏置项(5.11)更新物品偏置项(5.12)对每个用户u,执行步骤(5.13)~(5.15);(5.13)根据概率产生噪声向量np,其中ε2为差分隐私随机梯度下降的隐私预算;(5.14)更新用户因子向量pu←pu+np;(5.15)如果||pu||2>pmax,则执行其本文档来自技高网
...

【技术保护点】
1.一种基于差分隐私保护的矩阵分解推荐方法,其特征在于,包括以下步骤:步骤1、将已收集的用户对物品的评价或喜好,转化为用户‑评分矩阵,作为推荐方法模型的训练集;步骤2、利用矩阵分解方法建立评分预测模型,利用评分平均值、用户因子矩阵、物品因子矩阵、用户偏置项、物品偏置项预测用户对物品的评分情况;步骤3、通过差分隐私平均值计算方法,计算出差分隐私保护下的用户评分的平均值;步骤4、根据评分预测模型,建立最小化平方误差函数;步骤5、利用差分隐私随机梯度下降方法,训练评分预测模型中的用户因子矩阵、物品因子矩阵、用户偏置项、物品偏置项,并在训练过程中向用户因子矩阵、物品因子矩阵、用户偏置项、物品偏置项中添加差分隐私噪声,实现参数的差分隐私保护;步骤6、利用评分预测模型与训练出的差分隐私保护模型参数,预测用户对物品的评分。

【技术特征摘要】
1.一种基于差分隐私保护的矩阵分解推荐方法,其特征在于,包括以下步骤:步骤1、将已收集的用户对物品的评价或喜好,转化为用户-评分矩阵,作为推荐方法模型的训练集;步骤2、利用矩阵分解方法建立评分预测模型,利用评分平均值、用户因子矩阵、物品因子矩阵、用户偏置项、物品偏置项预测用户对物品的评分情况;步骤3、通过差分隐私平均值计算方法,计算出差分隐私保护下的用户评分的平均值;步骤4、根据评分预测模型,建立最小化平方误差函数;步骤5、利用差分隐私随机梯度下降方法,训练评分预测模型中的用户因子矩阵、物品因子矩阵、用户偏置项、物品偏置项,并在训练过程中向用户因子矩阵、物品因子矩阵、用户偏置项、物品偏置项中添加差分隐私噪声,实现参数的差分隐私保护;步骤6、利用评分预测模型与训练出的差分隐私保护模型参数,预测用户对物品的评分。2.根据权利要求1所述的基于差分隐私保护的矩阵分解推荐方法,其特征在于,步骤1中所述的将已收集的用户对物品的评价或喜好,转化为用户-评分矩阵,具体如下:将已收集的用于对物品的评价或喜好的,转化为n×m的用户-评分矩阵Rn×m,用户集U={u1,u2,...,un},其中n为用户总数,物品集I={i1,i2,...,im},其中m为物品总数,rui为用户u对物品i的评分。3.根据权利要求1所述的基于差分隐私保护的矩阵分解推荐方法,其特征在于,步骤2中所述的利用矩阵分解方法建立评分预测模型,具体如下:步骤4中所述的根据评分预测模型,建立最小化平方误差函数,具体如下:其中,rui表示用户u对物品i的评分,R表示评分矩阵,P表示用户因子矩阵,pu为用户因子矩阵中的向量,Q表示物品因子矩阵,qi表示物品因子矩阵中的向量;μ表示所有评分的平均数,用户偏置项bu表示用户u自身的打分倾向,物品偏置项bi表示物品i本身的所能得到的评价,而此时的则表示去掉偏置后用户的隐性因子u与物品的隐性因子i之间的关系;λ(||bu||2+||bi||2+||pu||2+||qi||2)为防止过拟合的正则项,正则化参数λ控制了正则化程度。4.根据权利要求1所述的基于差分隐私保护的矩阵分解推荐方法,其特征在于,步骤3中所述的差分隐私平均值计算方法,具体如下:(3.1)计算评分求和的敏感度:Δrsum=rmax-rmin,其中rmax表示评分中的最大值,rmin表示评分中的最小值;(3.2)计算评分计数的敏感度:Δrcount=1;(3.3)计算出差分隐私保护的评分和其中ε1为平均值计算的...

【专利技术属性】
技术研发人员:侯君李千目刘魁耿夏琛
申请(专利权)人:南京理工大学
类型:发明
国别省市:江苏,32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1