【技术实现步骤摘要】
一种基于不可信服务器的差分隐私混合推荐方法
[0001]本专利技术属于隐私保护
,尤其涉及一种基于不可信服务器的差分隐私混合推荐方法。
技术介绍
[0002]目前,互联网、大数据、云计算等技术的快速发展给人们的生活带来了便利的同时引发了“信息过载”的问题。因此,推荐系统孕育而出。它通过挖掘用户与项目之间的二元关系,帮助用户从海量数据中过滤其不太可能产生行为的项目,生成个性化推荐。
[0003]如今,在社交网站、影视娱乐、电子商务等领域,推荐系统已经成为必不可少的工具。然而推荐系统需要收集大量的用户信息、用户行为,这些所采集的信息往往会泄露用户隐私。用户出于隐私安全考虑,可能不愿意自己数据被推荐系统记录和存储。而且,我国于2021年11月通过了《互联网信息服务算法推荐管理规定》标志着数据的隐私保护已经成为推荐系统研究领域一个迫切需要解决的问题。
[0004]现有的隐私技术基本上围绕着匿名技术、加密技术和扰动技术。匿名技术通过将用户标识符泛化到等价类的方式保证用户的隐私,如k匿名技术,但它极易受到具有背景知识的攻击者的攻击,无法达到用户隐私安全的目的。加密技术将数据明文编码为仅特定人员能够解码的密文,保证存储和传输过程中数据的机密性,但它应用到推荐系统中涉及密钥传输以及对大量用户数据进行加密计算,巨大的通信与运算开销导致其在实际应用场景中难以落地。
[0005]在推荐系统中,仅通过噪声添加机制便可实现差分隐私,无需额外的计算开销,故已得到广泛关注。Dwork等人提出的差分隐私保护技术,解决了 ...
【技术保护点】
【技术特征摘要】 【专利技术属性】
1.一种基于不可信服务器的差分隐私混合推荐方法,其特征在于,所述基于不可信服务器的差分隐私混合推荐方法包括:构建新的隐私保护推荐系统框架,利用用户隐式反馈行为数据,在客户端考虑数值敏感度和数据分布不同,使用LCF
‑
VDP机制扰动原始数据并上传到服务器;服务器混合两种算法的相似度,最终选择topk混合相似度发送给每个用户设备,在每个用户设备中进行预测评分计算并推荐。2.如权利要求1所述基于不可信服务器的差分隐私混合推荐方法,其特征在于,所述基于不可信服务器的差分隐私混合推荐方法包括以下步骤:设计适合推荐系统的数据扰动技术LCF
‑
VDP,在客户端存储真实的交互记录,采用LCF
‑
VDP进行用户数据隐私处理并将处理后的数据上传到服务器端;定义服务器端的混合方式,采用简单的加权组合方式把从隐私处理后的数据中提取相似度与从内容中提取出的相似度进行混合;设计预测评分计算和推荐方法;在客户端本地根据存储的真实的交互记录和topk混合相似度进行项目预测评分计算,并从计算好的项目预测评分中取topN推荐给用户。3.如权利要求2所述基于不可信服务器的差分隐私混合推荐方法,其特征在于,所述步骤一中的无隐私保护的基于项目的协同过滤包括:从相似度计算、预测评分计算、推荐方法三个方面定义采用的基于项目的协同过滤的方法;当存在n个用户U={U1,U2,...U
n
}和m个项目I={I1,I2,...I
m
},用户U
u
∈U的历史交互数据记为X
u
,有X
u
∈I;使用Jaccard相似度从用户-项目交互矩阵中计算出项目-项目相似度矩阵;其中,intersection(I
i
,I
j
)表示同时交互项目i和项目j的用户数量,union(I
i
,I
j
)表示至少交互项目i或者项目j的用户数量;用邻居项目的交互记录的加权和计算用户U
u
的项目I
i
的预测评分;其中,sim(I
i
,I
j
)表示项目i和项目j的相似度,X
u
表示用户u对项目j的历史交互记录;所述根据从项目中提取的标签计算项目-项目相似度包括:其中,intersection_tags(I
i
,I
j
)表示项目i和项目j的标签的交集数量,union_tags(I
i
,I
j
)表示项目i和项目j的标签的并集数量;所述采用简单的加权组合方式混合相似度的形式如下:mixed_sim(I
i
,I
j
)=a*sim_jac(I
i
,I
j
)+b*sim_tag(I
i
,I
j
);其中,a是sim_jac(I
i
,I
j
)的权重,sim_tag(I
i
,I
j
)的权重值是b;当a=1,b=0时,混合算法退化成基于项目的协同过滤算法。4.如权利要求2所述基于不可信服务器的差分隐私混合推荐方法,其特征在于,所述步骤二中的差分隐私的形式化定义如下:
-差分隐私:对于任意一对仅相差一条数据的相邻数据集D和D'以及任意可能的查询结果S,如果一个隐私保护机制M能够使得相邻数据集上的查询结果满足下式,则算法M满足-差分隐私;其中,ε指隐私预算,用于衡量隐私与数据的可用性;ε越小,隐私性越好,数据的可用性越差,反之亦然;所述本地差分隐私的形式化定义如下:-本地差分隐私:给定n个用户,每个用户对于一条记录,给定一个隐私算法M及其定义域Dom(M)和值域Ran(M),若算法M在任意两条记录X和X'(X和X'∈Dom(M))上得到相同的输出结果满足下式,则算法M满足-本地差分隐私;其中,ε指隐私预算,用于衡量隐私与数据的可用性;ε越小,隐私性越好,数据的可用性越差,反之亦然。5.如权利要求2所述基于不可信服务器的差分隐私混合推荐方法,其特征在于,所述步骤二中的基于差分隐私的客户端-服务器协同保护推荐系统框架如下:(1)客户端用户数据隐私处理:用户的客户端保存着真实的交互数据,扰动方式使用LCF
‑
技术研发人员:杨昌松,唐紫薇,丁勇,柳悦玲,刘洋,
申请(专利权)人:桂林电子科技大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。