一种基于联合随机翻转的差分隐私保护方法技术

技术编号:31758252 阅读:19 留言:0更新日期:2022-01-05 16:41
本发明专利技术涉及一种基于联合随机翻转的差分隐私保护方法,属于隐私安全技术领域。该方法为:S1:将评分用编码机制编码成二进制形式;S2:将二进制形式评分按规则转换成二进制矩阵;S3:对二进制矩阵进行联合随机翻转;S4:将翻转后的二进制矩阵进行S2中的反向操作展开;S5:利用汉明距离求物品间相似性;S6:利用物品相似性与原始评分预测用户对未评分物品的评分,并完成推荐。本发明专利技术在保证用户信息隐私安全的同时,避免了差分隐私算法对推荐系统准确性的影响,实现了安全性与准确性的良好平衡。实现了安全性与准确性的良好平衡。实现了安全性与准确性的良好平衡。

【技术实现步骤摘要】
一种基于联合随机翻转的差分隐私保护方法


[0001]本专利技术属于隐私安全
,涉及一种基于联合随机翻转的差分隐私保护方法。

技术介绍

[0002]推荐系统可以利用用户海量的历史信息对用户的喜好进行推荐,用户如果购买推荐的商品或者下载了推荐的软件,则商家会得到相应的收益,所以提高推荐系统的准确性是很重要的研究方向。但由于用户历史信息中包含用户的隐私数据,为了避免隐私数据的泄漏,各种隐私保护方法被应用到了推荐系统中。其中差分隐私是近年比较热门的隐私保护技术,但是差分隐私对隐私数据起到有效保护作用的同时,也降低了数据对于推荐系统的可用性,从而使推荐系统准确性降低。因此,如何避免差分隐私算法对推荐系统准确性的影响,实现安全性与准确性的良好平衡是差分隐私推荐算法的关键。
[0003]随机翻转机制是Rade提出的一种满足差分隐私的机制,用于对二进制数据的隐私保护。在推荐系统中,用户信息的隐式表达为二进制形式,可以用随机翻转机制进行隐私保护。随机翻转机制的定义如下:
[0004][0005][0006]其中ε为隐私预算,表达的含义为,二进制位以p的概率翻转,以q的概率不翻转。随机翻转机制具有严格的数学推导和很强的隐私保护性能。
[0007]根据以上的分析可知,随机翻转机制在推荐系统中只能处理用户数据的隐式表达,不能处理用户显式表达(如评分数据),而且随机翻转机制对数据的可用性产生了影响,使推荐系统准确性降低。因此随机翻转机制有着一定的局限性。为了将其进一步推广至用户显式表达的处理,本专利技术提出了一种新的编码机制。为了消除对数据可用性的影响,本专利技术提出了一种联合随机翻转机制。

技术实现思路

[0008]有鉴于此,本专利技术的目的在于提供一种基于联合随机翻转的差分隐私保护方法,实现安全性与推荐系统准确性的良好平衡。
[0009]为达到上述目的,本专利技术提供如下技术方案:
[0010]一种基于联合随机翻转的差分隐私保护方法,该方法具体包括以下步骤:
[0011]S1:将U中的所有评分数据r
ij
利用编码机制编码成二进制形式b
ij,t
;r
ij
表示第i个用户对第j个物品的评分,利用编码机制编码成二进制形式b
ij,t
,t的范围为1~L,L为编码长度;
[0012]S2:每个用户的二进制数据转换成二进制矩阵b
i

[0013][0014]S3:每个用户的二进制矩阵拼接成用户二进制矩阵B:
[0015]B=[b1,b2,...b
i
];
[0016]S4:对用户二进制矩阵B进行联合随机翻转得到B


[0017]B

=[b
′1,b
′2,...b

i
];
[0018]S5:将B

进行S2中的反向操作展开U


[0019]U

=[u
′1,u
′2,...u

i
][0020]u

i
=[(b

i1,1
,b

i1,2
,...b

i1,L
),(b

i2,1
,b

i2,2
,...b

i2,L
),...,(b

ij,1
,b

ij,2
,...b

ij,L
)];
[0021]S6:利用汉明距离求U

中物品之间相似性,其中汉明距离公式为:
[0022][0023]其中,x,y为二进制数,d(x,y)为x,y之间汉明距离,为异或运算符;则物品m和物品n之间的相似性表示为sim(m,n):
[0024][0025]其中L为编码长度,s为m和n的共同评分用户集合,len(s)表示集合中共同评分用户的数量,b

s[t],m
和b

s[t],n
分别表示s中第t个共同评分用户对m,n的评分的联合随机翻转结果;
[0026]S6:利用相似性和原始评分U预测未知评分r(u,i):
[0027][0028]其中,N(i)为物品i的邻居物品集合,r
uj
为用户u对物品j的原始评分,将预测评分大于设定阈值的物品推荐给用户,完成推荐。
[0029]可选的,所述S1中,根据编码机制编码原始评分,编码机制为:
[0030]r
i
=(b1,b2,...,b
L
)
[0031]其中L为编码长度,L=评分最大值

评分最小值;r
i
为评分范围按升序排列的第i个值,b
i
∈{0,1},i∈[1,L]的整数,式子中b1至b
L

i+1
为0,b
L

i+2
至b
L
为1。
[0032]可选的,所述S4中,对用户二进制矩阵B进行联合随机翻转得到B

,联合随机翻转的公式为:r
i
=(b1,b2,...,b
L

i+1
,b
L

i+2
,...,b
L
)
[0033][0034][0035]其中ε为隐私预算,对于用户二进制矩阵B:
[0036]B=[b1,b2,...b
i
]=[(V
11
,V
12
,...,V
1L
),(V
21
,V
22
,...,V
2L
),,(V
i1
,V
i2
,...,V
iL
)][0037]将二进制矩阵B中的每一列V以p的概率全部翻转,即V中所有的1翻转为0,所有0翻转为1;以q的概率不翻转,即V中所有1和0均保持不变。
[0038]本专利技术的有益效果在于:本专利技术所述编码方法可以使编码前后距离度量没有损失;本专利技术所述方法实现了安全性与推荐系统准确性的良好平衡。
[0039]本专利技术的其他优点、目标和特征在某种程度上将在随后的说明书中进行阐述,并且在某种程度上,基于对下文的考察研究对本领域技术人员而言将是显而易见的,或者可以从本专利技术的实践中得到教导。本专利技术的目标和其他优点可以通过下面的说明书来实现和获得。
附图说明
[0040]为了使本专利技术的目的、技术方案和优点更加清楚,下面将结合附图对本专利技术作优选的详细描述,其中本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于联合随机翻转的差分隐私保护方法,其特征在于:该方法具体包括以下步骤:S1:将U中的所有评分数据r
ij
利用编码机制编码成二进制形式b
ij,t
;r
ij
表示第i个用户对第j个物品的评分,利用编码机制编码成二进制形式b
ij,t
,t的范围为1~L,L为编码长度;S2:每个用户的二进制数据转换成二进制矩阵b
i
:S3:每个用户的二进制矩阵拼接成用户二进制矩阵B:B=[b1,b2,...b
i
];S4:对用户二进制矩阵B进行联合随机翻转得到B

:B

=[b
′1,b
′2,...b

i
];S5:将B

进行S2中的反向操作展开U

:U

=[u
′1,u
′2,...u

i
]u

i
=[(b

i1,1
,b

i1,2
,...b

i1,L
),(b

i2,1
,b

i2,2
,...b

i2,L
),...,(b

ij,1
,b

ij,2
,...b

ij,L
)];S6:利用汉明距离求U

中物品之间相似性,其中汉明距离公式为:其中,x,y为二进制数,d(x,y)为x,y之间汉明距离,为异或运算符;则物品m和物品n之间的相似性表示为sim(m,n):其中L为编码长度,s为m和n的共同评分用户集合,len(s)表示集合中共同评分用户的数量,b

s[t],n
和b

【专利技术属性】
技术研发人员:王永胡勇进高明星彭俊杰
申请(专利权)人:重庆邮电大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1