一种隐私保护方法和装置制造方法及图纸

技术编号:27191663 阅读:15 留言:0更新日期:2021-01-31 11:33
本申请实施例提供一种隐私保护方法和装置,涉及终端领域,能够减少通信开销。其方法为:终端设备获取第一数据类型的隐私数据对应的差分隐私配置参数,差分隐私配置参数包括至少两个待上报的整数;终端设备确定第一数据类型的隐私数据对应的整数,第一数据类型的隐私数据对应的整数为至少两个待上报的整数的其中一个;终端设备向服务器上报第一数据类型的隐私数据对应的整数。本申请实施例应用于对用户数据进行隐私保护的场景。户数据进行隐私保护的场景。户数据进行隐私保护的场景。

【技术实现步骤摘要】
一种隐私保护方法和装置


[0001]本申请涉及终端领域,尤其涉及一种隐私保护方法和装置。

技术介绍

[0002]为了提供给终端用户更好的体验,需要搜集终端侧的用户数据进行智能分析。比如统计用户在某款应用(application,APP)上的平均使用时间,或者收集用户侧的本地人工智能(artificial intelligence,AI)模型的参数,以便在服务器侧进行AI模型的聚合。若明文传输用户数据,容易导致用户的隐私泄露。为了防止用户隐私泄露,如图1所示,用户的终端设备可以利用差分隐私(differential privacy,DP)技术对需要统计的原始数据进行保护,即通过差分隐私加噪模块对原始数据进行处理得到隐私保护数据,再将隐私保护数据存储到数据库。数据使用者在数据库进行查询(query)时,仅可以查询隐私保护数据的统计值(隐私保护查询结果),无法获取每个用户的原始数据,从而保护了用户数据。
[0003]现有基于差分隐私技术的方法,主要是通过对用户数据添加拉普拉斯(Laplace)噪声实现的。如图2所示,每个终端设备(用户1的终端设备或用户2的终端设备)上报自身训练得到的神经网络的权值ω时,可以为ω添加噪声(例如,Laplace噪声),而后将添加了Laplace噪声的ω提交给计算服务器。计算服务器对多个终端设备的上报值求和以及求均值时,可以近似抵消Laplace噪声,从而获取原始用户数据的和以及均值。
[0004]但是,在采用拉普拉斯方法为用户数据添加拉普拉斯噪声时,为了保证数据的降噪精度,需要使用浮点数,从而导致通信开销较大。

技术实现思路

[0005]本申请实施例提供一种隐私保护方法和装置,能够减少通信开销。
[0006]第一方面,本申请实施例提供一种隐私保护方法,包括:终端设备获取第一数据类型的隐私数据对应的差分隐私配置参数,差分隐私配置参数包括至少两个待上报的整数;终端设备确定第一数据类型的隐私数据对应的整数,第一数据类型的隐私数据对应的整数为至少两个待上报的整数的其中一个;终端设备向服务器上报第一数据类型的隐私数据对应的整数。
[0007]基于本申请实施例提供的方法,终端设备可以根据第一数据类型的隐私数据上报整数,即对第一数据类型的隐私数据添加随机噪声,保护了用户的隐私信息。并且,由于上报值为整数,相比上报浮点数可以节省通信开销。
[0008]在一种可能的实现方式中,差分隐私配置参数还包括隐私预算,第一数据类型的隐私数据的最大值和第一数据类型的隐私数据的最小值中的至少一个。
[0009]在一种可能的实现方式中,终端设备确定第一数据类型的隐私数据对应的整数包括:终端设备根据差分隐私配置参数确定上报至少两个待上报的整数中每个整数的概率;终端设备根据上报至少两个待上报的整数中每个整数的概率确定第一数据类型的隐私数据对应的整数。可选的,终端设备可以根据上报至少两个待上报的整数中每个整数的概率
和终端设备产生的随机数确定第一数据类型的隐私数据对应的整数。
[0010]在一种可能的实现方式中,终端设备根据差分隐私配置参数确定上报至少两个待上报的整数中每个整数的概率包括:终端设备根据第一数据类型的隐私数据的最大值和第一数据类型的隐私数据的最小值对第一数据类型的隐私数据进行线性化运算得到X,X大于0且小于等于1;终端设备根据X和隐私预算确定上报至少两个待上报的整数中每个整数的概率。
[0011]在一种可能的实现方式中,若至少两个待上报的整数包括1和0,终端设备根据X和隐私预算确定上报至少两个待上报的整数中每个整数的概率包括:
[0012]P(1)=(1+(exp(ε)-1)*X)/(exp(ε)+1);
[0013]P(0)=(exp(ε)-(exp(ε)-1)*X)/(exp(ε)+1);
[0014]其中,P(1)表示上报1的概率,P(0)表示上报0的概率,ε表示隐私预算,exp表示以自然对数底数e为底数的指数运算。
[0015]这样,终端设备可以根据隐私数据上报有限的整数,不必上报浮点数。例如,若待上报的整数包括0和1,终端设备可以上报0或者1,上报一个整数的开销只需要1个bit,通信开销小。
[0016]在一种可能的实现方式中,若至少两个待上报的整数包括0到N,N为大于或等于1的整数,终端设备根据X和隐私预算确定上报至少两个待上报的整数中每个整数的概率包括:
[0017]P(i)=(1+(exp(ε)-1)*X)/[((1-N)*X+N)+exp(ε)*((N-1)*X+1)],i=1,2,

,N;
[0018]P(0)=(exp(ε)-(exp(ε)-1)*X)/[((1-N)*X+N)+exp(ε)*((N-1)*X+1)];
[0019]其中,P(i)表示上报i的概率,P(0)表示上报0的概率,ε表示隐私预算,exp表示以自然对数底数e为底数的指数运算。
[0020]这样,终端设备可以根据隐私数据上报有限的整数,不必上报浮点数。例如,若待上报的整数包括0-3,终端设备可以上报0-3中的任一个数,上报一个整数的开销只需要2个bit,通信开销小。并且,待上报的整数包括0到N,相比待上报的整数包括0和1,上报值的种类更多,对用户隐私的保护能力更好。
[0021]第二方面,本申请实施例提供一种隐私保护方法,包括:服务器接收多个终端设备发送的整数,每个终端设备发送的整数中包括第一数据类型的隐私数据对应的整数;服务器确定第一数据类型的隐私数据对应的整数的和;服务器确定第一数据类型的隐私数据对应的整数的均值;服务器根据第一数据类型的隐私数据对应的整数的均值确定第一数据类型的隐私数据的均值。
[0022]基于本申请实施例提供的方法,服务器可以接收多个终端设备发送的第一数据类型的隐私数据对应的整数,相比现有技术中服务器接收隐私数据对应的浮点数,可以节省通信开销。服务器可以根据第一数据类型的隐私数据对应的整数的均值确定第一数据类型的隐私数据的均值,但服务器无法通过用户的一个上报值判断出用户的真实信息(原始隐私数据),从而保护了用户的隐私信息,符合差分隐私要求。
[0023]在一种可能的实现方式中,服务器根据第一数据类型的隐私数据对应的整数的均值确定第一数据类型的隐私数据的均值包括:服务器根据第一数据类型的隐私数据对应的整数的均值和差分隐私配置参数确定第一数据类型的隐私数据的均值,差分隐私配置参数
包括隐私预算、第一数据类型的隐私数据的最大值以及第一数据类型的隐私数据的最小值中的至少一个。
[0024]在一种可能的实现方式中,若多个终端设备发送的整数包括1和0,服务器根据第一数据类型的隐私数据对应的整数的均值和差分隐私配置参数确定第一数据类型的隐私数据的均值包括:
[0025]avg(t)=avg(X)*(max-min)+min;
[0026]avg(X)=(avg(y)*(exp(ε)+1)-1)/(exp(ε)-1);本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种隐私保护方法,其特征在于,包括:终端设备获取第一数据类型的隐私数据对应的差分隐私配置参数,所述差分隐私配置参数包括至少两个待上报的整数;所述终端设备确定所述第一数据类型的隐私数据对应的整数,所述第一数据类型的隐私数据对应的整数为所述至少两个待上报的整数的其中一个;所述终端设备向服务器上报所述第一数据类型的隐私数据对应的整数。2.根据权利要求1所述的隐私保护方法,其特征在于,所述差分隐私配置参数还包括隐私预算,所述第一数据类型的隐私数据的最大值和所述第一数据类型的隐私数据的最小值中的至少一个。3.根据权利要求1或2所述的隐私保护方法,其特征在于,所述终端设备确定所述第一数据类型的隐私数据对应的整数包括:所述终端设备根据所述差分隐私配置参数确定上报所述至少两个待上报的整数中每个整数的概率;所述终端设备根据上报所述至少两个待上报的整数中每个整数的概率确定所述第一数据类型的隐私数据对应的整数。4.根据权利要求3所述的隐私保护方法,其特征在于,所述终端设备根据所述差分隐私配置参数确定上报所述至少两个待上报的整数中每个整数的概率包括:所述终端设备根据所述第一数据类型的隐私数据的最大值和所述第一数据类型的隐私数据的最小值对所述第一数据类型的隐私数据进行线性化运算得到X,X大于0且小于等于1;所述终端设备根据所述X和所述隐私预算确定上报所述至少两个待上报的整数中每个整数的概率。5.根据权利要求4所述的隐私保护方法,其特征在于,若所述至少两个待上报的整数包括1和0,所述终端设备根据所述X和所述隐私预算确定上报所述至少两个待上报的整数中每个整数的概率包括:P(1)=(1+(exp(ε)-1)*X)/(exp(ε)+1);P(0)=(exp(ε)-(exp(ε)-1)*X)/(exp(ε)+1);其中,P(1)表示上报1的概率,P(0)表示上报0的概率,ε表示所述隐私预算,exp表示以自然对数底数e为底数的指数运算。6.根据权利要求4所述的隐私保护方法,其特征在于,若所述至少两个待上报的整数包括0到N,N为大于或等于1的整数,所述终端设备根据所述X和所述隐私预算确定上报所述至少两个待上报的整数中每个整数的概率包括:P(i)=(1+(exp(ε)-1)*X)/[((1-N)*X+N)+exp(ε)*((N-1)*X+1)],i=1,2,

,N;P(0)=(exp(ε)-(exp(ε)-1)*X)/[((1-N)*X+N)+exp(ε)*((N-1)*X+1)];其中,P(i)表示上报i的概率,P(0)表示上报0的概率,ε表示所述隐私预算,exp表示以自然对数底数e为底数的指数运算。7.一种隐私保护方法,其特征在于,包括:服务器接收多个终端设备发送的整数,每个终端设备发送的整数中包括第一数据类型的隐私数据对应的整数;
所述服务器确定所述第一数据类型的隐私数据对应的整数的和;所述服务器确定所述第一数据类型的隐私数据对应的整数的均值;所述服务器根据所述第一数据类型的隐私数据对应的整数的均值确定所述第一数据类型的隐私数据的均值。8.根据权利要求7所述的隐私保护方法,其特征在于,所述服务器根据所述第一数据类型的隐私数据对应的整数的均值确定所述第一数据类型的隐私数据的均值包括:所述服务器根据所述第一数据类型的隐私数据对应的整数的均值和差分隐私配置参数确定所述第一数据类型的隐私数据的均值,所述差分隐私配置参数包括隐私预算、所述第一数据类型的隐私数据的最大值以及所述第一数据类型的隐私数据的最小值中的至少一个。9.根据权利要求8所述的隐私保护方法,其特征在于,若所述多个终端设备发送的整数包括1和0,所述服务器根据所述第一数据类型的隐私数据对应的整数的均值和差分隐私配置参数确定所述第一数据类型的隐私数据的均值包括:avg(t)=avg(X)*(max-min)+min;avg(X)=(avg(y)*(exp(ε)+1)-1)/(exp(ε)-1);其中,avg(t)表示所述第一数据类型的隐私数据的均值,avg(y)表示所述第一数据类型的隐私数据对应的整数的均值,min表示所述第一数据类型的隐私数据的最小值,max表示所述第一数据类型的隐私数据的最大值,ε表示所述隐私预算,exp表示以自然对数底数e为底数的指数运算。10.根据权利要求8所述的隐私保护方法,其特征在于,若所述多个终端设备发送的整数包括0到N,N为大于或等于1的整数,所述服务器根据所述第一数据类型的隐私数据对应的整数的均值和差分隐私配置参数确定所述第一数据类型的隐私数据的均值包括:avg(t)=avg(X)*(max-min)+min;avg(X)=[(N+1)/2-avg(y)*(N+(exp(ε))]/[(N-1)*(exp(ε)-avg(y))-(exp(ε)-1)(N+1)/2];其中,avg(t)表示所述第一数据类型的隐私数据的均值,avg(y)表示所述第一数据类型的隐私数据对应的整数的均值,min表示所述第一数据类型的隐私数据的最小值,max表示所述第一数据类型的隐私数据的最大值,ε表示所述隐私预算,exp表示以自然对数底数e为底数的指数运算。11.一种终端设备,其特征在于,包括:获取单元,用于获取第一数据类型的隐私数据对应的差分隐私配置参数,所述差分隐私配置参数包括至少两个待上报的整数;确定单元,用于确定所述第一数据类型的隐私数据对应的整数,所述第一数据类型的隐私数据对应的整数为所述至少两个待上报的整数的其中一个;发送单元,用于向服务器上报所述第一数据类型的隐私数据对应的整数。...

【专利技术属性】
技术研发人员:尹瀚吴饶金温学军
申请(专利权)人:华为技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1