一种基于同态加密的隐私保护岭回归方法技术

技术编号:35140176 阅读:14 留言:0更新日期:2022-10-05 10:16
本发明专利技术为一种基于同态加密的隐私保护岭回归方法,属于信息安全领域。该方法包含以下步骤:S1:设定可验证解密方法相关参数并根据安全参数生成密钥;S2:设计密文向量安全求逆方法;S3:发送方和接收方分别利用预处理自己的数据集,并进行编码、加密,得到密文数据;S4:整合密文数据;S5:发送方设计改进共轭梯度法;S6:在接收方的协助下,发送方基于改进共轭梯度法,利用整合密文数据训练岭回归模型,得到模型参数的密文;S7:接收方对模型参数的密文解密后,解码得到模型参数,并将模型参数发送给发送方;S8:输入样本值,得到预测值。本发明专利技术能够解决在两个用户参与下训练岭回归模型的隐私泄露问题,具有效率高,通信代价低的优点。通信代价低的优点。通信代价低的优点。

【技术实现步骤摘要】
一种基于同态加密的隐私保护岭回归方法


[0001]本专利技术涉及一种基于同态加密的隐私保护岭回归方法,属于信息安全领域。

技术介绍

[0002]机器学习是人工智能领域的关键技术,可以从海量数据中挖掘数据潜在的价值为人们所用。随着计算能力的普遍提高,机器学习的应用也更加广泛。而机器学习依赖于大量的数据,往往数据越多,得到的机器学习模型的准确度也越高。而在信息时代,海量的数据可能被不同的用户持有,不可避免地涉及到不同数据持有者的敏感信息,模型的训练依赖于用户持有的共同信息,但用户为了保护自己的隐私,不想将数据暴露给其他人,而且在一些情况下泄露隐私也是法律上不允许的,因此,隐私保护逐渐成了数据挖掘的一大难题。
[0003]岭回归是一种重要且基础的机器学习算法,可以表征输出与多个输入之间的关系,属于监督学习中线性回归的一个变种,在医药、金融、风险评估以及推荐系统等领域都有着重要的应用。对隐私保护岭回归模型的研究,致力于在保护不同参与方的数据隐私的同时,高效、准确地训练模型,在实际中有着广泛的应用,尤其对于金融、生物医药、推荐系统等对数据有大量隐私保护需求的领域。针对两方参与下的隐私保护岭回归方法的设计,例如:两个医院想要结合双方的数据共同训练一个疾病预测模型;两个银行想合作评估贷款用户的还贷能力;两家大型的互联网公司通过收集各自用户的行为数据合作开发推荐系统等,这些场景下两个参与方都不能将自己拥有的用户数据泄露给对方,但结合双方的数据集能得到预测能力更好的模型,结合隐私保护技术训练有着很大的实用价值。
[0004][1]CI.Machine Learning Repository[OL].http://archive.ics.uci.edu/ml/datasets.php.
[0005][2]TIANCHI.Tianchi Data Sets[OL].https://tianchi.aliyun.com/dataset.
[0006][3]Lu L,Ding N.Horizontal Privacy

Preserving Linear Regression Which is Highly Efficient for Dataset of Low Dimension[C]//Proceedings of the 2021 ACM Asia Conference on Computer and Communications Security.New York:Association for Computing Machinery,2021:604

615.

技术实现思路

[0007]有鉴于此,本专利技术提供及一种基于同态加密的隐私保护岭回归方法,结合CKKS同态加密技术和带除法延迟的预处理共轭梯度法,可以有效解决两个用户场景下合作训练隐私保护岭回归模型时的隐私泄露问题,同时具有较高的运行效率和较低的通信代价。
[0008]为达到上述目的,本专利技术提供如下技术方案:
[0009]一种基于同态加密的隐私保护岭回归方法,其特征在于,包含以下步骤:
[0010]S1:接收方设置基于环上的容错学习(RLWE)问题的CKKS同态加密技术的参数,根据设定的安全参数生成公私钥对{sk,pk},并将公钥pk公开给发送方;
[0011]S2:设计密文向量安全求逆方法;
[0012]S3:发送方和接收方分别利用预处理方法在本地对自己的数据集进行处理,并利用向量编码方法进行编码,然后利用公钥pk进行加密,得到密文数据;
[0013]S4:在接收方的协助下,发送方将双方的密文数据利用密文向量安全求逆方法进行整合,得到整合密文数据;
[0014]S5:发送方利用密文向量安全求逆方法设计改进共轭梯度法;
[0015]S6:在接收方的协助下,发送方基于改进共轭梯度法,利用整合密文数据训练岭回归模型,得到模型参数的密文;
[0016]S7:训练结束后,接收方利用私钥对模型参数的密文解密后,解码得到模型参数,并将模型参数发送给发送方;
[0017]S8:双方独立使用训练好的岭回归模型,输入样本值,得到预测值。
[0018]进一步,步骤S1所述的基于RLWE问题的CKKS同态加密的技术参数为λ,p,p
c
,Q0,Q,N:
[0019]所述的安全参数为λ,根据预判敌手攻击次数2
λ
计算求得;
[0020]所述的扩张因子p和p
c
,是人为选取的2的整数幂;
[0021]所述的最小密文模Q0,是人为选取的2的整数幂,满足Q0>>p;
[0022]所述的初始密文模Q,满足log Q=n1log p+n2log p
c
+log Q0,其中n1是密文与密文运算消耗的乘法层数,n2是密文与常数运算消耗的乘法层数,;
[0023]所述的分圆多项式的维数N,为人为选取的2的整数幂,满足其中P是人为选取的特殊模数,满足其中表示向上取整的符号;
[0024]可优选地,根据中等安全等级的要求,参数可按如下设定:安全参数λ=80,扩张因子p=2
45
,p
c
=2
20
,最小密文模Q0=2
50
,特殊模数P=2
50

[0025]进一步,步骤S2所述的密文向量安全求逆方法,记作具体为:
[0026]S201:发送方输入向量x=(x1,x2,

,x
n
)的密文ct
x

[0027]S202:发送方在均匀分布U(a,b)上随机采样一个实数r,计算ct
rx
=r
·
p
·
ct
x
,记作ct
rx
=CMult(r,ct
x
);其中,a、b为实数;可优选的,a=1、b=24;
[0028]S203:接收方利用私钥sk对ct
rx
进行解密,得到向量(rx1,rx2,

,rx
n
),记作(rx1,rx2,

,rx
n
)=Dec(ct
rx
);
[0029]S204:接收方计算向量(rx1,rx2,

,rx
n
)的逆向量并利用公钥pk对其进行加密,得到逆向量的密文记作并将发送给发送方;
[0030]S205:发送方计算得到向量的密文
[0031]进一步,所述步骤S3具体为:
[0032]S301:根据数据集水平分布的特点,发送方和接收方共同选取缩放因子s;其中,发送方的数据集为{X1,y1},X1为n
×
d维的样本矩阵,y1为n维标签值向量,n表示样本个数,d表示特征个数;同样地本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于同态加密的隐私保护岭回归方法,其特征在于,包含以下步骤:S1:接收方设置基于环上的容错学习(RLWE)问题的CKKS同态加密技术的参数,根据设定的安全参数生成公私钥对{sk,pk},并将公钥pk公开给发送方;步骤S1所述的基于RLWE问题的CKKS同态加密的技术参数为λ,p,Q0,Q,N:所述的安全参数为λ,根据预判敌手攻击次数2
λ
计算求得;所述的扩张因子p,是人为选取的2的整数幂;所述的最小密文模Q0,是人为选取的2的整数幂,满足Q0>>p;所述的初始密文模Q,满足log Q=n log p+log Q0,其中n是消耗的乘法层数;所述的分圆多项式的维数N,为人为选取的2的整数幂,满足其中P是人为选取的特殊模数,满足S2:设计密文向量安全求逆方法;S3:发送方和接收方分别利用预处理方法在本地对自己的数据集进行处理,并利用向量编码方法进行编码,然后利用公钥pk进行加密,得到密文数据;S4:在接收方的协助下,发送方将双方的密文数据利用密文向量安全求逆方法进行整合,得到整合密文数据;S5:发送方利用密文向量安全求逆方法设计改进共轭梯度法;S6:在接收方的协助下,发送方基于改进共轭梯度法,利用整合密文数据训练岭回归模型,得到模型参数的密文;S7:训练结束后,接收方利用私钥对模型参数的密文解密后,解码得到模型参数,并将模型参数发送给发送方;S8:双方独立使用训练好的岭回归模型,输入样本值,得到预测值。2.根据权利要求1所述的一种基于同态加密的隐私保护岭回归方法,其特征在于,步骤S2所述的密文向量安全求逆方法,记作具体为:S201:发送方输入向量x=(x1,x2,

,x
n
)的密文ct
x
;S202:发送方在均匀分布U(a,b)上随机采样一个实数r,计算ct
rx
=r
·
p
·
ct
x
,记作ct
rx
=CMult(r,ct
x
);其中,a、b为实数;S203:接收方利用私钥sk对ct
rx
进行解密,得到向量(rx1,rx2,

,rx
n
),记作(rx1,rx2,

,rx
n
)=Dec(ct
rx
);S204:接收方计算向量(rx1,rx2,

,rx
n
)的逆向量并利用公钥pk对其进行加密,得到逆向量的密文记作并将发送给发送方;S205:发送方计算得到向量的密文3.根据权利要求1所述的一种基于同态加密的隐私保护岭回归方法,其特征在于,所述步骤S3具体为:S301:根据数据集水平分布的特点,发送方和接收方共同选取缩放因子s;其中,发送方的数据集为{X1,y1},X1为n
×
d维的样本矩阵,y1为n维标签值向量,n表示样本个数,d表示特
征个数;同样地,相同维度的接收方的数据集为{X2,y2};S302:发送方预处理自己的数据集:A1=sX
1T
X1,取A1对角线元素组成向量M1;接收方预处理自己的数据集:A2=sX
2T
X2,取A2对角线元素组成向量M2;S303:发送方和接收方分别对预处理后的数据进行编码及加密,对于向量b1、b2、M1、M2,直接用公钥pk加密得到密文ct
b1
、ct
b2
、ct
M1
、ct
M2
;对于矩阵A1和A2,采用逐列向量编码的方法,比如对矩阵A1=(a1,a2,

,a
n
),分别用公钥pk加密其列向量a
i
,最终将矩阵A1加密成n条密文,记作有4.根据权利要求1所述的一种基于同态加密的隐私保护岭回归方法,其特征在于,所述步骤S4具体为:S401:接收方将密文ct
b2
、ct
M2
发送给发送方;S402:发送方计算ct
b
=Add(ct
b1
,ct
b2
),ct
M
=Add(ct
M1
,ct
M2
);S403:双方利用密文向量安全求逆方法,得到S404:发送方随机选取实数r,用公钥pk加密rI得到ct
rI
,其中I是单位矩阵,然后计算ct
A
=Add(ct
A
,ct
rI
);所述的Add(ct
...

【专利技术属性】
技术研发人员:吴文渊吕由杨文强
申请(专利权)人:中国科学院重庆绿色智能技术研究院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1