一种保护隐私且非交互的多方逻辑回归模型训练方法技术

技术编号:39746978 阅读:8 留言:0更新日期:2023-12-17 23:45
本发明专利技术涉及云计算技术领域,具体涉及一种保护隐私且非交互的多方逻辑回归模型训练方法,构造了保护隐私的多方逻辑回归模型,具体为:用户对本地私有数据进行加密并上传给服务供应商,服务供应商收集用户的加密数据后,在云服务器的帮助下训练全局逻辑回归模型,最终获得模型结果

【技术实现步骤摘要】
一种保护隐私且非交互的多方逻辑回归模型训练方法


[0001]本专利技术涉及云计算
,具体涉及一种保护隐私且非交互的多方逻辑回归模型训练方法


技术介绍

[0002]随着云计算的兴起和数据资源的不断丰富,越来越多的机构和企业愿意将私有数据从本地转移到云服务器,从而进行更快速的分析计算任务和训练模型任务

这种趋势在医疗领域也得到了体现,许多企业和机构都利用机器学习算法开发了各种医疗应用程序和辅助诊断工具,以提高医疗水平和治疗效果

例如,疾病预测系统
(Disease Prediction Systems,DPSs)
近年来受到了广泛关注

逻辑回归作为一种经典的机器学习算法,已广泛应用于多种疾病的预测

尽管它很简单,但它比一些复杂的技术
(
如贝叶斯分类
,
支持向量机等
)
更有效和合适

[0003]不幸的是,由于隐私问题和通信限制,逻辑回归训练仍面临许多挑战

一方面,数据拥有者的本地训练数据通常包含大量个人或组织的私人信息

这些原始数据包含大量的个人隐私信息
(
如健康状况

收入状况等
)
,一旦这些数据被泄露,就可能导致对手利用计算机辅助犯罪

另一方面,围绕数据主权和管辖权的隐私问题和数据保护法律阻止这些机构和数据拥有者公开共享用户数据

此外,如果云服务器在模型训练过程中知道了模型,就容易擅自滥用模型,可能会将全局模型透露给他人,同时云服务器很容易地直接跟踪用户或将他们的一些隐私数据发布给其他广告商以达到自己的私利

[0004]然而,在加密数据上进行逻辑回归训练面临着严重的挑战

首先,用户需要在线与云协同工作
,
通过交互来处理大量数据的隐私计算

服务器之间需要多次交互,对网络的可靠性提出更高的要求

在实际应用中,用户之间或用户与服务器之间的多次交互不仅会导致大量通信负担,还会增加暴露隐私的风险

不幸的是,由于网络问题和通信限制等不可抗原因,用户并不能始终参与到训练过程中

其次,数据拥有者使用相同的公钥对数据进行加密,但是为所有数据拥有者使用统一的公钥无法抵御共谋,当云服务器与数据拥有者相互串通以获取其他用户的隐私时,云服务器就可以解密获得所有数据拥有者的数据


技术实现思路

[0005]本专利技术的目的在于提供一种保护隐私且非交互的多方逻辑回归模型训练方法,旨在解决现有逻辑回归模型训练时间长

计算开销大

模型精度低以及对用户隐私信息保护不足的技术问题

[0006]为实现上述目的,本专利技术提供了一种保护隐私且非交互的多方逻辑回归模型训练方法,包括下列步骤:
[0007]构建多方逻辑回归模型并进行初始化;
[0008]所述多方逻辑回归模型内的实体进行注册;
[0009]提供数据进行加密;
[0010]数据收集与身份验证;
[0011]使用隐私保护训练协议进行训练;
[0012]完成分布式解密

[0013]可选的,所述多方逻辑回归模型由密钥生成中心
KGC、
数据拥有者
DOs、
服务提供者
SP
和云服务器
CS
共4个实体;
[0014]所述密钥生成中心
KGC
负责生成系统所需的公共参数和强私钥
λ
,并将强私钥
λ
分成两部分,再将部分强私钥
λ1发送给服务提供者
SP
,部分强私钥
λ2发送给云服务器
CS

[0015]所述数据拥有者
DOs
负责提供训练所需的数据及加密;
[0016]所述服务提供者
SP
负责收集数据,初始化模型参数,并与云服务器
CS
进行交互式训练;
[0017]所述云服务器
CS
拥有部分强私钥
λ2,能够对服务提供者
SP
发送的密文进行部分解密,并对密文进行计算

[0018]可选的,所述数据拥有者
DOs
只负责发送数据,发送完毕后下线不再参与任何其他训练;所述云服务器
CS
不会与所述服务提供者
SP
共谋,也不会向其余实体泄露信息

[0019]可选的,进行初始化的过程,包括下列步骤:
[0020]所述密钥生成中心
KGC
选择一个安全参数
k
和两个大素数
p,q
,计算:
λ

lcm(p

1,q

1)

2p

q


N

pq

[0021]定义一个解密函数为并选择一个阶为
2p

q

的生成数
g
用于加密,并令强私钥为
SK

λ

[0022]将
SK

λ
随机分解成两部分,即
SK
j

λ
j
(j

1,2)
,其中
λ1,
λ2满足
λ1+
λ2≡0mod
λ

λ1+
λ2≡1modN2;
[0023]计算系统的公共参数
Par

(N,g)
和部分强私钥
SK1=
λ1,SK2=
λ2;
[0024]将部分强私钥
λ1发送给服务提供者
SP
,部分强私钥
λ2发送给云服务器
CS。
[0025]其中,安全参数决定了加密机制中的定义的计算的数值空间大小,通常是用
bit
位数表示,常取
1024bit

2048bit

p,q
:用于生成强私钥,大素数也为系统提供安全性,具体的,安全参数和大素数无取值范围限制

[0026]可选的,所述多方逻辑回归模型内的实体进行注册的过程,包括下列步骤:
[0027]数据拥有者
DOs
中的任意用户
DOi
注册:对于每个用户
i
,密钥生成中心<本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.
一种保护隐私且非交互的多方逻辑回归模型训练方法,其特征在于,包括下列步骤:构建多方逻辑回归模型并进行初始化;所述多方逻辑回归模型内的实体进行注册;提供数据进行加密;数据收集与身份验证;使用隐私保护训练协议进行训练;完成分布式解密
。2.
如权利要求1所述的保护隐私且非交互的多方逻辑回归模型训练方法,其特征在于,所述多方逻辑回归模型由密钥生成中心
KGC、
数据拥有者
DOs、
服务提供者
SP
和云服务器
CS
共4个实体;所述密钥生成中心
KGC
负责生成系统所需的公共参数和强私钥
λ
,并将强私钥
λ
分成两部分,再将部分强私钥
λ1发送给服务提供者
SP
,部分强私钥
λ2发送给云服务器
CS
;所述数据拥有者
DOs
负责提供训练所需的数据及加密;所述服务提供者
SP
负责收集数据,初始化模型参数,并与云服务器
CS
进行交互式训练;所述云服务器
CS
拥有部分强私钥
λ2,能够对服务提供者
SP
发送的密文进行部分解密,并对密文进行计算
。3.
如权利要求2所述的保护隐私且非交互的多方逻辑回归模型训练方法,其特征在于,所述数据拥有者
DOs
只负责发送数据,发送完毕后下线不再参与任何其他训练;所述云服务器
CS
不会与所述服务提供者
SP
共谋,也不会向其余实体泄露信息
。4.
如权利要求3所述的保护隐私且非交互的多方逻辑回归模型训练方法,其特征在于,进行初始化的过程,包括下列步骤:所述密钥生成中心
KGC
选择一个安全参数
k
和两个大素数
p,q
,计算:
λ

lcm(p

1,q

1)

2p

q


N

pq
;定义一个解密函数为并选择一个阶为
2p

q

的生成数
g
用于加密,并令强私钥为
SK

λ
;将
SK

λ
随机分解成两部分,即
SK
j

λ
j
(j

1,2)
,其中
λ1,
λ2满足
λ1+
λ2≡0mod
λ

λ1+
λ2≡1modN2;计算系统的公共参数
Par

(N,g)
和部分强私钥
SK1=
λ1,SK2=
λ2;将部分强私钥
λ1发送给服务提供者
SP
,部分强私钥
λ2发送给云服务器
CS。5.
如权利要求4所述的保护隐私且非交互的多方逻辑回归模型训练方法,其特征在于,所述多方逻辑回归模型内的实体进行注册的过程,包括下列步骤:数据拥有者
DOs
中的任意用户
DOi
注册:对于每个用户
i
,密钥生成中心
KGC
随机选择
θ
i
∈[1,N/4]
,并计算最...

【专利技术属性】
技术研发人员:王会勇陈天明丁勇唐士杰王继奎
申请(专利权)人:桂林电子科技大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1