【技术实现步骤摘要】
基于自适应模型扰动的联邦学习分类模型训练方法
[0001]本专利技术属于隐私计算领域,涉及一种联邦学习分类模型训练方法,具体涉及一种基于自适应模型扰动的联邦学习分类模型训练方法
。
技术介绍
[0002]伴随着数据量
、
算法和算力的巨大进步,人工智能迎来了第三次发展浪潮,开始了各行业的落地探索
。
传统的集中式机器学习,从各方收集大量数据到服务器进行模型训练,带动了机器学习性能的提升,但造成了隐私数据的泄露
。《
通用数据保护条例
》
等隐私保护法案的建立使得不同行业
、
部门之间存在数据壁垒,形成了一个个的数据孤岛,而仅凭各部门独立数据训练的机器学习模型性能无法满足需求
。
为了解决数据孤岛和隐私保护问题,
McMahan
等人提出联邦学习,其强调多个客户端之间不交换数据而交换模型权值参数进行联合训练,得到一个在各个客户端本地数据集上表现良好的全局模型
。
这种数据不出本地的特点使得联邦学习成为一种流行的分布式机器学习范式
。
[0003]联邦学习可用于广泛的机器学习任务,如分类
、
回归
、
聚类等
。
其中图像分类是一种常见的机器学习任务,常常使用卷积神经网络提取图像中存在的特征来准确识别图像的目标类别
。
在联邦学习中,多个客户端通过交换卷积神经网络的权值参数或梯度而不是原始数据,联合训练一个全
【技术保护点】
【技术特征摘要】 【专利技术属性】
1.
一种基于自适应模型扰动的联邦学习分类模型训练方法,其特征在于,包括如下步骤:
(1)
构建联邦学习系统:构建包括服务器和
N
个客户端的联邦学习系统,其中,
N≥2
,第
n
个客户端表示为
c
n
;
(2)
每个客户端获取本地训练样本集,并初始化本地训练参数:每个客户端
c
n
获取包含
L
个目标类别的
M
幅图像,并对每幅图像中的目标进行标注后,将所有图像及其对应的标签组成本地训练样本集,同时初始化本地迭代次数为
e
,最大迭代次数为
E
,其中,
L≥2
,
M≥500
,
E
>0;
(3)
服务器获取全局测试样本集,初始化全局分类模型和强化学习模型及相关参数:服务器将包含
L
个目标类别的
M
g
幅图像及其对应的标签组成全局测试样本集;同时初始化聚合轮次为
t
,最大聚合轮次为
T
,
T≥100
,初始化包括顺次连接的
K
个特征提取模块和
F
个全连接层的权值参数为
ω
g
的全局分类模型
X
g
;初始化包括权值参数为
ω
a
的
Actor
网络
X
a
和权值参数为
ω
c
的
Critic
网络
X
c
的强化学习模型;初始化强化学习经验数量
amount
和强化学习模型更新阈值
warmup
;并将
X
g
发送给每个客户端
c
n
;其中,
M
g
≥5000
,
K≥2
,
F≥2
,令
t
=0,
amount
=0;
(4)
服务器为每个客户端自适应分配隐私预算:服务器计算第
t
轮全局分类模型在全局测试样本集上的精确度得到本轮状态
s
t
;判断
amount≥warmup
是否成立,若是,通过
s
t
和
Actor
网络为每个客户端
c
n
自适应分配第
t
轮隐私预算并更新强化学习模型权值参数;否则为每个客户端
c
n
随机分配隐私预算值并将隐私预算作为本轮的动作
a
t
;将发送给每个客户端
c
n
;
(5)
每个客户端对本地分类模型进行迭代训练:每个客户端
c
n
将全局分类模型的权值参数作为本地分类模型的权值参数,并通过本地训练样本集对其进行迭代训练,得到训练好的
N
个本地分类模型;
(6)
每个客户端对训练好的本地分类模型进行自适应扰动:每个客户端
c
n
根据服务器自适应分配的隐私预算值计算满足高斯分布的噪声矩阵并将添加到的权值参数上,实现对的自适应扰动,然后将自适应扰动后的本地分类模型的权值参数上传至服务器;
(7)
服务器对本地分类模型的权值参数进行聚合:服务器对
N
个客户端上传的权值参数进行聚合
,
并将聚合结果作为全局分类模型的权值参数发送给每个客户端
c
n
;
(8)
服务器获取联邦学习分类模型的训练结果:服务器计算全局分类模型在全局测试样本集上的损失值并通过损失值和第
t
轮的隐私预算计算第
t
轮的奖励
r
t
;然后将
r
t
以及第
t
轮的状态
s
t
和动作
a
t
作为第
t
轮的经验存入经验池,令
amount
=
amount+1
;最后判断
t
=
T
是否成立,若是,得到权值参数为的联邦学习全局分类模型否则,令
t
=
t+1
,并执行步骤
(4)。
2.
根据权利要求1所述的方法,其特征在于,步骤
(3)
中所述特征提取模块
、Actor
网络和
Critic
网络,其具体结构分别为:特征提取模块,包括依次层叠的卷积层
、ReLU
层
、Dropout
层和池化层;
Actor
网络,包括依次层叠的多个全连接层
‑
ReLU
层和全连接层
‑
tanh
层;
Critic
网络,包括依次层叠的多个全连接层
‑
ReLU
层和全连接层
。3.
根据权利要求1所述的方法,其特征在于,步骤
(4)
技术研发人员:王子龙,胡嘉琪,陈谦,王鸿波,罗可,
申请(专利权)人:西安电子科技大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。