基于深度确定性策略梯度的联邦学习分类模型训练方法技术

技术编号:34955047 阅读:13 留言:0更新日期:2022-09-17 12:33
本发明专利技术提出一种基于深度确定性策略梯度的联邦学习分类模型训练方法,实现步骤为:构建联邦学习分类系统;客户端获取联邦学习数据集;中央服务器为每个客户端构建联邦学习分类模型和深度确定性策略梯度模型;客户端初始化联邦学习训练参数;客户端得到联邦学习分类模型的状态;客户端对深度确定性策略梯度模型的权重参数进行本地更新;客户端获取联邦学习本地训练超参数并记录动作;客户端对联邦学习分类模型的权重参数进行本地更新;中央服务器聚合联邦学习分类模型权重参数;客户端得到联邦学习分类模型。本发明专利技术降低了在选择联邦学习本地训练超参数时客户端的计算资源开销和内存资源开销,以及中央服务器的通信资源开销。以及中央服务器的通信资源开销。以及中央服务器的通信资源开销。

【技术实现步骤摘要】
基于深度确定性策略梯度的联邦学习分类模型训练方法


[0001]本专利技术属于机器学习领域,涉及一种联邦学习分类模型训练方法,具体涉及一种基于深度确定性策略梯度选择本地训练学习率和最大本地迭代次数的联邦学习分类模型训练方法。

技术介绍

[0002]分类任务是机器学习领域的一种基础任务,其目的是根据目标样本携带的特征,把不同类别的目标样本区分开来。分类任务的样本数据类型包括图像、文本、音频等,实现分类任务的机器学习分类模型包括卷积神经网络模型、逻辑回归模型、支持向量机模型等。训练一个分类精度值高的机器学习分类模型需要中央服务器从客户端处收集大量的训练样本,而收集数据的过程必然会带来通信开销过高的问题。
[0003]基于上述原因,需要一种通信高效的方法来支持训练样本数据共享以实现分类模型训练,于是谷歌提出了联邦学习。联邦学习是一种分布式的机器学习模式,一个联邦学习系统由中央服务器和多个客户端组成。联邦学习的主要执行流程为:中央服务器为每个客户端构建模型后由客户端初始化、客户端在本地更新模型权重参数,并将结果发送给中央服务器、中央服务器进行全局聚合后将结果发送给各客户端,然后进行新的一轮迭代,直到损失函数收敛或者达到设定的最大迭代次数。在“客户端在本地更新模型权重参数”的步骤中,由中央服务器为所有客户端规定相同的联邦学习本地训练超参数,包括控制联邦学习模型的权重参数更新幅度的学习率,以及控制联邦学习模型的本地训练程度的最大本地迭代次数。使用不同的“学习率

最大本地迭代次数”超参数组合最终得到的联邦学习分类模型的测试精度值不同,因此,对超参数组合进行调优可以在一定程度上提升联邦学习分类模型的最终测试精度值。
[0004]申请公布号为CN 113609785 A,名称为“基于贝叶斯优化的联邦学习超参数选择系统及方法”的专利申请,公开了一种基于贝叶斯优化的联邦学习超参数选择系统及方法,该系统由中心节点和多个参与节点组成,其中,中心节点启用贝叶斯超参数选择模块,多次基于不同超参数组合,调度联邦学习的交叉训练和交叉预测过程,选择性能最优的超参数组合。该方法在选择超参数的过程中存在的不足之处是:参与节点在联邦交叉训练过程中需要训练多个联邦学习模型,占用了参与节点的计算资源与内存资源;中央节点在联邦交叉预测过程中需要将完整的联邦学习模型列表传递给参与节点,占用了中央节点的通信资源。

技术实现思路

[0005]针对上述已有技术的不足,本专利技术提出一种基于深度确定性策略梯度的联邦学习分类模型训练方法,客户端利用深度确定性策略梯度模型选择包括学习率和最大本地迭代次数的联邦学习本地训练超参数,降低了在客户端选择联邦学习本地训练超参数的操作中客户端的计算资源与内存资源开销,以及中央服务器的通信资源开销。
[0006]为实现上述目的,本专利技术采用的技术方案包括如下步骤:
[0007](1)构建联邦学习分类系统:
[0008]构建包括中央服务器以及可与其通信的N个客户端C={c
n
|1≤n≤N}的联邦学习分类系统,其中,N≥2,c
n
表示第n个客户端;
[0009](2)客户端获取联邦学习训练数据集和测试数据集:
[0010]每个客户端c
n
获取包含E个目标类别的U个数据,并对每个数据的目标进行标注后,将其中半数以上的数据及其标签组成训练数据集将剩余的数据及其标签组成测试数据集其中,E≥2,U≥1000;
[0011](3)中央服务器为每个客户端c
n
构建联邦学习分类模型H
n
和深度确定性策略梯度模型I
n

[0012]中央服务器为每个客户端c
n
构建包括依次层叠的输入层、隐藏层、输出层的联邦学习分类模型H
n
,同时构建包括并行排布的主网络与目标网络的深度确定性策略梯度模型I
n
,其中,主网络包括顺次连接的actor模块μ
n
和critic模块Q
n
;μ
n
包括依次层叠的输入层、隐藏层和输出层,Q
n
包括依次层叠的输入层、隐藏层和输出层;目标网络包括顺次连接的actor

模块μ

n
和critic

模块Q

n
,μ

n
的结构和μ
n
的结构相同,Q

n
的结构和Q
n
的结构相同;
[0013](4)客户端初始化联邦学习训练参数:
[0014]每个客户端c
n
设置联邦学习全局迭代次数为t,最大全局迭代次数为T,T≥1500,设置联邦学习本地迭代次数为α,第t次全局迭代中客户端c
n
的最大本地迭代次数为每个联邦学习分类模型H
n
的权重参数为令t=1,α=1;
[0015](5)客户端c
n
得到联邦学习分类模型H
n
的状态
[0016]每个客户端c
n
将从测试数据集中无放回地随机选取的D1个测试数据作为联邦学习分类模型H
n
的输入进行前向传播,H
n
的隐藏层对每个测试数据进行特征提取,输出层根据特征对每个测试数据进行分类,得到D1个测试数据的预测标签集合然后通过预测标签值及其对应的真实标签值计算联邦学习分类模型H
n
的损失值精确度值以及F

1值客户端c
n
然后将这三个值顺次排列,得到第t次全局迭代中联邦学习分类模型H
n
的状态
[0017](6)每个客户端判断t>1是否成立,若是,利用状态对深度确定性策略梯度模型I
n
的权重参数进行本地更新后,执行步骤(7),否则,执行步骤(7);
[0018](7)客户端获取联邦学习本地训练超参数并记录动作
[0019]每个客户端c
n
将步骤(5)中得到的状态作为μ
n
的输入,μ
n
的隐藏层对状态进行特征提取,输出层根据特征进行预测,得到联邦学习分类模型本地训练超参数:学习率和最大本地迭代次数然后将与顺次排列,记录第t次全局迭代中联邦学习分类模型H
n
的的动作
[0020](8)客户端对联邦学习分类模型的权重参数进行本地更新:
[0021](8a)每个客户端c
n
将从训练数据集中无放回地随机选取的D2个训练数据作为联邦学习分类模型H
n
的输入进行前向传播,H
n
的隐藏层对每个训练数据进行特征提取,输出层根据特征对每个训练数据进行分类,得到D2个训练数据的预测标签集合
[0022](8b)每个客户端c
...

【技术保护点】

【技术特征摘要】
1.一种基于深度确定性策略梯度的联邦学习分类模型训练方法,其特征在于,包括如下步骤:(1)构建联邦学习分类系统:构建包括中央服务器以及可与其通信的N个客户端C={c
n
|1≤n≤N}的联邦学习分类系统,其中,N≥2,c
n
表示第n个客户端;(2)客户端获取联邦学习训练数据集和测试数据集:每个客户端c
n
获取包含E个目标类别的U个数据,并对每个数据的目标进行标注后,将其中半数以上的数据及其标签组成训练数据集将剩余的数据及其标签组成测试数据集其中,E≥2,U≥1000;(3)中央服务器为每个客户端c
n
构建联邦学习分类模型H
n
和深度确定性策略梯度模型I
n
:中央服务器为每个客户端c
n
构建包括依次层叠的输入层、隐藏层、输出层的联邦学习分类模型H
n
,同时构建包括并行排布的主网络与目标网络的深度确定性策略梯度模型I
n
,其中,主网络包括顺次连接的actor模块μ
n
和critic模块Q
n
;μ
n
包括依次层叠的输入层、隐藏层和输出层,Q
n
包括依次层叠的输入层、隐藏层和输出层;目标网络包括顺次连接的actor

模块μ

n
和critic

模块Q

n
,μ

n
的结构和μ
n
的结构相同,Q

n
的结构和Q
n
的结构相同;(4)客户端初始化联邦学习训练参数:每个客户端c
n
设置联邦学习全局迭代次数为t,最大全局迭代次数为T,T≥1500,设置联邦学习本地迭代次数为α,第t次全局迭代中客户端c
n
的最大本地迭代次数为每个联邦学习分类模型H
n
的权重参数为令t=1,α=1;(5)客户端c
n
得到联邦学习分类模型H
n
的状态每个客户端c
n
将从测试数据集中无放回地随机选取的D1个测试数据作为联邦学习分类模型H
n
的输入进行前向传播,H
n
的隐藏层对每个测试数据进行特征提取,输出层根据特征对每个测试数据进行分类,得到D1个测试数据的预测标签集合然后通过预测标签值及其对应的真实标签值计算联邦学习分类模型H
n
的损失值精确度值以及F

1值客户端c
n
然后将这三个值顺次排列,得到第t次全局迭代中联邦学习分类模型H
n
的状态(6)每个客户端判断t>1是否成立,若是,利用状态对深度确定性策略梯度模型I
n
的权重参数进行本地更新后,执行步骤(7),否则,执行步骤(7);(7)客户端获取联邦学习本地训练超参数并记录动作每个客户端c
n
将步骤(5)中得到的状态作为μ
n
的输入,μ
n
的隐藏层对状态进行特征提取,输出层根据特征进行预测,得到联邦学习分类模型本地训练超参数:学习率和最大本地迭代次数然后将与顺次排列,记录第t次全局迭代中联邦学习分类模型H
n
的的动作
(8)客户端对联邦学习分类模型的权重参数进行本地更新:(8a)每个客户端c
n
将从训练数据集中无放回地随机选取的D2个训练数据作为联邦学习分类模型H
n
的输入进行前向传播,H
n
的隐藏层对每个训练数据进行特征提取,输出层根据特征对每个训练数据进行分类,得到D2个训练数据的预测标签集合(8b)每个客户端c
n
通过预测标签及其对应的真实标签计算联邦学习分类模型H
n
在训练数据集上的损失值然后...

【专利技术属性】
技术研发人员:王子龙陈嘉伟陈谦柴政胡嘉琪
申请(专利权)人:西安电子科技大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1