一种多服务器加速分割学习模型训练速度的方法技术

技术编号：38733987 阅读：14 留言：0更新日期：2023-09-08 23:22

本发明专利技术提出一种多服务器加速分割学习模型训练速度的方法，属于分布式深度学习领域；具体为：每个客户端将数据划分为数据1与数据2；客户端a使用其数据1与服务器s1进行训练，并更新模型给客户端b，s1更新其模型；客户端b使用其数据1与s1按上述方法训练，同时，客户端a使用其数据2与服务器s2按上述方法训练；客户端c继续按上述方法训练，同时，客户端b将得到的两个客户端模型聚合，基于此使用其数据2与s2继续训练。持续上述训练过程直至本轮训练结束，之后服务器通过客户端的聚合转发得到全局服务器模型，客户端通过模型转发得到最新模型，用于下一轮训练；直至完成实验设定的训练轮数。本发明专利技术加速了训练速度同时保护了模型的隐私。隐私。隐私。

全部详细技术资料下载

【技术实现步骤摘要】
一种多服务器加速分割学习模型训练速度的方法

[0001]本专利技术属于分布式深度学习领域，涉及分割学习的模型效率和隐私安全，具体是一种多服务器加速分割学习模型训练速度的方法。

技术介绍

[0002]分割学习模型的特点之一是模型的更新方式会导致多个客户端顺序执行。
[0003]在传统多用户分割学习系统中，同一时间只有一个客户端与服务器交互进行训练；与联邦学习中多客户端并行训练的模型相比，会导致模型整体运行效率大大降低。
[0004]目前针对分割学习运行效率问题的解决方法主要是通过服务器聚合、客户端局部并行或集成学习等。如文献1：Thapa C,Arachchige P C M,Camtepe S,et al.Splitfed:When federated learning meets split learning[J].arXiv preprint arXiv:2004.12088,2020.提出用单独的聚合服务器来聚合客户端侧模型，其本质是一个分割学习与联邦学习结合起来的框架，称为SplitFed。
[0005]在该框架中，客户端和主服务器之间通过模型的分割共同执行训练过程，另外还引入了Fed服务器来对客户端的模型进行聚合操作，以此来结合分割学习和联邦学习的优势之处。通过引入分割学习对完整的模型进行分割，使部分算力不足的客户端能够参与训练，同时也有着更好的模型隐私性。通过引入Fed服务器对客户端模型进行聚合，使客户端部分可以并行训练，保留了联邦学习的优势。但是，该框架违背了分割学习的主要目标，...

【技术保护点】

【技术特征摘要】
1.一种多服务器加速分割学习模型训练速度的方法，其特征在于，具体步骤如下：步骤一、搭建包含客户端和服务器的通信场景，每个客户端将各自的数据随机划分为第一部分数据和第二部分数据；步骤二、针对第一个客户端a，首先使用其第一部分数据a_1在本地客户端初始模型W
C
上进行前向传播训练，得到分割层的输出数据发送给第一个服务器s1；步骤三、第一个服务器s1在本地服务器初始模型W
S
上对分割层输出数据继续训练，并反向传播，将返回给分割层的梯度发送给客户端a；步骤四、客户端a基于返回的梯度继续进行反向传播更新其初始模型W
C
为并发送给下一个客户端b；同时，服务器s1更新其初始模型W
S
为步骤五、客户端b在得到模型后，使用其第一部分数据b_1进行前向传播训练，得到分割层输出数据发送给服务器s1；同时，客户端a的模型使用其第二部分数据a_2进行前向传播训练，得到分割层输出数据发送给服务器s2；步骤六、服务器s1使用客户端b发送来的分割层输出数据在本地服务器模型上进行前向传播和反向传播，将梯度...

【专利技术属性】
技术研发人员：芦效峰，李颖慧，闫彩虹，
申请(专利权)人：北京邮电大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人