一种基于模型分割和资源分配的联邦学习训练方法及系统技术方案

技术编号：34618468 阅读：43 留言：0更新日期：2022-08-20 09:25

本发明专利技术公开了一种基于模型分割和资源分配的联邦学习训练方法及系统。所述方法面向在资源受限且异构的边缘环境中执行的联邦学习训练任务，将待训练模型自适应划分为两部分，将其中一部分模型的训练任务从工作节点卸载到主节点，同时结合对带宽资源和主节点计算资源的动态调整，极大地减少了联邦学习训练过程中的通信开销并且有效平衡了异构工作节点的完成时间，从而显著提升了联邦学习的训练速度。度。度。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于模型分割和资源分配的联邦学习训练方法及系统

[0001]本专利技术属于联邦学习与边缘计算领域，具体涉及一种基于模型分割和资源分配的联邦学习训练方法及系统。

技术介绍

[0002]面向深度神经网络协同训练的联邦学习框架旨在充分利用边缘环境中丰富的计算通信资源，通过多个智能终端协作式训练高精度机器学习模型。在面向边缘计算环境的联邦学习框架中，智能终端基于对本地训练数据的计算对当前全局模型进行更新，由边缘服务器作为协同节点对中间结果聚合并同步模型参数，通过多次迭代训练达到模型的预期精确度。联邦学习具有易于分布式协作、边缘数据就近处理、用户隐私保护等突出优点，完美契合边缘计算的核心理念，近年来受到学术界和工业界的广泛关注。
[0003]然而，随着边缘智能应用场景日趋复杂，联邦学习中深度神经网络模型所涉参数规模快速上升，例如，在高精度图像识别、自然语言处理等典型应用场景中，其参数规模达到数百万甚至上亿的规模，加之终端设备网络环境动态多变且通信性能受限，难以满足联邦学习中间结果聚合与模型参数同步的通信需求，导致时间开销加剧，并成为制约边缘环境下联邦学习训练速度的关键因素。此外，在资源异构的边缘环境中，负责模型训练的终端设备计算能力和通信能力不同，完成相同计算量和通信量的任务所花费的时间也具有显著性差异。在基于批量同步并行的模型同步方法下，资源性能好的终端设备需要等待资源性能差的终端设备完成后执行模型聚合，因此联邦学习完成一次全局模型更新的时间取决于性能最差的参与节点，这不仅导致了严重的资源利用率不足，而且进一步增

【技术保护点】

【技术特征摘要】
1.一种基于模型分割和资源分配的联邦学习训练方法，其特征在于，所述方法包括以下步骤：主节点收集工作节点的资源信息，包括计算能力和无线信号传输功率；主节点根据待训练模型的配置计算模型的参数量、模型中间层的输出数据量以及训练所需的计算量；主节点确定模型分割策略和资源分配策略，包括：初始化模型分割策略和资源分配策略，根据模型分割策略和资源分配策略预估一轮模型训练的全局完成时间，根据当前系统资源的状态选择最优的模型分割策略，根据当前的模型分割策略选择最优的资源分配策略，重复以上操作直至全局完成时间减少量的精度小于预设精度时，完成模型分割策略和资源分配策略的确定，其中模型分割策略指定工作节点和主节点分别负责的计算量，资源分配策略指定分配给工作节点的带宽和分配给工作节点的主节点计算资源；主节点按照模型分割策略将每个工作节点的模型进行分割，并按照资源分配策略调整分配给每个工作节点的带宽和主节点计算资源；工作节点和主节点协同对分割后的模型进行训练。2.根据权利要求1所述的方法，其特征在于，所述根据待训练模型的配置计算模型的参数量、模型中间层的输出数据量以及训练所需的计算量包括：根据模型结构和类型计算每一层模型的参数量；根据训练数据的尺寸和模型的结构计算模型每一层的输入和输出尺寸；根据模型每一层的输入和输出尺寸以及该层的类型计算每一层模型完成一次训练所需要的浮点操作数，一次完整训练所需的计算量即为所有层所需浮点操作数的总和。3.根据权利要求2所述的方法，其特征在于，所述类型包括卷积层、池化层、全连接层。4.根据权利要求1所述的方法，其特征在于，所述主节点初始化模型分割策略和资源分配策略包括：将无线带宽资源平均分配给所有工作节点；将主节点可用的计算资源平均分配给所有工作节点；将所有工作节点的模型分割点设置在最后一层，即初始时由工作节点完成所有的训练任务。5.根据权利要求1所述的方法，其特征在于，所述模型分割策略将模型分割为两部分，第一部分模型从第一层到分割层，包括分割层；第二部分模型从分割层到最后一层，不包括分割层；所述工作节点的计算量为第一部分模型完成前向传播和后向传播所需的计算量，所述主节点的计算量为第二部分模型完成前向传播和后向传播所需的计算量。6.根据权利要求5所述的方法，其特征在于，所述根据模型分割策略和资源分配策略预估一轮模型训练的全局完成时间包括：根据分割策略确定工作节点和主节点间的通信量，训练过程中工作节点与主节点间的数据传输操作包括对第一部分模型的两次传输、工作节点向主节点传输分割层的输出结果、主节点向工作节点传输分割层的梯度，上...

【专利技术属性】
技术研发人员：陈晨曦，叶保留，王楚豫，陆桑璐，
申请(专利权)人：南京大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人