基于联邦学习和神经架构搜索的云边协同训练方法及系统技术方案

技术编号：37508789 阅读：12 留言：0更新日期：2023-05-07 09:48

本发明专利技术公开了一种基于联邦学习和神经架构搜索的云边协同训练方法及系统，包括：基于P个残差网络构建包含若干网络的搜索空间；收集图像构建包括训练集和验证集的样本集；基于策略梯度的强化学习方法对搜索空间中的网络进行训练得到优化网络，根据验证精度和模型大小设奖励函数选取最优子模型；中心服务器在最优子模型的每一层网络的后方添加分支分类网络作出口，形成含若干个分支模型的退出点模型；将分支模型分配给边缘设备训练得到退出点本地模型，中心服务器利用联邦学习对训练后的退出点本地模型聚合，以最小化总损失函数和最大化验证精度为目标对退出点模型更新。本发明专利技术通过选择适当的分支模型部署在不同边缘设备上，提高了模型可重用性。提高了模型可重用性。提高了模型可重用性。

全部详细技术资料下载

【技术实现步骤摘要】
基于联邦学习和神经架构搜索的云边协同训练方法及系统

[0001]本专利技术属于神经网络
，具体涉及一种基于联邦学习和神经架构搜索的云边协同训练方法及系统。

技术介绍

[0002]近年来，随着边缘计算的发展，深度神经网络被部署在不同的边缘设备上，然而由于边缘设备的异构性，需要设计一系列模型结构。为了实现设计的自动化，一些方法使用神经架构搜索(Neural Architecture Search,NAS)方法构建模型，从而减少了人力和计算资源。为了保护数据隐私，联邦学习(Federated Learning,FL)可以在不泄漏数据的情况下对边缘环境中的模型进行协同训练。但是将神经架构搜索和联邦学习相结合的方案还处于起步阶段，在集中的搜索过程结合云边协同的训练过程中会出现一些技术问题。比如：不同设备上的模型是异构的，传统的联邦学习只能聚合相同结构的模型，针对结构不同的模型没有特定的聚合策略。
[0003]针对上述问题，利用基于联邦学习的神经架构搜索方法，自动搜索多退出模型，为设备提供异构的模型，并针对异构模型设计协同训练的聚合策略，为边缘场景中实现异构、高效、可复用的训练框架提供有效的解决方案亟待解决。

技术实现思路

[0004]针对以上问题，本专利技术提出了一种基于联邦学习和神经架构搜索的云边协同训练方法及系统。为解决以上技术问题，本专利技术所采用的技术方案如下：
[0005]一种基于联邦学习和神经架构搜索的云边协同训练方法，包括如下步骤：
[0006]S1，基于P个残差网络...

【技术保护点】

【技术特征摘要】
1.一种基于联邦学习和神经架构搜索的云边协同训练方法，其特征在于，包括如下步骤：S1，基于P个残差网络构建包含若干个网络的搜索空间，且P≥2；S2，收集图像数据构建样本集，将所述样本集划分为训练集和验证集；S3，采用基于策略梯度的强化学习方法利用训练集对搜索空间中的网络进行训练得到优化网络，根据验证集精度和模型大小设定奖励函数，选取奖励函数最高的网络作为最优子模型；S4，中心服务器在最优子模型的每一层网络的后方均添加分支分类网络作为出口，并添加输入层和输出层形成包括若干个分支模型的退出点模型；S5，将步骤S4中退出点模型的分支模型分配给边缘设备进行训练得到退出点本地模型，中心服务器利用联邦学习方法对训练后的退出点本地模型进行聚合，并以最小化总损失函数和最大化验证精度为目标对中心服务器中的退出点模型进行更新。2.根据权利要求1所述的基于联邦学习和神经架构搜索的云边协同训练方法，其特征在于，所述步骤S1包括如下步骤：S1.1，选取P个残差网络，对每个残差网络分别进行裁剪按照网络层将裁剪后的残差块对应存储在每层的残差块池中；S1.2，分别从每个残差块池中随机选择一个残差块组成对应的网络层；S1.3，对步骤S1.2得到的网络层进行连接形成包含个网络的搜索空间，其中，N表示残差块池中候选残差块的数目，L表示残差块池的数目。3.根据权利要求1所述的基于联邦学习和神经架构搜索的云边协同训练方法，其特征在于，所述步骤S3包括如下步骤：S3.1，基于长短期记忆网络建立控制器；S3.2，利用控制器从步骤S1建立的搜索空间中随机选取网络，采用策略梯度的强化学习方法基于训练集数据对选取出的网络进行训练得到优化网络；S3.3，利用验证集数据对优化网络进行测试，基于验证精度和模型大小计算奖励函数，选取奖励函数最大的网络作为最优子模型。4.根据权利要求3所述的基于联邦学习和神经架构搜索的云边协同训练方法，其特征在于，所述奖励函数的计算公式为：式中，Acc(h，ε)表示共享参数为ε的优化网络h在验证集上的验证精度，P表示基线网络的参数，p
h
表示优化网络h的参数量，R(h，ε)表示共享参数为ε的优化网络h的奖励函数，β为正整数。5.根据权利要求1所述的基于联邦学习和神经架构搜索的云边协同训练方法，其特征在于，所述步骤S5包括如下步骤：S5.1，设置聚合总轮次T，初始化聚合轮数t＝1；S5.2，将步骤S4中退出点模型的分支模型随机分配给所有边缘设备，边缘设备利用本地数据对分支模型进行训练得到退出点本地子模型；...

【专利技术属性】
技术研发人员：王晓飞，张子桐，仇超，刘志成，赵云凤，
申请(专利权)人：天津大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人